人口贩运研究的进展和挑战①
——《巴勒莫议定书》签署20 年纪念

2022-02-13 13:16张晓东吴乐
警学研究 2022年6期
关键词:受害者人口评估

张晓东 著,吴乐 译

(1.美国马萨诸塞大学洛威尔分校,波士顿;2.福建警察学院,福建 福州 350002)

2000年,联合国通过了《联合国打击人口贩运公约》(或称《巴勒莫议定书》)②《巴勒莫议定书》的文本和签署国可见https://www.unodc.org/unodc/en/organized-crime/intro/UNTOC.html.,美国通过了《人口贩运受害者保护法》,这标志着人口贩运跨学科专门化研究的开始。二十年后,世界上大多数国家都通过了某种形式的反人口贩运立法,并建立了打击人口贩运的法律机制,进一步证明了新兴研究的专业化。如今,人口贩运研究已经超越了问题是否真实或是否值得进行科学调查和解决的阶段。全球反对各种形式的人口贩运运动势头汹涌,世界各国政府和民间社会都投入了大量的资源。早期的关注来自严重侵犯权利的耸人听闻的描述,并引发了强烈的道德愤慨,之后越来越多的实证研究揭示了这一全球问题的严重性和复杂性。研究初期,占主导地位的是以起诉被抓获的贩运者为中心的执法叙事,现在则强调系统性改变导致人口贩运活动的社会环境,研究界在促成此种范式转变方面值得称赞。人口贩运研究共同体在过去20年中也取得了巨大的发展,现在已经不再是那个仅有少数研究人员的报告或文章被反复引用的时代了。

过去20年,以美国为首的西方国家投入了巨大的精力和资源来反对人口贩运。在美国,最活跃的机构包括美国国务院、司法部、劳工部、卫生和公共服务部。国际上,联合国毒品和犯罪问题办公室、国际劳工组织和国际移民组织是最活跃的国际组织。每个机构在选择资助项目时都会有自己独特的视角。

在研究界,政府机构和国际组织赞助了许多大大小小的会议,过去几年间发生了两件引人注目的且经常被引用的标志性事件,其激发并综合了人口贩运研究界的不同观点和方法。一场活动由美国国家科学院(National Academy of Sciences)于2019年2月在华盛顿特区举办,主题是评估美国人口贩运发案率的方法,邀请了来自(主要是)北美的知名研究人员,测量和生成各种形式的人口贩运活动发案率估计值。另一场是2019年5月在内布拉斯加州奥马哈市克赖顿大学举行的人口贩运研究国际会议(International Conference on Human Trafficking Research)。这次会议是罕见的一次没有机构推动议程或主题的会议。实证研究人员和政策分析人员相互交流各自立场,并进行了富有成效的对话。如果美国国家科学院会议的重点是评估方法中的统计程序和测量一致性,那么人口贩运研究国际会议就是一个研究总结,展示了实证研究中的想法、政策影响和挑战。

一、实证数据匮乏的情况有所缓解

最近,任何对人口贩运进行文献回顾的人都可以搜索到数以万计的期刊文章和报告,其作者包括政府分析师、非政府组织、研究人员和基金会。显然,人口贩运领域已经超越了早年很少有实证研究的局面。然而,多年来,由于其“隐蔽”性质,严格的实证研究和合理的估计仍然难以达成目标,关于人口贩运受害的实证研究通常很困难。在缺乏实证数据的早期,大家都只能靠推测,例如,美国早期的人口贩运报告(U.S.Trafficking in Persons reports)称其拥有按年龄和性别分类的跨国人口贩运数据,其中2004年人口贩运报告说:每年有60万~80万名受害者被贩运到边境地区,其中80%是女性(包括妇女和女孩),高达50%是未成年人,并且她们大多数被贩运去从事商业性性行为。[1]斯坦法特(Steinfatt)和贝克(Baker)[2]分析后却未能证实这些说法。其他人估计,截至2006年,人口贩运是世界上第三大犯罪行业——仅次于毒品和枪支贩运,每年获利数十亿美元。[3]

研究界早已认识到人口贩运数据匮乏[4],一些批评者甚至认为:反人口贩运运动建立在未经证实的主张之上,其合法性应受到质疑。[5]费迪南(Fedina)[6]认为,继续使用未经证实的数据不仅在描述社会问题方面不准确,而且对反贩运运动也没有好处。

不过,经过20年的发展,情况已经发生了很大变化,如今可用的发案率估计的数量就证明了这一点。但是,人口贩运文献数量的大幅增加并不等同于实证数据质量的提升,奥克奇(Okech)等人[7]就发现,许多文献的实证证据仍然不足,因此在指导政策制定和干预计划实施方面仍然存在问题。

二、人口贩运测量的进展

人口贩运研究界早期面临的障碍之一是如何界定人口贩运活动。德科克(De Cock)[8]在人口贩运研究兴起之初就曾指出制定各领域统一的人口贩运测量办法的困难和重要性。虽然大家在人口贩运的法律定义上几乎没有分歧,但不同的利益相关者(如司法机构、警察机构和社会服务提供者)倾向于采用适合其自身职能目标的标准。遵循《人口贩运受害者保护法》或《巴勒莫议定书》是一回事,将这些法律概念转化为研究人员可以用来收集现场数据或问题的具体措施则是另一回事。研究界长期面临着人口贩运定义的挑战,特别是那些努力想证明贩运问题具有普遍性的人,其中心任务或争论点就是怎样定义人口贩运行为。

研究界在过去二十年已经做了多方面的重大努力,以制定更适合广泛使用的量表。首先是国际劳工组织为制定详尽的人口贩运操作指标进行了尝试,该组织使用德尔菲法制定了一份强制执行的操作指标清单。[9]然而,它不是一种调查工具,而是具有不同权重的指标列表(例如,强或中等指标)。最接近调查形式的问卷之一是国际移民组织《援助贩运受害者手册》中包含的筛选访谈表[10],具体项目旨在帮助服务提供者筛查贩运受害者。而国际移民组织手册则将人口贩运目的解释为“性剥削、强迫劳动、乞讨、犯罪、收养、切除器官”,并建议通过“性、生理、心理”的测量方式录入数据库。[11]

经过这些早期努力之后,许多人开始制定用于收集实证数据的测量工具。例如,北极星计划(Polaris Project)[12]进行的综合性人口贩运评估中,具有对劳动力贩运的特定评估问题。维拉研究院(Vera Institute)的人口贩运受害者识别工具(Trafficking Victim Identification Tool)对性交易和劳工贩运的受害者进行了测验,并发现了在这些情况下可靠地预测受害情况的方法。[13]成人人口贩运筛查工具和指南由儿童和家庭管理局(Administration for Children and Families)发布,该机构使用创伤知情和幸存者知情的方法来筛查和识别潜在的性贩运受害者和劳工贩运受害者,让受害者与公共卫生、行为健康、医疗保健和社会工作专业人士接触。[14]张晓东[15]制定的圣地亚哥劳工贩运量表采用了保守的操作方案,重点关注了侵犯人权的两个基本方面——强制和欺骗(欺诈)。圣地亚哥量表旨在测量无证移民劳工中存在的贩运违法行为的普遍性(即问题的严重程度或遭受任何侵犯/虐待的抽样对象的比例)和发生率(即受害经历的频率和严重性)。

尽管它们的结构和测量方法不尽相同,但都共同反映了人口贩运研究界不断发展的领域,并根据这些领域开发出测量人口贩运活动的量表。上面这些例子也反映出:如何综合定义、衡量问题的普遍性、宣传目的或项目评估等缺乏一套通用的衡量标准已经成为一个紧迫的问题。虽然正在尝试测量的复杂社会和行为活动通常处于微妙的文化背景中,但还是有一些共同点能够就一些基本指标达成一致,可以使用这些指标来收集可比较的经验数据。

目前,研究人员正在共同努力,以期在测量人口贩运方面取得更多的一致意见。在美国国务院的资助下,佐治亚大学发起了降低发案率创新论坛(PRIF),最近资助了六个团队在不同国家开展涉及不同目标受害者人群的发案率测量研究。这些项目涵盖了广泛的人口贩运议题,包括巴西的儿童性交易、巴西农业部门的强迫劳动、哥斯达黎加渔业的强迫劳动、坦桑尼亚移民工人的家庭奴役、摩洛哥的家庭奴役、巴基斯坦的强迫砖窑工人劳动和突尼斯的家庭奴役。①降低发案率创新论坛的内容可见https://apries.uga.edu/prevalenceforum/。降低发案率创新论坛为测量工具开发提供了巨大的机遇,因为所有团队都将使用相同的人口贩运的统计学定义。

三、发案率估计的进步

就“什么是人口贩运活动”达成了一致仅解决了初始问题,接下来的障碍是“如何计算人口贩运活动”,这需要数据收集和后续统计分析的策略。大家都知道通过收集第一手数据(即原始数据)来估计人口贩运发案程度的重要性,但资金往往是个问题。相对于公共卫生、医学、经济或刑事司法等方面的成熟研究基础,人口贩运研究迄今仍像是处在家庭作坊阶段。大多数发案率研究的规模和地点都有限,这让人怀疑从宏观层面上估计人口贩运活动的可行性。[16]不过,尽管面临挑战,研究人员仍在继续尝试不同的方式方法,并在改进抽样和估计方面取得了重大进展。下面介绍其中一些估计方法。

(一)链式跟踪抽样方法

链式跟踪抽样有几种方式,最著名的是被访者驱动抽样法(respondent-driven sampling)。由于大多数贩运受害者被认为是“隐蔽的”,因此,基于概率的传统抽样方法是无效的。近年来,研究人员一直在开发和应用各种链式跟踪抽样技术,以实现对“隐蔽”人口的参数估计,赫卡松(Heckathorn)提出的“被访者驱动抽样法”就是其中重要的一种。该方法旨在通过采用类似于滚雪球抽样的结构化招募程序来产生代表性样本,但又在两个方面改变了传统的滚雪球抽样法。(1)采用双重激励制度,即受访者在参与研究和招募他人参与研究时都会获得奖励;(2)使用优惠券确保匿名并鼓励参与。[17]通过在结构化流程中招募受访者,多样性得到了保证,并且可以通过经验进行验证。传统的滚雪球抽样法中的志愿服务被弱化,因为双重激励招聘程序被认为是鼓励参与和招募;被访人的同质性倾向也被弱化,因为基于优惠券的招募策略要求在每一波招募中有固定数量的推荐人,从而限制了那些网络强大的个人受访者的影响力。链式跟踪抽样方法在接触难以接近的人群方面一直以来都被广泛使用。在人口贩运研究中,被访者驱动抽样法仍然是最流行的抽样方法之一。

最近,加拿大统计学家凯尔·文森特(Kyle Vincent)设计了一种新的抽样方法,即文森特链式跟踪抽样法(Vincent Link Tracing sampling,以其主要发明者的名字命名)。其主要目的是保留传统概率抽样和被访者驱动抽样的特征。简单地说,文森特链式跟踪抽样法利用任何现有的采样框架(全部或部分)来开发大量初始种子。这些种子(或链式跟踪招募过程的开始阶段)可以从传统的抽样设计中生成,例如简单随机抽样,或基于可用(尽管不完善)抽样框架的分层随机抽样。由于种子数量巨大,文森特链式跟踪抽样法仅招募两到三波对象,这些人都从初始种子样本中的个人网络中抽取。文森特链式跟踪抽样法的一个独特之处是,它试图识别不同网络之间的重叠,因为一个人有可能出现在不同社交网络之中。由于文森特链式跟踪抽样法使用所有辅助信息并在社交网络之间寻找重叠,不需要进行多轮样本收集,因此比传统被访者驱动抽样法更有效。[18]

(二)网络规模迭加法(Network Scale-Up Method)

如萨尔加尼克(Salganik)等人所述,该方法近年来在估计隐匿人群的发案率方面得到了广泛关注。[19]这一方法最早是一个由数学家、人类学家和网络分析师组成的团队在估算1985年墨西哥城地震中的死亡人数时首先使用。这种方法背后的原理很有说服力。它假设人们的社交网络(即你认识的一组人)平均代表他们所生活的普通人群[20],如果一组受访者说他们的个人网络规模平均为300人,而他们的个人网络中平均有两人死于地震,那么我们可以假设大约有2/300的总人口死于地震。通过使用人口普查数据或其他已知的人口特征,可以估计特定群体的人口规模,在这个案例中则是估计出地震中的死亡人数。

网络规模迭加法不需要特殊的抽样程序,因为它可以作为任何概率抽样的一部分,因此被认为是研究隐蔽人群的廉价方法。网络规模迭加法只需要设计一组独特的问题:(1)个人网络中具有特定特征的人(如强迫劳动的受害者);(2)一些已知亚群体的估计作为参考值。估计个人网络规模有几种方法,包括求和、已知的总体估计[21],以及更广义的网络规模迭加法模型。[22]基本上,受访者会被问到一系列“你知道多少个X”的问题,其中X对应于已知和未知规模的几个亚群体。已知群体对应于已测量其大小和范围的参考群体,例如美国的糖尿病患者;未知群体对应于感兴趣的目标人群,如性工作者。由于网络规模迭加法不要求受访者识别任何个人(包括他们自己),因此人们认为它可以提高受访者的诚实度。

(三)使用二手数据多系统估计法(multiple-system estimation)

在大多数情况下,人口贩运研究中的原始数据收集仍然是一种奢侈行为,除非评估是受资助项目的一部分。在无法收集原始数据的情况下,多系统估计法在发案率估计中就非常有吸引力,进而在人口贩运研究界引起了广泛关注。多系统估计法的基本逻辑很简单,因为它是经典的标记-再标记估计法(capture-recapture)的变体。当一名人口贩运受害者出现在一个机构的名单上时,被视为“被标记”,如果这个人又出现在另一个名单上,则被视为“再次标记”。在两个或两个以上样本群体中出现(或标记)的个体数量用于估计总体规模,因为第二个样本中标记的比例大约等于标记个体在总体中的比例。因此,再次标记的个体(即出现在两个或多个列表中的个体)比例越小,估计的群体规模就越大。

在过去的十多年里,多系统估计法受到了研究界的广泛关注。国际劳工组织提供的一些被广泛引用的强迫劳动统计数据就是使用这种方法得出的。[23]国际劳工组织依靠两个独立的研究团队建立起一个独立的案例数据库,其中记录了每一个能找到的强迫劳动案件,然后检查同一案件在两个或多个来源中出现的重叠情况,即重新标记情况。如果一个团队重新标记了所有已在库的强迫劳动案例,那案例库这些案例就代表了全部已确定的强迫劳动事件的样本。另一个团队也按照相同的原理开展工作以得出另一个案例表。从理论上讲,如果两个团队都检索了相同的数据,并尽最大可能检索全部数据源,那么两个团队最后可能会得出相同的案例列表,这其实不利于达成多系统估计法的目的。国际劳工组织也承认使用现有报道中的受害者数据的局限性,并呼吁通过国家或地区调查来加强原始数据的收集工作。

多系统估计法的优点也很明显。首先,多系统估计法可能是估算人口贩运活动发案程度最便宜的方法。该方法利用现有记录,查询不同机构数据系统之间的重叠情况,数据估计方法背后的统计原理合理且简单。在没有其他更严格的数据收集方法的情况下,多系统估计法是一种高效且经济的方法,它可以给研究者一定的提示,目前,在人口贩运发案率估计中的应用呈上升趋势。例如,西尔弗曼(Silverman)利用官方记录中的2 744名潜在人口贩运受害者进行研究,估计2013年英国的人口贩卖受害者“暗数”或当局未知的案件受害人在10 000至13 000名之间。[24]林厄姆(Lyneham)等人估计,2015—2016年和2016—2017年的两个年度里,澳大利亚的人口贩运受害者人数分别在1 300至1 900人之间,约为官方确定人数的四倍。[25]法雷尔(Farrell)等人也运用多系统估计法来分析官方数据,并在美国国内首次完成了实证应用。他们认为,引用不完整和缺失的记录是稳健多系统估计法最严重的挑战。[26]

四、对反贩运行动方案的评估

根据联合国大学研究人员的一项研究,2000年至2013年间,全球30个国家在打击人口贩运方面共投入了40多亿美元,其中美国是最大的资金来源国,约占全球总额的60%。[27]除了已经投入的大量资金外,还有源源不断的资金投入,但令人惊讶的是,大家对如何防止高危人群被贩卖或转运的措施却知之甚少。与人口贩运研究的其他方面相比,对什么样的干预路径和干预措施能实现最有效干预方面的评估研究仍然非常欠缺。

然而,反贩运计划已有完整的文献回顾,其详细描述了各种反贩运行动和方法,包括立法、执法和基于社区的计划。这些回顾还包括对研究和干预措施的评估[28];执法机构和民间机构打击人口贩运、强迫劳动和童工的共同努力[29],以及帮助商业性性剥削儿童和年轻人的项目[30],等等。发展研究所(Institute of Development Studies)①发展研究所(IDS)是隶属于英国布莱顿苏塞克斯大学的智囊团,总部位于东萨塞克斯郡法尔默。它提供发展研究领域的研究和教学,并在2019年全球智库指数报告中被公认为排名第一的国际发展智库。网站http://ids.ac.uk。——译者注进行了全面的文献回顾,并构建了现代奴役制的证据地图和快速证据评估,对干预措施和相关评估研究的类型进行了分类。②有关现代奴役制的证据地图和快速证据评估可访问https://msr.heart-resources.org/。然而,大多数对打击人口贩运方案的评估都是描述性的,没有任何定量比较。创新扶贫行动研究所(Innovation for Poverty Action)③创新扶贫行动研究所是美国非营利性研究和政策组织,由经济学家迪恩·卡兰(DeanKarlan)于2002年创立。自成立以来,该组织与400多位顶尖学者合作,在51个国家/地区进行了600多次评估。该组织还管理“脱贫进展指数”。网站http://www.poverty-action.org。——译者注最近一次的文献分析发现,有九项研究采取随机对照试验的方法来评估人口贩运行动方案,其中四项正在进行中,尚未得出评估结果。[31]

目前关于反人口贩运行动评估研究严谨性的讨论才刚开始。大多数行动计划在面临大量社会、政治和经济挑战的地方实施,极具挑战性。20多年来,虽然已开展了大量的打击人口贩运项目,但如何有效地向高危人群提供服务还存在很大不足。很少有项目使用严格的评估方法,比如真正的实验性试验。实施行动计划的机构不习惯接受正式评估,更不用说严格评估了。缺乏严格评估,也完全没有随机对照试验的行动计划,就像没有临床试验的临床医学。由于所有行动都涉及破坏、控制或改变现状,因此将随机对照试验作为评估这些项目的标准方法不仅在伦理和道德上是必要的,且对人口贩运的研究也是必须的。在随机对照试验研究制度化方面,仍未达成统一标准,这是当前反贩运行动主要依靠“常识”、个人经验和传统的主要原因之一。

然而,现在已经出现一些充满希望的迹象。例如,在过去五六年间,美国国务院发出的项目申请公告中都要求申请人将随机对照试验研究设计落实到其项目规划和评估中。其他资助机构,如美国国际开发署、自由基金会、人类联合会、国际移民组织、世界银行和丹麦外交部[32],也开始要求运用随机对照试验研究来实施干预行动和进行项目评估,以证明其影响力。然而,对严格评估的需求往往伴随着高成本,目前对研究成本的影响还缺乏认识,因此,也很少有项目使用随机对照试验设计来探究因果关系。

十几年来,人口贩运研究领域取得了很大的进步,一些主要领域有了重大突破。虽然仍存在一些不足,但许多人已经认识到问题并正在努力改善这种状况。同时,被资助机构招聘了不少研究生学历的研究助理,这让项目负责人可以考虑长周期研究,并投入更多资金进行严格的评估。笔者记得,五六年前有个著名的基金会曾提出要做大规模研究,并要求在3到6个月内完成。如今几乎没有这样的资助项目了。与处理大型社会问题的其他学科(如公共卫生、环境科学或心理健康)相比,人口贩运研究缺乏严谨性和基础标准,不能为项目或行动提供获得认可的科学证据标准,而这种情况在医学领域就很常见。由于人口贩运研究在某种程度上是一项专门的研究工作,其未来的发展不仅严重依赖公共和私人的资金的支持,而且还依赖于各种学术背景的研究人员的持续参与。

猜你喜欢
受害者人口评估
《世界人口日》
人口转型为何在加速 精读
第四代评估理论对我国学科评估的启示
人口最少的国家
1723 万人,我国人口数据下滑引关注
受害者敏感性与报复、宽恕的关系:沉思的中介作用
评估依据
儿童雾霾的长期受害者
立法后评估:且行且尽善
关注恐怖主义受害者