大数据科学中的司法判案研究

2020-05-26 18:24李彤李天沐韩琇丹
青年生活 2020年13期
关键词:数据安全

李彤?李天沐?韩琇丹

摘要:当今,随着科技发展,大数据的应用日渐普遍。从西方国家对大数据的应用实例中可以看出,在司法判案中应用大数据科学,可有效地提高效率和准确率。然而,新事物的发展必将面临巨大的困难。在实践生活中,判案与大数据结合往往会遇到许多棘手的问题,例如,对大数据在司法判案中的讨论不足,数据壁垒较为严重,数据量化缺乏等诸多问题阻碍了司法大数据的实际应用。因而,应当加强各地区的数据联系与共享,拓展法律数据获取途径,提高数据准确性,通过大数据科学,对司法判案进行合理分析预测,才能让司法判案与大数据科学深度融合,让司法判案与百姓的生活联系更为密切,从而促进社会的和谐与进步。

关键词:大数据科学;司法判案;数据安全;数据利用

引言

近年来,受惠于时代的高速发展,大数据在司法领域的实践逐步加深。“要发挥我国制度优势和市场优势,面向国家重大需求,面向国民经济发展主战场,全面实施促进大数据发展行动,完善大数据发展政策环境。” [1]国各级法院在“互联网+”的大力推动下,加快信息化建设的步伐,不断完善司法数据库,将法院裁判文书引进网络领域等方案的实施为司法判案提供了有力的支持。现法学界对于在法律领域运用大数据的看法层出不穷,却也抑制不住大批关于法律大数据和人工智能的公司和机构纷纷成立。但无论在收集和应用等各个方面,大数据在司法判案实践中仍然存在着不可忽视的问题。如何在司法领域正确应用大数据,成了新时代司法判案实践无法避及的挑战。

一、大数据与司法结合促进司法实践的发展

进入“互联网+”时代,大数据的发展带动各个领域的成长与进步,是许多领域想获得发展而不可或缺的条件。如今,科学研究离不开数据支持,因此,是否能够灵活运用大数据成为必须面对的世纪难题。大数据具有全样本、混杂性、相关性三个特征,利用这三个特征,司法领域的数据整合将更为全面具体,更具有客观性,实证性。在案例分析中,司法大数据可有效帮助法官判案,科学分析案例,增强法官对案件的理解,提高判案效率与质量;在案件收集上,司法大数据将会记录司法程序及裁判文书,能克服传统司法记录低效、错误多、缺失的不足,为法官提供更多有效的借鉴资料。因此,将大数据引入司法实践,改变传统方法,使其更为科学合理,有助于司法公信力的提高。

无论是国内国外,司法大数据都已得到不同程度的应用。在国外,大数据已在公权力与私权利领域的法律实践中广泛渗透。在公权力领域,法律大数据在两个方面得到较多利用: 一是在警务活动中,美国法律大数据被充分运用于犯罪趋势分析、发案情况预测、警力分配以及调查工作重心的确定等。[2]二是在审判活动中,法律大数据已大量应用于司法管理活动和程序性司法决策。例如,法官通过对法律大数据进行分析、评估,建立有关犯罪嫌疑人能否得到保释风险预测模型,以此决定嫌疑人能否被保释; 法官利用法律大数据对罪犯是否符合假释条件进行评估,以此作为判斷罪犯能否被假释的重要参考。[3]

在国内,在司法判案中运用大数据也日渐被人们所接受。中国司法大数据服务网,中国裁判文书网等各个以大数据为基础而成立的网站现已成了便民利民的工具。法律相关从业者,甚至普通百姓皆可通过大数据了解司法实践的现状,增强对法律的理解。但宏观来看,我国的司法实践与大数据的结合仍存在许多漏洞,与国外存在着不小的差距。于是,党在十八大以来的法治中国建设(尤其是司法改革)与信息化、大数据技术相结合,促成了法律改革的“无心插柳柳成荫”的良好局面。[4]

二、国内司法判案数据利用的空白与发展阻碍

(一)司法判案中的数据应用讨论不足

当今我国法律行业相关从业人士对大数据的利用意识明显不足,原因在于大部分人没有真正地意识到大数据对法律行业究竟意味着什么,人们止步于中国的法系为大陆法系不适用大数据的智能判案,且地方各级部门对其不够重视或是因为司法判案自身的隐私性,导致数据不够全面。没有重视,所以没有出台相关规定,最后利用方式不足阻碍了司法判案迈进大数据时代的步伐。

(二)数据孤岛普遍存在

伴随法律行业数据的发展,每个部门都有其各自所属的数据。各个部门的平行发展导致了数据无法有效得到交换互动。专业人士把数据孤岛分为物理性和逻辑性两种。物理性数据孤岛指的是,数据在不同部门相互独立存储,独立维护,彼此间相互独立,形成了物理上的孤岛。逻辑性的数据孤岛指的是,不同部门站在自己的角度对数据进行理解和定义,使得一些相同的数据被赋予了不同的含义,无形中加大了跨部门数据合作的沟通成本。各个部门的间隔性导致数据孤岛的产生,数据将无法很好地进行统一集中处理找到合适的解决方法,更不用说大数据也无法产生其应有的便捷效加强各部门统一的数据网络,并构建合理的集中化分析体系。面对问题,相关开发人员可以开发各部门相联系的系统,把司法机关各部门掌握的碎片化数据结合在一起,使数据由分散走向整体,打破原有的数据碎片化模式。司法机关内部提高数据利用的整体化,让每个部门的工作人员都能使用整体化的数据,了解案情中发生的细节,让司法审判环节更清晰,结果更公正。

(三)我国司法大数据量化缺乏

其原因一是大数据起步时间较晚,近几年才进入我国,存在司法大数据理论的缺乏,因此判案基础较为薄弱。在本世纪初,美国的学者们就已经对当时美国法律实证研究现状进行了非常系统的批评。相较于美国,我国更是有更多的差距。其二是法院不愿意将裁判文书发布到网上,垄断数据,或是只发布一部分,发布的文书与应该公布的文书内容和数量相差甚远,所以说现今的司法数据还只是大数据一小部分。

裁判预测是基于法律规定及大量以往案件信息与法律后果之间关系的科学分析,对未决案件法律后果的一种或然性推测。大数据加入,使真正意义上的裁判预测成为可能。[5]在相当一部分案件中,合议庭、审判庭、审委会都可能就本案进行过讨论,但是这些讨论信息并不会出现在最后的裁判文书中,而是记录在其他地方,或者不记录。这也就是导致数据量化缺乏。

(四)数据准确率低遗漏点多

由于司法大数据存在着量化的缺乏,在这些少量的大数据的中,也有许多的暗礁。其中较为严重的问题是准确率低遗漏点多。在裁判文书中记载的当事人、审判案件、案件的真实性等问题都存在着非标准性,需要我们落实。所以,到目前为止,我们口中的“司法大数据”,还只是一个虚构的大饼。对于有志于从事法律大数据分析的人而言,现阶段只能画饼充饥。其一,上传的网上的许多文书都缺乏代表性,许多司法机关或律师事务所为了适应大数据的发展,将许多类似的案件全都上传到网上,使数据上传的十分随意,使原本精细的案例变得越来越“粗枝大叶”。其二,案件种类缺乏、新案件缺乏,例如,在裁判文书网中,赔偿类案件占比不到千分之一,且众多案件都是多年前的。司法数据不能及时的更新,便会影响司法判案的准确性。

三、司法判决数据利用的改进与发展

(一)拓展法律数据获取途径提高数据准确性

面对司法大数据存在着量化的缺失,以及准确性较低的问题,我们应如何解决?

首先,拓展法律数据获取途径和提高数据准确性,表面上看是两种不同的侧重点,但实际上它们两个是紧密相连的,是互补的。拟定的解决方法有下列三点:第一,完善法律数据库,例如:聚法案例库、无讼案例库、威科先行网、裁判文书网、这些法律数据库为我们查询法律条文、案例的时候都提供了很大的帮助,例如用裁判文书网进行鉴定案例的真假,用无讼案例库查法条。然而,即使有许多法律的数据库,也没有一个是可以进行全方位的查询,每个都有自己的缺点。因此,我们要完善法律数据库,提高科技手段,加大科技的投入,扩大司法数据的范围,使一个完整的数据库可以满足司法判案的全部需要。第二,另类的搜索源,例如,通过微信、知乎、博客等平台上的文章获取近期对大数据的统计。而有一些混淆视听的文章会误导群众,降低司法判案结果在社会上的影响力。为加强数据的准确性,我国出台《关于在案件审判中确保数据真实性准确性的规定》中规定两级人民法院以建立了电脑局域网,应当按照案件审判流程节点,确保案件相关信息的及时、真实、准确、完整输入,从源头上杜绝虚假的数据生成。

(二)司法大数据可以对判案情况进行预测

大数据作为海量数据的存储库,以重新整合、智能分析、数据重组等功能,找到许多不易被发现的规律,使对司法判案情况进行预测变得不再遥不可及。

在2017年,法国一年仅25周岁的青年,路易·拉海-查内设计了一个离婚诉讼结果预测软件,在法国受到了雷恩上诉法院、杜埃上诉法院及里尔律师公会的关注。该软件立足于已公开的250余万份司法判决,并进行大数据处理,能较准确地演算出法国各地不同类型离婚案件诉讼结果的概率,包括子女抚养权、离婚补偿金数额等。例如,在雷恩,如果女方当事人存在通奸行为,有孩子需要抚养,那么有34%的概率获得离婚补偿金,赔偿金的数额在0.8万欧元到3.2万欧元之间。而且,所提供的情况越详细,演算的结果越精确,越接近司法实务的现实状况。[6]这部预测软件一时间引起了法务市场的轰动。于是,法学界就此展开了热烈的讨论:运用大数据进行司法预测,真的会为司法界带来新的变革吗?

就目前来看,大数据的预测功能是其最受关注和热议的功能之一。利用其预测功能进行司法预测,既可提高司法办案的质量和效率,又可使司法无论从程序还是结果来看都更为公正。因此,美国在刑事司法中,利用数据库为量刑、假释、保释做出了较为准确的预测。例如,借助司法数据预测功能,美国公共安全评估预测软件的预测结果为保释程序带来诸多积极影响——在试点项目之后,夏洛特市将其审前羁押率降低了20%。[7]使用大数据技术可以实现对诉讼结果的分析,服务于审判预测。目前这项分析研究颇受民间关注,信用卡透支纠纷这一类型的判决结果呈现出鲜明的一边倒特点,即基本为原告银行胜诉。由于笔者无法靠人力抽取准确数字,故使用模拟数字制图如下:

然而,作为大陆法系的代表,我国实际应用大数据进行司法预测的情况并不多。其中技术发展不平衡问题是必须要重视的。想要更好地利用大数据预测功能为严肃的司法领域服务,就必须提高数据分析重组的功能。否则,数量庞大、形势粗糙的数据很難方便司法领域更准确公正地裁决判案。

结语

科技的进步带动各领域的发展,因此想要将司法判案与大数据深度融合,需要建立一个完整、智能的司法数据库。如今大数据科技依然以不可估量的势头更新发展,而对司法领域应用大数据却有些讨论不足。因此,人们应该增加对大数据的使用意识,推动司法与大数据的结合,从而改善应用效果,使大数据无论是协助司法判案还是进行预测等各个方面都得到拓展应用。

参考文献:

[1]2017 年12月 8日习近平在中共中央政治局就实施国家大数据战略进行第二次集体学习时的讲话。

[2]See generally Ric Simmons,Quantifying Criminal Procedure: How to Unlock the Potential of Big Data in Our Criminal Justice System,2016 Mich.St.L.Rev.948-949(2016).

[3]See Lyria Bennett Moses,Janet Chan,Using Big Data for Legal and Law Enforcement Decisions: Testin g the New Tools,37 UNSW Law Journal 643 -678 ( 2014) .

[4]程金华:《未来还未来:反思中国法律大数据的基础建设》,《中国法律评论》,2018年第2期,第162页。

[5]白建军:《法律大数据时代裁判预测的可能与限度》,《探索与争鸣》2018年第2期,第95页。

[6]施鹏鹏:《裁判可通过大数据预测》,http://m.china.com.cn/,2018.01.30.

[7]Shaila De wan, Judges Replacing Conjecture with Formula for Bail, N.Y. TIMES (June 26,2015).

[8]郭玉:《让数据发声:司法领域大数据的效用前瞻》,《法治论坛》,第44辑,第289页。

猜你喜欢
数据安全
数据安全治理的参考框架
工信部:未来三年,建立并完善电信和互联网行业数据安全标准体系
工信部部署推进2020年电信和互联网行业网络数据安全管理工作
部署推进2020年电信和互联网 行业网络数据安全管理工作
工信部:2021年初步建立网络数据安全标准体系
大数据时代的数字化转型如何实现数据的安全使用
直面热点问题提升网络数据安全保护能力
直面热点问题 保障数据安全
如何进一步做好网络与数据安全工作
数据安全政策与相关标准分享