大数据语境下司法统计的实证分析与经验借鉴

2017-04-15 07:23易万云
湖北警官学院学报 2017年2期
关键词:审判司法法院

易万云

(湖北省秭归县人民法院,湖北 宜昌443600)

大数据语境下司法统计的实证分析与经验借鉴

易万云

(湖北省秭归县人民法院,湖北 宜昌443600)

在大数据时代,司法统计口径与方法改革成为当下亟需解决的问题。我国法院司法统计人员多为兼职,审判信息数据尚未完全实现同步录入,数据挖掘方法有限,案件信息反哺审判工作较差,尚未形成统一的司法数据平台。借鉴美国司法统计局的实践经验,我国应建立一支高素质司法统计队伍,实现司法统一规范化,夯实基础数据准确性,搭建统一的司法统计数据平台,提高数据的分析运用水平。

司法统计;大数据;审判信息;基础数据;数据挖掘

引言

近年来,随着法院改革与信息化建设的不断推进,我国法院系统司法统计工作已经初步实现了电子化、数据化、规范化,并形成了海量的审判执行信息数据。然而,这些数据却长期处于“休眠”状态,分散在计算机系统与档案室中,无法实现数据价值,严重影响司法统计的发展与整体功能的发挥。

一、回顾:司法统计概述及历史演变

(一)司法统计之相关概念解析

1.从统计到司法统计

在汉语中,“统计”(Statistics)一词有合计、总计的意思,是指对某一现象有关的数据的搜集、整理、计算、分析、解释、表述等活动。我国2010年修订的《中华人民共和国统计法》第二条将统计的基本任务表述为“对经济社会发展情况进行统计调查、统计分析,提供统计资料和统计咨询意见,实行统计监督”。

随着统计实践的不断发展,统计作为一种定量认识问题的工具,与司法审判相结合而形成了一门新学,即司法统计(Judicial Statistics)。司法统计主要“研究如何用计量的方法来搜集、整理和分析司法领域的各种数据,以此来分析审判工作的现状,认识审判活动的规律”。[1]其与法学、统计学密不可分,但其研究对象又不同于法学与统计学,因此,司法统计具有独立的、不可取代的地位。

2.从司法统计到大数据

大数据(BigDate)是超出传统软硬件采集、储存等所有数据的集合,是从海量的、模糊的、随机的、不完全的数据中分析挖掘并提取出的未知的、难以察觉的有用信息。其能够揭示数据背后隐藏的规律和发展趋势,为辅助决策作出参考。

在数据信息膨胀的时代,司法统计的信息数据是大数据的重要组成部分。二者相辅相成,有机统一:一方面,司法统计是发展大数据的重要力量;另一方面,大数据也为司法统计的发展提供了新的平台与挑战。在法院,司法统计数据主要由各种数字、图像、音频、视频、人员资料、卷宗档案等组成,是对法院工作最原始、最直观的反映。①因本文篇幅有限,本文所指司法统计仅限于法院,下文不再赘述。对人民法院而言,海量的数据信息已经成为宝贵资源,司法统计在人民法院工作中具有基础性、全局性、战略性地位。

(二)司法统计发展之历史回眸

司法统计作为一种搜集、整理数据资料的社会实践活动,有着悠久的历史。上世纪五十年代开始,司法统计工作已经启动。除1968年1月至1972年12月“军事管制”期间中断外,基层法院的司法统计工作由专职或兼职统计人员负责,各业务庭、人民法庭每月定期向法院报表,统计员汇总,法院领导审核后报送上级法院。各基层法院至今基本延续着此“层层上报”方式。

人民法院先后使用了六套制式报表,依次为1982年前制表、1983年制表、1988年制表、1993年制表、1997年制表、2002年制表。1982年前,法院司法统计的类别较少,只填报“刑事初审案件情况统计”与“民事初审案件情况统计”两类。其中刑事、民事案件有关的单项统计报表6张,信息项4557个,实行月报制、季度汇总、半年汇总、年度汇总,在上级法院规定的时间内完成司法统计工作上报任务。后根据最高人民法院《全国法院司法统计细则》以及全国第一次、第二次司法统计工作会议精神要求,司法统计工作制度被进一步修订与完善,司法统计工作全面升级。截至2002年,司法统计类别增至九类,分别增加了“经济纠纷一审案件统计”“行政一审案件统计”“刑事、民事、经济、行政案件的审判监督统计”以及“执行案件统计”等类型,单项统计报表46张,信息项77399个[2],案件统计更加系统、全面。前四套制式报表均为手工填报。随着时代的进步,计算机操作逐步取代了传统的填报方式。近年来,最高人民法院以逐步规范司法统计工作为宗旨,相继出版了《案件信息管理与司法统计》《人民法院案件质量评估体系理解与适用》《关于人民法院案件案号的若干规定及配套标准》等若干书刊,涉及司法统计工具使用、统计指标分析、案件案号、类型代号等方面。

二、审视:H省Y市基层法院司法统计工作运行现状

笔者所在的法院属于H省。目前司法统工作主要通过通达海审判管理系统与紫光华宇司法统计软件(1.8.9.9版)完成:案件收、结案等基本信息录入后,司法统计报表在系统同步自动生成数据;核对表内、表间关系无误后,将数据对接至司法统计软件,待汇总后向上级法院层报。Y市基层法院是H省具有代表性的法院之一。对Y市基层法院的司法统计工作情况进行实证调查,可以折射出H省法院司法统计工作的现状。

(一)司法统计人员多为兼职,专业能力有限

Y市16家基层法院中从事司法统计的人员有16名。从司法统计人员的教育背景、兼专职上看,15人为法学专业,1人为计算机专业,无统计学相关专业的人员。同时,仅4人为专职司法统计人员,其余12人为兼职司法统计人员(同时兼任审管办、研究室、办公室、审监庭等两三项工作)。

从司法统计人员的工作年限和工作经验来看,从事司法统计工作五年以下的有12人,五年以上十年以下的有2人,十年以上的仅2人。其中,五年以下工作年限的人员绝大多数为初入法院、尚无审判业务经验的法学专业本科毕业生,仅4人有审判业务经验。

司法统计是一门技术性、专业性很强的工作,对司法统计员的综合能力要求颇高。它既需要一定的统计学方面的知识,还需要一定的计算机操作水平及审判业务经验。司法统计员只有集三项技能为一身,方能在司法工作上触类旁通,游刃有余。Y市法院司法统计员的专业及学历结构单一,长期专职从事司法统计的实务人员匮乏,在一定程度上束缚了司法统计工作向多元化发展的可能性,难以满足大数据下司法统计“大格局”的实现。

(二)审判信息数据未完全实现同步录入,数据难优

审判信息数据录入是数据的“入口关”。调研发现,H省Y市16个基层法院信息已初步实现了案件信息的同步网上录入,但仍有少数法院沿用专人负责、结案后逐案录入的传统模式。网上同步办案是当今人民法院实现信息化、大数据战略的新要求。全省三级法院除了不能公开的案件外,法官需随着办案进度将所有卷宗材料同步录入统一的网上办案系统,实现网上立案、节点流转、审限追踪、结案等全部流程,形成一套动态的、全面的、海量的审判执行数据。然而,仍有少数法院出于严格控制流程节点的顾虑,将网上报结案权限收归该院审管办、审监庭或研究室司法统计员负责,待案件信息核对无误后再逐案录入结案信息。该种方式虽然有效控制了结案的随意性,但是审核信息未实现同步,徒增司法统计员的工作量,司法统计数据滞后。

同时,信息同步录入中仍存在诸多主客观因素,影响数据的准确率。一是责任心不强。不论是司法统计员专职录入还是法官同步录入,都需要工作人员具备较强的责任心。部分工作人员思想涣散,重审执,轻数据,网上信息数据与实体卷宗形成“两张皮”。二是司法统计系统(紫光华宇软件)报表在无人监管的情况下可任意修改,只需手动人工配平,亦可造成司法统计报表与实际审判数据存在误差且难以纠正。三是司法统计软件自身存在缺陷,通达海系统数据转换为紫光华宇司法统计软件时,部分数据难以对接,案件类型、结案方式设置不科学,造成部分数据缺失,因而数据的真实性与准确性不能完全得到保证。

(三)数据挖掘方法有限,数据难得

海量的审判数据信息存储于庞大的电脑系统中。欲实现数据的巨大价值,关键在于对数据的挖掘方式与“提纯”技能。在设定的口径内得出有价值的数据越充分,司法统计数据与分析就越有实践意义。

数据挖掘是司法统计工作的前提。笔者以Y市Z基层法院50名工作人员为样本,对基层法院工作人员挖掘数据方式进行了抽样调查。该样本涵盖了员额法官、法官助理、书记员及司法行政人员。数据显示,该院挖掘数据主要以司法统计软件汇总与审判管理系统手动查询两种方式为主,以下级部门报送数据和其他方式为辅(见图1)。

图1 挖掘数据方式比例图

通过司法统计软件取得数据的方式可以快速统计出案件受理数、结案数、结案率、调撤率、结案方式、诉讼标的额等基础数据。然而,由于司法统计软件的数据为电脑自动合成,其程序设定的公式固定、类型有限,不能完全涵盖所有需求信息项目。例如,统计行政非诉审查与执行案件的结案方式,在司法统计软件中只显示了裁定准予执行与裁定不准予执行两种结案方式,未设置撤诉项的数据,因而尚需结合审判管理系统手动辅助查询才能知晓撤诉数。若穷尽两种方式仍不能得到数据,就只能通过各个业务部门及下级部门报送或者其他形式取得,如报送司法救助案件数与发放救助金金额、社区矫正情况、涉港澳台司法协助情况、妇女及未成年人犯罪情况等等。

随着大数据时代的到来,社会对司法数据的需求量更大、涉及面更广,可能涉及审判案件的程序运行、法律适用、效果评价等。但在现有条件下,人民法院很难得到这些珍贵的数据,就算是勉强得到,数据也不完整,不具有参考价值,故而无法准确、完整地反映司法活动全貌。

(四)案件信息反哺审判工作效果较差,数据功能难彰

在司法统计的数据分析与运用上,Y市绝大多数基层法院都编写了本院的审判执行工作管理通报。该通报多为该院审判管理部门对内监督管理的手段,在法院系统内部发布。其内容多为通报每月、每季度、半年或者全年的审判执行工作情况,是对前期工作情况的总结性分析,用于通报办案进度、统计工作量等,但预测性或建议性的司法统计分析较少。数据开发利用意识欠缺,司法统计信息的服务审判、决策参考的巨大潜力尚未开发与运用,数据多处于“沉睡”状态[3],没有充分发挥数据的预测功能,信息资源浪费严重,庞大的数据库只能束之高阁。

(五)尚未形成统一的司法统计数据平台,“数”出多门

法院涉及的审判执行信息数据繁杂,每个案件都涉及当事人基本信息、适用程序、法律适用、裁判结果等上百个信息项。H省每年受理案件五十万件左右,每年网上录入案件信息项至少五千万个。近年来,由于司法统计软件多头开发,对司法统计数据又缺乏整合,审判执行信息数据分散在多个系统之中。以Y市为例,Y市基层法院的办案软件较多,有通达海系统、紫光华宇系统、司法文书直报系统、司法文书信息屏蔽系统、执行信息公开系统、涉外司法协助管理系统、质量绩效评估系统、强制医疗填报系统等。其数据不仅存储于几个系统之中,还涉及内外网之间的转换。数据内容存在交叉和重复统计,无法实现信息对接和数据交换,因而统计数据时操作较为复杂,统计数据难以集中存储。

三、借鉴:以美国司法部司法统计局实践为例

我国法院现有的司法统计有相对坚实的信息收集、加工整理的组织、人才和技术基础,但与发展法院“大数据”战略的形势相比,司法统计职能过于狭窄,组织机构相对单薄,部分制定标准以及规范、指导、监督信息活动的职能缺失。

早在19世纪,美国就出现了比较正式和系统化的司法统计。1979年12月27日,美国司法部司法统计局(theBureauof Justics Statistics intheU.S.DepartmentofJustice)正式成立。这一具有司法领域统计职能的专门机构的成立,标志着美国司法统计制度有了重要的组织机构保障。司法统计局成立以来,美国已初步形成一套以司法统计局为协调机构,涵盖司法各个阶段的多种统计类型,官方及非官方渠道相结合,定期或不定期出版调查统计资料的司法统计制度。

司法统计局是美国司法部下设的一个统计部门,是“美国司法案件统计、司法信息标准制定、发布、管理以及调查研究等方面的唯一机构,是真正的司法信息中心”。[4]在人员配备方面,司法统计局由五十多名全职员工组成,其中有50%以上的人员为专业统计人员。司法统计局设局长及副局长一名,局长全面主持工作,副局长分管统计业务处。在部门设置方面,目前司法统计局设4个行政办公处(研究与公共政策事务处、规划管理与预算处、出版发展与鉴定处以及出版与电子发布处)和5个统计业务处(刑事统计增强项目处、犯罪测定的方法学与制度支持处、执法、审判与联邦统计处、受害统计处以及矫正统计处)。[5]在经费保障方面,司法统计局每年收到直接拨款大约2500万美元左右,保障统计工作的有效展开。据总结,美国司法统计在数据的收集与分析上有以下明显特征:

(一)数据来源渠道广,数据更“接地气”

与我国司法统计数据仅来源于法院内部不同,美国司法统计数据来源较为广泛,一方面有来自警察、法院、矫正机构等官方渠道的一手资料,另一方面也有受害调查、自报调查等非官方或民间渠道。而后,司法统计局再对多渠道得来的数据进行整合:大体上以官方渠道,即司法系统各部门已掌握的情况为主,以非官方或民间渠道,即未被司法部门掌握的情况为辅。二者相互结合,使数据不浮于表面,更加详实和有说服力。

(二)数据采集模式成熟,方式灵活多变

司法统计局在采集数据上一般采取全面调查与抽样调查两种方式。全面调查虽然成本较高,但调查准确全面;抽样调查统计成本较低且设计科学,可根据工作需要和工作条件灵活选择较为适当的统计方法。在数据资料收集的时间上,有成为常态的调查统计,如一年或五年一次,也有不定期的、临时的专项调查统计。比如,美国司法部司法统计局在做“执法统计”时,对全国1.8万多个执法部门的抽样样本数据进行分析,联邦、州以及地方执法部门的普查以及校园执法部门调查定期举行,针对少数民族和女性人员比例、人员教育和培训要求、交通工具的类型和数量、薪水和特殊津贴等进行研究。反观我国,司法统计一般采取全面调查的方式取得数据,由法院各业务部门进行逐案登记,然后层层汇总、上报,抽样调查的统计方式很少甚至没有,统计方式及时间设置较为“程式化”。

(三)数据收集汇总方式细致,数据“有备无患”

司法统计局工作时,既注重通过报表汇总的方式收集汇总数据,又重视收集“单元记录数据”。两种方式的最大不同在于前者是一种合成数据,后者是一种最原始的基础数据。由于汇总数据大多是通过既有公式合成的,只能得出相对应的数据汇总结果,若还需要对既有公式以外的数据进行分析,则很难通过报表看出来。此时,“单元记录数据”便是一种有效弥补汇总数据不足的方式,可以通过最原始的数据加加减减得出需要的答案。由此可见,在司法统计发展较为成熟的美国,司法统计报表也不是万能的,并不能窥见所有想知道的数据。在重视司法统计报表的同时,更应作好原始记载,收集一手资料,做到“有备无患”。

(四)数据统计分析运用到位,让数据“开口说话”

美国犯罪统计的统一犯罪报告与全国犯罪受害调查是诠释美国数据运用分析的范例。统一犯罪报告从1930年起一直延用至今,“是一种基于警察自愿报告的犯罪资料收集制度,由司法部联邦调查局负责组织实施。一般认为统一犯罪报告所统计的数字覆盖了全国97%左右的人口范围,因此统一犯罪报告所提供的犯罪率等资料,在相当程度上能够反映出美国犯罪的基本态势”,[6]受到广泛关注。全国犯罪受害调查是一个在全国样本中收集的关于犯罪受害的影响、后果及频率等数据的统计,被更多的公众和领导者作为参考依据。公众可以从中理解犯罪的性质,评估可能遭受何种犯罪侵害的概率;领导可利用报告中的数据,研究和制定打击、预防犯罪的重点与对策。

(五)重视信息化手段运用,助力司法统计

美国司法统计的跨越发展离不开信息化水平的飞跃。例如,美国联邦监狱系统安装了SENTRY信息管理系统。该系统不仅提高了监狱罪犯管理信息化水平,而且为矫正统计提供了许多有用的统计资料。高科技的不断开发运用为提高司法统计的准确率及工作效率提供了重要的帮助。

四、践行:司法统计口径与方式的改革构想

我国人民法院的司法统计工作尚有不断进步与上升的空间。在大数据时代背景下,结合我国司法统计存在的问题,应从以下几个方面予以改革和完善。

(一)转变观念,建立一支高素质司法统计队伍

一方面,要转变观念,树立大数据意识。要转变思维方式,摒弃传统的工作管理模式,重视数据,逐步向数字化、智能化、精细化数据管理靠拢。审判大数据是基石。要学会借助审判大数据的优势,提升司法统计的职能,反哺审判执行工作。

另一方面,各法院应配备若干政治素养好、业务素质高、稳定性强的司法统计人员,专职负责全院司法统计工作,不再兼职与司法统计无关的工作。各审判业务庭配备一名书记员,专职负责庭内司法统计数据的收集、填报和录入,形成由审管办或研究室统一指导、归口管理、分级负责的司法统计队伍结构和对外统一口径、统一发布、统一协调的工作格局。由于司法统计是一门专业性、综合性较强的工作,对工作人员的统计、法律、计算机等水平要求较高,应加大各法院的司法统计人员参加司法统计培训的力度,保证在大数据时代不掉队、不作假;同时应加大对司法统计人员的激励机制,保证职级待遇,保持队伍的相对稳定。

(二)实现司法统计规范化,制定全国统一的司法统计标准

近年来,司法统计工作虽然有司法统计报送规则、统计工具运用等基本规范,但是对统计报表和统计原始资料填报规则缺乏详细规定。因此,需要制定全国统一的司法统计标准,解决统计范畴、案件界定、案件分类、收结案标准、案件节点流转等司法统计基础问题,实现司法统计工作的规范化、标准化。同时,“建立以统计技术部门为主导、审判业务部门和审判管理部门共同参与的司法统计信息标准制定机制,信息技术部门负责相关标准在信息化建设中的技术性规格,彻底改变多头制定司法统计信息标准的现象”。[7]

(三)严把数据“入口关”,夯实基础数据准确性

基础数据的准确性与否直接影响司法统计的真实性。目前,司法统计原始数据的提取是通过案件的收、结案卡片的信息来提取的。而司法统计报表自动生成后,其核对方式是通过表内核对、表间核对进行的,并不能对整个案件卷宗情况进行比对。因此,要准确找到数据,尚需查看卷宗材料。司法统计自动生成的数据不完全准确,且难以核对。

除去填报信息数据的失误和司法统计软件的不完备外,可以考虑在数据录入的源头下功夫,建立一个表格式的裁判文书模板。整个裁判文书的模板可按照不同案件类型进行划分,如按照当事人信息、诉讼请求、诉辩意见、争议焦点、法官分析及判决结果分类填写。在设计模板时,民事案件的裁判文书可以侧重案由、结案方式及结案标的;刑事案件的裁判文书侧重当事人信息及判决最终结果;行政案件的裁判文书侧重案件信息的案由及审理的最终结果;执行案件的裁判文书侧重案件信息的结案方式及结案标的情况等;以上信息均单独列表。当法官在该裁判文书模板上制作对应的裁判文书后,该系统便自动透过文书提取了该案件的绝大部分有效信息。这样就杜绝了书记员录入收结案信息时因操作失误而造成信息填写失真的现象。

(四)拓展数据的挖掘方式,搭建统一的司法统计数据平台

随着信息化技术运用的不断深入,人民法院建立了统一的网上办案系统,初步实现了网上同步办案。除了不能公开的案件以外,案件均同步录入办案系统,实现案件网上流转。同步录入的信息形成司法统计数据的基础。

应依托网上同步录入办案信息的建设,搭建统一的司法统计数据平台,突破“数”出多门的桎梏,实现对信息数据的科学调度。将案件质量绩效评估、裁判文书上网、案件质量评查、发回重审、改判和指令再审等作为新的调查方式嵌入网上办案系统,从而实现对类案审理、审判质效、法官绩效等相关自定义主题内容的实时查询和自动分析,为审判工作的开展提供数据支撑与服务决策。[8]与此同时,仅针对人民法院内网数据统计受理数、结案数、结案率、调撤率、结案方式、诉讼标的额等已成为过去式,还应当定期或不定期与公安机关、人民检察院等部门的数据联动,采取走访调查、抽样调查等方式,对数据进行收集、挖掘、分析。

(五)提高数据的分析运用水平,用数据辅助决策

司法统计旨在司法领域的分析与运用。人民法院司法统计工作应当突破司法统计填报表格、汇总数据的传统,从被动统计、单项服务向能动统计、多元化服务转型,提高数据分析与的运用能力与水平。在数据的分析与运用方面,可借鉴北京法院的做法。“北京法院通过对法院审判工作与案件特征的长期、深入分析,结合数据仓库与数据挖掘技术建立数学统计模型,把孤立的案件之间建立起联系,提供数理统计、预测、挖掘等高级数据分析功能,形成了系统主题应用,获得各种视角的统计分析结果,包括执行案件终结与中止情况、商业贿赂犯罪情况等专题分析……”[9]同时,司法统计数据与资料不能仅限于法院内部流转,还应定期公开发布相关统计数据,使其他司法机关、高等院校、法律团体组织及调研机构能够充分利用司法统计资料,研究社会现象,预测犯罪趋势。

结语

面对我国法院系统“数据信息膨胀,实践运用匮乏”的现状,司法统计工作改革之路任重而道远。司法统计工作的革新不能一蹴而就。其涉及审判信息录入、审判流程管理、信息化基础建设等方面,还有许多理论问题有待进一步论证与解决。笔者坚信,随着法院司法统计的改革的不断推进,司法统计的困境会一一破解,从而成功借助大数据之力,最大程度发挥司法统计之职能。

[1]最高人民法院研究室.司法统计基础与实务[M].北京:人民法院出版社,2007:17.

[2]吕瑶,时小云,蒋敏,邱素芳.挖掘审判大数据实现资源全运用[N].人民法院报,2015-07-23.

[3]严戈.人民法院发展“大数据”战略的思考[N].人民法院报.2014 -08-06.

[4][6]郑霞泽,周勇.美国刑事司法统计制度概述[J].中国司法,2007 (5).

[5]周勇.美国刑事司法统计制度及其借鉴[J].河南司法警官学院学报,2006(2).

[7]吴红艳,夏南.司法统计发展路径的实证研究——以成都市中级人民法院司法统计历年档案为依据[J].法律适用,2011(4).

[8]王海萍.依托信息化运用大数据实现司法统计工作现代化[N].人民法院报,2015-06-11.

[9]李璐名.司法统计在庭审科技化进程中的应用与发展[J].商场现代化,2012(21).

【责任编校:王 欢】

Empirical Analysis and Experience Reference of Judicial Statistics in the Big Data Context

Yi Wanyun
(Hubei Province Zigui Couty people's Court,Zi Gui 443600,China)

In the era of big data,how to reform the caliber and method of judicial statistics,that become an urgent problemneed tosolve.At present,most ofChina's justice statisticspersonnelare part-time,synchronizationrecordingof trialinformation data has not been fully realized,the method of dig into data is limited,the cases information to support the trial work is worse,and a unified data platform has not been formed.According to learning from the practical experience of the United States Bureau of Justice Statistics, China should establish a judicial statistics team whit high quality, realizing the unification and standardization of judicature, tamping the accuracy of basic data, building a unified data platform for judicial statistics, improving the level of data analysis.

Judicial Statistics;Big Data;Trial Information;Basic Data;Dig into Data

D926.2

A

1673―2391(2017)02―0095―06

2017-02-12

易万云(1987—),女,法学硕士,湖北省宜昌市秭归县人民法院审判管理办公室、审判监督庭书记员,研究方向为民商法。

猜你喜欢
审判司法法院
制定法解释中的司法自由裁量权
百姓拆迁心结一朝化解法院主持调解握手言和
司法所悉心调解 垫付款有了着落
非正式司法的悖谬
班里设个小“法院”
我国法院在线调解的兴起、挑战与未来
“五个到位”推动未成年人案件审判试点工作
裕仁天皇如何逃过审判
论人民调解与法院调解的衔接配合
消失中的审判