类案检索系统的应用现状与优化进路

2022-03-09 01:50谭小彤庞丽

山东法官培训学院学报(山东审判) 2022年1期

谭小彤庞丽

统一裁判尺度，是确保法治权威性和统一性的应有之义，也是司法作为社会公平正义最后一道防线的必然要求。基于对统一裁判尺度抱持强烈的需求与期待，各项类案检索智能应用应运而生。①参见左卫民：《如何通过人工智能实现类案类判》，载《中国法律评论》2018年第2期。但受通用大数据理论影响和限制，现有类案检索系统存在数据真实特征模糊、脱离法学理论和法律思维、检索供需不平衡等问题。本文从大数据理论分析视角出发，提出对智能类案检索系统优化重构，通过自然语言分析和机器学习等技术，解析裁判数据并自我学习进化以实现快速匹配同案类案的功能，为司法审判提供辅助决策信息，向社会公众提供法律规范、裁判规则参考的系统化应用。

一、类案检索低效利用之现实

（一）类案检索应用现状

1.类案检索规范发展情况

2013年通过的《最高人民法院关于人民法院在互联网公布裁判文书的规定》①法释〔2013〕26号，该规定现已失效。目前执行的是于2016年7月25日由最高人民法院审判委员会第1689次会议通过的法释〔2016〕19号《最高人民法院关于人民法院在互联网公布裁判文书的规定》。要求自2014年1月1日起,法院生效裁判文书应当统一在中国裁判文书网公布。自2014年起该网站的民事裁判文书年收录量呈现飞跃式增长，为此后各类类案检索系统的诞生提供了坚实基础（见图1）。

图1 中国裁判文书网2011—2021年每年收录民事案件裁判文书数量对比（数据截至2022年1月17日22时）

之后的《最高人民法院司法责任制实施意见（试行）》《最高人民法院关于进一步全面落实司法责任制的实施意见》，明确规定“类案与关联案件检索”机制和强制检索机制。2020年7月发布的《关于统一法律适用加强类案检索的指导意见（试行）》（以下简称《指导意见》），在总结人民法院类案检索实践经验的基础上，围绕类案界定、强制检索、检索平台、检索范围和顺序、结果运用、反馈回应、法律适用分歧解决等提出了明确的指导意见，进一步规范完善了类案检索制度，①参见刘树德、胡继先：《关于类案检索制度相关问题的若干思考》，载《法律适用》2020年第18期。是目前指导类案检索系统研发的重要制度依据（见图2）。但审判实践中难以精确检索到贴切的类案用以裁判参考，理想与现实的矛盾急需解决。

图2 《指导意见》规定导图

2.四大热门检索系统比对

我国类案检索系统中目前使用较多、针对性较强的有四大网站，分别是中国裁判文书网（wenshu.court.gov.cn）、法信（www.faxin.cn）、北大法宝（www.pkulaw.com）、聚法案例（www.jufaanli.com）。此外，各地法院也自主研发了不少类案检索系统，例如重庆市法院的“民事类案智能专审系统”②重庆市高级人民法院信息技术管理处：《【成果巡礼】号外！重庆市法院民事类案智能专审系统开通了》，载微信公众号“智慧法院进行时”，2018年12月29日。、浙江金华市中级人民法院与金东区人民法院的“类案大数据分析平台”③浙江省金华市中级人民法院：《【成果巡礼】人工智能大数据助力司法审判——浙江金华中院研发类案大数据分析平台》，载微信公众号“智慧法院进行时”，2018年7月13日。、北京互联网法院的“知识地图”系统④参见刘玄：《上线了，北互线上首次应用！北互上线“诉讼风险分析”与“知识地图”信息系统》，载微信公众号“北京互联网法院”，2020年11月9日。等。

前述网站中，中国裁判文书网原本仅是面向案件/文书检索，但近年经不断更新改版逐渐满足用户高级检索需求，四大网站均设置了案件名称、案由、法院名称等基础元素，同时还能直接检索争议焦点、本院认为、裁判结果等用户更为关心的人性化元素。在此基础上，每家网站支持的检索项目又有所不同（见表1）。

表1 四大类案检索网站高级检索项目对比

对于无效检索行为的自动修复功能，中国裁判文书网、法信与北大法宝会在未能精确匹配到符合用户需求的案例时自动切换成“全文+模糊”模式，聚法案例则会提示用户是否需要“切换成模糊检索”。整体而言，法信与北大法宝在检索用户体验方面设置更为人性化。

相比其他类型案件，民事案件更具有案由繁多、法律关系复杂、案情多变、数量巨大等典型特点，类案检索需求量巨大，但四大检索网站的检索方式仍为关键词检索，检索结果并不精准。目前尚未研发推广一个针对民事审判工作的专业化、智能化的类案检索系统，导致《指导意见》列举要求形同虚设。

（二）现有系统共性问题表征

本文对G省J法院的类案检索系统使用情况进行了调研（见图3、图4、图5），五分之一的法官或法官助理均不进行类案检索，大多数法官反映经常检索不到预期的结果，尤其是承办疑难案件较多的资深法官检索需求很大但对检索系统满意度偏低，普遍反映关键词检索不精确，检索到大量不相关的简案文书或检索不到相关裁判要旨，久而久之放弃使用检索系统。

图3 类案检索使用频率

图4 类案检索系统使用感受

图5 类案检索系统存在的问题

虽然不少学者在技术、制度改进上提出了方案，①参见王禄生：《司法大数据与人工智能的技术障碍》，载《中国法律评论》2018年第2期；周佑勇：《智能技术驱动下的诉讼服务问题及其应对之策》，载《东方法学》2019年第5期。近两年四大网站也在提升用户体验感上进行优化，但仍表现出共性问题：第一，检索数据不够精准，关键词检索容易导致检索结果范围过大、过小或误筛正确类案，且需求量小的简案数量反而较多；第二，检索出的类案往往只是文本形式或用词用句相似的案件，法官最关心的类案裁判规则呈现较少；第三，检索结果受限于数据来源限制，文书之外案件信息体现不足；第四，审判与技术复合型人才较少，检索系统设计忽视审判实践需求，《指导意见》实施现状与设想仍有差距。

二、类案检索低效利用之成因

（一）本体论：数据通说特性难以适用

普遍认为大数据具有“4V”特性——海量性（volume）、高速性（velocity）、多样性（variety）、价值性（value）。②参见王禄生：《论法律大数据“领域理论”的构建》，载《中国法学》2020年第2期。即认为数据应具备样本量大而全面、体量及处理速度显著增长、多结构数据自动高效处理和整体样本价值性等特性，但是否完全符合裁判大数据真实特征值得商榷。

第一，数据规模体量并非根本特性。若海量简案裁判数据背后所指向的裁判规则一致，则法官仅需一个简案类案即可，因此更应关注数据分析、加工、利用的可处理性，如何在庞大体量的裁判数据中准确检索到所需裁判理由和依据是法官更关心的问题。

第二，数据处理速率并非核心需求。给予类案信息识别、提取、筛选、训练、反馈的时间相对充裕，对于实时计算的需求在所有领域中并非最高。在大数据领域发展大背景下，当前裁判数据处理速度足以满足类案检索需求，不“图快”而“图精”才是用户核心需求。

第三，数据内容类型并非仅限文书。裁判数据载体多为裁判文书，其在结构上具有相对固定、规律的表达，各部分位置大致相同且均有明显标识，因此数据技术处理更集中于自然语言表达分析。庭审视频、证据音频、图片等重要数据资源也承载大量案件信息，可受限于技术障碍和开发成本未能得到重视，利用程度有限。

第四，数据价值密度并非整体利用。大数据“价值性”是基于深度学习海量数据以实现未来行为预判，当个体数据样本集成一定量整体才具有利用价值。但判例价值均在于个案示范效应，即便是我国作为非判例法国家，最高人民法院发布的指导性案例也具有极高的个案价值。如果疑难案件、新类型案件的裁判规则库存一成不变，则无法适应司法领域的“创造性演变”。①参见王禄生：《论法律大数据“领域理论”的构建》，载《中国法学》2020年第2期。因此，在单个指导性案例或典型案例中提取的知识价值要高于归纳海量简案裁判共性规则价值。

明确裁判数据的核心数据特征是类案检索系统的构建基础，在数据本体论构建出现模糊数据特征的情形下，盲目追求数量规模、处理速度、样本形式、数据价值，导致类案检索系统成效不佳。

（二）认识论：知识发掘逻辑存在问题

当前大数据研究在认识论上强调依靠已有数据、技术工具和集中变量相关性。因此法律思维推导、裁判规则归纳、检索结果表达与检索数据的演算过程存在巨大差异，导致裁判数据基础庞大，但输出利用率低下。

1.法理构建的思维差异

大数据分析强调从现有数据推导行为，即“追求相关、放弃因果”②[英]维克托·迈尔·舍恩伯格、肯尼思·库克耶：《大数据时代：生活、工作与思维的大变革》，盛杨燕、周涛译，浙江人民出版社2014年版，第68页。。类案检索系统正是在这一认识论基础上，借助数据挖掘技术从海量裁判文书、卷宗材料等非结构化、半结构化数据中发现法律适用规律并加以应用。③参见王禄生：《论法律大数据“领域理论”的构建》，载《中国法学》2020年第2期。然而经典三段论的法律思维是“在规范与事实之间循环往复，建立案件事实和法律规则之间的涵摄关系，进而推导出结论”④杨先德、陈禹橦：《类案检索运用场景与规则方法》，载《检察日报》2020年2月22日，第3版。，将结论共识凝结的过程即为司法行为。⑤参见马长山：《面向智慧社会的法学转型》，载《中国大学教育》2018年第9期。两者思维模式差异导致类案的因果关系和说理解释并不充分。

2.内容获取的数据壁垒

类案检索的根本目的在于利用生效案件裁判内容为待决案件提供已经检验和凝练的规则或标准。法官通常情况下看到的是裁判要旨，但更希望看到由此表现出的裁判规则。⑥参见张骐：《指导性案例中具有指导性部分的确定与适用》，载《法学》2008年第10期。因此，类案检索不是单纯寻找类似案件裁判结果的过程，更是寻找提炼出的法律规则的过程。且往往疑难复杂案件、新型案件才需要案例进行指导、约束。目前系统中只有数量占比极小的指导性案例、公报案例附带裁判要旨，而其他案件并无直接体现裁判规则，即便法官能够检索出一定数量这样的类案，对待决案也用益不大。此外，当前系统所收录的裁判文书效力一般不予标明，导致检索出大量相关文书后还需要逐一复核。

3.结果表达的技术阻碍

检索系统一般从定性和定量两方面对裁判数据进行分类解析。定性是指按照案由、法律关系进行宏观标注分类；定量是指“要素式分解”，即依照预设关键词解构具体案情。最后使用了文本词频统计方法和语义层次结构方法计算相似度，①参见王君泽、马洪晶、张毅、杨兰蓉：《裁判文书类案推送中的案情相似度计算模型研究》，载《计算机工程与科学》2019年第12期。将案件信息转化为代码、符号等程序语言。目前关键词检索不能给予用户精准检索结果，其因有三：第一，经关键词检索出的数据过大，即使用户输入关键词缩小范围，也仍需人工逐一查阅筛选；第二，由于用户与系统间拟定关键词的差异，“在结果中检索”新的关键词容易错误筛除检索结果；第三，检索结果呈现不够简洁精准，无论是裁判文书标题还是裁判要旨的呈现均不够明晰。

（三）方法论：检索机制矛盾尚未解决

类案检索如果不能正视现有矛盾，则必然脱离实践，致使研究轨道偏离。

1.法官检索需求与研发技术门槛之间的矛盾

长期以来，法律大数据的研发奉行技术主义，类案检索系统研发与应用过程中也出现了技术人员与法学专家脱节、技术开发与审判一线需求分离的现象。学者约翰·梅利曼早前曾指出类案检索之内在动因——前案判决权威、不愿独立思考、不甘冒险被上诉撤销。②参见[德]约翰·梅利曼：《大陆法系》，顾培东、禄正平译，法律出版社2004年版，第47页。基于前述三种原因法官自发进行检索。然而必须与数据打交道成为法官参与类案检索系统研发的先天技术门槛，薄弱的数据运用能力可能导致系统开发程度流于浅层甚至产生谬误。反之，如果单纯依靠大数据技术研究人员，则很难把握裁判文书的用词、语义以及更深层次的关联。目前常用的“词频—逆文本词频模型”（TFIDF），将文本按照词汇划分，根据词汇出现频率来计算两篇文书的相似度。但由于法官表述差异，采用TF-IDF模型计算分析出的类案只能说是两篇写法高度相似的文书。

2.简案供过于求与难案供不应求之间的矛盾

类案检索存在一条供需悖论：能被大量检索到的都是简案类案，法官所需要参照的典型疑难类案又没有数据或极难检索。这导致“降低了法官的用户体验和使用意愿”③魏新璋、方帅：《类案检索机制的检视与完善》，载《中国应用法学》2018年第5期。。一方面，大多数简案的检索意义不大。首先，大部分法官基于自身经验和知识积累，对于某类反复出现的案件自然而然形成了裁判规则，无需参考类案；其次，当前法院案多人少，如果简案也进行类案检索势必使法官不堪重负。另一方面，《指导意见》规定的强制检索情形也是针对疑难复杂案件而设计。目前各大系统大量收录简案裁判文书，往往因文书撰写较为简练没有体现裁判规则，能够提供给待决案件解决疑难问题的裁判思路有限。

3.类案冲突处理与裁判统一尺度之间的矛盾

类案检索的最终目标是实现裁判尺度统一，然而目前的系统大多还停留在发现类案的层面。类案类判、同案同判的关键是统一的裁判思路和规则，理想状态就是法官只需通过检索出类似案件并参照类似案件的裁判规则完成法律适用。但审判实践的情况要复杂得多，检索出的类案群所蕴含的裁判规则往往也是多元的，①参见孙海波：《类案检索在何种意义上有助于同案同判？》，载《清华法学》2021年第1期。当类案群所提供的裁判思路和规则不一致甚至相互对立时，法官又需要解决规则适用问题。

三、智能类案检索系统之规制设想

（一）求同存异：集成“3C”特性数据样本

为解决前述本体论问题，智能类案检索系统的数据应在汲取“4V”特性合理性的基础上明确“3C”特性。

1.准确性（correctness）：类案标准的界定

要检索出适合的类案，前提必须明确类案数据的标准，即何以判断案件是否“类似”。根据《指导意见》，案例之间“类似”的标准至少包含基本事实类似、争议焦点类似、法律适用类似。事实类似是案件类似的首要标准，但客观上并不存在完全一致的案情，如果将检索关键词设定过窄则可能导致无效检索。因此事实“类似”只需限定为指向争议焦点而影响裁判的关键法律事实一致即可。例如，盲人因盲道设计缺陷摔倒受伤和路人因道路井盖损坏坠落受伤两起案件，看似个体情况、受伤原因均不相同，却可提取“当事人因为市政工程不完善而受到人身损害”的共性。②参见黄凯柯：《如何检索“类案”？详细方法来啦！》，载微信公众号“最高人民法院司法案例研究院”，2020年12月1日。但目前系统预设的案情要素却往往难以提取共性信息。并且仅关键事实一致仍不足解决部分复杂案件时就需要系统提供争议焦点和法律适用具有一致性的案例。

2.兼容性（compatibility）：数据处理的适配

智能类案检索系统应更强调数据兼容性，不过分追求数据海量性，而要追求类案检索所需数据。裁判文书本身就是一种不完全的记载形式，因此需要系统整合庭审视频、音频、图片等多个数据资源，以达到数据间的查漏补缺。另外，全国各地案件裁判受地域文化差异、经济发展水平等影响，全国数据训练效果势必无法适应各地审判实务的多样性，因此要对数据进行本土化处理，在总体相似度阈值基础上设定细化阈值。同时针对各类型案件裁判的主题需求形成类案检索指标、收集适配样本。

3.可变性（changeability）：法律适用的更新

通用领域的数据价值相对稳定，可以反复挖掘深度利用；而裁判尤其是民事裁判的部分数据具有易变性，情境一经调整，原有数据将失去挖掘价值。当前类案检索缺乏有效的时间指引，在法律规定不断推陈出、不断涌现的新类型、新案情的背景下，不加时间范围限制、新旧法律衔接的类案检索显然不合时宜，需要推动类案检索的法律知识库自动更新，并根据最新的法律规定向用户优先显示最新的案例，对于没有适用最新法律的检索结果应注明法律适用建议。

（二）不破不立：破解法律数据知识壁垒

“法律＋大数据”应用发展需要攻克将法律领域的理论结构映射到法律大数据的知识发现过程并指导法律大数据应用的问题，①王禄生提出法律大数据领域认识论的更新需要引入当前科学界提出的“轻量级理论驱动”（lightweighttheory-driven）。参见王禄生：《论法律大数据“领域理论”的构建》，载《中国法学》2020年第2期。同理改进类案检索系统亦必须完成将法学理论结构映射到裁判大数据的知识发现过程，对符合“3C”特性的数据进行知识表示、提取、导出的数据挖掘。

1.建立案情要素识别模型

要素表示的基础是明确案件中需要描述的对象，而这些要素之间相互关联又各自有不同的表现维度。例如，合同无效“要素”有“无民事行为能力人”“虚假的意思表示”“违反法律、行政法规的强制性规定”“违背公序良俗”“恶意串通损害他人合法权益”“超越经营范围订立”，而仅就“无民事行为能力人”这一要素中即有多种表现维度，包括“不满8周岁的未成年人”、因智力、精神健康原因所致“不能辨认自己行为的成年人”以及“不能辨认自己行为的8周岁以上的未成年人”，以上要素在具体案件中又可能有多种语言表示。由于没有专用法律词库，实践中连篇章结构划分都无法达到100%的精确性，还需要大量人工识别标注。②参见王禄生：《论法律大数据“领域理论”的构建》，载《中国法学》2020年第2期。故而需建立明确法律知识要素与表现维度的专用法律词库，才可采用深度学习算法优化形成具有可解释性的案例数据挖掘过程。

同时，还需进一步探索裁判文书改革。应当规范裁判文书数据生成和上网，重视裁判文书说理，必要时增加“裁判要旨”撰写和裁判规则凝炼，既推动裁判文书说理的实质性提升，③参见梁平：《基于裁判文书大数据应用的区域法治化治理进路——以京津冀类案检索机制的构建为例》，载《法学杂志》2020年第12期。又为类案检索规范化、系统化供给原始数据。

2.深化NLP与OCR技术应用

法律知识要素并不是法律知识本身，还需要在诸多的个案中提取出满足法律知识要素的数据装载到数据库中，因此类案数据的收集过程又可以归纳为案件原始信息获取、信息标注、识别训练和结果生成。其中信息标注不是简单的“贴标签”，这一关键环节需要将大量非结构化、半结构化的裁判数据转换为类案检索需要的知识要素变量。首先需要自动识别判决书的篇章结构并准确分割“首、正、尾”三部分；在识别篇章结构后，进一步根据符号进行句子分割；最后按照法律专有词汇进行分类，进而识别、抽取个案关键信息。因此，势必要在汇编专用法律词典的基础上充分借助自然语言处理技术（NLP），将目标案件的属性标签与原有法律大数据库中所有案例的属性标签进行比对，计算相似度之后反馈给用户。

同时，要推进司法领域光学字符识别技术（OCR）的研发，对卷宗材料中的图片进行准确OCR识别以进一步实现由非结构化、半结构化数据向结构化数据转换的关键一步，最终满足裁判大数据多样性与兼容性。①参见王禄生：《论法律大数据“领域理论”的构建》，载《中国法学》2020年第2期。

3.智能显示类案检索成效

优化最终显示的检索内容是提升用户满意度的关键，因此在类案检索结果生成上应当遵循精准简明的原则，除案例名称、案号、案由、案例效力级别等基础信息外，还要根据用户特点有侧重点地优先显示其最需要的内容。比如，法官更关心关键词、争议焦点、查明事实、裁判要旨、适用法条等内容；当事人更关心证据证明力和裁判结果，代理人更关心诉辩意见、争议焦点、裁判要旨等内容。在此基础上智能生成检索报告或有侧重点推荐其他类案。

（三）对立统一：化解类案检索三组矛盾

1.建立JEC复合型人才结构研发团队

要强化法官在类案系统研发中的角色，加强复合型人才培育。可借鉴深圳市盐田区人民法院创立的“鹰眼查控网JEC模式”，建立“法官+工程师+外包公司”JEC研发维护团队。②参见胡志光、王芳：《智慧法院建设的思维导图——以深圳法院“鹰眼查控网”建设为案例》，载《中国应用法学》2018年第2期。其中，法官和法学专家需要在类案检索需求分析、裁判数据本体论构建、适配数据训练集确定、法律知识要素标注、类案检索模型校验的研发维护全环节中结合专业知识积极发挥作用。在法官的指导下，法院工程师先行绘制知识地图并向外包公司技术人员转译法律术语和协作开发系统。

2.难案收录扩大化与裁判规则抽象化

海量简案文书虽一定程度上提高了法官处理待决案件的效率，但审判活动的根本目的是实现公平正义，类案检索的落脚点亦应是提供正确的裁判思路与规则。一些新型案件的案情要素甚至前所未闻，例如无锡冷冻胚胎案，该案争议焦点是如何认定人工冷冻胚胎的法律性质以及是否能作为遗产以供继承，在法律没有明文规定的情形下，二审主办法官在国外的相似案例中找到裁判思路，支持失独老人获得已故儿子夫妇冷冻胚胎的监管权和处置权。①美国有高度相似的案件：亡故夫妻留下11枚冷冻胚胎和一个2岁的孩子，最终法院判决由医院保管冷冻胚胎，等小孩成年以后由其决定如何具体处置这些胚胎。参见张圣斌、范莉、庄绪龙：《人体冷冻胚胎监管、处置权归属的认识》，载《法律适用》2014年第11期。这类疑难案件或新型案件为后来此类案件的处理提供了重要裁判指引。因此，类案检索系统的发展应当在提高难案数量的基础上，朝着提炼共性裁判规则的抽象化发展方向前进。

3.明确类案效力等级与冲突处理规则

追求裁判尺度统一则不可避免要面对类案裁判冲突的问题。《指导意见》对类案提供了一种建议性排序。首先，当检索到的裁判规则包含指导性案例并且发生冲突时，指导性案例提供的裁判规则具有准法源之效力，如无特殊情况，具有排他效力；其次，由于其他案例非未做强制性的效力排序，此时法官对类案裁判规则的取舍与协调更多依靠其自身对案件的通盘考虑作出判断。为使人工智能更好服务于类案检索乃至裁判实务，提供明确的类案筛选规则和效力等级，尽可能减少类案检索的算法缺陷，在用户进行检索的极短时间内满足用户的检索需求，实现更有效的类案数据输出。今后还需要根据法律适用分歧解决原则继续细化类案的效力标准，以实现裁判规则统一。