类案智能裁判中的人机协同及其改进

2023-11-12 13:40孙跃

学术交流 2023年7期

孙跃

(山东工商学院法学院,山东烟台 264005;山东大学法学院(威海) 法律方法研究中心,山东烟台 264005)

近年来,通过类案裁判促进统一法律适用成为理论界与实务界日益关注的问题。最高人民法院于2020年和2021年陆续发布了《关于统一法律适用加强类案检索的指导意见(试行)》《统一法律适用工作实施办法》等文件,将类案裁判确立为一项正式司法制度。随着人工智能、大数据等数字科技赋能司法实践的推进,“类案智能裁判”为缓和“统一法律适用”和“案多人少”紧张关系创造了新的契机,特别是以生成型预训练(GPT)为代表的自然语言处理技术(NLP)和人工智能生成技术(GAI)的快速发展,更是为类案智能裁判的推动勾画了广阔前景。最高人民法院在《人民法院在线运行规则》中将“类案智推”列入“智慧审判系统”的建设范畴,并且《关于规范和加强人工智能司法应用的意见》确立了类案智能裁判应当遵循的基本原则。

类案智能裁判本质是一项由“人”和“机”共同协作开展的司法活动,前者是指法官等人类主体直接从事的活动,后者则是指借助人工智能、大数据等科技手段实现的功能。从人机协同的角度研究类案智能裁判存在的问题更有助于揭示其本质。综上,本文将在明确类案智能裁判人机协同基本架构与司法功能的基础之上,探究其面临的现实障碍,并为类案智能裁判人机协同的改进提出若干对策。

一、类案智能裁判人机协同的架构及功能

在探讨类案智能裁判人机协同存在的问题及解决方案之前,有必要明确其系统架构与司法功能。在基本架构方面,类案智能裁判系统中的人机协同关系与一般意义上的智能裁判系统中的人机协同关系基本同构,由于其被赋予追求类案同判的特定目标,而呈现出独有的特殊样态。

(一)类案智能裁判人机协同的系统架构

类案智能裁判系统是智能裁判系统的一种特殊类型,其虽然以类案同判而非一般意义上的司法裁判为目标,但是在基本架构上与通用化的智能裁判系统类似,可以将其视为后者为满足特殊目标的专项系统。因此,类案智能裁判的人机协同关系,也可以被视为人机协同关系在类案裁判领域的具体化。如果将类案智能裁判视为一个系统整体,其基本框架由三个子系统组成：(1)设定与输入系统：由人类预先设定类案裁判的目标以及应当遵循的规则,并将这些目标与规则以数字化形式输入机器;(2)处理与输出系统：机器运用数据和算法等技术手段模拟法官的类案裁判活动,辅助法官处理案件并输出司法裁判;(3)学习与改进系统：人类对机器参与的类案裁判活动进行监督与评估,通过后续调整来改进机器学习,使整个系统更加完善。以上三个系统之间呈现出“(1)—(2)—(3)—(1)……”的前后连接与循环关系,各个系统的基本原理如下：

(1)设定与输入系统。无论是从技术层面还是伦理层面来看,目前的司法人工智能系统均不具有人类的主体地位和自主意识,其只能对人类思维活动进行模拟,这就有赖于人类向机器输入预先设定好的目标与规则。在类案裁判领域,人类为机器设定的目标是“类案同判”,即统一法律适用,这意味着机器所有的活动都是围绕实现这一目标展开的。实现特定司法目标需要遵循特定的思维规则,也就是法律方法。或者说,机器需要运用数字技术来模拟法官对这些思维规则的运用,如类案检索的思维规则、类案判断与区分的思维规则、运用类案进行裁判说理的思维规则等。上述目标与规则主要的载体是建立在文字符号系统上的自然语言文本,需要将其转化为基于数学符号系统的计算机机器语言输入类案智能裁判系统。

(2)处理与输出系统。类案智能裁判中人机协同体现为“机器辅助下的人类司法决断”。在处理案件与输出司法裁判方面,人类和机器有着各自的比较优势,为两者之间的角色分工奠定了基础。人类的优势在于其具有自主意识以及基于此的能动性,我们在语言理解、加工以及表达方面具有天然优势。类案裁判属于司法活动中较为特殊与复杂的语言理解和处理活动,需要对案例文本的信息进行识别、提取、理解、分析,并遵循一定的法律方法形成裁判文书或检索报告。类案检索与裁判往往用于解决具有一定争议性的疑难案件,这些疑难案件背后可能存在价值或利益冲突。价值判断和利益衡量属于司法中的实质判断,这是人工智能目前难以处理的内容,只能依靠法官的决断。相对地,机器具有数据存储量以及数学意义上的算力优势,可以对类案裁判活动中数据化和形式化程度较高的信息进行快速处理,并借助自然语言理解与生成技术(NLU和NLG)辅助法官工作。

(3)学习与改进系统。正如传统意义上由人类直接从事的司法活动会不断总结经验一样,类案智能裁判系统的运行还涉及机器学习以及人机之间的互动反馈。借助基于深度神经网络等机器学习技术,人工智能系统可以不断从先前的处理活动中优化其数据结构和算法运用路径,以提升今后辅助类案裁判活动的效率与准度。例如,基于GPT模型的自然语言处理技术需要人工微调(fine-tuning)与人类的指示(promoting)进行机器学习。通过人机之间的反馈,不仅可以促进机器学习,而且还可以帮助人类更加准确及时地掌握现有技术缺陷,为类案智能裁判系统的更新迭代提供实证参考。

(二)类案智能裁判人机协同的司法功能

基于人机协同的类案智能裁判系统具有保障司法公正、提升办案效率并防范数据安全风险三个方面的主要功能。首先,人机协同有助于提升类案智能裁判活动的可靠性,促进司法公正的实现。基于统计学常识,法官能够检索到的案例样本越丰富,就越能掌握大概率主流的司法观点,同时也不易遗漏某些极少数属于例外情形的个案。借助司法大数据以及基于此构建的类案偏离预警系统,可以扩大检索的案例文本范围以找到更多相似性程度更高的先例,并在一定程度上降低过度偏离主流司法观点的概率。不过,大数据毕竟是基于过去的数据建立的函数模型,其输出结果不过是对业务场景中的缺失信息的补充或未来趋势的预测。这种预测可能会在一定程度上忽略个案正义。同时,基于数据和算法的类案智能裁判系统主要是从形式逻辑的角度来校验不同案件裁判结论的一致性。这种判断模式固然可以排除人类情感与偏好对司法裁判公正性造成的扰动,但也可能弱化对某些特殊案件的实质性判断。若要充分考量个案的复杂性与特殊性,依然需要法官在价值与情理层面进行充分研判。(1)例如,最高人民法院印发的《深入推进社会主义核心价值观融入裁判文书释法说理》规定,裁判文书说理要做到“积极讲明情理”并“综合考量法、理、情等因素,加强社会主义核心价值观的导向作用,不断提升司法裁判的法律认同、社会认同和情理认同”。因此,只有通过人机协同互补,才能实现类案裁判在普遍正义与个案正义、形式正义与实质正义之间的平衡。

其次,运用基于人机协同的类案智能裁判系统有助于提升办案效率。判断法律适用的相似性需要对待决案件与先例相关联的法律条文进行查找和比对,通过预先的数据标注与机器训练,得以对海量案例文本数据进行结构化处理,将类案对比经验数据化,从而大幅度降低类案检索的时间成本。通过人机互动反馈的机器学习,可以在之前检索经验的基础之上不断提升今后检索活动的效率,使类案裁判系统的运行呈现加速趋势。此外,效率的提升不仅可以体现在节约时间成本上,而且还可以体现在法官从事类案裁判活动积极性的提升上。实践中,法官一方面具有“类案同判”“强制检索”等义务,另一方面又面临“案多人少”的办案压力。由于当前司法工作业绩考核体系是以办案数量与结案率考核为核心的,而类案检索制度本身的拘束力又比较有限,法官很容易权衡利弊选择优先满足后者的需求。久而久之,就会形成一种对类案同判的抵触与逃避习惯。但如果通过人工智能系统的赋能以及人机协同操作,类案检索与裁判活动便不再是一种繁重的负担,就可以对类案检索的推广适用产生正向激励。

最后,类案智能裁判人机协同还是确保类案裁判活动安全性的重要手段。类案智能裁判系统需要借助特定的算法实现其功能,这就可能存在“算法黑箱”和“算法歧视”等问题。算法黑箱效应很容易侵害诉讼各方的知情权,使当事人的权益在未知状态下被错误处分;算法歧视则容易造成“类案异判”或“异案同判”的后果,这显然与类案裁判所追求的目标背道而驰。同时,类案智能裁判系统的运行离不开案例数据库的支持,案例数据库中储存的海量裁判文书数据不可避免地包含个人隐私、企业商业秘密、国家秘密等不宜公开的信息。即使经过了去标识化处理,已公开裁判文书中的私密信息仍可以“撞库”或“数据画像”的方式而暴露于公共空间。[1]即使是未公开的裁判文书,其数据也可能因安全保障机制不健全而被泄露。总之,类案智能裁判系统不能在脱离人类监管的环境下运行,否则会引发诸多数据安全以及由此派生的次生问题。

二、类案智能裁判人机协同的现实障碍

现实中诸多障碍的存在对类案智能裁判系统的结构产生消解效应,并最终影响了系统整体功能的实现。在人机协同关系中,人类一方需要提供法律思维(法律方法)层面的规则供机器学习与执行,因为如果类案裁判思维规则化程度较低,则容易导致机器缺乏明确的预设目标与规则,而使人机协同沦为无源之水。由于科技赋能的不足,类案智能裁判缺乏数据和算法的双重支持,其难以高效准确地辅助法官处理与输出司法裁判。此外,类案智能裁判系统的运行本身也蕴含诸多隐患,缺乏合规机制的督导与约束,很有可能引发数据安全与个人信息安全问题。

(一)法律方法层面：类案裁判思维的规则化程度较低

为类案智能裁判系统设定思维规则本质上是一个法律方法的问题。类案裁判方法需要解决的问题包括两个方面：其一,类案判断的对比要素,即通过对比案例中的哪些信息来判断两者属于类案;其二,类案判断的推理与论证,即运用何种思维模型来分析案例是否构成类案并进行裁判说理。以上两个方面的规则化程度较低,容易造成类案智能裁判系统目标模糊且缺乏可作为依据的运行路径。对于第一个问题,根据《关于统一法律适用加强类案检索的指导意见(试行)》第1条的规定,类案判断的对比要素包括基本事实、争议焦点、法律适用。(2)《〈最高人民法院关于案例指导工作的规定〉实施细则》第9条规定,与指导性案例构成类案的标准是“基本案情”与“法律适用”,并不包含“争议焦点”。以上规定看似简单明了,但无论是在理论概念还是实践操作层面,均存在不少障碍。例如,三种之间的逻辑关系不明,构成类案是要求三者均具有相似性还是其中部分内容具有相似性即可?如果要求三者均相似才构成类案,那么是并列判断还是递进判断?又如,案例中的基本事实不同于日常生活中的事实,其本质上是“目光往返于法律规范与事实之间”的产物,即具有法律意义的事实,那么事实判断与法律适用判断往往相互纠缠,难以区分。此外,争议焦点分为事实性争议焦点和法律性争议焦点,其内容完全可以被基本事实和法律适用所吸收,规定三种要素有冗余之嫌。对于第二个问题,目前尚未有制度层面的明文规定,但域外以德国为代表的大陆法系国家已有理论和实践经验可供参考。由于德国也是以制定法为主要法源的国家,判例具有从属地位,故其判例实践与奉行“遵循先例”的英美法系国家存在一定差异。在英美法系国家,判例适用方法是建立在对关键事实比对与区分的基础上,本质上是“从个别到个别”的类推过程。[2]而在德国等大陆法系国家,判例适用的思维模式为“类比—归纳—演绎”：(1)运用类比推理寻找与待决案件可能具有相似性的先例;(2)从先例中归纳超越个案判断的一般性裁判规则;(3)运用演绎推理将先例裁判规则与待决案件事实连接,得出裁判结论。根据相关研究,我国在类案检索实践中也基本采用了上述模式,但其运用不够规范,存在类比推理运用不充分、归纳的裁判要点难以满足决疑需求、作为演绎推理大前提的裁判要点规则不明确的问题。[3]之所以存在这些问题,是因为在缺乏操作细则的情况下,法官更加依赖个体经验、偏好和习惯去检索与适用类案。而这些经验性因素具有很强的随意性与内容上的高度不确定性,难以形成统一、明确的规则。法律方法运用的规则的不统一、不明确,就难以被转化为数据和算法被机器识别,也无法为机器学习提供训练用的规范依据。

(二)科技赋能层面：案例数据与算法技术支持的滞后

类案数据库平台建设方面,存在案例数据统一性与公开性有限、数据结构与内容的智能化适配程度较低等问题。我国的类案数据库可以分为官方数据库与商业数据库两类,数据内容不一致、数据碎片化程度高、数据结构化与洁度较低等问题普遍存在,案例数据的“孤岛效应”明显。权威性相对较高的法院系统内部案例数据库并不完全向社会公开,这就造成法官与其他诉讼主体(如当事人、律师)在类案检索方面的信息不对称。类案检索与裁判是嵌入到司法场域中的活动,不公开的案例由于难以被公众、当事人以及律师等群体知悉,其内容的真实性与准确性难以接受外部监督,无法稳定公众对法律适用的预期,甚至会引发人们对类案裁判正当性的质疑。在案例数据结构与内容方面,以中国裁判文书网为例,其数据结构是按照关键词检索而非智能语义检索的模式构建的,容易使法官面临“高频不需要找,低频找不到”的尴尬。[4]至于面向社会公开的商务用案例数据库,虽然其具备更加丰富的功能和优化程度更高的数据结构,但是经济成本较高且收录的案例内容各异,难以为类案智能裁判提供统一权威的数据支撑。

在算法层面,现有的类案智能裁判算法技术与模型也面临着类案裁判活动复杂性的严峻挑战。根据凯文·阿什利的研究,面向判例的智能法律解析包含三个主要组成部分：(1)运用特定的算法模型,构建基于案例的法律推理(CBR)系统;(2)构建案例文本解析技术,即从案例文本中提取有效信息,主要依靠自然语言处理技术(NLP)实现;(3)将前两者进行连接。[5]现有的类案检索系统在以上三个方面均存在不同程度的缺陷。由于我国主要的法源形式是法律法规和司法解释,现有的法律检索系统主要偏重于抽象规则的检索,对基于案例的推理系统(CBR)缺乏重视。现有类案检索系统所使用的NLP技术主要依靠关键词的识别以及相似关键词数量的对比来推送案例,其难以解析不同关键词之间的逻辑关系以及这些关键词共同蕴含的实质意义,推送的案例范围过大或过小的现象时有发生,导致检索的精度大幅度下降。在对案例文本解析与案例推理模型连接方面,现有的类案检索系统功能过于单一,往往只能生成是否构成类案或相似性程度状况的简单结论,无法生成支持该结论的理由,对基于类案的裁判说理辅助作用有限。

(三)体制机制层面：类案智能裁判缺乏合规机制保障

司法机关使用类案智能裁判系统,属于《民法典》《个人信息保护法》《数据安全法》中“数据(个人信息)处理者”的范畴,其行为应当符合科技伦理、法律法规以及数据治理领域的国家强制性标准。根据《个人信息保护法》第54条的规定,个人信息处理者应当定期对其处理个人信息遵守法律、行政法规的情况进行合规审计;《人民法院在线运行规则》也在第34—44条对智慧司法中的合规安全问题进行了总括性规定;最高人民法院还通过《关于规范和加强人工智能司法应用的意见》确立了智能裁判的若干基本原则。

不过,上述规定总体上还停留在一般性规定层面,与之配套的规范体系与具体工作机制尚未确立。在规范体系方面,现有的立法、司法解释以及规范文件并未确立与智能裁判相关的规则,至于作为智能裁判子项目的类案智能裁判,就更加缺乏具体数据治理规则的约束。除法律和司法解释外,国家技术标准也是数据合规的重要依据。近年来,我国制定了大量关于个人信息保护、人工智能以及大数据的国家技术标准,但这些标准大多面向一般互联网或工业领域,尚未向智能裁判领域延伸。在具体工作机制方面,法院系统和其他国家机关均未建立面向智能裁判的合规机制,合规机构、合规审查机制、合规风险应对机制等均存在空缺,难以对智能裁判存在的数据风险进行有效预防与治理。

在类案智能裁判中最值得重视的专项内容是算法合规。算法可以视为裁判标准与方法代码化的产物,事实上其会影响裁判的路径及结果。算法的黑箱效应不仅会阻隔外界对司法过程的监督,甚至会使法官的裁判思维在不自知的情况下受到影响,最终造成“技术宰治司法”。考虑到类案裁判相比于一般案件的裁判更加复杂,这种技术宰治引发的风险可能会更大。例如,GPT等人工智能生成技术(AIGC)虽然可以辅助类案检索报告和裁判文书理由的创作,但是也可能生成一些仅符合语言规律却无法律意义的论证理由,并对法官的判断产生误导。算法歧视则会造成“类案异判”或“异案同判”的现象,与类案同判追求的法秩序统一及司法公正相悖。目前,国内常用的案例数据检索与智推系统均未对其算法模型的原理及可能产生的风险进行说明,难免令人对其中可能存在的算法黑箱与算法歧视问题产生担忧。

三、类案智能裁判人机协同的改进路径

改进类案智能裁判中的人机协同,需要树立数字正义观念,为相关活动提供价值引领和法理基础。在数字正义理念的指引下,还需要从法律方法、科技赋能以及体制机制等多个方面出发,以形成系统性的应对方案。在法律方法层面,有必要建构明确的类案裁判思维规则,为人力思维向机器算法的转化和输入提供依据。在科技赋能层面,应当建立统一权威、开放高效的案例数据库,并借助基于CBR与生成式人工智能混合模型提升其运行效果。在体制机制方面,需要将数据合规治理机制引入类案智能裁判领域,尤其是要借助算法解释与备案机制来强化对类案智能裁判算法黑箱和算法歧视的规制。

(一)价值理念层面：以数字正义司法观为引领

类案智能裁判是数字科技在司法领域应用的产物,建立在司法与数字科技互动的基础之上。结合类案智能裁判人机协同的语境,对数字正义的理解可以从两个向度出发：(1)“科技—法律”向度,即类案智能裁判中技术手段对司法活动的赋能作用;(2)“法律—科技”向度,即类案智能裁判中法律方法和法律制度对技术手段的规范作用。

1. “科技—法律”向度下的数字正义

有研究者将正义分为“超验正义”与“对比正义”,前者旨在寻求理想情况下完美正义的制度设计,后者则更加关注如何消除现实中阻碍正义实现的不利因素。[6]根据上述分类标准,数字正义属于“对比正义”的范畴。限于人类认知与理性的极限,绝对完美的正义可望而不可即,但相对更接近正义的理想目标则是可行的。在此意义上,数字正义是一种强调运用数字科技更好地实现传统正义的新型正义观念,其强调应当通过数字科技的应用来克服那些实现正义的阻碍因素,是一种帮助人们更加方便地“接近正义”的模式。[7]从法理的角度来看,传统意义上的正义观念侧重于关注法律治理中的价值目标问题,其强调运用法律治理社会时的“规范性”,即将法律所追求的特定价值(如自由、平等、公正等)现实化。相较而言,数字正义不仅强调通过法律治理实现正义的规范性,还高度重视在这一过程中技术赋能与对技术的规制,具有鲜明的“技术性”特征。质言之,相比于传统意义上的正义观念,数字正义的领域和维度更加多元,其同时涉及正义的规范性、技术性以及两者之间的互动关系。

在类案智能裁判领域,上述理念体现为：(1)通过科技赋能提升司法裁判的效率并降低其成本,从而为一些固有法律难题的破解提供新机遇。类案检索与裁判通常被运用在疑难案件中,其会消耗大量的人力资源与智力资源。通过强化科技赋能,可以有效地减轻疑难案件裁判的负担,促进司法资源的合理配置和高效运用。(2)通过科技赋能提高司法裁判的精确度。例如,通过改进案例数据库及类案检索与推送的算法模型,促进裁判结论从“正确”向“精准”的提升。(3)增强法律治理的信息公开度与透明度,实现正义的可视化并改善提升用户体验感。例如,借助GPT等模型的自然语言理解与生成技术,可以实现类案智能裁判中的人机实时交流互动,使多元主体在司法中的沟通渠道得以畅通。

2. “法律—科技”向度下的数字正义

数字科技在为社会经济发展以及司法水平提高带来“数字红利”的同时,也暗藏诸多新的风险隐患。例如,基于信息不对称和专业认知能力的差异,普通人很难充分理解算法的运行规则。2022年以来在社会各界引发持续关注的ChatGPT聊天程序,就是基于大语言模型(LLMs)的算法模型不断迭代的产物。因具有强大的自然语言生成能力,ChatGPT以及类似应用为类案智能裁判系统的迭代创造了新机遇。然而,此类技术也可能诱发“深度伪造”、知识产权争议、隐蔽性的文化歧视与算法偏见等风险。[8]一旦这些风险传递扩散到司法领域,就很容易影响司法公正。例如,算法歧视可能会扰乱本就不太明晰的类案判断标准,进而引发“类案不同判”或“异案同判”,与类案检索制度的初衷背道而驰。

从上述向度来看,数字正义并非对传统正义观念的全盘否定和替代,不仅如此,其在价值追求和精神内核上继承沿用了古往今来关于正义的经典名题之要义。正义本质上关注的是权利义务能否被公正合理分配的问题,包括分配的过程(程序正义)和分配的结果(实体正义)。尽管数字正义在此基础上注入了技术性要素,但其依然强调法律与司法裁判的规范性。在过程层面,数字正义强调通过科技赋能应当尽可能在规范框架下进行,不允许科技对司法的僭越;在结果层面,数字正义强调通过科技赋能合理地协调与分配各方利益。若要确保类案智能裁判领域程序与实体结果的规范性,就需要从两个方面出发：(1)法律思维层面的规范性,即法律方法的规范建构与适用;(2)法律制度层面的规范性,即智能裁判相关领域的法律合规体制机制的建设。

(二)法律方法层面：建构明确的类案裁判思维规则

1.以要件事实为确定类案判断要素的基础

类案裁判方法适用规则体系的核心在于案例的“要件化”,也就是对案例中的事实要素与法律要素进行一体化要件处理,以此为类案智能裁判的“最小单位”。案例要件化的理论基础包括：(1)“个案规范”理论,该理论认为法律规范在适用之前,必须结合个案事实进行具体化;(2)“规范领域”理论,该理论主张通过案例文本与案件事实的一体化构建,为待决案件事实提供规范依据。[9]质言之,如果两起案例的要件事实相似,就相当于它们在法律与事实层面上均具有相似性,由此便解决了类案判断要素凌乱以及相互之间逻辑关系不明的问题。

以指导案例24号为例,该案的裁判要点为“交通事故的受害人没有过错,其体质状况对损害后果的影响不属于可以减轻侵权人责任的法定情形”。该裁判要点中有诸多要素同时具备事实性与法律性：“交通事故”是案件事实上的起因,但同时也是案件在诉讼法上的案由以及实体法上的侵权法律关系类型(机动车交通事故责任纠纷);“过错”不仅是侵权人事实上的主观心态,也是法律规定的侵权责任构成要件之一;“体质状况”不仅是受害人在事实上的身体状态,也是侵权用来抗辩和主张减轻责任的法定事由之一。因此,对以上要素进行一体化整合,就可以提炼该案的要件事实为“交通事故”“受害人无过错”“受害人的体质状况对损害后果产生影响”,其关联的司法评价即“不属于可以减轻侵权人责任的法定情形”。

要件化之所以是目前与类案智能裁判进行适配的最优方案,主要理由包括四个方面。其一,案例要件化有助于“基本案情(重要事实、关键事实)”“法律适用”“争议焦点”等要素中的信息更加规整与清晰,具有思维简约、可操作性较强的优点。将要件作为案例对比要素的“最小单位”,不仅可以快速提取类案检索需要的关键词,以便运用数理逻辑工具进行连接,而且数据结构化程度高,在进行信息加工时会更加便捷。其二,要件思维具有整合法律规则与案例事实的重要作用。要件事实是介于“生活事实”与“法律要件”之间的案件事实,是一种获得了法律评价的案件事实。案例要件同时包括了法律判断中的价值因素和事实因素。其三,作为类型化思维的产物,案例要件能够在类案裁判单位划定的抽象性与具体性之间保持平衡。如果最小单位过于抽象,容易降低裁判精度;反之,如果过于具体,以现有的人工智能技术则难以实现高效的裁判活动。因此将案例要件作为最小单位,能够在一定程度上兼顾类案裁判的精度与效率。其四,案例的要件化具有较好的普适性与兼容性,能够与民事、刑事、行政等各种类型案件的智能裁判活动兼容。

2.类案检索与适用的“类比—归纳—演绎”论证模型

为了增强类比推理的可靠性,要以要件事实为基点,全面对比先例与待决案件案情、法律适用、争议焦点等方面的相似性,并引入“可废止性检验”与“裁判结论一致性检验”。“可废止性检验”是指在类案相似性初步成立后,有可能出现“更强理由”推翻之前的初步判断结论,继而终止先前的法律推理。由于法律推理的前提往往只能在常规条件下根据有限的资料得出,当常规条件变化或新资料增加时,推理的正当性或结论就会被改变。[10]判例运用中的“常规条件变化或新资料增加”通常体现为“更强理由”,其可以起到反驳作用。“裁判结论一致性检验”是指通过核验待决案件与先例在法律评价方面的一致性,来确保类案能够“同判”。以指导案例172号为例,该案裁判要点规则第2条为“被告人自愿交纳保证金作为履行生态环境修复义务担保的,人民法院可以将该情形作为从轻量刑情节”。在建构论证模型时,就需要类比其中的要件事实和量刑标准。

为了完善归纳方法的运用,要以“明确”与“无冗余”为目标建构类案裁判要点及规则的适用思维模型。“明确”是指应当在裁判理由中明确类案的来源信息,以及归纳出裁判要点及规则的完整内容,不能仅以简单的结论一笔带过。“无冗余”是指类案裁判要点应与现有的裁判规则体系有实质性区别,不宜重复已有裁判规则。同时,类案裁判中的归纳推理也是一个“目光往返于待决案件决疑需求与类案之间”的过程。在整体方向上,裁判要点要围绕待决案件争议焦点中的法律适用问题展开,突出其问题意识与聚焦功能。类案裁判要点的核心内容与争议焦点问题要形成一种“问—答”的对话结构,以直接回应个案决疑的需求。例如,指导案例33号总结出的争议焦点有两条：第一,涉案合同是否构成“恶意串通,损害第三人利益”;第二,关于本案所涉合同被认定无效后的法律后果。该案的裁判要点也包括两条,分别是关于恶意串通,损害第三人利益导致合同无效的认定以及合同无效的后果,它们均是对争议焦点中法律适用问题的直接回应。在内容方面,需要结合待决案件决疑需求对规则的抽象程度进行动态调整。如果待决案件是一起在定罪问题上存在争议的刑事案件,那么裁判要点规则内容就只需涉及定罪的法律适用即可;如果待决案件在定罪与量刑方面同时存在困难,那么裁判要点规则中关于定罪与量刑的要件事实均应当被突出。

3.类案裁判中法官判断的保留事项及其判断规则

由于类案智能裁判系统无法也不应代替法官进行实质性判断,因此要为类案裁判活动中的实质性判断划定范围,将此作为人机系统中人类的保留事项。其一,基于价值取向的实质性判断。此类判断又分为两类：(1)结合具体案情和相关法律规范,对案例中体现的各种法价值进行排序,选取通过类案裁判优先保护的价值;(2)在基于规范和逻辑的形式判断无法得出是否参照类案的结论时,运用社会主义核心价值观对规范空缺进行填补,为类案裁判提供理由。其二,基于利益衡量的实质性判断。通过对案例相关的利益进行权衡或取舍,以平衡各方利益并增进社会总体福祉。例如,指导案例164号在对《破产法》相关条文进行解释和适用时,以实现社会安定、经济稳定和发展为目标,在综合考量公平与效率、灵活性与可预见性的基础之上,通过平衡各方利益创制了“试生产”制度的裁判规则。在遭遇多方利益冲突的疑难案件时,就可以参照上述解释方法来建构裁判要点规则。其三,基于后果导向的实质性判断。类案裁判不仅追求法律适用的统一性,还需要考量各种类案裁判方式可能产生的社会效果、经济效果、政治效果,并选择“最优解”。

与基于形式逻辑的论证一样,上述实质性事项的判断也要遵循一定的思维规则。首先,应当符合规范目的,类案裁判中的实质性判断需要符合法律教义学以及制定法渊源所确定的目的,不得与之明显背离。[11]其次,要追求比例适当,在进行实质性权衡时要注意手段与目的之间的比例关系,将被舍弃一方的权益损害降至最低的必要限度。最后,兼顾个案情景与法秩序统一,类案裁判中的实质性权衡依托于个案裁判的语境展开,同时需要兼顾类案同判。需要指出的是,“保留事项”强调的是人类法官在上述实质性判断中占主导地位,而不是完全排斥智能科技的运用。例如,法官为了在不同的社会效果之间进行权衡取舍,可以借助大数据来为基于后果的法律论证提供实证经验层面的论据,或者借助某种算法模型来辅助预测裁判可能产生的社会影响。

(三)科技赋能层面：推进案例数据库建设与算法模型迭代

1.建立统一权威、开放高效的案例数据库

为了确保案例数据库的统一性与权威性,可以建立案例数据认证机制,引导和规范法院案例数据与商业案例数据有序融合。受限于硬件算力与人力资源成本以及保密义务,将法院系统的案例数据库完全开放给社会使用难度较大,同时也不利于商用案例数据库的服务改善。因此,可以建立由最高人民法院牵头的案例数据认证机制,通过定期的数据认证,比对核验法院系统案例数据库与商用案例数据库,确保关键数据的一致性、真实性以及清洁性。经过认证的商用数据库中的案例具有和法院系统数据库中的案例相同的司法效力。此外,还可以借助区块链技术,将案例数据上传至区块链,防止在数据迁移中引发数据失真。

为了提升案例数据库的开放性,在对案例文本中涉及个人隐私、敏感信息、商业秘密以及国家机密的部分进行去标识化处理或脱敏处理的前提下,应当尽可能地将案例向社会公众公开。类案数据的公开不仅可以有效防止因信息不对称削弱类案裁判的司法公信力与权威性,而且还可以让更多的法律人(主要是律师)通过研习和运用类案创造条件。未来在条件允许的情况下,还可以考虑将非涉密的类案检索报告纳入案例数据库的公开范畴,通过裁判文书附带类案检索报告公开,为类案检索提供更加全面的数据支持。

在提升数据库使用效率方面,可以从数据输入、标注以及检索技术等方面入手。应统一裁判文书撰写及录入系统的规范标准,并根据案例的层级以及难易度进行分类分级,提升类案检索以及机器学习的效率。案例关键词的标注要突出要件事实以及与之相关联的信息。案例的类型与层级划分,则应当分别考虑案例的难易程度以及权威程度。例如,《统一法律适用工作实施办法》第6条规定“应当进行类案检索”的案例、最高人民法院的指导性案例、最高人民法院的典型案例及生效裁判、高级人民法院发布的参考性案例及生效裁判等权威度较高的案例应当被优先标注。为了提升数据检索的效率和精度,可以考虑将基于机器学习技术的“命名实体识别技术(NER)”应用于案例数据的分析与标注,发挥其语义类别与特征、模型选取、实体细粒度标注原则以及数据增强功能。[12]此外,案例数据也可以被作为GPT等生成式人工智能技术的预训练语料与算法微调语料。

2.融合案例推理系统(CBR)与基于混合模型的生成式人工智能技术

随着大数据时代的来临,深度神经网络的机器学习生成式人工智能技术的发展有望为传统CBR模型框架的迭代提供新的支持。这就为构建融合基于案例的推理系统(CBR)与基于Bert和GPT混合单元的模型奠定了基础。Bert是一种基于双向语言模型预训练模型,可以通过分析案例文本上下文中的关键词之间的复杂关系来解释文本语义;GPT是一种单向语言模型预训练模型,相对于Bert,其在自然语言推断、文本蕴含任务方面取得了较大的提升效果,在语义相似、情感分析类数据集中也有很好的性能表现。[17]相较而言,Bert更擅长语义理解与逻辑推理,因而我们可以将其用于案例文本解析、关键词提取以及相似性对比的功能单元,使其辅助类案与待决案件的对比区分。而GPT则更擅长在解析文本的基础上生成文本,因而可以将其用于类案裁判说理论证的功能单元,使其辅助裁判文书和类案检索报告的制作。当然,无论是Bert还是GPT都需要人工监督与辅导下的“微调(fine-tuning)”或“指示(prompting)”,对其判断结论进行调适与修正,通过基于人机协同的机器学习提升类案裁判的准度。

需要强调的是,各种生成式人工智能模型的融合运用虽然在理论上可以做到取长补短,但是仍有几个方面的问题需要关注。首先,从人工智能法律系统设计与运用的角度来看,不同算法模型之间可能存在技术层面的兼容性问题。从法律适用的角度来看,还要防止因算法模型融合使用引发的法律适用不统一或法律适用冲突。其次,从技术的发展沿革来看,不同算法模型的相对优势是实时变化的。例如,早期的GPT在语言理解能力上明显不如Bert,但GPT-4版本已经有了较大提高。未来这些模型孰优孰劣以及在司法领域中的适配性,还有待观察和对比测试,以便优中选优。最后,各种模型在法律解释与推理方面的能力距离高水平人类法官尚存在明显差距。为了提升这些模型在法律文本解释与法律推理活动中的效果,需要法学界与科技界展开深入合作,运用法律思维规则和各种不同类型的法律问题持续测试检验不同模型的表现,结合实践需求推陈出新。

(四)体制机制层面：健全类案智能裁判数据合规机制

1.类案智能裁判数据合规体系及一般机制

基于《关于规范和加强人工智能司法应用的意见》确立的基本原则,建立类案智能裁判的数据合规标准体系,其内容至少应当涵盖：(1)在最小限度内收集处理个人信息数据,在非合理使用的情形下不得因公开判例数据而侵犯个人隐私或企业商业秘密;(2)明确类案智能裁判算法的解释与备案规则,提升算法透明度与公正程度;(3)明晰类案智能裁判引发的技术性风险及其损害责任归结原则,同时赋予当事人及其代理人或辩护人充分的申辩权利以及救济权利;(4)防止司法机关对类案智能裁判科技的过度依赖或对公共利益的损害,保障法官的主体地位及对司法裁判的控制权。除制定司法解释和规范性文件对上述内容进行具体化规定外,还需要出台一系列关于类案智能裁判的技术标准,并将其纳入智慧法院建设与评估指标体系之中。考虑到类案智能裁判活动涉及司法公正与当事人基本权利,相关技术标准应当以国家强制性技术标准为主。

类案智能裁判的数据和算法合规机制主要包括数据合规机构及工作流程、数据合规标准体系以及作为数据合规专项内容的算法解释与备案审查机制。考虑到类案智能裁判数据具有“司法性”与“数据性”双重特征,其合规机构应当包括履行法律监督职责的上级法院与检察院以及履行个人信息保护与数据安全监管职责的网信部门,同时还可以根据需求聘请专业资质的第三方社会机构。在工作机制与流程方面,应当建立类案裁判数据日常安全合规管理与风险应急流程机制。前者主要对类案智能裁判活动中各个数据处理的环节进行常态化监管,包括案例数据的收集、存储、使用、加工、传输、提供、公开等;后者主要针对类案智能裁判出现合规风险后的应对,主要包括对数据风险扩大的及时控制、对数据处理技术缺陷的矫正以及对数据事故的法律监督和法律救济等。

2.类案智能裁判数据合规专项机制：算法解释与备案

类案智能裁判数据合规中的重点专项内容是算法审查与备案机制。类案智能裁判算法备案与审查机制应当以“算法透明”与“算法公正”为目标,前者旨在破除算法的黑箱效应,后者旨在规制算法歧视现象。类案智能裁判的算法透明原则体现为“算法释明”。由于算法本身具有极强的专业技术色彩,即便公开类案智能裁判系统的算法代码,大多数司法工作人员或一般社会公众也很难洞悉其运作机制。不仅如此,算法代码的公开,也容易使其技术漏洞暴露,反而更容易被不法分子利用。因此,类案智能裁判技术应当以追求可解释性为目标,通过“产生更多可解释的模型, 同时保持高水平的学习性能 (预测精度);并使人类用户能够理解、适当信任和有效管理新一代人工智能合作伙伴”[14]。

类案智能裁判的算法公正原则要求司法机关不得运用算法对相似的情形给予不同的对待,同时对于可能影响类案同判实现的算法技术运用进行解释说明。在此方面可以美国“卢米斯案(State v. Loomis)”为镜鉴。在该案中,卢米斯因为交通事故逃逸等五项罪名而被起诉,法院在审判时运用了COMPAS系统作为量刑的辅助参照工具。对此卢米斯提起诉讼,认为法院违反正当程序且存在性别歧视。尽管卢米斯最终并未胜诉,但威斯康星州最高法院借助该判例对智能裁判系统的运用提出了警示,并限定了此类软件的使用范围和方式,要求法官对此类技术的运用进行解释。[15]

在贯彻算法透明与算法公正原则的基础上,需要为类案智能裁判建立专项的解释与审查机制。首先,面向法院的类案智能裁判系统算法应强制备案,面向商业用途的类案智能裁判系统算法应建议备案。其次,算法备案应注明类案智能裁判系统的开发者、使用者以及产品本身的详细信息,并明确系统的基本功能、原理以及对司法活动产生的实质性影响。再次,应对类案智能裁判系统中可能存在的算法歧视的技术缺陷进行风险提示,防止法官对其过于依赖引发的次生问题。对于存在明显技术风险的功能模块,应及时停止其使用。最后,还要明确类案智能裁判系统算法违规的责任归结以及救济机制。

结语

中外判例实践经验表明,“类案同判”是一项长期且复杂艰巨的司法任务。在案件类型日益丰富、案件复杂程度日益提高的现代社会,实现类案同判仅依靠人类大脑的思维和身体的力量越发捉襟见肘。人类文明的发展历史同时也是一部人类不断发明创造工具、与工具进行协同并最终走向共融发展的文明史。在类案裁判领域,随着法律方法研究与应用的推进、智能科技手段的日益成熟以及相关司法理念与体制机制的改革,法官与智能科技的融合还将逐步深化,这可能会孕育出一种人机交融的新型裁判模式。人机协同理论认识的深入与实践活动的推进,最终可能会使得我们比历史上任何一个时代更加接近“类案同判”所带来的公平正义。