左卫民:法律计算在中国法学研究中的新展开
文摘
社会
2024-11-25 13:59
北京
作者:左卫民(四川大学法学院教授,法学博士)
出处:《比较法研究》2024年第6期
一、引言
二、当代法学研究如何计算法律?
三、中国法律计算研究的当下展开
四、对中国法律计算的进一步思考
五、结语
摘要:计算是人类与生俱来的重要技能。历史上,受限于计算方法与计算能力,人类仅能在特定领域展开小范围的法律计算。随着计算方法的革新与计算能力的跃升,社会科学领域的广泛计算逐渐成为可能,法律计算在法学研究领域的表达和影响愈发突出。当代我国法律计算研究呈现如下图景:计算对象上更多地使用法律文本大数据,并拓展和寻求新的数据来源;计算方法上创造性使用实验方法生成“新”数据展开研究,同时开始更多使用机器学习方法等大数据技术。着眼未来,除了要充分认识当下法律计算的局限与不完善之外,也要承认我国法律计算正处于不断发展的进程中,肯定先行研究者对拓展我国自主法学知识体系作出的探索与努力。同时,学界应继续坚定计算的信心,积极探索大模型计算等前沿的法律计算思路与方法,实现法律计算的精准量化,促进法律计算的繁荣,服务法律实践的现实需求。关键词:法律计算;法律实证研究;机器学习;法律大模型;法律大数据
抽象思辨是法律论证与法学研究的经典方式。长久以来,主流的见解一般视法律及其实践为一种定性的价值判断与相关操作,然而,历史是否当真如此?考察历史可以发现,法律从未与计算绝缘,计算法律也并非现代社会的专利。按照研究者的考证,在历史上,无论是中国还是外国,数字对法律文化的影响是深刻的,用来表达法律制度背后所蕴含的理念。可能正是因为如此,法律及其实践早就具备了一定的可计算性。欧洲中世纪盛行的法定证据制度(numerical proof,又称“数量证据制度”),便是早期模糊量化证据规则的体现,法定证据制度的部分内容在某种程度上可被理解为证据证明力算术叠加的技术规则。又如,20世纪90年代纽约大学政治学家布兰斯(Steven Brams)与美国联合学院的数学家泰勒(Alan Taylor)将“调整赢家法”应用于婚姻财产分配,以“赋分+计算”方式减少财产纠纷。安德烈-米歇尔·盖瑞(André-Michel Guerry)收集了1820—1830年代法国各地区刑事法庭数据,并进行分类汇总以发现司法判决的规律。类似实践情况表明,法律自身具备计算属性,能够通过数学计算的方式解决法律领域的部分问题。尽管早期法律研究中已经出现量化和计算思维的影子,但法律计算真正系统性、广泛性融入法学研究是在20世纪末至21世纪初。这一方面是得益于法律与经验社会科学间交叉合作关系的持续推进,出现了诸如司法政治学、法律与经济学、法律社会学等交叉学科;另一方面也得益于部分学术协会以及顶尖法学院对推动实证研究所作的持续努力。 关于当代法律计算的实践样态,有学者认为,社会科学与计算科学研究方法业已不同程度地贯穿于法学研究之中。在庞大的数据的支持下,多种前沿统计模型、计算机模型、形式模型已在认知、解释、预测法律行为与司法实践中发挥了重要作用。换言之,法律计算可采取计量研究方法、聚类分析技术以及机器学习、人工智能等“计算”维度的分析方法。也有学者认为,法律计算以具备数量变化关系的法律现象为计算出发点,旨在通过实证研究评估司法的实证效果,反思法律规范的合理性,探究法律规范与经济、社会的内在关系,主要涉及统计学、现代数学、人工智能等技术方法。另有学者认为,法律计算的方法包括规则推理建模、数据推理建模与“规则+数据”融合推理建模这三类。诸如此类的观点强调法律具有量的属性,法律现象自然可以使用数学计算方法加以研究。总而言之,不同学者将法律计算的方法归入了不同的研究范畴,具体涉及实证法学、计量法学、计算法学、数据法学等研究范式。 需要说明的是,法律计算是一个相当宽泛的概念。在笔者看来,一切运用计算思维和数据科学与计算科学的原理与技术对法律进行数字化研究与应用的行为均可看作是法律计算。因而,本文所探讨的主要是应用于法学研究中的法律计算。在这一意义上,现阶段法律计算方法以法律实证研究和相关的计算法学的研究方法为主,且这两种范式呈现出“一体两面”的关系,二者在研究对象、研究思维和研究领域上相通。计算法学将机器学习方法作为主要的法律计算方法,其本质是实证研究在新材料、新方法兴起后的应用与拓展。当下,我国法律计算的范围、方式等都有新的变化,通过对当代法律计算的发展脉络与中国实践进行梳理与总结,有助于把握我国法律计算进一步发展的方向。
计算什么?早期,用于法律计算的数据大多是根据研究问题的需要从原始材料(如档案、台账、案卷等)中收集、整理而来,通常聚焦于对审判流程、制度运行、法律后果中某“单一”指标的测量。因此,这些数据一般是小体量(千量级以下)的结构化或半结构化数据。近些年,随着计算法学概念的兴起,尤其是大数据、人工智能、机器学习等技术的引入,法律计算的对象已经从传统的单一记录式、文本型法律数据,扩展到更加多元化和复杂化的领域。当下法律计算对象包括但不限于大量的判决文书数据、社会调查数据、司法统计数据,甚至包括非法律数据,如社交媒体、新闻报道、网络行为等。总体上主要体现为大体量、包含大量法律内外信息的非结构化数据。总的来看,法律计算对象已有从单纯的“静态”数据向庞大、动态、互动的法律信息系统(涵盖从立法、司法到法律实施和社会反应的各个环节)转变的趋势。 如何计算?从法律计算方法发展的维度来看,法律计算大致经历了三个阶段。其一,以描述性统计方法为主要形式的萌芽阶段。该阶段以人工或半自动化的数据收集、处理和描述性统计方法为典型代表。其二,以相关性统计分析和少量因果分析为主要形式的发展阶段。主要表现为使用多元回归方法发现法律现象中的互动机制,以及尝试使用双重差分等因果分析方法解释法律现象背后的因果机制。其三,以大数据技术运用为重要标志的迭代升级阶段。其不仅使用计算科学的方法收集、处理数据,更重要的是使用计算科学(主要是机器学习)的方法来分析数据。对此,笔者选择以下几种常见形式加以说明。 有学者梳理法律实证研究的发展历程发现,美国法学界有关司法裁判的实证分析早在1925年就已出现,但直到20世纪80年代,实证研究所使用的一般为单一数据,且在方法上往往只涉及描述性地运用数据进行案例研究。事实上,这种被认为是早期或传统的实证方式长期并大量存在于法律计算领域,美国《实证法律研究杂志》的副主编赫伯特·M.克里泽指出:“直到近期,尽管发表在该杂志上的研究大多是定量的,但其中大多数实证法律研究都是高度描述性的,仅仅试图提供某些法律现象的丰富细节。” 在这一阶段,学者一般只能基于手动收集和整理的有限案例,以及公开或半公开的司法数据展开研究。同时,由于研究者掌握的量化、分析手段有限,其往往只能通过一个较小切面考察某一法律规则或制度运行状况。尽管如此,但由于描述性统计通常只需要通过“计数”和简单运算,就能一定程度上呈现出法律条文、案例、法律实施结果等在某一地域、某段时间的整体情况,因此被研究者长期、广泛使用。 如笔者团队在二十年前所做的刑事证人出庭问题的实证研究就不同程度地涉及法律计算问题。我国1996年刑事诉讼法明确规定了证人应当出庭。笔者当时带着“应当出庭”的立法初衷是否实现的疑问,以C市2004年两级法院审理的6810件刑事案件为研究样本,展开了带有“法律计算”意味的实证研究。研究发现,仅26件案件存在证人出庭的情形,占比0.4%。此外,在证人出庭作证的案件中,基本上都是辩方申请证人出庭,每个案件平均出庭的证人数量为2.6个,控方证人与辩方证人的出庭比例为2:1。同时,在对待刑事证人出庭问题的态度上,超过80.0%的律师认为刑事证人出庭对案件有“很大影响”或者有“一些影响”,持相同观点的检察官与法官人数占比均约为60.0%。这些数据表明,刑事案件中证人出庭作证的问题并非证人出庭率偏低,而是争议案件罕有证人出庭。从诉讼主体的层面考量,证人本身并非问题的根源,造成上述现象的原因是法官、检察官对证人出庭作证的消极态度。又如,陈苇、何文骏对离婚救济制度的实证研究也是这方面的典型代表。他们以重庆市某基层法院的离婚案件卷宗为样本,统计离婚案件当事人基本信息、请求离婚理由、结案方式、损害赔偿处理等“单变量”的分布情况,从中发现并分析我国现行离婚救济制度的规定及其司法实践存在的问题。 如前所述,描述性统计一般只能停留在法律结果层面,较难深入揭示法律现象之间的内在联系。很快,那些不满足于对法律现象进行表层阐释的研究者开始尝试发现法律机制中隐藏的交互关系。例如,在美国“弗曼诉佐治尼亚州案”中,大法官道格拉斯基引用了多篇关注死刑处置中种族差异的实证研究成果,以说明黑人与高执行率间存在统计意义上的关联,并以此加强对“死刑本身即是一项备受质疑的惩罚”的观点的论证。自20世纪以来,法律计算的对象和方式出现了与既往不同的新变化,不再局限于机械地了解法律规则,而开始解释和验证法律在现实中的运行及其规律。当一项研究中主要关注是两个变量或多个法律因素(自变量)对法律结果(因变量)的作用机制时,涉及的主要推断方法是各种形式的回归分析以及更为复杂、确定性更强的因果推断。 值得注意的是,前期的相关性分析主要使用(多元)线性回归方法。如白建军教授对“罪因、罪行与刑罚适用三者之间的关系”的实证研究,该研究使用相关系数、多元回归分析的相关性分析方法。首先两两计算我国横向(不同地区)、纵向(不同年份)犯罪率与各种社会经济指标(GDP、平均工资、年人均收入等)、人口数据(城镇人口率、人口密度、人口自然增长率等)间的相关系数,筛选出有显著相关性的经济、人口因素,再使用多元回归方法,确定与犯罪率真正相关的有效变量。多元分析结果证实经济发展与犯罪率之间呈高度正相关关系。白建军教授进一步阐明相关关系并不代表因果关系,因此上述结果并不代表经济发展与犯罪间存在“A导致B”的因果关系。 要回答“一个变量是否导致另一个变量发生”的问题,需要进行因果分析。因果分析能够揭示现象之间的传导路径和作用机制,帮助理解现象背后的因果逻辑,从而更好地解释复杂的法律实践。例如,陈天昊等学者利用双重差分法(differences-in-differences,简称DID)推断检察行政公益诉讼与环境污染之间的因果关系。他们基于基准DID模型构造双向固定效应的双重差分模型,选取实施公益诉讼试点地区的环境监测数据为自变量,将衡量地区污染水平的工业二氧化硫及其人均排放量的对数值、人均工业废水排放量等因素作为因变量。同时,加入诸如产业结构因素、第二产业GDP比重等因素作为控制变量。结合上述数据,使用多元回归的计算结果以及稳健性检验结果,反映出检察行政公益诉讼试点实质上降低了试点地区工业废水总排放量和人均排放量,客观上证明了行政公益诉讼的试点实施效果。 早在1898年霍姆斯就在演讲中多次提及“预测”,并以此表达法律的特点。其认为“我们研究(法律)的目的就是预测,预测在什么情况下公共权力通过法庭这一工具起作用”,并且这种“预测”不是零散或随意的,而是整体性和系统性的存在。事实上,法律制度往往包含大量明确的规则和原则,通过对历史判决、案件特征和法律条文的分析,可以发现一定的规律性(现有法律、先例和既定程序的作用模式)和一致性(相似案件在相似情境下具有相似结果),这使得法律适用和判决预测成为可能。进一步,随着自然语言处理、机器学习等工具技术的进步和司法透明度的提高,数据获取渠道增多以及数据体量明显增大等也为法律预测功能的实现提供了现实条件。 如Berk等人对被指控实施家庭暴力的嫌疑人再犯风险的研究。该研究获取来自主要大都市地区的28000多起面临家庭暴力指控的传讯案件数据集,将数据集随机划分为训练集(用于训练模型)和测试集(用于评估预测性能)。基于训练集训练随机森林模型,并使用交叉验证在迭代中不断提高模型性能,最终使用测试集对模型进行预测和评估,以使训练模型具备稳健的预测功能。研究结果显示,如果对“提审后两年内没有因家庭暴力被捕”的样本进行“样本外预测”,其正确率约为90%。通过准确预测,可以帮助法院在审前阶段更好地评估被指控人的危险程度,作出更合理的决定,进而在避免不必要监禁的同时减少“再犯情形”的发生。又如,有研究者基于美国最高法院数据库(SCDB)中1816年至2015年的24万余次法官投票和2.8万个案件结果的数据集,提出了一个具有普遍性、一致性并且能够适用于样本外预测的机器学习模型,用于预测美国最高法院的裁决。该模型在判定法官个人投票和整体案件结果上,分别达到了71.9%和70.2%的准确率,显著超过了基线模型的表现。尽管这一准确率尚未达到能够实际应用的程度,但仍展现了机器学习在法律预测领域的潜力,并为后续司法预测型法律计算研究提供了理论和方法支持。
整体而言,法律一直以来都具有可计算性。受制于计算方法的局限与计算思路的匮乏,以前的法律计算仅表现为小范围内的简单计算。随着数字时代的到来,多元量化方法和数字技术的普及、推广,研究者的计算能力得到显著增强。从前一些不可量化的法律现象现在可以逐步量化,越来越多的法律条文通过数字化或计算化的方式加以表达,相应地,法律计算的方法和模式也发生转变。回顾近些年发表在我国主流法学期刊上的法律计算研究的相关成果,笔者发现多篇成果展现出我国法律计算的新特点。 在裁判文书网上线以前,法律计算的数据往往是区域性、小范围的实践或调研数据,样本量在几百到几千已可以看作“大样本”。在上网裁判文书积累到一定体量后,少数学者和研究团队开始基于裁判文书网对文本大数据展开计算,典型的如王禄生团队专门开发了可以分词、分段检索,识别检索词自然语义的数据提取工具,实现对303万份判决书数据的批量提取与处理,为后续开展刑事诉讼制度改革相关问题的研究打下了基础;马超等利用中国裁判文书网所公开的2015—2019年23.8万份一审行政判决书为研究样本,以原告胜诉率为指标,对全国范围铁路法院审理行政案件的效果进行实证研究。同时,裁判文书网的发展也促进了北大法宝司法案例库、聚法案例库、汇法网等案例数据库的开发。由于裁判文书网检索方式相对单一,使用“类案检索”式案例库开展法律计算也成为部分学者的选择。如吉林大学蔡立东团队利用“聚法案例”平台,从已公布的5600余万份裁判文书中筛选出关涉“夫妻共同债务认定”的裁判文书60余万份,并借助自然语言处理、机器自动聚类技术对裁判文书进行无监督学习式的数据挖掘。近五年,各法学学科均出现使用相似数据规模的研究。可以说,基于裁判文书的大量上网,法律计算的对象已由小样本转向大样本,以万级甚至十万级以上的样本量开展大数据法律研究逐渐成为主流。 计算对象的多元化、丰富化也是我国当下法律计算的新趋势。已有学者探索使用“新”数据展开研究,这些数据往往未被既往的研究者察觉和利用。其一,从其他领域数据中挖掘法律相关信息。如冯煜清、曾瑜使用中国社会状况综合调查数据库(CSS),从中提取涉及民众对司法、执法公正态度的部分,描述民众感知正义的总貌与趋势,并分析影响感知正义的因素。其二,使用法律领域中常见但尚未被作为研究样本的数据展开研究。如张永健及其合作者获取129个法域的物权法文本,对其中土地私有制、善意购买人等108个物权法原则进行编码,进而运用阶层分群法等各种监督与无监督机器学习算法,考察129个法域物权法之间的异同。其三,综合、交叉运用法律和非法律数据展开研究。如吴雨豪、刘庄对民意影响司法决策机制的研究,该研究除获取涵盖全国的104万危险驾驶罪裁判文书数据外,还提取了中国家庭追踪调查(CFPS)中各个地区3万余名民众对醉驾行为量刑的民意数据。通过法律“内+外”相结合的计算方式,发现法官更倾向于遵循民意量刑以及民意与量刑之间存在互相加强的规律,拓展了学界对“传统”量刑影响机制的理解和认知。因此,拓宽法律计算的数据来源,能够使研究者发现常规法学研究中不易被谈及的新问题、新现象,从而有助于进一步形成新规范、新理论。 有学者总结域外量化法律实证研究范式的新发展发现,如果研究无法作因果推论,而只能发现相关性,或只是作描述统计,就很难发表在美国一流的期刊上。近年,这种“因果革命”在我国法学研究中有萌芽之势。因果分析的核心在于制造“反事实”,即通过构造与观察到的事实不同的条件情境,探讨事件P发生是否会增加事件Q发生的概率,或因素A的变化会对结果B的趋势产生何种影响。目前,主流的因果推论包括实验、断点回归、双重差分、工具变量、配对以及事件研究等方法。其中双重差分法和断点回归方法长期用于政治学、经济学的政策评估研究,因此扩展应用到法学领域的时间较早,发展较为成熟。总体而言,使用因果分析方法的法律计算仍主要使用既有的实践数据进行,而鲜少使用需要更具挑战性的实验方法。这主要是因为要确保实验的科学性和结论的准确性,实验方法对组织人的资源调动能力、被试者的能力和参与度、实验条件的准确和统一等都有较高要求。因此,相较其他方法,实验方法的研究门槛较高,难度较大。 近年来,我国也有学者开始利用实验方法展开相关研究。其一是李学尧、刘庄采用实验方法,探究司法偏见与法官司法说理与否,以及说理同判决的先后顺序与之间的因果关系。其中实验以中国法官为受试者,采用2×3被试间设计,所有法官被要求裁判特定的抢劫犯罪事实,而实验组增加一项“抢劫款为受贿款”的事实变量,实验组与对照组的法官被随机分入三种决策程序:直接判决、先说理再判决和先判决再说理。实验结果发现:抢劫财物是否为受贿款同正当防卫构成要件的判断无关,对照组与实验组法官的量刑整体上没有显著差异,但是采用直接判决刑罚方式的实验组法官的量刑幅度显著高于对照组法官。据此,可以通过查看刑期的差异来判断不同司法行为是否会产生量刑偏见;通过查看刑期差异的变化情况,可进一步判断不同司法方式在消除量刑偏见方面的作用与效果。其二是王迎龙基于学业纪律惩戒的情景实验模拟认罪认罚场景。他将参与实验的学生随机分为实验组(没有“作弊”的无辜者组,意指在客观上没有实施犯罪行为的被追诉人)和对照组(实施“作弊”的有罪者组,意指客观上实施了犯罪行为的被追诉人),并通过提示承认与不承认“作弊”获得的不同处罚措施(类似于检察官的量刑建议)模拟认罪认罚场景,观察两组学生是否承认“作弊”(认罪认罚),以探究诉讼程序本身以及从宽的利益考量对被追诉人心理的作用。相较于其他研究法律与相关现象间因果关系的方法,实验方法更具科学的精确性和可验证性,更有助于发现法律实践中不易被察觉和验证的“因果律”。 计算法律的第一步是将法律经验、法律规律从法律的文本语言转化为计算机可以识别的数字,其过程实际上就是法律信息的模式识别,需要对法律信息进行划分和归类处理。如今我国已转向使用大数据进行法律计算,传统适用于千量级或更少样本使用的人工数据录入方法已无法满足现实需求,因此不可避免地需要用到大数据技术,主要是机器学习实现自动化数据提取。目前运用较多的是自然语义处理(NLP)技术。在生成式人工智能迅猛发展的影响下,嵌入大语言模型(LLM)式的提取模式也开始被应用。通过技术处理将外在表述不同,但内涵相对一致的法律文本语言划分为相同或者相似的类别,也就是使计算的法律经验数据类型化的过程,只有具备类型化特征的数据才能具有进一步被模式化识别和分析的条件。 除法律数据提取外,大数据分析同样需要使用机器学习方法。事实上,当前所说的“大数据”是指数据规模巨大。换言之,不仅数据“条数”多,每条数据所包含的信息量也更多。传统的回归分析等统计方法往往需要满足很多预设条件,当变量多且复杂时,前提条件很难验证,模型参数可靠性也难以确定。在大数据条件下,机器学习的计算能力、处理复杂数据的能力以及捕捉数据特征和关系的能力明显更强。当下运用机器学习方法已成为我国量化法律研究的主流趋势之一。比如,李佳静构建了一个包含法律语义理解层、法律知识学习层和法律要素推理层的认知系统计算框架,向系统输入事实描述,司法裁决的概率即自动给出。相比于支持向量机(SVM)等传统方法,该系统可以更有效地预测离婚案件裁判结果。周翔选取13万余份起诉书和不起诉书,使用长短期记忆(LSTM)深度学习算法对其中犯罪嫌疑人的社会危险性进行量化,并使用梯度提升决策树(GBDT)预测不同输入条件下(案件事实信息/案件事实信息+社会危险性)的强制措施类型。可以说,法律计算中机器学习等计算技术的应用已由数据提取阶段向数据建模、分析阶段延伸,其法律预测功能开始显现。
在法律计算逐步融入我国法学研究体系的背景下,其工具性与方法论价值已得到一定认可。可以预见,未来法律计算将在创新法律理论、优化法律实践方面扮演更重要的角色。但同时,法律计算的潜力尚未被充分挖掘,其局限与挑战也仍然存在,面对不断涌现的技术变革与法律实践的复杂需求,法律计算研究如何回应,实现从探索阶段向成熟体系的过渡,仍需要学界的持续思考与接续努力。 笔者曾对计算法学发展进行前瞻和判断,认为计算法学应致力在更多问题上、更广阔领域内探索、应用机器学习,并与传统法律实证研究以及其他研究方法共同揭示法律实践规律与匡正法学理论。法律计算当下的新展开似乎表明学界正大步沿这条道路前进,并仍在不断延伸其边界。对于笔者曾指出的“我国公开司法数据多属结果性材料,在研究司法人员推理、决策等过程性问题方面作用有限”问题,程金华指出的“法律实证研究论著出现研究选题乏味、理论应用不力、量化数据不足和统计操作随意的技术缺陷”问题,以及徐文鸣指出的“法学实证研究当下面临外部缺乏认同、内部陷入发展瓶颈的双重挑战”等问题,当下法律计算实践已有所回应。实验方法通过测试法律行为主体(如法官、律师、普通公民)的行为,探讨其在特定法律情境中的决策过程和行为倾向,为探究司法人员推理、决策机制提供了全新的方法论工具。通过机器学习对法律大数据进行数据提取和相关性分析这一计算形式,为传统法学知识体系提供了新论题和新观点,并提升了法律研究中的自动化与智能化水平。对法律大数据的充分挖掘丰富了研究选题,量化方法的应用同样在向多元化、科学化方向发展。纵观近些年法学期刊上对计算法学、大数据技术等新兴概念的讨论,总体上呈现谈论困境与反思有余,鼓励与肯定不足的态势。笔者以为,在我国法学主流期刊对合作研究认同较低,更青睐重视理论性研究以及对实证研究存有偏见的环境下,更应充分肯定法律计算“先行者”们对计算对象、计算方法和计算规范的不懈探索和追求。 要增强学界对法律计算的接纳度和认同感,首先要锚定目标,即法律计算要致力于回答各种法律经验现象以及如何更好地解决现实问题。同时,还应持续提升法学研究者的数字化素养,注重多背景人才的培养,建立法律计算研究的资助和激励机制,推动更多法学研究者投身于该领域,促进法律实证研究、计算法学在学科建设中的系统化发展。此外,适当开展对大数据、机器学习等技术应用的伦理、合法性研究,通过学术研讨和理论探讨消除偏见和疑虑。 如今法律量化方法的普及使得大量法律文书、司法实践得以数据化呈现。多元量化分析方法的推广、应用促进了法律计算的顺利开展。不过,法律计算也有其局限性。一方面,法律计算始终难以充分、精准地模拟法律人的思维推理过程。大量“只可意会,无法言传”的法律经验知识以及思维活动较难通过数字及其计算反映。诸如“排除合理怀疑”“内心确信”等证明标准虽然可通过文字表达,但是简短的文字、数字却难以反映其丰富的内涵。另一方面,法律世界还包含着人类对法律事实的情感判断。大量“情理交融”“情法冲突”案件的处置原理很难通过简单的数学运算加以解决。这类复杂案件的处置依然需要法律人根据自己的公平正义观,结合法律条文进行价值权衡。可以说,无论法律计算的范围和程度如何发展,始终都不能完全替代法律人的思维推理与情感活动等一系列复杂思考过程。换言之,法律计算往往要么是局部范围、有限程度的精确计算,要么是较大范围、精准性有限的计算。我们应理性看待法律计算的发展,既不能忽视法律计算对法学专业知识结构产生的影响,也不宜过度夸大法律计算的能力,不当扩大法律计算的范围。 梳理、总结目前我国应用法律计算的法学研究也可发现,使用新材料、新方法以及针对大数据进行法律计算的研究仍处在有限、少数的状态,还未形成系统化、规模化的研究之势。受制于法学学科的人文知识结构属性,法学背景的学者长期训练形成的知识体系与统计学、计算科学这些理工类学科间存在“天然壁垒”,贸然“打破”既不现实,也会影响研究的水平和质量。中国法律计算的本土化发展需要多元学科与不同领域知识的持续驱动,而要克服上述困难,既要积极寻求外力帮助,也要注重交叉人才的培养。一方面,要加强跨学科的合作,有学者分析计算法学全球发展趋势发现,国内研究合作缺失明显,而国外研究的突出特点之一是研究人员具有多元学科背景,并开展广泛的科研合作。就此来看,加强建立跨学科研究平台,推动建立研究机构与学术期刊互促互融的关系尤为重要。另一方面,需要积极促进法学学科的融合发展,将法学学科与统计学、计算科学等知识融合,培养法律人知悉数学知识,掌握多元化的法律计算方法,以及具备通过计算解决法学问题的实际操作能力。在这方面,中国政法大学“四跨”人才培养模式具有一定的借鉴意义。 应该说,研究者获取数据的手段和方式越来越多,但不容忽视的是,很多研究者赖以进行法律计算的数据和网络文书资源却表现出逐年减少的趋势,尤其是裁判文书上网骤然收紧。从近五年中国裁判文书网每年上传的文书数量来看,民事裁判文书的数量从2018年的14024738件减少到了2023年的3816110件,呈现出逐年递减的趋势;刑事裁判文书的数量从2018年的1420784件减少到了2023年的199851件,同样是逐年减少;行政裁判文书亦然。威科先行法律信息库中的裁判文书数量的变化趋势与中国裁判文书网类似。当然,也有学者认为裁判文书网上公开制度还存在即时性欠缺、个人信息保护不到位、文书质量不高及裁判文书获取不便利等问题。这些现实和质疑是否意味着基于裁判文书网数据的法律计算会丧失其意义呢?笔者认为并非如此。 事实上,研究者仍可将裁判文书网等公开数据作为研究的重要数据来源,这一判断是笔者基于我国目前法律数据和法律研究的现实情况作出的。一方面,裁判文书网等大数据平台是中国法律数据区别于其他国家或地区法律数据的重要特征。域外法律实证研究更易获取来自实务部门的司法数据,但获取门槛较高,一般的法律研究者难以涉足。而中国法律裁判文书的公开程度具有绝对优势,这为难以从其他渠道获取法律数据的研究者提供了大量的研究材料。可以说,在网上公开提供法院判决方面,中国是“潮流引领者”,并且随着裁判文书长期公开,法律学者将能够追踪对诸如过错、因果关系或损害等概念的不断演变的解释,或者研究法院如何处理特定类型的案件或当事人的模式。另一方面,我国立法的刚性和司法制度的稳定性决定了我国法学研究的对象多为长时、普遍的现象,因此基于裁判文书大幅公开期间的数据开展研究,仍可以把握司法裁判的实践特征和未来走向。 当然,研究者也要注意对数据合理、充分的挖掘与运用。我国目前从事法律实证研究(包括计算法学研究)的学者与《厨神争霸》中无法随心所欲选择食材的“大厨”处在相似的境地,而“如何使用有限的食材调料烹饪出色、香、味俱全的美味佳肴”就要看“厨神”理解、处理、融合食材的功力。首先,应尽量获取能够充分反映法律运行中的过程性事实与结果性事实的高质量法律数据,进而全面真实地展现法律世界的全貌,避免因遗漏某些重要且“隐秘”的法律事实而影响法律计算的可靠性,尤其要注意所选数据的随机性和代表性。其次,在“完美”数据集难以获取的情况下,可结合个案分析、问卷调查、访谈等研究方式,增强结果的可印证性和说服力。 需要强调的是,对法律数据的获取不可过度依赖中国裁判文书网等数据平台,还应善于发现、利用其他渠道展开法律计算研究,以应对裁判文书不上网等变化。随着数字社会的发展,社会科学的研究范式已经出现了明显的变化。首先,各数字平台的崛起为社会科学研究者提供了海量的数据资源。其次,计算范式与AI范式正处于崛起状态。在此背景下,法学研究面临新的时代性挑战,即对于各数字平台生成的极大规模的,通常以文本、图像或视频方式呈现的非结构化数据,如何寻找新的研究路径与数据处理方法。社会学研究领域新兴的计算范式也许为法律计算的未来发展提供了思路。例如,有学者借助网络爬虫程序从推特等平台上获取了来自多个国家的数亿条信息,并借助谷歌云平台对多源大数据进行处理和分析。当然,如果确实受限于大数据资源的获取,法律计算仍可围绕小数据、中数据或较大数据展开。此类数据资源仍然可以在法律计算中发挥重要作用。 大语言模型在法律领域的垂直应用可能是我国法律计算发展的新形式,尽管我们需要正视其应用的有限范围而不能夸大其前景。当前,我国已开启了对“法律大模型”的探索,数款法律大模型应用相继面世。例如,北京大学研究团队打造的法律大模型系列ChatLaw系列模型,依托海量的法律新闻、司法解释、法律咨询、法考题及判决文书等原始文本,构建了丰富的对话数据;南京大学新型软件技术国家重点实验室、人工智能学院、智能科学与技术学院联合开发了LawGPT模型,与常见GPT-4、Baichuan2等大模型相比,该模型具备更强的案例分析和法律咨询功能,可看作是一家虚拟的律师事务所,能为广泛的用户提供全面的法律服务;浙江大学联合阿里巴巴达摩院与华院计算研发的智海-录问平台,通过运用高质量法律领域知识对大模型进行训练,并在模型推理阶段与司法知识库高度融合,使模型具备法律问答、案情分析、推理决策、法律文书生成等功能;山东大学联合浪潮云、中国政法大学研发了夫子·明察司法大模型,涵盖法条检索、案例分析、三段论推理判决以及司法对话等功能。整体而言,当下崛起的基于法律文本大数据的大模型计算模型,可通过对法律语料的计算实现智能法律问答、法律咨询等功能,甚至在某种程度上可以完成现实中的一些法律工作。这无疑具有创新性,明显不同于传统的法律计算。 需要指出的是,当下我国较为普遍的法律计算仍更多地表现为基于实践数据的统计,而非基于法律文本大数据的大模型计算。一方面,开展大模型法律计算需要法律、计算机科学、数据科学等多学科的交叉协作,以及产学研间的资源整合,而近期出现的法律大模型多由“非法律人”开发,法律领域的参与明显不足。同时,模型训练需要收集大量、全面的法律数据,而法律数据不仅包括判决文书、法律条文,还涉及大量的法律解释、评论、意见书等非正式文本,这些数据往往分散在不同平台和机构以及法院内部,难以系统、全面地收集。另一方面,即便是已研发面世的法律大模型也存在较为明显的短板。通过预训练语言模型(PLM)输出文本的过程仅是对所训练法律语料库的“信息整合”,而无法产生“信息增量”。现今法律大模型多采用 “通用模型+法律数据微调”模式,其语境学习能力、语言生成能力来自通用模型训练使用的海量非专业性数据,而用于微调的法律专业数据规模较为有限、质量较难把控。而训练语料库的规模、丰富性与质量将在很大程度上影响模型的准确性和输出能力。事实上,ChatLaw的研发者也承认该模型在逻辑推理和演绎等任务中的表现并非最优。此外,在整合了大量特定领域的数据后,ChatLaw对通用任务的泛化能力也有待进一步提升。其他法律大模型还存在诸如检索效果一般、对融合知识的理解能力一般、稳定性不足和准确性难以保障等问题。 观察大模型以及当前已面世的法律大模型可以发现,大模型计算以“大数据”“强算法”“大算力”为主要特征,其在法律垂直领域具有广阔的发展潜力,值得进一步探索。对此,法律计算的研究者与运用者要有危机意识与创新观念,应该积极拥抱基于法律文本的大模型计算方法。首先,必须认识到研究素材与研究方法已经发生根本性变化:一方面,研究素材从有限的实践数据转向大规模法律语料库;另一方面,研究方法从传统、透明的统计分析和机器学习转向生成式人工智能,后者具有更强的语言生成与推理能力,但其复杂性和不透明性也带来了新的解释挑战。其次,在计算方法上,应积极采用前沿的深度学习技术,特别是具有更多参数、更深层次结构的大语言模型,以提高模型的拟合能力和对法律问题的表达能力,使其能够更精确地处理复杂的法律问题。最后,在算力上,处理大规模法律数据和执行复杂的计算任务,需要依赖高性能计算设备或云计算平台,以充分发挥大模型的潜力,从而更好应对法律问题的复杂性,并为未来的法律研究与实践提供技术支撑。
法律计算的广泛应用与深入探索已成为当代我国法学研究的一种趋势,并正在重新定义其研究方法。观察近年我国法律计算研究的发展历程,可以发现,在研究对象上使用数字技术提取法律文本大数据展开研究逐渐成为主流,同时研究者积极探索新的数据来源,例如未被充分发掘的法律数据、包含法律信息的社会学数据和网络大数据等,以发现法律领域的新现象与新问题,突破了传统法学研究的论域。在研究方法上,出现了基于实验方法“生成”数据解析法律因果关系的研究路径。同时,机器学习等大数据技术更深入地融入数据提取和数据分析过程,为法律计算研究提供更加高效、精密与系统化的技术支撑。然而,法律计算的局限性仍然不容忽视,在法律与计算相关学科的跨学科对话中,研究者还应充分认识数字技术的工具性与法学研究的独特性,避免技术至上主义对法律规范与价值判断的“侵蚀”。 进一步,法律计算的发展应坚持以服务中国自主法学知识理论体系构建与回应我国法律实践发展需要为要旨。在理论层面,致力于法律知识与规则的适当表达,通过数据驱动的研究方法,描述法律现象并揭示其背后的运行规律,增强法学研究的科学性与系统性。在方法论层面,应该不断拓展和应用多元化的、适配研究需要的计算方法,并继续探索与深度学习、语言大模型等前沿技术的融合,构建符合我国法律语言规范和法律推理逻辑的法律大模型。在实践层面,注重问题导向,以回应我国立法完善、司法决策优化、司法效率提升等现实需求,形成对实践具有实际指导意义的研究成果。面向未来,法律计算的深入发展依旧需要研究者坚持不懈地尝试与探索,推进法律计算的本土化,促进法律计算思路与方法的成熟与普及,将是较长时期内法律计算研究的重要使命。