主题研讨集萃十一 || 王竹、林喜芬、王禄生、王燕玲等:司法大数据研究

学术   教育   2024-10-13 09:05   北京  
点击上方“政法论坛”关注我们
转载时烦请注明“转自政法论坛公众号”字样

编者按




《政法论坛》“主题研讨”栏目开设于2021年,通过聚焦重大理论和现实问题,围绕国家法治建设重点领域开展有针对性的选题策划与成果推出,推出一系列在法学界有较大影响的专题论文,为全面依法治国提供强有力的智力支持,助力国家治理体系和治理能力现代化。为了进一步方便读者结合系列专题类文章进行阅读,本刊公众号特推出主题研讨及相关论文集萃,以飨读者。

本期推送《政法论坛》2022年第5期主题研讨“司法大数据研究,并挑选本刊和其他刊物发表的同类主题相关论文集萃,敬请关注!



司法人工智能推理辅助的“准三段论”实现路径

我国司法人工智能研发面临法律思维、可解释性和可计算性三大瓶颈,应以可解释的司法人工智能推理辅助作为主要突破方向,法律要件解耦是关键。在司法人工智能推理辅助中无法直接嵌入传统三段论逻辑,应当以“争议焦点”替换“结论”,构建“准三段论”逻辑结构,应对大前提的横向杂糅性、争议焦点的类型化和小前提的复杂性与多样性等主要挑战,并实现动态维护。基于“大前提≥争议焦点≥小前提”层次性态势,设置不超过五级的标签体系,可以通过三大“组群”关系合并表达“准三段论”束46种具体链接方式,实现一定程度和范围的智能推理辅助。

原文下载链接:

点击阅读:王竹:“司法人工智能推理辅助的‘准三段论’实现路径”,全文刊于《政法论坛》2022年第5期。


论命名实体识别技术在司法大数据中的适用

法治均等化与可及性建设,需要推动我国社会公平正义的司法体制综合配套改革。在法治研究与人工智能深度融合的背景下,作为专有名词识别与自动标识的命名实体识别技术(NER),在适用于法律人工智能的过程中具有积极价值。命名实体识别在司法大数据中应用的法理根基在于文本解读的主体间性。就法律规范文本而言,命名实体识别技术可通过“法律规范文本数据集—实体标注与识别—深度学习训练模型”的路径实现。就裁判文书文本而言,应重点关注文书文本的语义类别与特征、模型选取、实体细粒度标注原则以及数据增强功能,提升法律实证分析、类案检索的精准性。通过命名实体识别技术的深度应用,为法律人工智能的可及化和均等化提供新的技术工具和辅助参考。

原文下载链接:

点击阅读:王燕玲:“论命名实体识别技术在司法大数据中的适用”,全文刊于《政法论坛》2022年第5期。


司法大数据文本挖掘与量刑预测模型的研究

大数据时代,计算机数据正以海量速度增长,尤其是非结构化的文字数据最为惊人。利用自动化文本挖掘技术处理非结构化数据,获得有价值的预测或趋势信息,已成为近年来的热门议题。法院判决书是典型的非结构化数据,本研究以中国裁判文书网毒品判决书为文本挖掘对象,利用TF-IDF、N-Gram、关联性分析及CRISP-DM等技术方法,对388份判决书进行自动化分类及数据化转换,并利用统计线性回归方法,实时分析法院判决数据,建构出量刑预测模型。经评估后发现,本研究所提出的判决分类及量刑预测模型均有良好的预测能力。本研究所提出的判决书文本挖掘流程与自动化模型架构,未来可以为司法大数据应用提供参考。

点击阅读:舒洪水:“司法大数据文本挖掘与量刑预测模型的研究 ”,全文刊于《法学》2020年第7期。



司法大数据在中国法院的应用与前景展望

人民法院积极适应信息技术革命,推动建立司法大数据管理和服务平台,在服务司法审判实践、提升审判管理质效、建立阳光司法机制、深化应用法学研究、助力科学决策等方面进行了积极有益探索。同时,司法大数据的应用也面临一些挑战,应进一步加强对数据的利用和管理,提升数据处理能力和数据质量,重视法律和数据技术复合型人才培养。未来的司法大数据应用,将秉持"服务司法实践、服务公众需求、服务社会发展"的理念,立足于提升司法大数据应用效能,朝着"使法院更健康,使法官更健康,使社会更健康"的趋势发展,在助力提升审判体系和审判能力现代化水平以及社会协同治理能力、优化社会治理模式方面发挥更大作用。

点击阅读:孙晓勇:“司法大数据在中国法院的应用与前景展望”,全文刊于《中国法学》2021年第4期。


惩罚确定性与犯罪控制——基于1986—2019年司法统计数据的研究

犯罪增长和冤假错案问题近年来讨论热烈,但惩罚不确定和威吓不足所导致的错放问题却鲜有研究。1986—2019年的法律年鉴数据显示,刑事司法虽在命案控制方面成效显著,但对其他类型犯罪应对不足甚至放纵也是其重要特征。具体表现为:破案和逮捕、起诉、审判率低,且呈明显递减趋势;疑似犯罪不立案、不起诉,职务犯罪受案、立案量都显著下降;拘役和非监禁刑比重成倍上升,刑罚不当轻缓化现象明显。时间序列分析显示,各种惩罚不确定性指标对犯罪增长有显著影响。中国在转型时期需坚持惩罚确定性,继续用严格的刑事司法措施和监禁刑控制犯罪。

点击阅读:熊谋林:“惩罚确定性与犯罪控制——基于1986—2019年司法统计数据的研究”,全文刊于《清华法学》2021年第5期。


大数据证据在刑事司法中的运用初探

在数据时代,大数据应用于刑事证据已然成为理论和实务的重要议题之一。当前在刑事案件中,大数据证据主要被用于侦查破案线索、弹劾被告辩解、补强言词证据、印证性的间接证据等,在作用方式上包括了基于海量数据的数据库比对和基于算法模型的大数据分析。关于大数据证据的法律定位及运用规则,不宜囿于刑事诉讼法的现有证据种类,而应回归到证据方法的概念,对基于海量数据的数据库比对宜采取庭上展示和辩方质证的证据方法,对基于算法模型的大数据分析宜采取专家辅助人提供检验意见和出庭接受质证的方法。在大数据证据的证据能力审查上,应能经受住相关性检验和科学可靠性检验;在证明力评价层面,应结合大数据应用的信息连接点选择、算法歧视可能性、逻辑架构合理性、算法结论稳健性等判断大数据证据的可信性以及对待证事实的证明程度。

点击阅读:林喜芬:“大数据证据在刑事司法中的运用初探”,全文刊于《法学论坛》2021年第3期。


司法大数据应用的法理冲突与价值平衡——从法国司法大数据禁令展开

2019年3月法国立法机关颁布的2019-222号法律第33条禁止基于法官身份的数据分析、比较、评估与预测,由此将判决书大数据应用限制在相对有限的领域。上述禁令的出台,是立法机关对司法大数据应用与法官隐私、司法独立、司法权威、司法公正之间法理冲突的回应。其深层次原因是改革者平衡司法公开与个人信息、司法权威与言论自由、司法独立与技术主义、法官个人与法院整体等价值之后选择的折衷方案。围绕禁令的讨论对规范我国司法大数据应用具有重要的启示意义。在我国司法大数据应用中有必要引入个人信息保护理念,破除片面技术主义误区。在此基础上,推动司法大数据应用的常规备案与伦理审查、明确司法大数据应用的非约束性适用原则、建立司法大数据应用的负面清单制度。

王禄生:“司法大数据应用的法理冲突与价值平衡——从法国司法大数据禁令展开”,全文刊于《比较法研究》2020年第2期。


司法大数据与人工智能技术应用的风险及伦理规制

与传统司法信息化相比,司法大数据与人工智能技术的应用呈现出数据前置性、算法依赖性、自我适应性与领域限定性的技术特征以及范围全面性、功能根本性、地位关键性与态度开放性的时代特征。上述特征与司法场景特性的融合交叠可能诱发司法固有属性被消解、法官主体地位被削弱、司法改革目标被替代和司法改革结果失控等风险。为了有效防范风险,在司法大数据与人工智能技术应用中必须遵循以保障司法固有属性为终极目标、以强化法官主体地位为根本出发点、以工具主义为功能定位、以比例原则推动审慎创新的伦理规范。

点击阅读:王禄生:“司法大数据与人工智能技术应用的风险及伦理规制”,全文刊于《法商研究》2019年第2期。


基于大数据样本的刑事附带民事诉讼司法重构经验与逻辑

吸收自前苏联的刑事附带民事诉讼制度在经过多年的本土化发展之后,逐渐具备了助力解决我国司法实践问题的中国特色。通过大数据样本的实证研究,发现刑事附带民事诉讼在司法实践中存在被过度透支的现象,其不仅被扩张适用于精神损害赔偿领域,还影响辐射至普通民事诉讼中,严重地背离了该项制度的预设目标。刑事附带民事诉讼的底层逻辑是以程序正义换取诉讼效率,其功能是在保障实体正义的基础上提升诉讼效率,而非兼顾程序正义与诉讼效率。正确适用刑事附带民事诉讼,就必须明确其系简化的民事程序的本质,并在司法实践中严格遵守"因犯罪行为造成物质损害"这项立法限制。

点击阅读:夏伟:“基于大数据样本的刑事附带民事诉讼司法重构经验与逻辑”,全文刊于《法学论坛》2021年第5期。


刑事司法证明中大数据相关关系的局限作用论

大数据相关关系形成于归纳逻辑,且经由心理建构的本质,与作为司法证明证据外元素的一般经验知识相类似。但是,意图控制一般经验知识选择及适用的英美道德约束机制抑或我国释法说理公开机制,在面对算法参与产生的大数据相关关系时,难以充分发挥作用。不仅如此,意图使大数据相关关系在刑事司法证明中发挥逻辑黏合作用的构想,还面临难以逾越的技术难题与道德忧虑。而当大数据相关关系以意见证据样态出现时,无论是基于英美科学证据制度还是我国“准鉴定意见”的证据定位,均需对其科学可靠性进行重点审查。然而,以实证检验为核心,加之同行评议的标准体系,尚不能充分评估大数据算法分析的科学可靠性。可参考英美证据有限可采性规则及我国类似实践,仅出于特定证明目的,使用以意见证据形式呈现的大数据相关关系。现阶段,大数据相关关系仅能在刑事司法证明中发挥局限作用。

点击阅读:黄健:“刑事司法证明中大数据相关关系的局限作用论”,全文刊于《清华法学》2023年第2期。


“预测正义”能否预测正义?基于法国司法大数据预测应用的考察与启示

在着力发展司法大数据预测应用的当下,提升司法质量和效率的价值目标伴随着信息安全风险、算法偏见、决策独立性降低、解释性判例体系冲击等阴霾。面对相似的挑战,对具有成文法传统的中法两国司法大数据预测应用的比较研究具有现实意义。法国以2016年《数字共和国法》颁布为标志,推进以司法大数据预测应用为内容的“预测正义”。在强保护立场和保守基调下,法国预测正义在功能局限与价值冲突上备受质疑,司法个人信息保护、决策独立性、算法有效性、解释性判例体系嬗变等问题成为了争议的焦点。法国通过公开裁判信息预处理、“法官画像”禁令、以“等距法”理论更新司法范式、倡导异议裁判支持机制、提高算法透明度等途径,试图对冲预测正义带来的冲击。立足中国实际,批判借鉴法国经验教训,建议强化司法大数据中信息权的保护、确立司法智能决策有限参考原则、构建算法专业监督机制和异议裁判保护机制,以完善和发展我国人工智能辅助司法决策制度。

点击阅读:戎静:“‘预测正义’能否预测正义?基于法国司法大数据预测应用的考察与启示”,全文刊于《中外法学》2023年第5期。


人民陪审员参审效能的实证分析——基于36万余份刑事判决书的司法大数据考察

人民陪审员制度作为我国一项重要的司法制度,一直以来备受国家和社会的关注和重视。然而,“陪而不审”“审而不议”似乎长期支配着学界对于陪审员的想象。以36万份刑事司法裁判文书数据和一手田野调研资料为分析素材的实证研究发现,人民陪审员能够系统性地影响审判结果,陪审员的参与会使最终的判决结果更加“宽大”;陪审员在合议庭中与法官的不同组合方式,也会给案件结果带来不同的影响。其背后的理论机制可被归结为:法官能够自利性地抵消陪审员的能力短板;陪审员能够能动性地发挥自身的能力优势;法官在组织合议庭时策略性地与陪审员结成“联盟”。

点击阅读:王翔、于晓虹:“人民陪审员参审效能的实证分析——基于36万余份刑事判决书的司法大数据考察”,全文刊于《法学家》2023年第3期。


数字时代大数据辅助司法证明的构造及其风险防控

“大数据辅助证明”有助于提升事实认定的科学性与准确性。大数据辅助证明以整体主义为指引,在证据推理环节通过大数据技术高效组织数据,整合经验概括对个案中的推论命题和要件事实等的确定形成类型化指引;在证据评价环节可以辅助证据标准的数据化校验与证明力概率评价的科学化。如果对大数据智能产生非理性崇拜,那么其有可能异化为新的神明裁判方式,侵蚀理性主义传统,导致认知偏差难以得到控制,证明责任的界限模糊化,以及用“客观规律”代替“认识论概率”等问题,而且会增加事实认定在各方面的附随风险。为应对挑战,司法证明的重心应当从“信息规制”迈向“风险防控”,并坚守数据技术的辅助性,诉讼主体的认知交互性和证明的外部可检验性原则。当大数据辅助证明诱发的风险无法通过隔离、警示和对抗等手段预防时,应当合理分配证明过程中的风险。

点击阅读:刘金松:“数字时代大数据辅助司法证明的构造及其风险防控”,全文刊于《现代法学》2024年第1期。

END


推荐阅读

时建中、张新宝、张守文、左卫民等:数据法学

应松年、马怀德、叶必丰等:行政法治现代化

雷磊、王迁、王禄生、支振锋等:数据法学 生成式人工智能

张明楷、罗翔、张翔、王志远等犯罪前科如何消灭?

马怀德、余凌云、卞建林、刘松山、王勇、单平基等民行刑一体化公益诉讼专题

陈光中、卞建林、陈卫东、谢佑平等刑事诉讼法修改专题

李曙光、陈景善、张世君、陈夏红等破产法修改

赵旭东、冯果等公司法修改

张明楷等:《刑法修正案(十二)》及中国刑事立法

《政法论坛》2024年第5期目录及摘要

《政法论坛》2024年第4期目录及摘要

《政法论坛》2024年第3期目录及摘要

《政法论坛》2024年注释体例

《政法论坛》2024年投稿须知

征订 || 欢迎订阅2025年《政法论坛》



扫码关注政法论坛




政法论坛
《政法论坛》是中国政法大学主办的法学学术期刊。秉持“一切为了政法学术”的办刊使命,打造新时代下“引领学术潮流、促进学术交流、分享学术智识、承载学术思想”的重要政法研究平台,入选教育部社科期刊“名刊工程”,第一批国家社科基金资助期刊等荣誉。
 最新文章