庄乾龙 ​| 论刑事案件大数据分析报告的证据属性

文摘   科学   2024-07-25 21:17   北京  
本文刊载于《公安学研究》2024年第2期。为方便阅读,编辑中对部分文本进行加黑并删除了文章脚注。

【作者简介】

庄乾龙(1978—),男,北京林业大学人文社会科学学院副教授,法学博士、博士后(北京100083)


【摘    要】

刑事案件大数据分析报告在司法实践中的广泛运用与立法未将其纳入法定证据种类之间的矛盾,导致理论与实务人员对其定性产生截然不同的观点,先后涌现出司法鉴定说、书证说、证人证言说、电子数据说及新型证据说等观点,也有人认为刑事案件大数据分析报告只能作为查办案件的线索,不能将其视为证据。从司法实践应用情况、法律规定及其证明价值看,大数据分析报告具有证据属性。但受人工智能、大数据分析方法等科技手段尚未成熟的影响,对刑事案件大数据分析报告定性宜将其区分为办案参考材料、鉴定意见与新型证据种类三个阶段。在此基础上,应当积极稳妥地推进大数据分析报告取证、质证、认证程序制度建设。
【关 键 词】
刑事案件;大数据分析报告;证据属性

一、问题的提出
“随着物联网、移动互联网、智能终端和云计算技术的发展,人类社会步入了‘大数据’时代。”“大数据开启了一次重大的时代转型。就像望远镜让我们能够感受宇宙,显微镜让我们能够观测微生物一样,大数据正在改变我们的生活以及理解世界的方式,成为新发明和新服务的源泉,而更多的改变正蓄势待发”。司法场域作为社会生活领域重要组成部分,同样受到大数据的影响与冲击。面对浩如烟海的大数据信息材料,司法领域缺乏足够的人力、物力对涉案证据抽丝剥茧。相较于有限的司法资源,大数据具有无限性特征。例如,“某起涉税案件具有资金密集、跨地域、犯罪链条长等特点,因此办案民警调取了涉案主体在所有银行的全量资金数据,整个案件涉及的资金流水数据有上亿条,账户数达上万个。面对这么复杂的资金数据,人工梳理根木不可能”。又如,在快播公司传播淫秽物品牟利案中,控方共计调取了7台服务器中的55016个视频文件,共锁定了38273个淫秽视频。控辩双方面对上述海量视频,不可能逐个观看并进行质证。
海量数据倒逼司法实务部门借助高科技手段审查判断涉案证据,希冀以人工智能、科学数理算法提高证据搜查、审查与认定的效率。人工智能、机器算法等伴随着大数据一起涌入法庭,引发众多证据适用疑问。刑事案件中大数据分析报告属性问题就是疑问焦点之一,其能否作为证据使用及归属于何种证据类型,实践做法各异。如美国司法实务中有将汽车系统记录数据作为证据使用的判例。我国司法实务部门不乏运用大数据分析报告的情形,但大多分阶段限制性适用。在侦查阶段,大数据分析报告主要作为侦破案件的线索,审查起诉与审判阶段一般将大数据分析报告作为法院裁判的参考。也有司法机关将大数据分析报告视为证据的情况。如在“e租宝”案中,阿里云计算有限公司提供“e租宝”平台服务器海量镜像文件、数据库备份文件作为检材形成电子数据检验报告,再以检验报告为依据做出司法鉴定,确认“e租宝”平台的业绩情况。法院采信了司法鉴定意见,但控辩双方对该鉴定报告意见不一。其主要原因是目前尚无法律规范对大数据分析报告性质予以明确,司法实践作上述处理实为无奈之举。明确大数据分析报告属性,规范其法律地位是回应大数据司法适用的迫切要求。

二、刑事案件大数据分析报告属性纷争
大数据分析报告证据种类归属争议源于我国立法对证据种类采用列举式模式。证据种类的法定化有其优势,但其难以周延证据法定类型的缺陷也至为明显,无法灵活应对社会发展变化对证据法的影响。目前学界对刑事案件大数据分析报告证据类型属性主要有如下几种观点。
(一)归入传统证据种类
该观点认为,当最终以从大量混杂数据中分析获取的“小数据”举证时,则大数据分析报告自然可归属于传统证据种类范畴,具体包括检验报告说、书证说、司法鉴定报告说、证人证言说、电子数据说等。
检验报告说认为,根据修订前《最高人民法院关于适用〈中华人民共和国刑事诉讼法〉的解释》(以下简称《高法解释》)第87条规定,对案件中的专门性问题需要鉴定,但没有法定司法鉴定机构,或者法律、司法解释规定可以进行检验的,可以指派、聘请有专门知识的人进行检验,检验报告可以作为定罪量刑的参考。例如,把资金大数据分析纳入司法鉴定范畴,资金大数据分析报告即可视作检验报告,做出资金大数据分析报告的人需要出席法庭,就该报告做出说明,并接受质证。笔者认为,检验报告尽管与大数据分析报告具有相似性,但两者之间具有本质区别。检验报告的对象是专门性问题,普通群体因缺乏专业知识无法准确认知专门性问题,他们需要借助专门工具与专业知识对该特殊问题进行解读。检验报告以检验人的意见为主。大数据分析报告主要是借助人工智能、机器算法等自动生成的机器逻辑结果,是人工意见与计算结果的综合体。两者的生成机制有着本质差异,难以将其等同视之。此外,新修订司法解释删除了“检验报告”证据类型,直接将“指派、聘请有专门知识的人就案件的专门性问题出具的报告”视为证据,但在审查时,需要按照鉴定意见规则进行审查认定。可见,将大数据分析报告视为检验报告既不符合目前法律规定,更不能从根本上解决其归属问题。
书证说。持书证说的观点认为,大数据分析报告一般最终以书面的方式予以呈现,其证明案件的方式是分析报告内容,这与书证证明案件的方式具有一致性。如在《山东省菏泽市中级人民法院刑事裁定书》(2018年鲁17刑终430号)中,控方举证证明行为人使用的手机号码记录证明,在一段时间内,行为人连续在某网吧内上网。法院将该手机号查明的内容作为书证予以认定。书证是通过书面语言、符号等承载的内容予以呈现案件事实,大数据分析报告是在对元数据进行筛选、加工的基础上形成的一种结果,大数据分析报告尽管可以通过纸质的方式予以呈现,但其证明案件的方式并非源于原始数据反映的字面含义,而是经过机器逻辑加工并经人工解释而成的证据,分析报告包含着原始数据字面含义与综合处理后的逻辑内容。将大数据分析报告视为书证的观点只看到了其呈现书面的形式,而忽略了其证明方式的特殊性。

司法鉴定报告说。该观点认为,“目前我国相当一部分案件需要司法鉴定人的参与,尤其在侵犯计算机系统的案件当中,由于犯罪工具的隐形化,往往需要司法鉴定人对网络数据进行恢复、提取、保存及分析,从大量无关数据当中挖掘出破坏计算机系统的工具。”由此形成司法鉴定报告,该报告具有证据属性,大数据分析报告与司法鉴定报告并没有实质性区别,完全可以将其视为司法鉴定报告予以证明案件事实。该观点与检验报告说类似,同属于鉴定意见类。如前所述,司法鉴定报告的本质是具有专门知识的人员利用专业知识对特殊事项进行专业解读。大数据分析报告形成过程与此不同,两者的根本区别是机器逻辑与人的逻辑使用方式之间的差异,将大数据分析报告等同于司法鉴定报告有混淆机器逻辑与人类逻辑之危险。
证人证言说。该观点认为,随着互联网及人工智能的发展,机器语言成为法庭不可忽视的一种特殊语言。机器通过大数据方式传递的信息可以视为是机器证言,应将其视为证人证言中的一种。尽管机器语言在现代法庭中扮演着越来越重要的角色,但其与一般意义上的证人证言依然有着本质性区别。证人证言是自然人基于对案件事实的了解向法庭进行证明,并接受法庭的质证。机器证言只是单纯信息的系统记录,无法对相关事实做出灵活性地说明并接受质证,缺乏人类所有的非逻辑性特征。刑事证明是人类逻辑与非逻辑综合运用的结果,刑事证明建立于证据种类准确归属基础之上。该观点将大数据分析报告视为证人证言,但因其证明案件事实的特殊性又不能接受证人证言审查规则的约束,无法保证该证据的可靠性与真实性。
电子数据说。该观点认为,大数据分析报告主要源于电子数据,与电子数据证据具有高度一致性。实践中,有高达66%的判决将大数据分析报告视为电子数据。该观点以大数据分析报告主要源于电子数据为出发点,将其视为电子数据,有以偏概全之嫌。笔者认为,电子数据与大数据分析报告有着明显区别:一是证据材料来源不同。电子数据源于电子形式存在的数据材料。大数据分析报告材料来源包括电子数据与纸质数据信息等;二是证明方式不同。电子数据通过原始数据证明案件。大数据分析报告需要通过大数据挖掘、比对、分析等过程形成,通过数据整合后的分析结果证明案件事实;三是是否需要时间同步不同。大数据分析报告是在海量数据信息基础上通过技术手段形成,与电子数据出现的时间相比具有滞后性。电子数据证据则需要形成时间的同步性。实际上,当电子数据以海量方式呈现时,电子数据本身很难被直接用作证据,从取证、举证、质证等证据运用环节进行观察,大量数据的直接运用均难以实现证明效果。即使被直接运用,亦会出现“数据倾倒”危机,即优势方向对方倾倒海量数据,致使阅卷不能、质证不能,从而强化己方优势。海量电子数据在刑事案件中起到证明作用主要是通过机器算法与人工分析形成报告的方式予以实现。
(二)创新证据种类
鉴于大数据分析报告的特殊性,有观点认为,有必要将大数据分析报告认定为单独的证据种类,单独予以规制。但对大数据证据与大数据分析报告证据之间的关系又有区别论与分别论之分。区别论认为,大数据证据并非直接生成于案件事实发生过程之中的证据,而是借助大数据算法对原生于案件事实本身的海量电子数据,进行数据收集、挖掘、清洗、整理和计算等一系列分析之后所生成的。在最终的大数据报告生成之前,并不存在区别于传统类型的证据。这是因为,作为分析对象的大数据集在案件发生之前已然存在,其实质是电子数据,而非一种新型证据。且,若不存在大数据报告,大数据算法对于案件事实也无法产生任何证明作用,根本不可能被当作一种证据来看待。因此,当且仅当大数据报告生成时,才存在所谓的大数据证据。该观点不认为大数据本身是证据,只有经过对复杂数据进行分析合成之后的结果即大数据分析报告才能成为证据。区别论认为对于“大数据中那些跟案件相关的数据信息,可以纳入‘电子数据’这一既有的法定证据种类范畴。
笔者赞同区别论观点。区别论观点将大数据证据区分为大数据证据与电子数据两种类型:如果电子数据本身与案件事实相关,将其认定为电子数据证据;对于电子数据与案件事实没有直接关联,但可以通过大数据分析与案件事实建立关联者,将其视为大数据分析证据。实际上,无论电子数据本身是否与案件事实相关,对其筛选、对比、挖掘、分析之后形成的分析报告和原始数据在与案件事实之间的关系、证明目标、证明强度等方面均有实质差异。在大数据概念之下再行区分大数据分析报告与电子数据证据实无必要。大数据的海量特征决定了司法者依靠传统手段无法挖掘其与案件事实之间的关系,只有借助高科技分析手段方能判断其是否具有证明力。“从技术原理上讲,大数据变身证据通常要经过三个环节:第一步是汇总数据并进行数据清洗,第二步是建构分析模型或机器算法,第三步是进行运算形成分析结论。这一过程结束后,就会产生大数据证据。”笔者赞同将大数据证据视为大数据分析报告的观点,但对其宜以大数据分析报告代替大数据本身,因为“大数据证据”这一革新性语词虽然具有逻辑上的可接受性。但因为大数据可能会涉及元数据问题,未经综合逻辑整理分析的数据难以称之为证明案件事实的材料,故以大数据分析报告命名使得这一概念更为清晰与合理。并且,无论是我国司法实务还是域外刑事诉讼实践均未有大数据证据概念,但我国司法裁判中已存在使用大数据分析报告术语以表明其证据形式的先例。
大数据分析报告作为证据应具备客观性、关联性与合法性三个基本属性。大数据分析报告是在海量数据基础之上基于机器逻辑算法得出的结论,其过程是人、数据与机器算法进行的多层次互动。首先,在大数据分析之前,需要明确分析对象与预期目标。此过程主要表现为人的主观能动性的发挥,具有一定的主观性特征。其次,需要对相关数据进行采集。无论是何种案件,所采集数据与案件事实相关性程度都将影响大数据分析报告与案件事实的关联性程度,而数据样本全是大数据分析报告准确的重要保障。再次,对数据按照一定的标准或规则进行分类,使得相关数据变得有序,这有助于后续的分析。至于按照什么样的标准或规则进行分类,一定程度上也会影响到大数据的分析结果。从次,基于相对成熟的分析工具或者机器算法,对数据进行分析,从而获得趋势性结论。最后,相关主体在上述数据趋势性结论基础上进行汇总分析,阐述观点或结论,进行大数据分析报告的编写。综上,大数据分析报告尽管是建立在大数据基础之上进行机器算法得出的汇总,但其过程不乏有主体的参与,如何防止参与者的主观偏见对分析报告产生不良影响也是未来立法者必须考虑的因素。因为这将影响证据的客观性、关联性乃至合法性。

(三)不能作为证据看待

基于刑事案件大数据分析报告本身的不稳定性与证据种类归属的困难,有观点认为,不宜将其作为证据使用,因为“大数据分析只能预测一个人很有可能进行的行为,并不是精准的预测,违背刑事诉讼无罪推定原则,并且会扭曲人类最本质的东西,即理性和思维。”大数据中挖掘出来的数据,依靠的是专业人士的主观、二次分析解读。专业人士的专业解读难免基于主客观因素导致最终结论的妥当性和准确性问题。但考虑到分析报告在侦查犯罪等诉讼行为中会起到较为重要的作用,故可以将其作为查获案件的线索作用使用。还有观点认为,大数据(分析报告)证据在实践中缺乏应用,尚未形成独立的证明方式。系统性并非是大数据(分析报告)证据所独有,新增大数据(分析报告)证据种类没有必要。否定论理由集中于大数据分析报告难以满足证据的客观性与关联性两个属性。否定论者认为,大数据分析报告更多地是主观产物,无法保证分析报告的客观性与真实性,难以成为证据。此外,因大数据分析的结果更多地是一种趋势性预测,而非精准证明某个案件事实或整体案件事实。该理由本质是坚持传统证据证明力的因果关系论,即证据对待证事实必须具有强有力的因果关系。大数据分析报告与案件事实之间难以建立强有力的因果关系,是一种弱相关关系。因此不能将大数据分析报告作为证据使用。
基于传统证据理论,否定论观点有一定道理。但否定论者未对司法实践中对大数据分析报告的实际运用甚至是采纳的情形予以论证,也未对大数据分析报告在刑事案件事实证明中的独特作用进行阐述,更未指出在大数据日益发展的今天该如何应对这一大数据问题。互联网技术的发展,大数据的涌现逼迫司法实践必须予以回应。任何简单的否定或肯定大数据分析报告的法律定位与价值都不是务实的态度。2016年,最高人民法院、最高人民检察院和公安部联合发布了《关于办理刑事案件收集提取和审查判断电子数据若干问题的规定》(以下简称《电子数据证据规定》),对刑事诉讼中电子数据的定义及其收集、提取、移送、展示、审查、判断等方面讲行了详细地规定。其中有许多条款设置目的都是旨在保障电子数据的真实性识别。尽管大数据分析报告与上述电子数据并非同一概念,但两者审查方式却有着相同之处。可见,与学术界的否定观点不同,司法实践对电子数据的证明力等问题进行了较为全面的探索,上述规范性文件试图通过对电子数据证据的真实性进行严加规范,以确保其证明力。司法实践亦证明,上述努力是有效果的,目前大量的刑事案件定案中的证据都或多或少地使用数据证据,而在某些案件中电子数据证据甚至成为主要定案根据。大数据分析报告是客观存在的,并非是人类主观臆想的产物。我们对其只能客观对待,认真分析判断并予以规范。
三、刑事案件大数据分析报告属性探析
刑事案件大数据分析报告是否具有证据属性不应将其置于实体规范层面予以讨论。因为就现有证据种类来看,刑事案件大数据分析报告证明案件事实的方式具有独特性,难以归属于现有证据种类,这也正是对其属性产生争议的主要原因。应否将大数据分析报告作为证据看待,取决于司法实践对其适用情况、相关规范发展与其证明价值。
(一)大数据分析报告司法实践价值刑事诉讼全过程运用
大数据分析报告法律属性争议归因于立法缺失与司法实践广泛应用之间的冲突。司法实务部门对大数据分析报告的态度并非是主动选取的结果,而是源于大数据分析报告的现实作用,在侦查、审查起诉与审判三个阶段均有大量探索实践。
首先,大数据分析报告在侦查阶段主要作为发现案件线索的依据。以“技术侦查”为关键词检索到的裁判文书中,在侦查手段分布方面,采取与数据相关侦查手段的案件共120件,在总体案件中的占比为5195%,可见,大数据侦查手段被技术侦查广泛应用。刑事侦查的核心任务是搜查犯罪证据,寻找犯罪嫌疑人,查证犯罪事实。其中如何快速有效地查获犯罪嫌疑人是侦查工作重要努力目标。大数据分析可以从海量数据中挖掘、比对个人信息,为准确锁定犯罪嫌疑人提供技术支持。也正是因为大数据分析在查获犯罪嫌疑人方面的有效性,有学者对大数据分析报告挖掘犯罪人的类型进行了深入研究,并将其区分为两种类型:一是目标锁定型数据挖掘。该类型是指通过大数据分析对比挖掘发现并锁定犯罪嫌疑人;二是确认型数据挖掘。该类型是指通过大数据分析挖掘并比对涉嫌的犯罪嫌疑人,并予以确认犯罪嫌疑人。我国司法实务中通过运用大数据分析实现两项重要任务,一是通过大数据分析发现案件线索,如“通过对数据的挖掘、比对和分析,……会收集到与犯罪行为人有关联的更深层次的案件线索,……”二是通过大数据分析发现线索再进而发现案件。此种方式改变了侦查机关被动发现案件事实的传统侦查模式,大数据分析让公安司法机关在发现犯罪中更具有针对性与主动性。通过大数据分析报告获得的案件线索及查获的犯罪嫌疑人成为案件侦破经过的重要组成部分。实践中,侦查机关为规避大数据分析报告证据资格问题,往往将其演化为案件“情况说明”,但该“情况说明”本质是依托超越立法的突破性司法解释。而数据挖掘势必会触及个人隐私,隐私计算与大数据侦查融合应用的实质是侦查机关通过技术手段扩展外源性数据,强化对公民个人信息的获取和干预,使用不当会造成全景式监控风险、流转风险、失控风险。在相应法律规范缺失背景下,辩方在技术手段方面的非均衡性参与使其更加陷入边缘化境地,这种缺少制约的侦查权运行方式容易导致新型“侦查中心主义”的复辟。
其次,大数据分析报告是检察机关法律监督的重要手段。司法实践中,大数据分析报告成为检察机关审查案件发现同案漏犯的利器。如在尚某涉嫌内幕交易一案中,检察机关对涉嫌犯罪的尚某做出不予批准逮捕决定的主要原因是本案没有嫌疑人的口供,且同案犯在逃。检察机关为此对本案的侦查机关提供法律指导意见:根据本罪涉及的犯罪构成要件内容,通过数据库查证嫌疑人的资金账户、资金流向、交易记录,和历史对比进行大数据挖掘分析。侦查机关最终将尚某在内的六名犯罪嫌疑人抓获并移送审查起诉。在审查起诉中,“办案人员再次邀请泉州市信息技术局提供协助,运用大数据技术和关联分析手段,以可视化图表的方式分析、展示其相关交易行为,清晰得出五名犯罪嫌疑人的交易行为明显异常的结论,犯罪嫌疑人的辩解难以成立。2016年10月至12月间,检察机关经审查先后对王某等六名被告人分别以泄露内幕信息罪、内幕交易罪提起公诉,案件正式进入法院审理程序。”在刘某升等人敲诈勒索案中,涉嫌犯罪人多,但隐蔽性强,犯罪痕迹少。本案中,侦查机关仅移送两名犯罪嫌疑人。检察机关把大数据思维贯穿办案全过程,从风险人员、关联案件数据入手,最终将本案从仅有2人参与2起犯罪事实的案件中挖出12人参与14起“仙人跳”团伙犯罪案件,实现从大数据中挖掘价值信息纠正漏犯漏罪,以数据赋能检察监督。
最后,法院认可大数据分析报告的证明作用。形式上,法院对大数据分析报告的态度具有肯定与否定二元化特征。肯定者将大数据分析报告作为证据使用。如在上述尚某一案庭审中,检察院采用多媒体技术方式展示大数据分析报告,得到了法院的认可,从而得以认定行为人构成犯罪。否定者不认为大数据分析报告具有证据属性,其原因是现有的证据种类不能涵盖大数据分析报告。但否定者又承认大数据分析报告在案件处理中确实起到了重要的证明作用。为此,几乎所有对大数据分析报告证据属性持否定态度的法院又表现出较大的统一性:以变通的方式认可其对案件事实的证明作用,而非直接排除。如有的法院将大数据分析报告视为专家辅助人意见。专家辅助人员意见虽然不属于法定证据,但却起到了证明案件事实的作用。以至于最高人民法院《关于适用〈中华人民共和国民事诉讼法〉的解释》明确规定:“具有专门知识的人在法庭上就专业问题提出的意见,视为当事人的陈述。”而2018年最高人民检察院第八批指导性案例第28号中更是明确提出专家辅助人意见可以作为定案的根据。尽管上述文件并非专门用于规范法院处理刑事案件,但上述规定证明专家辅助人的意见对案件事实认定的重要作用。换言之,大数据分析报告对案件事实的认定同样起着重要的作用,只是囿于立法的缺失,法院不得已将其视为专家辅助人意见而已。有些法院将其作为“破案经过材料”对待。有些法院将大数据分析报告作为独立报告看待,但承认其对案件的证明作用,法律意义上处于定罪量刑参考性材料地位。
(二)大数据分析报告立法概况宏观与间接规范
针对大数据分析报告在司法实践中的突出作用,立法予以积极回应。2015年8月31日,国务院以“国发〔2015〕50号”印发《促进大数据发展行动纲要》。该纲要包括发展形势和重要意义、指导思想和总体目标、主要任务、政策机制4部分。纲要充分肯定了大数据的积极意义,宏观上规划了大数据发展的主要内容,成为指导我国大数据立法实践的重要依据。
在微观层面,目前虽然缺乏专门规范大数据分析报告的法律文件,但不乏有规范大数据分析报告的间接规定。2012年修订刑事诉讼法时新增技术侦查。但该法未对具体技术侦查手段予以明确,通过大数据搜集(分析)获得证据的手段是否属于技术侦查措施并不明晰。侦查机关利用大数据进行侦查的过程很可能会采用技术措施,故将其认定为技术侦查手段并非没有道理。《公安机关办理刑事案件程序规定》(以下简称《办案程序规定》)第264条第1款规定:技术侦查措施是指由设区的市一级以上公安机关负责技术侦查的部门实施的记录监控、行踪监控、通信监控、场所监控等措施。《办案程序规定》将技术侦查定位为监控措施,而大数据搜集中的筛选、比对与挖掘、分析行为均属于广义上的监控行为。《公安机关执法细则》(第三版)将“查询、检索、比对数据”单列为一种侦查措施,规定进行下列侦查活动时,应当利用有关信息数据库查询、检索、比对有关数据:(1)核查犯罪嫌疑人身份的;(2)核查犯罪嫌疑人前科信息的;(3)查找无名尸体、失踪人员的;(4)查找犯罪、犯罪嫌疑人线索的;(5)查找被盗抢的机动车、枪支、违禁品以及其他物品的;(6)分析案情和犯罪规律,串并案件,确定下步侦查方向的。尽管上述法律规范文件是针对侦查行为的,但该侦查行为无疑包含着大数据分析,侦查的核心是获取相关证据以查明案件事实,大数据分析报告在查明案件过程中扮演着极为重要的作用。
也正是因为数据分析在侦破刑事案件中的独特作用,相关法律规范文件进一步对电子数据分析种类做出规定。《电子数据证据规定》第16条第1款规定:“对扣押的原始存储介质或者提取的电子数据,可以通过恢复、破解、统计、关联、比对等方式进行检查。必要时,可以进行侦查实验。”该条款目的在于规范电子数据的收集与提取。上述法律条文中的关联与比对是大数据分析的重要方法,尽管该规范性文件并未对关联与比对的结果做出规定,但分析报告无疑是其承载结果的主要形式。这意味着,大数据分析报告在法律规范层面已有相应依据。《电子数据证据规定》第23条进一步规定了电子数据的审查与判断方法:对电子数据是否完整,应当根据保护电子数据完整性的相应方法进行验证:(1)审查原始存储介质的扣押、封存状态;(2)审查电子数据的收集、提取过程,查看录像;(3)比对电子数据完整性校验值;(4)与备份的电子数据进行比较;(5)审查冻结后的访问操作日志;(6)其他方法。从其内容看,该条款是为了确保数据的完整性与可靠性而设计的,其目的是为了保证“大数据分析”具有证明力。
综上,尽管我国刑事诉讼法及相关法律规范性文件并未直接规定大数据分析报告这一证据种类,但其内容已然涵盖了大数据分析报告。相关司法解释与规范性文件对其审查判断方法的规定进一步证明大数据分析报告作为证明案件事实的材料具有证据价值。
(三)大数据分析报告的证明作用相关性背景下事实认定的双重路径
证据的关联性具有事实性特点,证明力的认定属于自由裁量的范畴,证据法不仅具有法律规则性特点,还带有浓厚的事实性意蕴。这使得证据法学科更容易受到其他学科发展与科学方法论在认识领域中的影响。大数据作为当下“互联网+”时代显著经济标签之一,大数据分析技术已然成为中国经济社会领域创新的原动力之一,在经济生活领域成为新的认识论工具。对于证据研究而言,大数据分析技术能够对互联网全样本复杂数据进行大规模分析,对事件之间相关性趋势做出量化评价。大数据分析有助于司法者对某件事实做出倾向性认定,这就满足了证据相关性条件。证据作为论证案件的事实前提,带有些许瑕疵是正常现象,只要证据在认定某一案件事实中实现如下目标即可:有此证据则使得有此案件事实的概率增加。换言之,“各种地图、表格、图表及照片、录像与计算机动画数据等理解其他事实材料具有实质性帮助时就说明该证据具有相关性”。大数据分析无疑对查明或者认定案件事实的认定会起到实质性的帮助。实践中,已有大量利用相关关系查获犯罪的例证。如美国基于智能电表数据,发掘异常用电模式与室内种植大麻的相关关系,以及我国基于交易数据,发掘资金流转模型同特定互联网金融犯罪间相关关系的例证。
尽管相关性不同于传统的因果关系,但相关性是潜在因果关系的一个有用指标。如果两个变量有因果关系,即由一个可以得到另一个,那么它们应该高度相关。尤其是,如果另有独立证据支持两个变量之间存在因果关系的可能性,高度的相关性可以加强这项证据。在统计学上,这被称为联合概率的乘积效果。其实,刑事案件证据中不可能存在单一证据认定案件事实的情况,即孤证不能定案规则在理论与实践层面均成立。只有各个证据之间形成相互印证关系,司法者形成内心确信后才能确认案件事实。申言之,证据与案件事实的相关性或因果性与各证据之间的相互印证关系是两个层面的问题。当多个与案件事实具有相关性的证据能够形成印证关系时,可以大幅降低案件事实认定错误的可能。反之,作为统计分析意义上的证据,在只有大数据分析报告但缺乏其他证据印证的情况下,不能单独将其认定为案件事实的依据。
证据的运用过程是证据推理的过程。证据与案件事实的链接纽带正是司法主体根据证据本身对案件事实之间的关联性推断。传统司法主体在认定案件事实中更多地依赖于既有专业知识与经验、逻辑推断能力。大数据分析报告则是算法逻辑与经验判断结合的结果。如何界定大数据范围、选用何种算法逻辑、进行几维方式的分析及对数据结果的再分析均涉及人类知识经验的判断问题。换言之,大数据下的机器理性不能代替人类理性,两者之间形成优势互补,而非零和关系。就逻辑与经验之间的关系而言,两者并非非此即彼的关系。否定大数据分析报告不能作为证据处理的观点者大都认为,在大数据分析报告中法官的经验使用较少,甚至是忽略不计的,这不符合证据运用的传统规律,背离了运用证据证明案件事实的“自由”原则,极有可能会被技术所绑架,司法权有被技术侵入的危险。大数据、人工智能等作为现代化技术极有可能在推动司法技术化过程中,削弱司法权威。因为“在技术驱动的现代化路径中,技术话语的重要性逐步提升甚至有超越专业话语的趋势,典型表现在技术话语地位的中心性、目标的全面性,尤其值得强调的是在现有的技术驱动的现代化路径中,技术甚至被视为可以直接解决司法公正与司法权威问题。由此,原有的传统法学知识就处于被技术话语定义的位置,与专业话语相关的专业权力也就有被削弱甚至剥夺的可能。
实际上这种担心是多余的,或者说是因为对新生事物不了解而产生的一种过度担忧。首先,证据推断中的经验是相对的,对于新出现的、不成熟的科学知识或认知方法,我们很难将其认定为经验,更多地将其看成是一种科学逻辑。但当我们能够熟悉甚至能够不断改进该方法时,则该方法可能就会成为我们人类的经验。其次,证据推断中的经验可以区分为一般经验与特殊经验。一般经验是指“被假定为由一个普通成年人所拥有的足够经验相关证言主题”。特殊经验是指“仅由已经从事某种特殊行业、商业、艺术、科学或其他恰当活动的那些人也就是专家们所拥有的足够经验”。但实际上,当上述特殊经验成为社会一般公众经验时,则特殊经验也能够为司法者所掌握,转变为一般经验。“大数据分析最显著的特征是:全样本、混杂性、相关性,对于大数据分析的特征,全样本和混杂性是较为纯粹的技术问题,相关性则是大数据分析作为证据来讨论的出发点,大数据分析报告在当下是一种以数据可视化为表现形式的特殊经验。”证据的相关性由证据的实质性与证据的证明力组成。证明力强调的是逻辑上的因果联系,实质性则是指事实之间的关联性。事实之间是否具有关联性是基于司法主体的经验进行的推断,但同样可以基于计算机的总量计算。大数据分析同样存在司法主体的逻辑与经验运用,只是在海量数据面前司法者难以将传统的逻辑与经验运用于所有的数据分析。并且,以逻辑经验为主导的传统事实认定路径中,始终伴随着模糊性与不确定性,而“在大数据证据与司法认知的关系方面,通过数据以及算法分析一定程度上能够改善经验推定的偏见弊端,尤其是体现在对法官进行统计学和决策理论的训练方面。”基于大数据证据共享分析的“数据经验”在一定程度上有利于填补人类对繁杂信息的认知能力不足问题,能够在一个更完整的故事框架中解决案件的争议焦点。大数据分析报告作为认定事实的重要依据,开启了人工智能与人工双重认定事实的机制。
综上,刑事案件中大数据分析报告的证据属性是不言而喻的,只是在缺乏针对性规范的当下,司法者无从对这一既新颖又充满特殊性的证据进行“合法”认定而已。这是导致司法实务部门与学术界对大数据分析报告看法不一的主要原因。但学术争议无法代替司法判决,司法者面对一个个鲜活的个案,对大数据分析报告进行评价是摆在他们面前的一个现实问题。当然,判决书不宜对大数据分析报告的属性进行自由的学术评价,亦不能直接创设大数据分析报告这一证据种类。为此,务实的做法是对大数据分析报告采取三步走的做法,分为当下、中期与远期三个阶段对大数据分析报告属性进行法律定位。


刑事案件大数据分析报告定性三步走战略
通过上文的论述,我们不难得出大数据分析报告的证据属性结论,但目前不宜将其作为单独的证据种类进行认定,也不宜将其归属为其他证据种类。具体可将其区分为办案参考阶段、鉴定意见阶段与新型证据阶段。

(一)大数据分析报告作为办案参考阶段
将刑事案件大数据分析报告定位于办案参考主要基于以下三个方面的考虑。

首先,我们对大数据分析报告存在的问题尚未完全了解掌握。尽管目前在很多案件中已经适用大数据分析报告,但其中暴露出的问题尚未得到有效解决,对于可能出现的问题更缺乏应对策略。大数据分析报告作为新鲜事物,我们尚不能对其充分了解与把握。如,何为大数据,其内涵与外延是什么?我们无从得知。翻阅现有文献资料难以找到一个规范性的概念对其予以界定。个别概念也只是从社会学或计算机科学的角度对大数据作了原则性界定。当下我们缺乏对大数据未来发展趋向与边界的预测能力。大数据内涵与外延的准确界定关涉控辩双方的切身利益。外延界定不准,控辩双方均可对大数据的范围进行对抗质疑,影响诉讼效率。同理,何为“分析”也不明确,该分析是否只要符合基于机器算法运行逻辑即可,还是必须包括机器与人类的双重判断?笔者认为,熟练把控大数据分析报告的未来走向需要“充分的时间”保证。掌握大数据分析报告的本质需要时间的洗礼。纵观刑事诉讼法发展历史,任何概念、诉讼规则与制度的确立都经历了漫长时间的等待。电子数据证据自出现到正式纳入立法,历经30余年的时间。司法者对电子数据的认知经历了由否定到怀疑、彷徨再到肯定的漫长而又复杂的心路历程。而自2012年刑事诉讼法确定电子数据证据种类以来,电子数据证据规则又获得了进一步的发展与完善。大数据分析报告走向完善,成为独立的证据种类同样需要时间的洗涤。
其次,辅助大数据分析报告的科技手段尚待提高。“大数据的处理方式是相对传统的计算处理和分析机制的一次根本的转变”。以至于有学者将此转变称为继验证、推理和计算之后人类认知世界的“第四范式”。大数据分析报告的精确度与大数据分析工具的成熟密切相关。目前市场上大数据分析工具较多,优缺点各异,何种分析工具更具有合理性与科学性缺乏定论。相关主体在选取大数据分析工具时带有明显的主观倾向性。目前市场较好的大数据分析工具有Hadoop、HPCC、Storm、ApacheDrill、RapidMine、PentahoBI等。此外,每年还会有大量新型软件工具涌向市场。上述分析工具何者更适用于司法数据的分析,尚无法得知。况且,大量分析工具为国外研发,是否与中国司法实践中的大数据完全匹配有待进一步检验。控辩双方对于选取何种分析工具、何种算法分歧明显,甚至不乏有故意混淆算法以蒙混过关的情形。如在江西省高级人民法院“(2016)赣刑终33号刑事判决书”中就涉及被告人以大数据分析结果为依据提出辩护,指出侦查机关存在非法取证的概率较高,应当排除其相关证据的理由。本案中,“被告人虽采用了概率分析的大数据论证,但却暗中偷换了基准率频率与发生率频率的运用。通过对记录误差的放大及行贿时间背景因素的冲淡,剔除了重要数据并进行了选择性运算,从而达到所谓的非法证据排除的主张。”大数据分析报告以逻辑数据方式呈现,具有技术话语优势。但当相关主体基于特定目的对数据与分析工具进行刻意选择,并对算法进行操纵时,最终可能会形成迥异的分析结果。大数据分析的专业性与科学性可能会掩盖行为人基于特定目的而有意选取分析工具的错误。
最后,控辩双方缺乏质证大数据分析报告的能力。大数据分析报告作为证据使用时需要接受法庭控辩双方的质证。控辩双方是否有能力质证该大数据分析报告及法庭能否控制该质证程序令人怀疑。大数据分析报告形成过程过于专业,其复杂程度已经远超一般人的理解能力,甚至是专业人员也无法对其算法做出准确说明,影响被告人的质证权与其他诉讼权利。这就是域外学者所提到的“算法黑箱”,即人工智能本身与人工智能的设计者都难以将这一问题解释清楚。以至于有学者质疑通过说不清楚的黑箱做法计算得到的大数据分析报告的正当性。实践中,已然出现大数据分析不当,导致报告失真的案例。如,在一起高速公路费逃避诈骗案中,公诉方因无法准确认定高速公路逃避的起点与终点,就以交通运输部门出具的行经起始点为依据,制作了《高速公路数据表》,出具了大数据分析报告。但上述两份证据中的数据冲突率分别达33%和545%,其主要原因是数据失真与算法不当。此外,对大数据分析的工具原理及算法均属于商业秘密范畴,相关权利人缺乏在法庭上就其商业秘密进行解释与说明的意愿。立法者虽然可以权衡司法价值与商业秘密利益后要求商业公司提供相关算法的说明。但该规定势必以牺牲商业价值为代价,这也是域外各国鲜有立法作此规定的重要原因。商业秘密是市场经济发展的重要推动力量,司法者要求市场主体在法庭详细说明商业秘密,可能会给该市场主体带来重大利益损失,打击市场主体创造商业秘密的积极性。即便通过技术手段可以控制损失,但在“黑箱算法”背景下,开发公司也未必能够将具体算法解释清楚。各大法律科技公司都标榜自己开发的大数据分析软件是最先进的,但市场上通用的分析软件与法律之间基本是两层皮关系,软件开发中并未考虑法律专业术语、规则等特有现象,只是简单地将软件运用于法律行业。如此,法律科技公司人员缺少解读专业性极强的分析工具及其算法原理的能力。而软件开发者虽然了解分析工具的运行过程,但因其不熟悉法律专业知识而导致其不能深度结合法律问题分析说明报告形成过程的科学性与合理性。
综上,受制于各方面因素,立法者有必要给司法实践留足试错时间,在不断提高以软件分析工具为代表的科技辅助系统的同时,着力研发以法律与科技相融合的分析工具和机器算法,并在配合商业秘密、个人信息权法律完善基础上,制定完善的大数据分析报告证据规则。目前,上述条件尚不完备,但考虑大数据分析报告对案件事实的证明作用,可以将其视为办案的参考,并不断累积有益经验。

(二)大数据分析报告作为鉴定意见阶段
大数据分析报告受科学技术发展影响明显,尤其是多媒体、互联网的运用使得数据总量呈指数级速度增长。司法实务部门可能迫于大数据分析报告在司法实践中的广泛运用而将其作为定案根据。在相关配套科技、诉讼制度尚未完善的情况下,可以将其归类于与之最为相似的司法鉴定意见中,以作权宜之计。因为“大数据证据无疑是一种专业性或科学性很强的证据,其结论部分的意见表达是普通人无从凭借常识就能理解的。而在我国现行法律框架中,只有鉴定意见与之相符。……将大数据证据纳入鉴定意见之列,既具有形式上的亲缘性、可比性,也满足司法追求经济性的原则,司法人员可以相对容易地援引鉴定意见的审查判断规则去处理大数据证据的效力。”从鉴定意见发展历史看,其外延呈逐渐扩张趋势,经历了由最早的物证类鉴定、法医类鉴定扩展至声像资料鉴定、环境损害类鉴定发展过程。除上述四类鉴定外,实践中仍然存在大量需要依托专业人员通过专业知识予以解决的问题。根据《最高人民法院关于适用〈中华人民共和国刑事诉讼法〉的解释》(法释〔2021〕1号)第100条规定:“因无鉴定机构,或者根据法律、司法解释的规定,指派、聘请有专门知识的人就案件的专门性问题出具的报告,可以作为证据使用。对前款规定的报告的审查与认定,参照适用本节的有关规定。”由此,“其他类鉴定”,具有了“准鉴定意见”的证据定位。大数据分析报告与上述声像资料、电子数据无论从内容、形式还是发展过程上均具有相似性,将其纳入鉴定意见范畴具有一定的依据。
但正如波斯纳所言:“科学家想要运用诡辩时,他们比其他人更有资格,他们增强自己权威性的办法多种多样,利用数学的精确性施加影响,使用能唬人的行话压制疑问,在评析、试验统计或观察结果时隐瞒个人判断方面的因素等。”而“在实务中,当只有一方专家或技术顾问出庭时,庭审质证往往演变成对其他人员进行的专业知识普及课。”如此,法庭或将变成科学视野下的某个角落,当事人则成为数据与技术任意摆布的木偶,大数据分析报告的联合鉴定意见将加快这一演变。如此,完善鉴定意见规则,使其能够涵盖大数据分析报告的科学技术因素,是应对大数据对现有鉴定意见规则冲击的良策。目前鉴定意见规则难以满足大数据分析报告用作证据的要求,未来立法有必要完善鉴定意见规则,以能够吸纳大数据分析报告证据,具体包括以下四个方面。
首先,改鉴定程序主动启动单一模式为主动启动与申请启动相结合模式。根据现有法律规定,对司法鉴定起到主导作用的是侦查机关。对于绝大部分案件,侦查机关一般通过指派内部鉴定人员对专业性问题进行鉴定,只有在一些案情比较复杂的案件中,侦查机关才有可能聘请社会鉴定机构对专业性问题进行鉴定。法院对鉴定程序的启动缺乏实际的控制能力。“至于被告人及其辩护人,即使对侦查机关提交的鉴定意见提出了重大异议,也无权自行委托鉴定人和提交本方的鉴定意见,而只能申请检察机关、法院启动重新鉴定或补充鉴定程序”。鉴定意见在认定案件事实中属于关键证据,控辩双方对鉴定意见的分歧往往也是最大的,实践中申请重新鉴定的频率高,启动重新鉴定程序概率低,进而引发上诉,降低了司法裁判可接受程度。若将大数据分析报告纳入鉴定意见范畴,有必要改鉴定启动单一程序为双向程序,即控辩双方原则上都可以启动鉴定程序,辩方原则上拥有独立聘请鉴定人进行鉴定的权利,具体理由如下:其一,大数据分析报告使用分析工具并不成熟,使用不同分析工具形成的结论可能会有差异;其二,大数据分析报告使用的机器算法可能会影响最终结果的走向;其三,大数据分析报告涉及多个专业知识的混合,这与传统鉴定事项一般限于某个特定领域不同,联合鉴定或者分阶段鉴定在大数据分析报告中将成为常态。未来立法赋予辩方委托鉴定人进行大数据分析报告的权利,可以有效对质鉴定意见,以达到息诉服判的目的。
其次,完善审查鉴定主体资格程序。传统鉴定主体是否符合法律规定一般只需对其执业证书进行形式审查即可做出判断。但若将大数据分析报告纳入鉴定意见范畴,则其鉴定人员资格审查就变得复杂且重要。如前所述,大数据分析报告涉及手机取证、数据恢复、大型服务器取证、计算机文件系统分析、伪基站鉴定、软件功能分析、文件的真实性和同一性认定等。这些领域的鉴定人被统称为电子数据鉴定人,这种不区分专业知识的局面使得面对电子数据鉴定意见时,需要对鉴定人的相关背景与其作证内容的适格性问题进行审查。大数据分析报告的形成过程可能需要若干人的参与,若鉴定人只有一人,则该鉴定人必须具备综合知识背景。但在大数据领域精通各个专业知识的人寥寥无几。在联合鉴定背景下,需要进一步审查各鉴定人的鉴定资质,并对各鉴定人之间的知识背景是否能够形成可行的专业知识链条进行审查。
再次,丰富鉴定意见质证方式。传统对鉴定意见质证方面多重视出庭质证规则的构建,并认为落实庭审实质化改革的核心问题是“落实鉴定人出庭的规定、明确‘有专门知识的人’的法律定位”。大数据分析报告的专业性决定了要想弄懂所有问题需要花费极大的时间与精力。庭审言辞方式质证对控辩双方包括司法裁判者都有着极高的要求,质证过程失控的可能性升高。司法实践中不乏控辩双方因发问不当使得对方与法官难以理解所提问题的现象,不仅降低了诉讼效率,还迫使法官要求其将问题总结好之后再行发问。为此,可以考虑在庭前进行书面质证,以提高质证的效率与效果。丰富鉴定意见的质证方式是源于大数据分析报告形成过程的复杂性要求,对于过于专业的技术性问题,控辩双方进行充分的事前准备,以书面的方式进行质证可以避免知识漏洞而造成质证无效的危险,提升法庭质证效果。
最后,增设专家证人制度。目前,对鉴定意见的质证人员主要是辩护人。但随着科学技术的发展,法庭中的专业问题越来越科技化与专业化。当事人与辩护人作为普通公民在很多专业性问题面前无能为力。当事人甚至不能就鉴定意见中的知识提出问题,因为他们可能连理解该问题的能力都极为缺乏。为此,立法设置了专家辅助人制度,旨在通过同行专家的质证解决专业性问题。我国的专家辅助人有点类似于国外的专家证人,“英国专家学会为专家证人开设了一系列的培训课程,以教授‘专家’们如何从一个纯粹的专家转变为专家证人。”笔者认为,在鉴定意见规则中引进专家证人制度既是刑事诉讼法控辩平等原则的重要体现又是有效对质的基本要求因为平等的前提是双方之间具有平等对话的能力在当事人缺乏此种能力时理应通过制度强化此种能力如前所述我国立法对鉴定意见程序采取了单一启动模式同时赋予辩方申请重新鉴定的救济权利这种将鉴定意见争议通过重新鉴定来解决的机制却在实践上造成了不断重新鉴定的问题使法官在重新鉴定问题上越陷越深而无法自拔重新鉴定逐渐演变为重复鉴定并造成了久鉴不决影响了司法公正将专家证人引入鉴定意见规则可降低申请重新鉴定的概率减少鉴定意见争论这是一个学术和职业日益专业化的时代可得的知识现在是那么地浩如烟海通过互联网是那么容易获悉没有人能够指望在其教育或工作生涯中掌握整个知识领域大数据分析报告涵盖若干专业知识领域相较于传统司法鉴定任何一个大数据分析报告都属于疑难复杂的专业性问题联合鉴定分阶段鉴定将成为该类型鉴定意见中的常态实际上我国已经有规范性的文件对联合鉴定问题做出了规范司法鉴定程序通则34条规定对于涉及重大案件或者特别复杂疑难特殊技术问题或者多个鉴定类别的鉴定事项办案机关可以委托司法鉴定行业协会组织协调多个司法鉴定机构进行鉴定该条文旨在对司法鉴定中的特殊事项做出规定但在大数据分析报告联合鉴定成为常态的背景下在鉴定意见中引入专家证人规则实有必要即对鉴定意见采取强制性的专家证人对质制度在配合鉴定意见单向启动为双向启动改革基础上控辩双方均应聘请专家证人对质鉴定意见当然为确保专家证人的资格能力与中立性有必要借鉴当事人主义诉讼模式中的交叉询问与当庭审查相结合的方式规范专家证人未来立法有必要在现有专家证人制度基础上进一步完善专家证人门槛规则与质证规则

(三)大数据分析报告作为新型证据阶段
大数据分析报告在经历办案参考资料阶段与鉴定意见阶段之后,会积累更多的立法与司法实践经验,传统证据法制度在大数据证据运用之下经历充分的磨合,可考虑做出适当的转变,增加大数据分析报告这一新型证据种类
1.大数据分析报告作为新型证据的理念要求

大数据分析报告的司法实践运用源于犯罪形式的变化。大数据分析报告证据也好,传统证据法理念也罢,对其认知的改变本质上都是源于犯罪形式的变化。如果将传统物理空间内发生的犯罪视为是原始的、宏观的犯罪,那么发生于网络虚拟空间的犯罪则具有现代式的、微观化的特征。传统犯罪具有强烈的即视感,但在现代社会中,行为人借助网络科学技术手段可以进行隐蔽性犯罪。相应地,犯罪证据留存的形式也由可感知的外在形态化转变为电子数据的信息化。同时,证据的质与量也发生了重大转变证据的质由精确到模糊证据的量由稀缺到海量犯罪行为与犯罪证据的变化将根本性地影响到犯罪事实认定思路。传统利用精确而稀缺的证据证明证据与案件事实之间的因果关系理念难以适应模糊而海量的证据证明案件事实的需求。大数据分析报告证据恰恰迎合了犯罪形式变化引发的证据变形需求。
有论者基于传统证据法理论提出规范大数据分析报告的严格规则,试图将该新型证据纳入传统证据法理论视野。实际上,囿于大数据的海量特征,我们无法再像传统证据法那样对证据的真实性进行精准判断。大数据与大数据分析报告的特征要求我们在运用上述证据证明案件事实中进行如下三个方面思维理念的转变。
首先,大数据的证明特点要求我们由单向理性思维向交互理性思维转变。“印证模式着眼于证据群内证据的关系,更趋向于整体主义的证据分析”。印证证明“以整体信念的‘真’或‘有效’来证立单个信念的‘真’或‘有效’”。印证证明模式下重视证据的“量”,忽视对证据“质”的要求。实践中,印证证明模式备受司法者青睐的主要原因是可以通过证据的“量”抵御内外压力,易将证据全面审查异化为形式审查。大数据分析报告建立于海量数据基础之上,就单个证据而言,是“整体主义证明”与“原子主义证明”模式的结合。“大数据(分析报告)证据自成事实所依据的是相关关系的基础性作用,与其他证据共同作用证明案件事实。在这一过程中,大数据(分析报告)证据使证明认知从证据链的‘单向理性’到证据链的‘交互理性’的跨越”。

其次,大数据的海量特征要求我们由单一思维转变为总体思维或整体思维。传统证据量的稀缺要求我们对单一证据进行全面审查,并通过强化其与案件事实之间的因果链条以弥补证据量不足的缺陷。大数据分析建立于总体样本之上,依靠大数据证明的案件事实是更为宏大的个体或者事实。而基于稀缺证据建立的事实则为微观事实。有人将其形象地比喻为“大真实”与“小真实”的关系。大数据时代要求司法者必须快速转换传统的小数据或抽样数据样本观念,建立总体思维证据观。正如舍恩伯格所言:“我们总是习惯把统计抽样看作文明得以建立的牢固基石,就如同几何学定理和万有引力定律一样。但是,统计抽样其实只是为了在技术受限的特定时期,解决当时存在的一些特定问题而产生的,其历史不足一百年。如今,技术环境已经有了很大的改善。在大数据时代进行抽样分析就像是在汽车时代骑马一样。在某些特定的情况下,我们依然可以使用样本分析法,但这不再是我们分析数据的主要方式,慢慢地我们会完全抛弃样本分析。”

最后,大数据的无序特点要求我们将传统的精准查证观念转变为容错理念。大数据分析报告中所使用的数据包括结构化的高密度信息数据与非结构化的低密度信息数据,我们无法进行每一条信息的筛查检验,在整体思维之下,数据信息的精准化被淡化,信息混乱无序的客观现实要求我们树立容错理念。“‘大数据’通常用概率说话,而不是板着‘确凿无疑’的面孔……试图扩大规模的时候,要学会拥抱混乱”。更为重要的是,“数据不可能是完全对或者完全错的。当数据的规模以数量级增加时,这些混乱也就算不上问题了”。实际上,也正是因为这些看似混乱的数据给我们提供了传统抽样样本无法给我们带来的信息,使得案件事实变得更加客观与清晰。可以认为,“从传统概率统计的样本精确模式到大数据容错模式,人类恰似经历了正—反—合的思维转变,或是肯定—否定—否定之否定的涅槃重塑”。
2.大数据分析报告作为新型证据的规则要求

大数据分析报告核心要素包括大数据、分析与报告三个方面。相应地,该证据规则也应涵盖上述内容,具体包括大数据真实性判断规则、分析科学性规则、报告结果的关联性认定规则。
其一,大数据真实性判断规则。大数据真实性判断主要涉及数据来源可靠性审查。大数据是否真实将影响到分析报告的可信度。我国立法与司法实践一贯重视对数据证据真实性的审查。最高人民法院、最高人民检察院、公安部、国家安全部、司法部《关于办理死刑案件审查判断证据若干问题的规定》(以下简称《死刑案件证据规定》)、《高法解释》及《电子数据证据规定》均针对电子证据的真实性审查判断作了较为详细地规定。但上述法律规范性文件规范的对象是单个或者微观电子数据证据的真实性,并未涉及海量数据。电子数据证据真实性包括“电子证据载体的真实性、电子数据的真实性和电子证据内容的真实性。”我国现有法律规范文件着重规定了电子数据证据内容的真实性,并未涉及电子数据证据载体的真实性。大数据中,对数据证据载体的审查判断更为重要。如侦控机关从某会计人员的电脑中获取了海量银行账目往来数据,司法机关必须认真审查侦控机关在获取上述大数据时,该电脑系统是稳定正常运行的,没有受到外界因素的干扰。至于个别电子数据证据内容的真实性则只能采取随机抽样验证的方式进行真实性审查的判断。如对数据的真实性,则可通过审查数据形成的原理进行判断是否有人进行了刻意删除、修改等。对于数据证据内容,即其与案件事实相关内容的真实性审查也应通过证伪的方式予以查证其真实性。换言之,大数据视野下的真实性判断应该以“规模”为中心,以“微观”为辅助,构建证实与证伪相结合的真实性审查判断规则。此外,考虑到大数据保真的困难性,可以考虑引进区块链技术保存数据。实务中,已有此方面的探索,如北京、杭州、广州互联网法院分别组建了“天平链”“司法链”“网通法链”等存证平台,截至2019年12月底,这三个区块链平台存证的电子数据已近20亿条。
其二,分析科学性规则。分析工具与分析方法的选取是否科学将直接影响到分析结果的可靠性。就目前来看,我们尚无法准确判断何为科学的分析工具与分析方法。随着时间的推移,我们有理由相信大数据分析工具与分析方法会走向成熟。在此基础上,立法有必要构建分析工具与分析方法数据库,并进行类型划分。根据案件与大数据内容,控辩双方可以在司法机关确认的数据库中选择分析工具与分析方法。如此,一方面可以避免每一个案件都可能面临对分析工具原理和机器算法的质疑问题;另一方面也可为针对特殊案件需要特别的分析工具或特殊的机器算法进行科学性审查判断提供参考依据。与分析工具相比,对算法的审查更加重要。因为人类基于特定的目的可以进行不同算法的选取,这在很大程度上会影响到分析结果。“美国一些警务实践表明,算法设计者对犯罪威胁或风险预测、违规自动监控等的相关性赋值与权衡却带有偏见乃至错误,例如,与面部识别技术相关的算法对男性的识别率高于女性,对非白人的识别率高于白人。”大数据分析报告是“整个社会进入算法时代的产物”。人工智能与大数据的融合发展使得人们不得不面对“黑箱算法”问题。司法实务中对其处理有不同做法,有些判例虽然采纳了大数据分析结果,但却驳回了辩方对算法进行审查的要求,表现出不予理会的态度。这在将大数据分析报告作为办案参考时期似乎可以理解,但在其进入法定证据种类时,法院不能对此采取回避的态度。为此,有必要在构建商业秘密例外制度基础上,公开算法。因为黑箱算法会带来歧视、风险与不公。以至于有人直言:“打开黑盒子,设计者与用户面对的将是一堆可以得出某种答案的主观偏见与程序。而合上之后,它体现的就是客观性一种无须满足任何更多的条件即可生成‘是’与‘否’的二元选项的机器。”当人们根据上述算法进行决策时,“根本不知道他们做出的决定是否正确,制定的政策是否公正,有没有歪曲事实”。公开算法,将其纳入控辩双方质证的范围是打破黑箱算法的必要选择,这可让“那些对结果抱有怀疑的人可以掀开‘引擎盖子’看个究竟”。公开算法是大数据时代实现代码正义的要求,也是打破算法垄断的有效手段,从而维护当事人合法权益,实现司法的公平正义。
其三,报告结果的关联性认定规则。大数据分析报告最重要的价值在于报告内容与案件事实具有关联性。故对分析报告结果作关联性审查就变的至关重要,该审查也是司法者对大数据分析报告进行采信的过程。但分析报告的关联性并非是大数据与案件事实的关联性。分析报告是对大数据进行分析之后形成的新的证据,该证据是基于特定的分析工具与算法对原有数据进行运算得出的结果。大数据分析报告对案件事实的认定主要是通过验证的方式实现,具体验证的方式因其认定事实的类型不同而有所差异。基于大数据分析报告形成目的的不同可将其区分为单一事实的验证、相关事实的验证与未来事实的预测三种类型。单一事实的验证是指在刑事案件中,将行为人的某犯罪行为留存的证据进行分析,其得出的报告与微观事实本身具有一致性,或者足以验证该事实的存在,则可认定大数据分析报告与案件事实具有关联性。相关事实的验证是指,对于已经发生的行为与结果之间的关系进行验证,“体现的是行为与结果之间的间接关联性。此类报告在刑事诉讼中只能作为间接证据使用,必须经过证据印证补强之后方可成为证据链条的一环”。对于预测型大数据分析报告,其证明价值在于对已有数据分析判断行为人未来实施犯罪的可能性,但因其不是对确定事实的验证,一定程度上违反了无罪推定原则。但该类型的大数据分析报告可以有效地预防犯罪,并可有效激活刑法中的预备犯法条规定。此外,预测型的大数据分析报告还可以有效应对预备行为实行化的犯罪,如准备实施恐怖活动罪。
对于单一事实型验证,司法者只需要按照传统关联性规则就可以判断分析报告与案件事实之间的关联性。对于相关事实的验证需要在传统审查判断关联性规则基础上进一步创新审查判断规则。首先,需要将大数据证明案件事实的特殊经验纳入司法者判断关联性的既有知识与经验中来;其次,承认并接受大数据证明中的弱相关关系,理顺强因果关系与弱相关关系之间的关系。大数据使得一切事物被量化变得可能,大数据让我们对事物的定量有了更为精准的把握,但因数据的定性描述困难使得以传统的定性标准描述数据的性质就变得更加困难。实际上,“在大数据时代,因果关系不仅不会退居次于相关关系的地位,而且相反,作为因果派生关系,相关关系的当然基础是因果关系”。就此而言,“大数据不仅不是因果性观念的沦陷之地,反倒是进一步充分展开重新刻画的因果概念的最好场所。正是大数据带来了物数据化和数据物化的对称发展,而数据物化既是实践又是认识,它意味着一种新的因果性根据”。据此,未来立法有必要构建起审查判断大数据分析报告与案件事实之间的量化因果关系,创新大数据分析报告关联性规则。对于预测型大数据分析报告的关联性审查应该持谨慎态度,该类型分析报告内容表现为对某种趋势的预判,类似于品格证据规则,但又有实质性差异。未来立法同样应该明确此种趋势性报告原则上不能作为认定行为人具有实施该种犯罪的证据,但可以将其作为反驳行为人没有实施特定行为的依据。换言之,预测型大数据分析报告对案件定性原则上没有证明力,但可以对量刑起到证明作用,如对累犯、缓刑等刑罚制度的适用等可产生实质的影响。
3.大数据分析报告作为新型证据的配套制度要求

法律制度是法律原则与规则的总和。与具体法律规则相比,制度中还包含直接与间接相关的配套措施。大数据分析报告作为新型证据种类需要一系列制度的配套改革支持。这也是笔者不建议在当下将大数据分析报告作为单独证据类型的主要原因。制度不配套,即便有立法规定,司法实践也难以有效贯彻之。大数据分析报告作为新型证据至少需要商业秘密保护例外、大数据鉴定与利用大数据的侦查等三个配套制度的构建或完善。
首先,构建商业秘密保护例外制度。该制度是指,当因司法查明刑事案件的需要,拥有商业秘密的所有者或使用者有义务公开商业秘密内容。大数据分析报告涉及分析工具的制作过程与机器算法,上述内容大都属于商业秘密范畴。目前世界各国对商业秘密基本持保护态度,即当刑事案件涉及商业秘密时,司法一般让步于商业秘密。笔者认为对此不宜采取一刀切的方式予以处理。当保护商业秘密将严重影响司法公正或者无法查明重大案件事实时,则有必要公开商业秘密。具体可构建如下商业秘密保护例外原则与规则,原则包括两个方面:其一,穷尽手段原则。只有当穷尽所有手段都无法查明案件事实时,方可考虑公开商业秘密;其二,重大刑事案件原则。对于可能判处10年以上的重大刑事案件方可公开商业秘密。商业秘密保护例外具体规则包括如下三个方面:其一,修改现行刑事诉讼法中关于涉及商业秘密经申请可以不公开审理的规则为一律不公开审理;其二,变通公开的方式,对于特殊的商业秘密,若经司法审查即可认定机器算法的科学与否则可采取庭外审查的方式;其三,在上述方法仍无法完成查明案件事实的情况下,方可进行法庭公开质证的方式,但所有参与法庭审判的人员应该就所了解的商业秘密签署保密协议,遵守期限为该商业秘密的法律保护的最长期限。
其次,构建大数据鉴定制度。该制度是指针对总体数据进行鉴定的程序制度。现有大数据的鉴定规则主要是针对微观电子数据证据,无法满足以大数据分析报告为代表的大数据证据。大数据鉴定制度至少应涉及以下三个方面的内容:一是大数据鉴定的科学方法;二是大数据鉴定的主体;三是大数据鉴定的质证。为确保大数据鉴定方法的科学性,需要构建完善的鉴定方法数据库,以减少数据代码带来的不可控,提高刑事司法效率。大数据鉴定主体以联合鉴定为主,单人鉴定为辅。在联合鉴定的情形下,需要明确各鉴定人的责任,根据分段负责的原则,鉴定人只对自己鉴定的事项承担责任。当涉及鉴定事项前后关联时,需要进一步分析后者的鉴定行为与前者的鉴定行为是否有直接关联性,若后者鉴定错误是由前者的鉴定错误导致,则后者不负担责任。反之,即使前者鉴定错误,后者的鉴定与前者鉴定缺乏关联时,则后者依然要承担鉴定错误的责任。大数据的质证主要涉及质证人员的专业问题,这不仅需要配套专家辅助人制度,还需完善专家证人资格与质证规则,从而提高质证的效果。具体前文已经述及,在此不再赘述。
最后,构建大数据侦查制度。该制度是指,“通过计算机技术对存储于网络与计算机系统中的海量数据进行收集、共享、清洗、比对和挖掘,从而发现犯罪线索、证据信息或者犯罪嫌疑人的侦查措施与方法”。目前我国缺乏利用大数据进行侦查的法律规范,但又不能将其作为典型意义上的侦查行为看待。与传统侦查相比,利用大数据侦查具有如下特征:侦查方法表现为收集、共享、清洗、比对及挖掘等特殊方法;侦查对象是大数据信息;侦查本质是数据监控;侦查启动方式由被动转变为主动。传统侦查法律规范难以适用于利用大数据进行的侦查程序。大数据筛查与比对方式将原有的点对点监控升级为全面监控。有人将其称之为全景式监控。“全景式的社会监控模式以及公民个人信息的深度挖掘,正在逐渐吞噬公民的私人领域,社会控制日趋紧密。此种信息获取方式,一方面在程序上存在突破权力边界侵犯公民个人信息的可能,另一方面,信息的集中在客观上增加了公民个人信息泄漏的风险和危害后果”。利用大数据侦查获得的证据是形成大数据分析报告的前提与基础。但大数据侦查具有侵犯公民合法权益风险。未来立法有必要将大数据这一特殊侦查获得的证据纳入非法证据排除规则的范畴,构建大数据的证据能力制度,以满足大数据分析报告基础数据合法性要求。

结语
大数据分析报告是互联网与人工智能叠加的产物。大数据并非是简单电子数据总量的增加,亦非是单一电子数据证明力的累积,而是依靠人类无法量化的隐藏式规律来证明案件事实。大数据分析报告是电子数据量的积累达到质变的结果。无论是学术界对大数据分析报告的积极探索还是司法实务部门对其运用的能动反应都是大数据对社会生活产生深刻影响的体现。人类无法忽略这一问题的到来,但也不能就此断定大数据分析报告已然成为新的证据种类。正如电子证据经历了办案材料阶段、视听资料阶段直至独立证据种类阶段一样,大数据分析报告也需要经历司法实践的积淀与理论的学术淬炼。更为重要的是,大数据分析报告与电子证据相比有其本质差异,其与机器算法、人工智能等高科技呈融合式发展趋势。未来人工智能与机器算法能发展到什么程度尚不可预知,但有一点可以肯定的是,大数据分析报告的科学性与其证明价值会随着科学技术的发展而发展。大数据因果关系论、利用大数据进行侦查、大数据鉴定、大数据质证、大数据非法证据排除等一系列的规则制度会获得突破性发展。但应当如何制定大数据分析报告证据法规则,从证据制度上对可能产生的伪相关性进行排除,仍需进一步深化研究。
—    —
编辑 | 石纪辉

审核 | 史全增

签发 | 包   涵

 


李施霆 | 论毒品犯罪供述获取的法律障碍及破解路径

曾粤兴 孙道镭 | 跨境赌博犯罪多元治理路径研究

● 马明亮 |基于区块链的大数据侦查:价值、场景与协同规制
● 李辉 | 公安学“大问题”研究:还原、解构与建构
● 包涵 | 毒品分级管制的理论意义与制度建构
● 李小波 | 公安学范畴体系论纲
● 邹湘江 隋玉龙 卢雪澜 | 治安学科何以成为治安科学——科学方法论与知识增长的关系反思
● 李捷 | COVID-19疫情与暴力极端主义框架建构研究
● 马振超 | 新中国成立以来中国共产党政治安全话语:内涵、发展及逻辑
● 苏宇 | 警察权属性的考辨与反思
● 包涵 | 类似物管制的立法诉求和司法功能:美国《管制类似物执法法案》的评价与反思
● 姬艳涛 | 无人机警务应用的制度逻辑与优化路径
● 张梦星 | 论情态证据的刑事证据资格
● 翟化胜 周明 | 欧美国家“外籍战士”的数量差异:分析框架与案例研究
● 彭知辉 | 开放情报学论略:关于中国情报学建设的探讨
● 周延东 | 中国共产党调查研究优良传统与“枫桥经验”的生成延续
● 毕惜茜 梁嘉龙 | 英国侦查访谈技术探析及借鉴思考
● 郭晶 徐灿 | 论刑事“冷案”侦查模式的法治化嬗变
● 王龙 | 公安高等教育发展历史回顾与新时代展望
● 汪海燕 | 大数据侦查的哲学思考
● 李辉 丁姿 贾鼎 | “中核西制” ——论公安管理学科的生成与生长逻辑
● 李小波 | 理论纲领确认与学科建制化:全面建设21世纪的公安学

● 汪勇 周延东 | 情感治理:枫桥经验的传统起源与现代应用


长按识别二维码更多精彩

公安学研究
《公安学研究》(双月刊)于2018年创刊,是由中华人民共和国公安部主管,中国人民公安大学主办的学术期刊。
 最新文章