如何运用大数据探寻司法活动实质共性

时间:2022-03-17
来源:正义网
作者: 王志远、张玮琦

习近平总书记强调,努力让人民群众在每一个司法案件中都能感受到公平正义,这就需要司法活动保持实质上的一致性——非仅形式上的“相似”。近些年来,对于司法活动的法学实证研究成果汗牛充栋,其中不乏技术纯熟、问题意识明确的文章,然而应当指出的是,部分研究执着于表象上的“做法共性”,而未能深入研究样本、变量背后所蕴藏的“理念共识”。这就意味着,虽然诸多研究旨在通过裁判文书等素材、利用实证研究方法、以大数据研究的思路深入探寻司法活动的“实然”,却可能被数据与技术“一叶障目”,背离了实证研究所要揭示的本质问题。因此,相较既往的实证研究,围绕司法活动的大数据研究需要把握几个关键的转变。

思路的转变:从“做法共性”到“理念共识”

笔者认为,首先需要予以明确的是,通过实证研究所要得出的答案并非现象上所呈现的“大多数做法”,而是在司法智识上值得关注的理论“共识”。

既往围绕司法活动所进行的实证研究,为了数据的可得性以及计算上的精确性,通常会将变量设置为裁判文书中较为外显的要素,例如数额、刑期、某些情节的有无等等。这些变量易于通过技术手段抓取、录入,且易于被赋值,更是可以较为方便地对其进行诸如描述性统计、相关性、线性回归等常规统计方法的分析。但是,正如提问方式往往限定了答案的可能性,这样的整体思路也使得其所揭示的问题只能集中于这些外显的表象,毋宁说,所揭示的是犯罪的实然情况或司法活动在“做法”上的异同。这样一来,则恰好绕开了真正影响司法一致性的因素,即作为司法判断之前提的“理念”“原则”。

通过实证研究手段对司法活动所进行的大数据分析,应首先在整体思路上进行转变,将问题聚焦于“理念”“原则”,针对问题设计方法,而非被方法限制问题。由于既往的有些思路往往是在机械地找寻共性,所以势必要对一些变量进行必要的类型化处理,然而这种处理是针对不同变量所各自进行的,所以不同裁判中同样两个变量之间的逻辑关联的异同很可能会被这样的“误差”所掩盖。于是,基于不同的理念或原则可能会对“类似”的案件作出相同的判断,反过来,基于相同的理念或原则也可能会对“类似”的案件作出不同的判断,关键在于此处的“类似”究竟是现象上的还是本质上的。

从追寻“理念的共识”的思路出发,就必须回到司法活动语境展开研究,而非完全在统计学的框架内强行加入司法活动内容,这就需要在范式上完成转变。

范式的转变:从“定量分析”到“综合分析”

传统的定量实证研究在面对司法实践问题时,由于过度着眼于表象上的变量分析,并不能切中理论要害。既往的规范分析方法和定量实证分析方法之所以不能客观、准确地将“司法理念”予以凝练、表述,根本原因在于不能有效处理主观思想的作用。一方面,规范分析方法不可避免地会附着研究者的主观偏见,难以对实然情况进行全面把握;另一方面,当下对司法活动开展的实证研究中所通常采用的定量分析方法过度重视表层的统计特征,对主观思想的影响考虑较少,无法进一步将共性升华成共识。

那么,如何将定性分析和定量分析予以结合?

首先,应该进行定性预设。对于定性预设,既要借助法教义学知识,亦要结合实证分析方法。在法教义学的角度上,需要全面地对某一问题在法学理论上所涉及的各种不同的定性预设予以挖掘,将问题限定于法学理论体系可能的射程之内。在实证分析的角度上,需要通过相应的技术手段,对司法活动中所可能选用的路径予以明晰,以进一步确定问题域。简单地说,定性预设所需要的样本并非是一系列“同样具有某些变量”的文书、案例,而是一系列“同样具有某种演绎、推导路径”的文书、案例,唯此才能于前提上真正实现定性分析的可能性。通过法教义学规范分析和实证研究方法的结合,定性预设所起到的作用在于限定问题域,使得司法活动中因理念或认识的不同而存在的观点争议能够在规范逻辑的“神似”而非个别变量的“形似”中提取共性与共识。

其次,应该进行变量转化。对于变量转化,需要分析的核心问题在于司法实践在所持理念与其定罪、量刑结果上的深层因果关系问题。现实中,有些案件适用认罪认罚从宽制度、少捕慎诉慎押刑事司法政策的贯彻等,如若忽略了这些,那么对司法共识的总结则注定是片面的。举例而言,涉交通肇事罪案件中行为人被适用缓刑的概率明显高于盗窃、故意伤害等罪名,但究竟是因为罪名本身社会危害性较小、被害人谅解概率较高,还是因为行为人主观恶性普遍较小所导致的?若按照计算相关性的方法分析,则以上因素与适用缓刑结果之间皆呈高度相关,但这并不意味着这些变量皆是“原因”,因为同样,诸如行为人性别为男、行为人收入较高等因素也与结果呈高度相关,而这些无关因素的排除却只能依照研究者的直觉,“原因”的选取完全在于非实证的方式,那么看似可被视为“原因”的那些变量,究竟真的是“原因”,还是其他变量的外部性因素,抑或纯粹出于偶然,则同样是无法分辨的。如何破除这种机械性的变量选择?较为科学的方式是利用规范逻辑与反事实框架相结合,消除选择性误差,从而分析在司法实践中某些理念、认识、原则、政策等究竟是否影响了以及在何种程度上影响了对结果的选择。这就意味着,需要在方法上从聚焦于“变量间的数值关系”,转变为关注“变量间的逻辑关系”。

方法的转变:从“变量间的数值关系”到“变量间的逻辑关系”

对司法活动的大数据研究,核心的计算应当围绕变量的关系,而非变量本身。一方面,应当借助规范逻辑的知识,建构基本的逻辑模型;另一方面应当将原本孤立的各个变量进行连接,从而使变量以“逻辑关系”的方式而非孤立的“数值”的方式出现。“理念”本身难以作为独立的一个变量而被抓取,但一系列案件情节、结果与司法判决结果之间的完整逻辑关系,则无疑充分体现了司法者的裁判思路。这样一来,“理念”在分析中实际上是以逻辑关系为表达方式的。

如前所述,定量分析中的各种变量的逻辑关系是被其计算方法“刻意”忽略的。仍以围绕裁判文书展开的实证研究为例,各种情节、特征的出现与否并没有教义学意义上的逻辑关系,而倘若聚焦于逻辑关系,则实际出现的情节、特征与司法者所持有的原则、理念以及裁判结果之间,能够形成有效的关联。在此基础上,运用相应的实证分析方法,如相关性分析、回归分析等,则能够真正地印证、推导出相关的教义学预设。例如,某个或某些情节的出现与否是否会影响司法机关在办案理念、原则上的选择,持有某种原则的裁判文书在裁判结果上是否会显现出某种特征,这些关系的强弱在数值上各自是如何表现的。这些问题在原本的定量分析中,是无从揭示的。将原本价值无涉的纯粹实然领域的计算方法,拓宽至法教义学的分析中,这正是本文所倡导的司法理念一致性研究方法的应有之义。对于司法活动的实质“一致”,本质上并非是“出现了类似的条件于是导出了类似的结果”这种意义上的“共性”,而是逻辑上的同构性,即在表象上或许各有差异,然而其深层的推导方式、思维路径却表现出一定程度的“共性”,唯有这种共性才是司法理念一致性的表现,也是大数据研究方法有效性的关键。

(作者分别为中国政法大学刑事司法学院教授、辽宁大学法学院讲师)