《诉讼法学研究(第24卷)》:
(一)数据:人工智能裁判运行的知识储备
如前文所述,人工智能这一概念早已有之,但囿于小数据时代数据匮乏的境况,不足以支撑人工智能的实质性发展。直到大数据时代来临,冲破数据桎梏,全数据模式得以实现,人工智能技术才得以指数式增长。换言之,人工智能技术是以大数据为前置支撑技术发展运行的,它是一种二阶技术。只有通过充分的数据样本投喂,才能使人工智能得到充分学习,从而以数量筛选精度,得出精确的结果。人工智能裁判作为人工智能在司法领域的分支,也是如此。
首先,在人工智能裁判语境下,数据为生产智能司法知识创造了空间。司法实践中已运行的智慧司法系统,其功能大体可归结为智能案件推送、证据标准和证据规则指引、单体证据评估、量刑预测、裁判偏离预警、司法文书智能生成等。而这些功能在本质上都离不开司法数据的支撑和指引。仅以证据标准和证据规则指引为例作出深度剖析。以证据标准和证据规则指引较为有效的上海法院的“206系统”为例。在该系统研发过程中,技术人员将格式化后结构规则的历史案件数据切分为颗粒度尽可能小的数据片段,并在此基础上运用相应算法提取共性特征,经过人工标注,最后形成类案证据标准。在上述过程描述中不难看出,数据是一切行为的前提条件和资源基础,后续所有的切分、归纳、标注等复杂行为都是在数据层面上的操作。从信息输入、算法运行再到最后的结果输出,都是以数据的形式流转,可以说数据是人工智能裁判的表现形式,是人工智能裁判运行的血液。与证据标准和证据规则指引相比,其他功能在运行原理和技术应用方面大同小异,并无本质差别。另外,如果将人工智能裁判看成认识旧知识并形成新知识的过程,那么不仅是二者的表现形式,而且无疑为其创造了可适性空间。
其次,数据是淬炼人工智能裁判精确性的火焰。如上文所述,人工智能裁判系统运行流程可分为两个阶段:第一阶段是内部知识和规则的形成阶段。人工智能裁判需要分析样本数据库,提取其具备共同性高阶特征,形成自己的类案标准和内部智能知识库。第二阶段是规则的运用阶段。在待决案件信息输入人工智能裁判系统后,激发匹配相应的类按标准并在内部智能知识库中检索关联度高的知识片段,最终形成结论。上述过程是在技术层面上对人工智能裁判过程的解构和梳理,该过程只能保证系统可以作出相应裁判结论,但结论的精确性则无法保证。从社会效果的层面来看,司法裁判作为终局性结论,必须要为社会所接受才有公信力可言,才能进一步发挥定分止争的效果,而这种效果和公信力来源于裁判结果的精确性。这就要求人工智能裁判系统不仅要保证裁判可以作出,而且要保证裁判的精确性。解决这一问题的关键不在算法,而在于数据。人工智能裁判系统是以卷积人工神经网络算法为核心进行深度学习的。从微观的角度拆解这种深度学习算法的技术路径,可以得知:在每一个单体学习循环中,新输入的样本数据,会刺激算法进行新一轮的分析和吸收,在此基础上修正、完善原有的规则和知识库。如此往复,经过海量的数据投喂,理论上可以达到近乎真理的正确性。换言之,是样本数据的数量和质量控制并决定了人工智能系统运行结果的精确性。转换到人工智能裁判系统下分析,裁判算法通过一次又一次既有司法数据的投喂,不断更新弥补自身形成的裁判规则和内部智能知识库,每一次新数据的注入都是智能裁判走向精确的助推。裁判算法决定了系统如何运行和裁判行为是否可以成功作出,而数据则是过滤偏差、淬炼裁判结果精确性的火焰。
……
展开