近些年以来,伴随深度学习技术越发成熟,计算机运算速度显著提升,再加上互联网时代积攒的海量数据,人工智能愈发蓬勃发展,展现出深度学习、跨界融合、人机协同等新特点。司法也加快融入智能科技之内。司法裁判直接关联到公平正义的达成,其人工智能化达成的程度以及方式备受重视。

  人工智能的司法裁判场景

  人工智能,简称为AI,这一概念于1956年在达特矛斯会议上被正式提出。在人工智能的发展进程当中,影响最为重大的技术学派是符号主义以及连接主义。

  (一)两大技术流派考察

  把计算机符号操作视作为,围绕智能展开工作的关键切入点,秉持如此理念的学派,世人称其为符号主义,亦有逻辑主义、心理学派或计算机学派 的指代呢,其代表算法据统计是逆演绎算法,应用领域的典型代表可以首屈一指地说是知识图谱 ,1956年人工智能这个术语初次被启用,其背后首倡推动使其成为现实的力量正是符号主义学者,符号主义曾在较长时间段内处于显著优势地位,特别是专家系统成功开发且投入应用这一举措,极大推进了人工智能迈向拥有扎实工程应用基础的进程。

  有一种主义叫连接主义,它又被称作仿生物学派,这个主义的原理在于神经网络跟神经网络之间的连接机制以及学习的算法,这种算法跟概率统计学存在着紧密的关联。连接学派所具有的主要算法是反向传播以及深度学习,但它的代表应用包含语音识别、图像识别以及自动驾驶。在1986年的时候,鲁梅尔哈特等一些人提出了多层网络里的反向传播相关算法。在这之后,从整个模型一直到算法,从理论研究分析一直拓展到实际的工程项目实现,连接主义的发展趋势呈现出非常强劲的态势,依靠这样的发展态势为神经网络的计算机能够顺利走向市场奠定了坚实的基础。淘宝首页的“千人千面”以及今日头条的精准推送等都运用了连接主义的相关技术。

  符号主义技术有其长处,连接主义技术亦有其短处,二者各有优劣。符号主义技术,在缺乏数据资源的状况下,能够按照预先设定好的规则精确地计算出结果,然而梳理规则既费时间又耗精力,存在“有多少人工才有多少智能”的情形,而且靠逻辑规则加以定义的概念仅仅是极小的一部分。连接主义技术呢,在具备丰富的高质量数据之际,能够借助深度学习等算法得出结果,可是处于数据资源匮乏或者质量不高的情况下的时候呢,其实现效果就不太理想了。

  (二)国内外人工智能司法应用与研究

  1.国外司法应用与研究

  法学家以及科学家们,热衷于探讨人工智能在法律领域里的运用情况。美国伊利诺伊理工大学的科学家,运用一种名为随机森林的机器学习统计模型,针对1816年到2015年美国最高法院的判决展开预测,其准确率超过70%。该院法学教授丹尼尔·卡茨的团队,借助最高法院数据库,给每个投票都标注了16个特征,其中涵盖法官任期、诉讼发起法庭、口头辩论是否被听到等等。该模型先是学习了美国最高法院在1816年至2015年期间的案例特征,以及这些特征与裁决结果之间的关联,接着按照年份去研究每个案例具备的特征以及以此去预测裁决结果,最后该算法会对预测的结果展开学习,进而升级以后判决所采用的策略,结果表明,针对28000项判决结果以及24万张法官投票而言,新模型算法预测的正确率分别是70.2%和71.9%。

  国外媒体等报道称,伦敦大学学院也就是UCL,还有谢菲尔德大学与宾夕法尼亚大学,这些学校的科学家经研究显示,人工智能法官模型在那584个进行测试的案件当中,将其判决结果同欧洲人权法院的审判专家组判决结果做比较后,平均正确率能达到79%。

  在美国,于保释跟假释的决定里而言,一些州的法庭会运用算法去判定被告的“风险程度”,这个人有再次进行犯罪的可能性,被告具备如期出庭的可能性等各个方面因素,借此来决定是不是予以其保释或者假释。另外,法律人工智能被应用到法庭量刑上面。

  2.国内司法应用与研究

  上海所研发的“206系统”,其设计具备26项功能,以及88项子功能,该系统不止能够借助制定统一适用的证据标准指引与证据规则指引,嵌入公检法司机关刑事办案系统里面,给办案人员收集固定证据予以指引,并且还能够针对证据展开校验、把关、提示以及监督,例如,在法庭调查阶段的时候,要是证据不充分,系统就会提出证据瑕疵,并且自动提示合议庭重点予以关注。

  杭州互联网法院的网络交易全程智能化审判系统,会把起诉、答辩、举证、质证、庭审结构化、要素化、数据化,以此引导当事人讲清楚诉请和事实,进而智能生成争议焦点,基于法官专业积累,学习海量案件,形成电子商务完整知识图谱,凭借专业算法,自动提取裁判风险点让法官确认,最终智能生成完整判决书。

  由上述国内外司法实例能够看出,以法律知识图谱为核心的符号主义,以及借助机器开展深度学习的连接主义,是运用最为频繁的技术了通过对规则进行梳理从而形成法律知识图谱以适用于个案,这是当下之中主要的做法,而机器学习的运用乃是热门呀。

  优缺点分析与融合之道

  (一)符号主义的裁判应用分析

  符号主义凭着基于符号的逻辑规则予以展开,运用if…then的语句来进行设计,其确定性程度颇高,借助规则的梳理进而生成适用于个案的法律知识图谱,在依赖严密逻辑的司法裁判里相对比较易于被理解还能被接受。它具备如下这些优点:其一,契合立法与司法的关系,以及法官依法办案的要求。“三段论”作为基本的裁判逻辑,法官于具体的案件当中把法律规则当作大前提,将案件事实当作小前提,推导得出结论,以此保障把抽象的法律应用至个案之中。二是,其能够为占据多数的速裁案件,提供有力的辅助,速裁案件事实清楚,其适用的法律规则明确,案件事实是否符合特定情形下的行为模式相对清晰,进而在得出该案是否适用法律规则中的法律后果时,较为容易且较为准确,三是技术要求相对简单,进而法律规则的梳理可基于法律专家的经验,无需大量数据的训练,典型代表即为法律专家系统。

  该模式的最大缺点是具有封闭性,这是因为这类裁判系统是以既有的、经人工梳理的法律规则为前提进行构建的,一旦法律规则发生变化,系统无法自动识别并作出相应调整,而是需要人工再次进行干预才能实现调整,所以无法自动适用于新的规范环境。其次,知识图谱的梳理在传统上较为依赖人工,由于图谱构建速度与精度存在不足,致使案由的覆盖范围相当有限,甚至仅仅只能解决某一个案由中的特定类型的纠纷。另外,在知识图谱构建完成之后,可能需要借助成熟的自然语言处理技术来实现将案件事实与法律规则中的行为进行匹配。相当多的研发主体大量运用了普遍通用的自然语义识别技术,却并未针对司法场景来专门开发,如此一来,在基于知识图谱提取案件情节时,就极易出现错误以及发生遗漏的情况。

  (二)连接主义的裁判应用分析

  基于概率统计而展开的连接主义,模拟神经网络的工作机制,这种机制通过输入输出的闭环训练,使其具有学习进化的能力,在生动具体的个案裁判里有着独特的价值。它有着如下优点:其一,具备开放成长性,数据的积累以及训练为机器学习提供了充足的素材,并且数量越大的时候,沉淀就越丰富,然后推送也越精确。其二,体现不同案不同判的价值,现实生活是丰富多样的,哪怕是最厉害的专家也难以将其穷尽提炼,大量的规则分散在案例之中,难以获得抽象提炼。存在这样的情况,此类案例规则能够成为机器学习的对象,之后推送并应用于案件里。这是其一。还有,它能满足法官裁判的个性化需求。机器学习可根据法官的反馈情况,诸如法官使用痕迹来持续优化,经由与法官的长期互动,能够捕捉且满足法官的偏好,进而形成针对特定法官的特定推送。这是其二。另外,它能提供更多的裁判辅助。在符号主义的系统里,当规则缺失时,系统无法给予任何帮助,而在连接主义模式中,几乎不存在这种可能性,机器始终会尝试推送最为相似的结果以供法官参考。这是其三。

  该模式存在着较大缺点,其一,机器在开始工作时,需要通过大规模乃至海量的数据进行训练;其二,个案里的裁判推理是众多规则的组合,机器最低限度得经过规模达成千上万的数据学习才行得认别出特征;其三,机器学习推送的结果是带有随机性的,况且法官偏好具备多样性,这样的局势下很难确保法律实现统一适用以及质量控制;其四,机器学习的质量要看算法影响,算法跟模型的技术难度相对来说可不好容易解决处理,要实现的成本那可是相当之高的。

  (三)融合的路径

  存在着人们对于司法的期待,这期待有着稳定性、确定性的一方面情形,也存在着开放性、个性化的另一方面情形。法律有着对成文法条的需求,此需求是为了去满足秩序方面的要求,且法律还有着对个案解释的需求,该需求是为满足变动方面的要求。符号主义恰恰与前者相对应,连接主义则和后者相对应,在裁判应用里二者应当相互取长补短,进而达成融合发展。在那些实行成文法系国家,是把法条当作治理的基础所在,在人工智能的裁判应用当中,应当是以符号主义作为主干构成部分,以连接主义作为枝叶构成部分,以此形式来塑造出智慧裁判之树。

  1.按法治逻辑构造智慧树之主干

  规则之治是法治,理想的依法裁判完全依靠案件事实跟法律规则的逻辑关系而进行,不会受到非法律或者非逻辑因素的干扰,由此去保证法律的普遍适用,知识工程以及知识图谱,把表示学习和符号逻辑结合在一起,能够产生出效果可控、并是计算机可读的法律推理逻辑,极能保障法律严格贯彻,此种模式自然而然成为智能化裁判的首选方案。司法裁判里的规则,分布在以宪法作为核心的成文法律,以及案例、法理当中,经过梳理整合,形成具有逻辑层次,以语义网络形态存在的主干,而这个主干也就是法律的知识图谱。

  2.按数据量、要素化程度延伸枝叶

  于智能审判化之初期阶段,鉴于数据量尚少且质量欠佳,借由成文法则作精细化解析,梳理进而形成精细化之枝干,如此便能够提升机器学习之效率,对于存有强要素特征的案件,甚而有可能全然运用结构化细分整合之方式来形成裁判。当可使用的数据经积累,至通过算法令足以识别案件的特征或者要素这个地步,深度学习类算法开始施展自身之优势,起到实质作用。司法之举断不可拒绝裁判,于知识图谱空白之处,自然语言处理以及搜索推荐技术能够助力推荐相似案例。

  3.知识图谱的学习式构建

  人力向来是有限的,人的差错与失误是极难避免的情况,法律规则处于持续更新演化进程里,要确保规则跟得上时代发展,就得借助算法的形式在两类模式间搭建起桥梁,依靠机器学习的办法促使知识图谱得以完善,知识图谱在应用到具体个案的时候,应当吸纳个案里的法律规则,案例经过学习能够让知识逻辑树的枝干变得丰富,当前,法律知识图谱构建的自动化程度不太够,对人工存在过度依赖,致使构建速度迟缓、精度欠缺、成本高昂。笔者觉得,能够参考国际上依据数据驱动的自行知识图谱搭建方式,像基于等结构化数据的搭建方式、基于开放文档搭建()、基于fixed /的搭建方式以及基于层次化本体()的搭建方式,整合资源谋划一套框架去达成法律知识呈现和推理,把知识图谱实体、关系、词林、垂直知识图谱、机器学习算法模型等都收纳进来进行统一的描绘。

  智能裁判的实现路径

  利用知识图谱、标签技术、结构化电子数据库、搜索引擎的构建与深度学习等算法的运用,达成智能裁判,这是法律人与法律技术人员共同追寻的目标。如前文所剖析的,融合符号主义和连接主义的模式在当下具备优势。然而,必须承认,借助这个模式迈向“强人工智能”仍任重道远,在构建完备且可用的法律知识库、积累海量优质的电子化案件数据、探索先进且有效的算法、培育优秀的法律人工智能复合型人才等方面存在诸多问题亟待解决。

  (一)构建完备统一可用的法律知识库

  以发展智能裁判作为内容来讲,法律知识库是其基础所在。法律知识库自身属于一种信息库,其中涵盖了推理规则以及经验方面的信息。收集最新且最为全面的法规,具备权威且准确无误的案例,存有专业且详实细致的法学文献,这些是必不可少的。然而,仅仅做到这些是远远不足够的,原因在于当前人工智能的技术根本没有办法直接去理解,直接去学习,直接去应用这些信息。需要将法律规范、案例事实、裁判要旨、学术观点等多方面内容之间的逻辑节点予以打通,凭借人工智能在语义分析、相似度排序、数据挖掘等相关技术,去构建一套完整的且通用的并统一的可实际利用的法律知识库,以此为法律语言理解、法律人工智能技术迭代奠定基础。

  在法律知识库建设里头,有个特别突出的问题,那就是规则会有冲突,在同一假定条件之下,规定了不一样的行为模式,不同地区、不同法院对于同一个案子会有不同判决,不同的标准给智能审判系统的开发带来了困扰以及障碍,针对这个情况,其一,要完善相关的法律法规,健全我国的法律体系,把体系内部的规范冲突给消除掉,其二,要打破裁判规则的地域限制,加强上级法院的指导,强化各个区域、各个法院的司法协同,统一裁判的尺度,其三,要规范自由裁量权的行使,审判人员得严格去遵守法律明确规定的裁量范围。一旦法律自身存有空白状况,或者出现冲突情形,那么就要借助对其面临的问题以及存在的漏洞展开分析,进而及时去更新裁判规则。

  (二)积累大量优质的电子化案件数据

  想要发展智能裁判,电子化案件数据是其前提条件。当下,司法大数据跟人工智能应用的渐渐出现,和中国裁判文书网的文书公开有着紧密联系,然而,这还没办法很好地支撑智能裁判的发展。首先,中国裁判文书网上完成审判流程的文书数目不算很多。其次,其中呈现的案件信息没办法做到全面覆盖。最后,公开的文书质量高低不一。

  为了达成智能裁判,得积攒数量更为众多、信息更加全面、质量更高超的电子化数据,以此为机器学习营造条件。首先,要在全国范围进一步促使案件数据全程电子化。不但得积累裁判文书的数据,还得积攒起诉、立案、举证、质证、庭审以及证据等方面的电子化数据。案件的电子数据最好文本化,仅仅把书面的案件材料扫描转变成电子版本的做法,由于后续通常还涉及图文转换,会对数据的准确度以及获取效率造成影响。其次,要进一步推动司法公开,加大数据开放、共享。于保障数据安全、遵循法规的情形下,把立案、证据、庭审等方面的数据,借由特定形式、流程来公开,或者分享予相关单位。其次,要确立司法数据标准,用以提升法院彼此间,或法院与相关单位间数据流通、数据利用的质量与效率。

  (三)探索先进有效的算法

  推进智能裁判的发展进程,其中算法乃是智能化技术所不可或缺且处于核心地位的关键要素。人工智能通过“看”“听”“读”“懂”以及“搜集”“判断”“写作”等行为来开展工作,而在这些行为的背后,都必然需要算法为之提供支撑。

  学习式构建知识图谱,挖掘和处理案件信息等,运用了深度学习、特征学习、迁移学习等出色算法,通过这些算法,智能裁判系统方具备自我构建能力,能随计算、挖掘次数增多不断自动调整算法参数,让挖掘和预测结果更准确。(王禄生:《司法大数据与人工智能技术应用的风险及伦理规制》)在计算机视觉和语音处理方面,司法实践主要运用了OCR文字识别技术和语音转换技术。一般来说,上面提到的那两项运用所产生的效果还算不错,不过,也存在着一些不能让人完全满意的地方,就像特别难以辨认手写出来的文字那样。在自然语言处理这个范畴当中,借助这项技术,机器才能够针对法规、案例、证据、文书等展开精确地“识别”、“解析”、“搜集”、“理解”、“判断”以及“生成”。然而,在进行裁判的时候,机器需要在“法律条文与现实世界之间来回地穿梭”,这在客观层面上对机器对于法律语言的理解以及处理形成了一定的限制。我觉得呀,自然语言处理呢,得跟深度学习这类算法相结合,使得机器就尽量跟人类的大脑一样进行学习,然后思考,进而做出正确的决策。

  (四)培养优秀的法律与人工智能复合型人才

  把智能裁判发展起来,复合型人才在其中起着关键作用。要去探索并完毕上述三方面的工作,这就需要大量那种既理解法律、又懂得技术的人才。法官跟技术专家进行沟通的时候,成本是比较高的,而且裁判语言很难转化成技术语言。其中一方面,存在一些法官,他们既不了解、也不认可人工智能,有的对人工智能抱有过高的不切实际的期望,还有人担心人工智能的发展会对人类利益造成损害。另一方面,技术专家对法律概念、诉讼流程、判案逻辑的了解是有限的,所以很难把技术运用到裁判当中。

  当下,人工智能技术跟法律相结合的复合型人才匮乏,急需强化队伍建设。其一,能够制定契合复合型人才的招录政策,吸纳一定数量具备较高素质且有技术背景的人员。其二,可以构建培养机制,塑造复合型人才培养体系。制定特殊的人才考核以及奖励机制,施行专门人才管理制度,升级打造复合型人才库。其三,能够加强法院跟院校、技术公司的合作。三方联合设立法律与人工智能研究院,或者开设相关课程,相互派人讲授、学习法律与技术知识,共同参与相关项目。将法官集合起来,将技术专家集合起来,将法学专家集合起来,将法科学生集合起来,使他们成为包容并蓄的团队,协同推进各类数据库的建设,协同推进核心技术的研发。

  从总体方面来看,法律行业运用人工智能技术的水准尚处于初级时期,我们理应持有乐观的心理态势,确立理性且务实的发展观念,施展丰富的想象能力,既去接纳技术,又并非一味地迷信技术,既讲求技术突破,又关注人文关波及道德伦理,把符号主义跟连接主义相互融合,并且在知识图谱、数据、算法以及人才层面筑牢根基,进而促使人工智能与法律行业有效地结合起来,为司法现代化开拓智能新路径。

  (作者单位:杭州互联网法院)

标签: 人工智能, AI 与智慧司法融合趋势, 智能裁判系统, 法律知识图谱, 深度学习, 司法应用

添加新评论