三、何为计算法学:计算法学的范畴体系与研究方向

(一) 计算法学的范畴体系

计算法学的发展历史表明,计算法学的内涵是在发展变化的,并且与计算科学的发展状况密切相关。但是,计算法学所包含的内容必须具有一致性,才能成为一门独立的学科,并成为能够不断累进发展的科学。法律领域的一致性主要表现为内部逻辑一致,强调线性发展体系,能够抽象总结出成体系的法律结构和核心的制度规范,并由此可以通过法律释义学的研究实现知识在整个法律部门发挥作用,而不仅仅是在特定领域解决具体问题。74一般认为,各个方向的法学学科都是通过基本范畴来凝聚知识、深化思想、联结实践、引导学术进步的,75如我国1988年召开的“法学基本范畴研讨会”将权利义务确立为法理学的基本范畴,76使法理学提升了其科学化程度。民法学则通过主体平等、意思自治、诚实信用、公序良俗等基本原则和民事主体、民事法律行为、民事权利、民事责任等核心概念构建了基本范畴体系,由此形成了民法学的科学体系和基础性地位。本文所倡导的计算法学,一方面必然会承继法理学和部门法学中的一些既有范畴,另一方面也必须具备自成体系的基本范畴,这样才能证成其自身的独立性。

计算法学的发展基础是承认计算技术的广泛应用是一个必然趋势,这会形成有别于现实社会的计算空间身份、行为和关系,而传统的法学理论、法学方法和制度规范不足以应对这种革命性变革。计算法学是基于计算的对象、方法以及能力等方面的差异而产生不同的法律问题以及与法律相关的技术问题,从而融入计算思维研究法律问题,利用计算方法开展法律大数据分析,以及结合计算技术研究法律科技的一门学科。在这一基本设定的基础上,可以初步明确计算法学在不同维度上的范畴体系,以此确立计算空间法治发展的基本原则,总结计算技术运行在法律上的基本范畴,明确计算社会的规范工具、应用格局,进而总结出计算法学的知识体系,如下图所示。

图1 计算法学知识体系简图

计算法学以鼓励创新、安全可控、可问责制、计算透明、技术中立和普惠正义为基本原则。类似于合同法上的“合同自由”和“鼓励交易”原则,鼓励创新应当成为计算空间的基本原则,据此要求对计算技术的合法性评判遵循谦抑性原则,在不违反法律禁止性规定且没有损害公共利益或者他人合法权益时,应当对其予以承认和保护。此处的法律禁止性规定需要通过一定的原则或者程序进行限缩来给予创新力量以变革式发展的空间。在创新发展的同时,需要确保计算空间的安全可控,不仅要保障国家利益和社会秩序的安全可控,同时也要确保利用计算空间的用户的个人法益安全和风险可控。可问责制则是在创新发展和安全可控基础上所设计的责任机制,技术的研发、生产、使用者需要对各自行为所引发的风险承担责任,由此为应用计算技术引发的各种社会问题提供救济。计算透明是在计算技术日益复杂的背景下所提出的必要信息公开原则,通过平台运行规则透明、算法可解释性透明等方式,为用户的使用决策和追责溯源提供参考依据。技术中立要求对计算技术中的法律问题进行专业定性,减少法律对技术的不当监管,同时要求技术运营方一视同仁地对待网络用户。77普惠正义则是适应智能化、个性化的计算技术发展所必须重视的基本原则,一方面要求为中小企业和用户提供公平参与的环境,另一方面则要求通过技术手段降低法律实施的成本并提高公民对法律正义的可及性。

计算空间以数据、算法、平台和场景为基本范畴,由此构成了计算法学的结构体系。数据是计算空间的底层元素,在技术上体现为进位制数,原码、反码和补码,字符、字符串和文字,图像数据的表示,声音数据的表示等,78同时在经济上成为与劳动、资本、土地、知识等同等重要的生产要素。数据可划分为个人数据、企业数据和公共数据,建立数据的利用秩序并对其财产价值、人格利益进行分配,是计算法学的重要研究内容。此外,各类法治相关数据的增加和开放,也为法学研究和法律行业的创新发展带来了科技创新的机遇。算法是一种有限、确定、有效并适合用计算机程序来实现的解决问题的方法,一般认为编程形成的代码仅仅是实现一种已有的算法来解决某种问题。79因此“代码即法律”(Code Is Law)仅仅是一种表象,本质上是算法而非代码构成了计算空间的运行规则,所谓的人工智能也主要是算法与数据相融合所实现的功能,算法规制、算法解释、算法责任等构成了计算法学的基本命题。平台是计算空间的“数字门卫”,80它们是计算空间中的“二政府”,决定了各类组织进入市场的规则,同时也对电子化运行的消费者服务产生重要影响。各国政府越来越多地依赖平台实现社会治理目标,平台规则、平台竞争、平台安全、平台责任、平台纠纷解决机制等也成为计算法学研究的基本制度。场景是计算空间的各个分支领域,如电子商务、智慧政务、自动驾驶、精准医疗等,其中电子商务可以划分为互联网销售、互联网医药、互联网金融、即时配送等,这反映出场景的多样性。法律实践和法律场景是研究法律体系的两个重要维度,81普适计算背景下的法学研究也需要特别重视不同场景的法律问题研究。康奈尔大学的尼森堡姆(Helen Nissenbaum)在研究隐私权问题时曾指出,场景的各种组成要素都可能影响该特定场景的信息规范。82计算空间的不同场景原则上都应当遵循计算法学的基本原则和数据、算法、平台等方面的基本规则,通过场景理论的研究可以验证一般规则的有效性,也可以发现一般规则的缺漏,区分一般规则和不同场景下的特殊规则是计算法学基础理论研究的内容。

计算空间的规范工具包括法律法规、技术标准、伦理指南和技术自治四种主要方法,其规范效力、规范方法和规范作用均存在差异。法律法规在其中发挥国家基础性和国家强制性规范的作用;技术标准可以利用利益相关方共同制定的统一规范将法定要求或者市场需求具体化、技术化;伦理指南则是面对不确定性风险所要自觉遵守的指导性原则;网络运营者还可以自行采取技术性措施维护自身权益、避免伤害他人权益。

计算空间的应用格局是计算技术发展所形成的新样态,主要包括字节空间、国际协同、交叉学科和技术驱动。字节空间是代码、算法、数据等计算要素所构成的技术社会,是未来法治发展需要拓展的新维度;万物互联、国际融通的计算空间有鲜明的国际协同需求,在相关领域推动国际治理组织和国际治理规范的形成是网络空间治理协调性发展的重要趋势;计算技术在各个领域的推广应用是普适计算的发展方向,需要包括法学在内的各个学科与计算技术等学科进行交叉融合;技术驱动创新的同时也在塑造新的社会运行逻辑,这需要我们更加全面地研究技术发展与社会治理之间的关系。

基于所针对信息技术面向的不同,计算法学可以形成三个具有一定独立性的研究方向:作为研究对象的计算法学,即融入计算思维的新兴法律问题研究;作为研究工具的计算法学,即利用计算工具探索法律问题的实证分析;作为研究技术的计算法学,即结合计算技术的法律科技研究。

(二) 融入计算思维的新兴法律问题研究

计算思维已经成为一种与实证思维、理论思维相并列的解决问题的思考方式,其内涵是运用计算科学的基本理念来解决问题、设计系统以及理解人类行为,但其并不是编程,也不是计算机的思考方式,而是立足于计算空间的人类思维方式。83计算思维目前是现代各个学科都积极引入的研究方法,由此计算社会的范围也不断拓宽,产生了电子商务法、网络安全法、电信法、个人信息保护法、数据安全法等新兴法律领域,还出现了人工智能法、自动驾驶法、云计算法、互联网信息服务法、互联网竞争法等新的发展方向。对于这些问题的理解,都必须融入计算思维才能做出符合社会发展规律的科学解释。与此同时,在“法律即计算”(Law as Computation)成为趋势的背景下,我们更需要研究法律的计算机技术化是否可取以及法律科技实现的规范问题,这里面不仅仅是自然语言处理等相关的信息科技问题,还存在很多传统法学领域的问题。84因此,对于计算法学的研究,需要在计算技术应用的背景下,结合传统法学与计算思维进行法律基础理论和新兴问题的研究。

计算技术的发展和应用塑造了许多新的行为、资源和社会关系。这些新的行为、资源和社会关系如何在法律上进行评价,是法学研究必须与时俱进并予以解决的基本问题,也是计算法学研究的重要任务。在计算技术相关问题产生的初期,有些观点认为这些虚拟空间的问题是现实社会问题在另一个空间的投射,按照类比适用的方式就可以解决所有问题。但是,新一代信息技术引发的信息科技革命影响巨大:改变了全球的生产方式、生活方式和社会治理模式,产生了数据这一新的生产资料,创造了机器智能这一高度自动化的行为主体,还进一步强化了互联网平台的支配地位和社会影响力;对相关的社会治理结构、权利义务分配、法律上的因果关系、技术风险的预防等产生了一系列的影响;引发了新的数据保护与利用需求、新的平台治理问题、新的经济竞争模式、新的技术风险和新的利益平衡等基础问题,需要掌握必要的计算理论、计算思维和计算实践基础方能做出更深入的法律分析。这些研究内在地需要跨学科的知识,这与计算法学本身的交叉学科属性相一致。

传统法律规范的对象是人的行为,传统的法学研究也是着眼于人与人之间的关系进行制度安排研究。随着现代社会从信息化走向智能化,计算成为独立性日益增强的一类社会行为,数据、算法、平台和具体的计算场景都成为需要独立研究的对象。计算空间的法律及其执行者只能借助技术规则进行操作,这导致传统的法治模式只能授权给网络平台的运营者来实现法律的基本目标。对于这种现象,一种做法是继续确立传统法律主体的行为规则,所有的计算行为最终须溯源到传统的法律主体进行规制。然而,直接确立传统法律主体的行为规则已经与计算空间的实际情况日益脱节,其后果是导致法律实施的抽象化增强而具体化缺失,具体的社会运行规则制定权从代表民主的立法机关手中流失。出现这种结果的原因在于,将传统上着眼于人类行为的立法转移到计算空间,只能是一种责任担保机制的立法,其目标在于解决由谁承担责任的问题,但是无法为具体的计算行为提供准确的行为规则。因此,现在的立法更加强调对具体的计算行为进行区别对待,法学研究也需要融入计算思维以增加对计算行为的认识,对计算行为的种类、行为机制和规范方式等进行具体研究,才能适应我们正在进入的数字化社会,从而直接为计算行为提供行为规范。

(三) 利用计算工具探索法律问题的实证分析

利用计算工具探索法律问题的实证分析,是指变传统的规范法学研究为以事实和数据为基础的实证研究,特别是在大数据时代,利用大数据挖掘技术对传统法律问题进行实证分析将成为探究法律问题的新方向。法律大数据分析是一个高度依赖研究工具的研究方向,日益扩张的计算空间是一个被全面记录留痕的数字化环境,非常适合研究人员开展计算分析和实验。法律大数据分析是利用数学建模等信息技术的方法,以足量的法律数据为支撑寻找法律实践的量化和趋势规律。这种研究方法是计算社会科学的主要思路,也是国内计算法学现有研究成果的主要聚焦点。这一方向的研究可以涵盖传统法学关注的各类问题,充分利用科学的计算方法挖掘大数据的价值,探索数据视角下的法学研究方法和内容。

目前的法律实证研究在一定范围内存在研究选题乏味、理论应用不力、量化数据不足和统计操作随意的技术缺陷,85这反映出,开展计算社会科学研究需要将社会科学和数据科学的思想结合起来,才能充分利用数字时代带来的研究机遇。86着眼于计算方法的计算法学实则是以问题为导向、以计算工具为基础、以法律数据为轴心展开的“数据密集型科学”,实现了法律数据与规范理论的深度融合。其要义是借助计算分析工具对数据进行采集与分析、交互与整合、结构化与类型化,进而试图通过计算复杂的数量关系变化来表征潜藏在法律现象背后的社会性构成要素和生成路径,透过数据科学因果关系的推论以探知法律事实的内在结构和外部联系,并将数据分析结果用于裁判预测、立法评估、法律实施质效评估等领域,借此实现法学研究与应用的转型升级。87

利用计算工具的法律大数据分析将在法律数据的可视化分析和社会仿真实验等领域不断扩展。法律数据的可视化一般很难通过传统的法律分析或实证分析实现,它能够使专业人员和非专业人士直观地分析复杂的法律关系和逻辑趋势,成为法律印证和关系图谱构建等领域常用的表现方式。例如,以美国法典不同年份的XML(可扩展标记语言)格式数据为基础,可以通过数学建模来可视化地展示包含2200多万字的美国法典在结构层次、内部引用关系和语言使用等方面的变化幅度。88又如,可以将我国公司法领域的全部案例数据样本、评估有效及纵横交错的法律关系等挖掘结果以可视化的方式进行分析。89此外,社会科学领域的虚拟仿真实验也被称为社会科学计算实验,是区别于定量分析、定性分析的一种实验分析。其可以在计算机系统中依托历史经验数据构建虚拟仿真的社会环境,基于计算技术进行可控制、可复现的实验,从而解决社会科学领域的复杂性和不确定性难题。社会仿真实验不仅在法律谈判、选举、量刑和离婚等实践中具有价值,90在税法等法律政策的预期目标评估等领域也有重大价值。91社会科学的研究者可以用计算机的标准化程序语言来描述自己的思想,并且通过计算机的辅助来讨论过去、分析现状和预测社会系统的未来。92利用计算工具的法律大数据分析基于科学数据构建社会仿真模型,继而可以在科学可控的环境中研究法律政策和理论的社会效果。

(四) 结合计算技术的法律科技研究

计算技术的发展不仅给法律带来了挑战,也为法治模式创新发展和法学的“硬科学”转型提供了机遇。法律行业本身是一个利用法律规则建立秩序、解决纠纷并追求正义的服务领域,在法律领域出现内容纷繁复杂、适用成本高等现实问题之际,如何利用计算技术促进法律更好地实现其既定目标,是我们长期以来的一个重要研究方向。将既有的计算技术直接应用到法律工作中,固然是计算技术给法律行业带来的最基本的影响,其带来的司法公开、司法便民和司法效率等问题值得深入研究,但与此同时,越来越多的观点认为,以汉谟拉比法典为代表的成文法开启了对法律规则进行文字编码的历史,随着成文法数量的急剧增加,需要通过新的信息编码技术推动法律的可计算发展,这是法律演变趋势中自然会出现的下一步。93这种观点的理论和实践推动了法律人工智能的发展。耶鲁大学法学院教授莱曼·艾伦(Layman E. Allen)早在1957年就提出了运用符号逻辑技术起草和解释法律的设想,94人工智能技术的发展则为信息化时代的法律可计算性提供了强大的推动力。许多计算科学家和法学家都在探索法律的智能化发展。95在法律逻辑学领域,有不少研究分别基于哈特(H.L.A. Hart)、霍菲尔德(Wesley Newcomb Hohfeld)、阿列克西(Robert Alexy)等学者的理论,建立了各种法律执行程序的计算模型。96研究者开始在法律计算模型构建的基础上,利用不断增强的计算技术和信息化系统实现辅助法律实施的各种具体目标,研究的议题涉及法律推理的形式模型、论证和决策的计算模型、证据推理的计算模型、多智能体系统中的法律推理、自动化的法律文本分类和概括、从法律数据库和文本中自动提取信息、针对电子取证和其他法律应用的机器学习和数据挖掘、概念上的或者基于模型的法律信息检索、自动化执行重复性法律任务的法律机器人、立法的可执行模型等。

目前,构建可计算法律系统最实用的方法是基于计算逻辑,其本质是以符号主义为基础的法律推理过程机械化,也即规则驱动的法律人工智能。法律是专业人士通过严格程序对各类行为活动所作的抽象性总结,其运用过程具有较强的逻辑性,这为法律的符号表示和自动化推理创造了良好的条件。早在1958年,在英国国家物理实验室举行的思想机械化会议上,法国法学家卢西恩·梅尔(Lucien Mehl)就阐述了法律思维过程机械化的可能性。在20世纪80年代人工智能中兴的时期,就一直有人尝试使用符号主义的方法将法律翻译成可执行代码,也有人提出了辅助法律决策的实现路径。97早期可计算法律系统研发的一种方法是直接从法律文本对法律语言进行编码,例如伦敦帝国理工学院的一个小组用编程语言PROLOG(Program in Logic)对英国国籍法的一部分进行了可计算系统的建模。98随着可扩展标记语言(XML)的发展,阿姆斯特丹大学莱布尼茨法律中心在XML标准下创建了通用的MetaLex可扩展交换框架,99用于建立法律规则文本的统一机读标准。该框架在2010年前后已经被采纳为欧洲标准并被许多欧洲国家采用,其法律文本已经可以提供结构化的XML格式的元数据。这种通用机读格式的法律数据可以用来快速构建和分析数据库,而不需要先进的文本处理技术。连接主义人工智能技术的繁荣为法律的可计算性提供了新的思路,形成了一种数据驱动的法律人工智能。法律行业高度重视文本,积累了反映经验知识的大量文本数据。连接主义的技术本质是利用数据之间的相关性发现规律,通过机器学习的方式处理大量裁判案例等法律数据,并配合一些人工标注数据和可计算规则训练计算模型的法律工作能力。数据驱动的法律人工智能之所以具有可行性,是因为这样一个规律:将法律规则应用于一组社会事实就是一个依赖于概念和规则之间的相互作用的算法过程,这些概念和规则在不同的概括性级别上表达,原则上与神经分层和将相对权重分配给新的信息输入没有什么不同,这些新的信息输入具有深度学习中使用的人工神经网络的特征。100与此同时,构建符合特定法律工作场景需求的知识图谱,提高数据驱动模型的可解释性,将是法律人工智能未来发展必须完成的基础性工作。

规则驱动和数据驱动两条技术路线并非是相互矛盾的,未来的技术需要在两个维度上并行发展、互相补充,乃至寻找第三条出路。面对法律的模糊性、开放性和法律人工智能实践中出现的问题,长期以跨学科的方法研究法律与计算机科学的凯文·阿什利(Kevin D. Ashley)教授提出前端信息化和后期计算模型的相互配合,并建议使用本体论来恰当地描述特定法律领域内的相关关系。101Wolfram编程语言的开发者则提出通过高度自然语言化的符号语言来建立一套可计算法律系统。102还有学者结合量子计算最近的技术突破,阐述了量子计算机的诞生将超越经典计算机0和1的精确计算,通过量子纠缠理论为模糊乃至可能发生内部冲突的法律提供新的可计算方法。103在实践应用和法学教育方面,中国、英国、澳大利亚等先后启动数字法庭建设,104斯坦福大学、牛津大学、新加坡管理大学、荷兰教育部等众多高校和教育部门开始加强法律科技的教育工作,还有更多的政府部门、民间机构启动法律科技的革新项目,法律科技产业也进入高速发展的历史时期。105为此,在法律科技的未来发展中,已经过了“是否可以”的疑虑时期,进入了“如何更好实现”的探索时期。