斯坦福CodeX20周年纪念系列:计算法学的下一个模型是什么

文摘   2024-11-01 20:09   北京  


斯坦福大学CodeX副主任梅根·马(Dr. Megan Ma)前言

2025年,斯坦福法律信息学中心(CodeX)将迎来其20周年庆典。在此之际,我们满怀激动,纪念并致力于在法律与技术的交汇点上,继续推进二十年来所取得的突破性成果。CodeX已发展成为计算法学领域的全球领导者,不断探索利用数据、形式逻辑、算法和智能系统来变革法律实践和法律研究的可能性边界

在这一系列特别纪念文章中,我们将带您穿越CodeX的过去、现在与未来。我们将重温那些奠定计算法学基础的前瞻理念和开创性研究,并探索这些早期努力如何逐步转化为正在重塑法律领域的实际应用。更重要的是,我们将展望前沿,揭示CodeX未来发展的宏伟蓝图和尖端研究,我们希望通过这些努力为CodeX的未来发展铺路。

至关重要的是,这一系列文章将证明,法律的未来并非由机器人取代律师,而是人类与机器协同工作,共同推进法律赋能的使命。CodeX始终站在这一变革的最前沿,值此二十周年创新庆典之际,我们诚邀您一同畅想未来的无限可能。

本系列首篇文章由2024年CodeX奖得主L. 索恩·麦卡蒂(Professor L. Thorne McCarty)教授呈现

计算法学的下一层模型是什么?
——L. 索恩·麦卡蒂(Professor L. Thorne McCarty)教授

近期,我的文章《聚类、编码与相似性概念》(“Clustering, Coding, and the Concept of Similarity”)发表于《数学与人工智能年鉴》(2024)。这是系列三篇文章中的第一篇。第二篇文章题为《高维空间中的差异相似性:理论与应用》(“Differential Similarity in Higher Dimensional Spaces: Theory and Applications”),第三篇则为《流形逻辑与差异相似性理论》(“Manifold Logic and the Theory of Differential Similarity”)。我将在后续评论中详细讨论这三篇文章。

以下是概述:概率、几何、逻辑。第一波人工智能基于逻辑,第二波则基于概率,多年来人们一直试图将这两者融合为一个统一的形式体系。

本文的新颖之处在于几何:几何模型构建于概率模型之上,而逻辑则构建于几何模型之上。关键问题在于:如何构建这三个模型之间的接口?此外,我们希望递归地扩展此堆栈,以便逻辑支持另一个概率层。

 

更具体地说,这三个模型分别基于随机过程、微分几何和范畴理论。数学内容相当复杂,但我在几周前CodeX 2024的演讲中简要阐述了主要思想,若您对此理论感兴趣,这将是一个很好的起点。

[视频:2024年CodeX奖FutureLaw活动]

第一篇文章《聚类、编码与相似性概念》探讨了基本的数学理论,并研究了概率模型与几何模型之间的接口。不过,讨论仅限于三维空间,以便更易于可视化。


几何模型的坐标系采用了一种原型编码形式。

我们测量从原型(即坐标)到多个指定方向(即坐标)的距离。黎曼不相似度量衡量的是沿坐标曲线等概率增量的变化,而坐标曲线则是沿恒定概率密度表面的最短路径。

由于19世纪微分几何的一个重要结果——弗罗贝尼乌斯(Frobenius)定理,这种几何模型得以成立。作为弗罗贝尼乌斯定理的一个推论,我们可以证明“弗罗贝尼乌斯积分流形”与恒定概率密度的表面完全一致。因此,几何模型与概率模型完全匹配。


第二篇文章《高维空间中的差异相似性:理论与应用》将理论扩展到一般n维情况。这带来了巨大差异。

在MNIST示例中,我们从60万个7x7图像块开始,将它们排序为35个“原型聚类”,每个聚类由一个坐标和48个坐标定义。然后,我们展示了如何通过找到具有11个最优坐标的子聚类,将维数降至12。


在CIFAR-10示例中,我们为理论增加了两个新特性:商流形和积流形。商流形用于在几何模型中构建与概率模型已知特性相一致的不变性。积流形则用于将低维解决方案组合到更高维的问题空间中,以便我们可以递归地应用降维技术。在CIFAR-10示例中,我们通过计算每个R/G/B颜色通道中最优的12维子流形,然后将积流形的维数再次从36降至12,来演示这一过程。

在每种情况下,差异相似性理论都能给出与几何模型和概率模型相一致的“最优”子流形的合理表征。


第三篇文章《流形逻辑与差异相似性理论》目前仍是不完整的草稿,但我已将副本分发给少数人进行初步评论。我预计将在未来几个月内完成这篇论文,并将其作为预印本发布。

与此同时,您可以阅读我2015年ICAIL会议论文中第3节对该逻辑的初步总结。或者,您也可以阅读《密歇根州立大学法律评论》中一篇技术性稍弱的总结。

这两个参考文献还展示了差异相似性理论与先前人工智能与法学研究工作的关联性。

以下是几何与逻辑之间接口的一个简单示例:


在MNIST示例中,假设Patch23是一个流形,?P23指该流形上的一个点,其他三个图像块同理。数字“4”的图像则是四个图像块积流形的一个子流形,以2x2阵列排列。但这与左侧的逻辑表达式所表示的内容完全相同。在经典逻辑中,谓词是其参数的笛卡尔积的子集。在流形逻辑中,谓词被解释为参数积流形的子流形,方式完全相同。

因此,在范畴逻辑中,我们只需将集合及其元素替换为流形及其点即可。

清华大学智能法治研究院
发布清华大学法学院、清华大学智能法治研究院在“计算法学”(Computational Law)前沿领域的活动信息与研究成果。
 最新文章