南京大学吕建,马晓星团队 | 神经符号系统:非确定性管理的视角

文摘   科技   2025-01-23 12:03   北京  

文章下载

李泽南, 姚远, 马晓星, 吕建神经符号系统:非确定性管理的视角. 中国科学:信息科学, 2025, 55(1): 1-31, doi: 10.1360/SSI-2024-0163



研究意义

神经符号系统 (Neuro-Symbolic Systems) 作为一种融合了神经网络和符号规则的智能化软件新形态,不仅在概念上契合丹尼尔·卡尼曼 (Daniel Kahneman) 所提出的 “系统1 + 系统2” 式人类思维认知模式,也已在自动驾驶系统、智能医疗设备、机器人语音操控等诸多领域展现出巨大应用前景。

图1 神经符号系统的3个实例,分别完成 (a) 视觉数独求解;(b) 自动驾驶;以及(c) 智慧司法任务


在软件方法论的层面上,神经符号学习这一框架融合了“智能化软件的开发”和“软件的智能化开发”两方面的内容,其基本原理和算法的研究具有重要的意义。本文旨在以非确定性管理的新视角,较为系统深入地讨论分析“端到端”神经符号学习的技术挑战,整理评述相关工作的思路与进展,以期提供一个有利于读者理解掌握的路线指引。

本文工作

现有“端到端”神经符号学习技术难以有效支持较大规模系统的自动构建。本文提出,非确定性 (Uncertainty) 是理解高效融合神经符号之内在技术挑战的一个关键。神经网络和符号规则两类软件实体对非确定性的处理方式截然不同。前者基于学习泛化理论,把非确定性隐式地包含于期望损失最小化的学习目标之中,而且主流的神经网络学习技术常常牺牲对于非确定性的精确管理,并以此来换取更好的预测准确性。后者的构建过程中,人类开发者负责抽象掉现实世界问题的非确定性,以换取符号规则推理的可计算性、可解释性和可组合性。然而,在结合神经网络模块与符号规则模块,实现“端到端”神经符号学习时,这两个相互割裂的非确定性处理方式带来了很大的问题。一方面,神经网络训练忽略显式化的非确定性管理,直接追求最小化经验损失,导致在后续神经符号接地过程中,极其容易陷入“逻辑推理捷径”,使得整个神经符号系统的性能不佳;另一方面,人工排除了非确定性后的符号演绎系统,难以通过梯度下降的方式和神经网络模块共同训练、相互促进,极大地影响了神经符号学习的效率。因此,可以说,“端到端”神经符号学习需要一套新的非确定性管理方案。
为此,本文以非确定性管理的新视角,来建模和分析“端到端”神经符号学习的关键步骤和技术挑战。首先使用标准的数学框架将神经符号学习建模成一个双层优化问题,用以讨论“端到端”学习的优越性和必要性,以及当前实现“端到端”学习的两个主要技术瓶颈:“神经符号接地”以及“可微符号合成”。
模糊逻辑方法与模型计数方法均将网络的预测非确定性建模到了神经符号接地过程中,以提高神经网络模块训练的效率。
图2 基于投影的马尔可夫链蒙特卡洛采样技术

图3 数独 (4 × 4) 的符号约束 S_y (z)

本文讨论了多种针对不同约束结构的符号约束合成方法,特别是其可微化技术,这些技术所解决的关键问题在于如何引入和表示一个候选符号约束的非确定性评估。
图4 霍尔子句符号约束合成方法TensorLog和NTP

图5 整数线性符号约束合成方法IntLP和PBL

在以上框架下,本文综述了现有的神经符号学习工作,并以非确定性管理的视角解读它们的贡献和当前仍然存在的问题。在此基础上,展望了下一步的发展方向。





中国科学信息科学
《中国科学:信息科学》及其英文版《Science China Information Sciences》的宣传平台。
 最新文章