NeurIPS 2024 | 类脑智能与黎曼图学习:黎曼脉冲神经元初探

创业   2024-11-15 08:22   北京  

本文介绍来自华北电力大学孙笠老师团队发表在NeurIPS 2024上的一篇文章“Spiking Graph Neural Network on Riemannian Manifolds”。脉冲神经网络由于其低功耗和事件驱动的特性受到深度学习领域的关注。在图学习问题上,现有脉冲图神经网络仅支持在欧几里得空间建模,忽略了图结构的内蕴几何,并且受到传统的BPTT训练方式的高时间延迟问题的影响。

鉴于上述问题,作者提出在黎曼流形上的脉冲图神经网络,设计了一种简单而有效的黎曼流形脉冲图神经网络(MSG)。它可以应用于任何测地线完备的流形,如常曲率空间(CCS)及其积空间与商空间。

为构建该脉冲网络,本文设计了一种黎曼脉冲神经元,其基于流形的微分通路(DvM)为训练脉冲神经网络提供了一全新的视角,可避免BPTT训练高延迟的缺陷。在理论上,作者揭示了MSG与黎曼流形常微分方程的深刻联系。在现实数据集的实验中,MSG展现出优于现有脉冲图神经网络的表达能力,并且其能源效率相比于典型的黎曼图神经大大提高。该研究为脉冲神经网络和黎曼图学习带来了新的可能。

论文名称:

Spiking Graph Neural Network on Riemannian Manifolds 

论文链接:

https://arxiv.org/abs/2410.17941


一、背景与研究动机

传统的图神经网络(GNN)通过复杂的浮点运算获得强大的表达能力,但与此同时带来了高昂的能耗开销;脉冲神经网络(SNN)利用脉冲神经元进行稀疏和事件驱动的通信,具有功耗低的特点。近年来,脉冲图神经网络(Spiking GNN)逐渐受到学界的关注,并设计了一系列脉冲网络架构,例如图卷积、注意机制、变分自编码器和连续图神经网络。虽然上述工作取得了阶段性的成功,但是脉冲图神经网络仍然面临亟待解决的挑战:

(1)表示空间

现有脉冲图神经网络在欧几里得空间中建模图结构,忽略了图结构所蕴含的几何特性。大量的研究表明图结构具有典型的非欧特性,且基于欧式空间的嵌入会导致不可避免的失真。近年来,基于黎曼流形的图表示学习取得了巨大的成功,然而其尚未与脉冲神经网络建立联系。

(2)训练算法

离散的脉冲序列并不可微,这成为了训练脉冲神经网络的主要障碍。现有方法通常将脉冲图神经网络类比于循环神经网络,进行梯度替代并采用BPTT方法训练模型。这类训练方法需要逐时间步地梯度回传,也因而存在高延迟的问题。

鉴于上述问题,本文提出了第一个基于黎曼流形的脉冲图神经网络(MSG),其总体架构如图1所示,并从理论上阐述了其与黎曼流形常微分方程的联系。

二、黎曼流形脉冲图神经网络(MSG)

作者提出了黎曼流形脉冲图神经网络(MSG),其避免了传统BPTT训练高延迟的问题。

2.1 流形脉冲层

给出脉冲层统一的形式化描述,其采取了并行前馈机制。该网络层由一个图卷积和一个新颖的流形脉冲神经元(MSNeuron)组成,如图2所示。对于图中的每一个节点,第l层的变换公式如下:

在并行前馈的过程中,脉冲序列与流形表征相互关联:

具体地,该神经元在将脉冲序列转换为输入电流同时向其注入结构信息。输入电流由图神经网络给出,采取基于消息传递的图卷积操作:


其次,作者利用微分同胚(Diffeomorphism)将脉冲序列与图形表征相互关联。鉴于脉冲序列的欧式结构,作者通过指数映射构造了切空间与流形之间的微分同胚,其适用于测地线完备任何流形。给出测地线的单位矢量,指数映射的形式化描述如下:


其次,作者利用微分同胚(Diffeomorphism)将脉冲序列与图形表征相互关联。鉴于脉冲序列的欧式结构,作者通过指数映射构造了切空间与流形之间的微分同胚,其适用于测地线完备任何流形。给出测地线的单位矢量,指数映射的形式化描述如下:

最后,介绍模型的初始化方法。作者基于流形的北极点给出初始表征

2.2学习方法:基于黎曼流形的微分通路(DvM)

下面介绍MSG的训练方法。本文作者注意到,现有脉冲图神经网络普遍存在高延迟的问题,其主要原因在于BPTT训练方法的逐时间步梯度回传。作者将这样的反向传播方式称为基于脉冲域的微分通路(DvS):


为解决该问题,作者不再局限于BPTT方法,开创性地解耦了前向与反向传播过程,提出了基于黎曼流形的微分通路(DvM)的训练方法:


为了阐述DvM的机理,现将微分几何的相关概念简述如下。

Pushforward、Pullback and Dual Space

在黎曼几何中,Pushforward为一导函数,其原函数关联两个黎曼流形 。在MSG中,作者考虑流形上的实函数 ,其中 为定义域流形。在点 处的推前 将切向量 映射到一个标量值,并且相应地, 属于切空间 的对偶空间,这是一个由所有线性泛函 组成的向量空间。由于流形上不同点的切空间是不同的,它需要一个回拉 (pullback),将对偶空间 映射到对偶空间
DvM的计算过程由下述定理给出:

公式(9)处处可微,因此不需要梯度替代(surrogate gradient),而且基于流形的微分通路(DvM)无需递归的反向传播,从而减轻了高延迟训练的问题。
作者指出,指定的DvM和之前的DvS在前向传播中都递归地计算每个时间步,区别在于反向传播:DvM只进行无需递归的逐层梯度反向传播;DvS则需基于BPTT进行逐层逐时间步的梯度回传。除了可微和无需递归的特性外,DvM也不会出现梯度消失或者梯度爆炸问题。

三、理论:MSG与神经微分方程

在理论上,作者揭示了MSG与神经微分方程的内在联系:MSG在极限意义上等价于黎曼流形常微分方程的求解器。

作者利用黎曼流形的图卡(chart)这个概念来研究MSG和黎曼流形常微分方程之间的关系。黎曼常微分方程如下:


特别地, 为流形上的轨迹方程, 为其切丛中的矢量场。
MSG的流形输入与输出的变换过程被描述为一组连续的流形常微分方程(ODE),其向量场由切丛(tangent bundle)中的脉冲神经网络控制。

MSG利用动态chart(图3)的思想分析黎曼流形常微分方程的解。动态chart求解器的定义如下:

由上可知,一个黎曼流形常微分方程可以由一组连续的切空间进行求解,而这组切空间与chart关联。

由定理5.2的一阶近似可知,给定步长 ,路径的终点 由参数化的脉冲图神经网络给出。逐层前向传播的过程即为从当前chart到其后继chart的流形常微分方程求解过程。因此,MSG的输出在极限意义上等价于流形常微分方程的解。

四、实验与评估

作者使用12个基准模型在Computers,Photo,CS 和Physics数据集上进行了大量的实验,通过表达能力、能耗开销以及DvM的优势三个方面来评估MSG的性能优势:

4.1 实验结果和讨论

4.1.1表达能力

表1体现了MSG在基于SNN的模型较其他方法是更优的。此外,MSG在节点分类中通常优于基于ANN的基线,并且在链接预测中的结果能够接近基于ANN的黎曼基线的结果。

4.1.2消融实验

表2是MSG在不同的流形上的几何变体的实验表现。

在不同的表示空间中,训练时间的对比实验如图4(a)所示:DvM的反向传播时间明显少于BPTT算法。此外,作者计算了DvM的反向梯度,并在图4(b)中绘制了每一层的梯度范数,这表明DvM不会出现梯度消失或者梯度爆炸的问题。

4.1.3能耗开销

作者研究了图模型在理论能量消耗(毫焦耳)方面的能量成本。结果显示,基于SNN的模型通常比基于ANN的模型享有更低的能量成本。除了Photo数据集外,MSG在基于SNN的模型中也实现了最佳的能量效率。

4.1.4可视化与讨论

作者通过实证研究展示了MSG与流形常微分方程之间的联系。图5为Zachary空手道俱乐部数据集的一个简单示例。


五、总结与展望

本文作者从崭新的黎曼几何视角研究了脉冲图神经网络,设计了一种基于黎曼流形的脉冲神经元。其以微分同胚关联黎曼流形与脉冲序列,并提供了基于黎曼流形的微分(DvM)通路以避免传统BPTT训练的高延迟问题。作者进一步揭示了其数学构形与流形常微分方程的内在理论联系;大量的实验证实该模型取得了当前最优的结果。

本文为在提出脉冲神经网络训练方法的同时,也为低能耗的黎曼神经网络设计开辟了新的路径。作者也指出其网络架构主要适用于无向、同质图,而其他类型的图学习仍然是开放的研究问题。

llustration From IconScout By IconScout Store

-The End-

扫码观看

本周上新!


“AI技术流”原创投稿计划


TechBeat是由将门创投建立的AI学习社区(www.techbeat.net社区上线600+期talk视频,3000+篇技术干货文章,方向覆盖CV/NLP/ML/Robotis等;每月定期举办顶会及其他线上交流活动,不定期举办技术人线下聚会交流活动。我们正在努力成为AI人才喜爱的高质量、知识型交流平台,希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。


投稿内容

// 最新技术解读/系统性知识分享 //

// 前沿资讯解说/心得经历讲述 //


投稿须知

稿件需要为原创文章,并标明作者信息。

我们会选择部分在深度技术解析及科研心得方向,对用户启发更大的文章,做原创性内容奖励


投稿方式

发送邮件到

melodybai@thejiangmen.com

或添加工作人员微信(yellowsubbj投稿,沟通投稿详情;还可以关注“将门创投”公众号,后台回复“投稿”二字,获得投稿说明。


关于我“

将门是一家以专注于数智核心科技领域新型创投机构,也是北京市标杆型孵化器公司致力于通过连接技术与商业,发掘和培育具有全球影响力的科技创新企业,推动企业创新发展与产业升级。

将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。

如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我“门”: 
bp@thejiangmen.com

    


点击右上角,把文章分享到朋友圈
点击“阅读原文”按钮,查看社区原文

将门创投
将门是一家以专注于数智核心科技领域的新型创投机构,也是北京市标杆型孵化器,由前微软创投在中国的创始团队于2015年底创立。公司致力于通过连接技术与商业,发掘和培育具有全球影响力的科技创新企业,推动企业创新发展与产业升级。
 最新文章