基于脉冲神经网络的机器人智能控制研究进展
引用格式
敖天勇, 曹贤泽, 付乐, 周毅. 基于脉冲神经网络的机器人智能控制研究进展[J]. 信息与控制, 2024, 53(4): 453-470.
摘要
像人一样在复杂多变的非结构化环境中灵巧操作是机器人研究追求的目标之一。受生物脑工作方式启发的脉冲神经网络(SNN)是类脑智能领域的主要工作范式,具有良好的生物合理性,在机器人智能控制领域日益受到关注。本文对基于SNN的机器人类脑智能控制相关研究展开综述,期望能为机器人和类脑智能领域的研究带来启发。首先,介绍SNN的发展历程、神经元模型、编码方式、突触可塑性和网络结构等相关知识。其次,借鉴人类的运动反馈控制机制,给出一种基于SNN的机器人类脑智能控制框架。再次,从运动控制、柔顺控制、协同控制三个方面介绍机器人类脑智能控制策略的研究进展。最后,对基于SNN的机器人类脑智能控制技术进行了总结与展望。
引言
具身智能机器人旨在构建具备自主环境感知、可靠智能决策与自然运动操作规划的机器人系统[6]。随着对机器人自主化、智能化的要求不断提高,机器人控制尚存在动作柔顺性弱、鲁棒性差等诸多挑战[7],特别是在非结构化环境中保持协调运动控制[8]、拟人柔顺操作[9]、高效人机协同[10]等方面尚有很大的提升空间。这一方面是因为现有机器人系统的性能受传感器精度、系统重复精度、辅助机构性能以及能耗等因素制约,另一方面是因为非结构化环境中存在着复杂多变、高噪声、强不确定性等因素。例如随机放置的物体、动态障碍物或行人等。面对这些复杂未知环境时,传统的机器人控制技术费力、复杂且容易出错[11-14]。
大脑在未知的非结构化环境中,能出色地控制身体完成柔顺操作。特别是在行为控制精度较低、功耗有限的情况下,大脑控制身体可以获得优于各身体单元独立能力的整体性能[15]。这对机器人的控制研究有着极大魅力和启发性,吸引了诸多学者对类脑智能机器人展开研究[16-18]。生物学研究表明,大脑采用脉冲方式进行信息传递与处理[19]。因此,借鉴了大脑的信息处理机制的SNN[20-21]受到了广泛关注。研究表明,SNN不仅对于非结构化环境下的任务具有良好适应性[22],而且能使机器人操作更具仿生性和柔顺性[23]。同时,SNN还具备低功耗潜力,能以较低功耗处理机器人控制中的高维数据[24]。因此,基于SNN的机器人类脑智能控制是一个值得深入研究的方向。
如图 1所示,根据多种场景下处理任务的复杂性及动态性,可以构造一个四象限图。纵观模式识别与人工智能算法发展历程,可以发现:面对简单静态类任务,如简单的文字识别,可以通过模板匹配等模式识别类方法解决[25];针对复杂静态类任务,如图像识别,可以通过卷积神经网络类方法解决[26];针对简单动态类任务,如语言或交通流预测,常采用循环神经网络(recurrent neural network,RNN)类[27]及Transformer等[28]方法。尽管基于Transformer类方法的大模型在文字生成及视频生成等复杂动态类特性领域展现出来较强的能力,但其消耗资源及能源巨大[29]。面对复杂动态类任务,如视频或柔顺运动控制,目前还缺乏高效的解决方法[30]。由于SNN最大的优势在于其能够充分利用基于时空事件的信息[31],且SNN可以与Transformer等技术结合以发挥两者的优势[32]。所以针对复杂动态类任务,预期SNN会有较大的发展空间。因此,对基于SNN的机器人类脑智能控制展开研究有着积极的意义。
1
脉冲神经网络的相关理论
下面将从神经元模型、编码方式、突触可塑性和网络拓扑结构四个方面介绍SNN的相关知识。
1.1 神经元模型
神经元是SNN的基本运算单元。神经元模型的优劣主要考察两个方面:模拟生物学特性的丰富程度和计算复杂度[52]。因此,构建兼具高生物合理性和低计算复杂度的神经元模型是实现高性能SNN的关键。常见的脉冲神经元模型有H-H模型、IF模型、Izhikevich模型等。
生物神经元在外部刺激下会表现出复杂的脉冲发放与簇放电行为。通常可以分为20种神经计算特性。表 1总结了常用神经元模型的生物合理性、可模拟实现的神经计算特性种类、参数量及运算量等信息。其中,H-H模型具有较高的生物合理性。然而,H-H模型需要大量的浮点运算。相比之下,IF模型计算简洁。它通过整合输入信号直至达到阈值来发放脉冲,从而在保持一定生物合理性的同时大幅降低了计算复杂度。虽然IF模型无法精确模拟神经元的所有神经计算特性,但IF模型及其变种在实现大规模SNN时提供了一个高效且实用的选择。不同模型的选择需要根据特定应用的需求和可用资源进行权衡。
脉冲神经元模型 | 生物合理性 | 神经计算特性/种 | 浮点计算量/(次/s) |
H-H模型[36, 52-53] | 高 | 20 | 8 |
IF模型[53-54] | 低 | 3 | 4 |
Izhikevich模型[41, 53] | 中 | 20 | 5 |
分段线性模型[55] | 中 | 20 | 6 |
多间室神经元模型[56] | 高 | — | — |
注:“—”表示暂无相关信息,因为多间室神经元模型种类多样。 |
1.2 编码方式
SNN使用离散脉冲序列进行信息传递,而外界信号多为时变的模拟信号。因此,需要对输入神经元的外部信号进行编码,将其转换为脉冲序列信息。常见的编码方式有频率编码、时间编码和群编码等。
频率编码是一种传统的神经信息编码方式[57],只考虑脉冲的发放频率,忽略了脉冲序列的时间信息。它通过时间窗口内的脉冲序列个数来反映外界的刺激强度,因实现简单而被广泛应用。
时间编码用脉冲序列的精确时间表示刺激信息,即信息被编码到了脉冲序列的时间结构中。与频率编码相比,时间编码充分利用了脉冲序列的时间特性。其编码更加稀疏,传输效率更高[58]。目前,时间编码方式包括首脉冲时间编码[59]、排序编码[60]、脉冲延迟编码[61-62]等。
群编码利用多个神经元的集群活动编码输入信息,可以更好地表达外界的刺激信息[63]。此外,群编码可实现稀疏编码,还可通过锐化高斯感受野和增加神经元数量来提高输入信号的表示精度[64]。群编码在SNN与强化学习结合的相关算法中被广泛使用[24, 64-66]。
一般来说,从编码实现的复杂度上看,复杂度由低到高依次是频率编码、时间编码、群编码。从编码方式所能反映的信息量来看,编码信息能力由低到高也依次是:频率编码、时间编码、群编码。
1.3 突触可塑性
突触可塑性是指神经元之间突触的连接强度可改变的特性,被认为是生物实现学习和记忆的重要基础。早在1949年,HEBB对生物神经网络中突触可塑性进行了假设,提出了赫布规则[67]。后续的STDP规则可被认为是赫布规则的一种拓展。STDP规则主要包括长时程增强作用(long-term potentiation,LTP)和长时程抑制作用(long-term depression,LTD)。当突触前神经元比突触后神经元先发放脉冲时引起LTP,反之引起LTD。突触连接强度还取决于两神经元发放脉冲的时间差。此外,生物神经网络中还存在着短时突触可塑性[68-69]、突触自组织传播[70]和侧抑制[71]等可塑性学习规则。
突触可塑性也受到神经递质的影响[72],如多巴胺、乙酰胆碱、甲肾上腺素等。IZHIKEVICH[43]于2007年提出了一种多巴胺调节的STDP规则,即R-STDP规则。其理论依据是基于大脑的远端奖励假设:当特定的放电顺序引起突触变化时,若多巴胺在几秒钟的关键时间窗口期内出现,则这种变化就会增强。相较于STDP,R-STDP在一定程度上解释了突触改变是如何促进神经系统目标实现的。此外,R-STDP引入了奖励信号,使其在面对复杂数据集和大规模网络时具有较高性能。因此,R-STDP在机器人领域中被广泛应用。
1.4 网络拓扑
从总体上看,SNN的拓扑结构可分为前馈型和递归型两大类。前馈型SNN中信息传播是单向的,每个神经元的输入来自上一层节点的输出,神经元处理后得到此节点的输出,并传递给下一层节点。与前馈型SNN相比,递归型SNN具有更丰富的动态特性和更高的计算能力,但也更难训练和分析。递归型SNN又可以分为时间递归型SNN和结构递归型SNN两种类型。在时间递归型SNN中,神经元不仅可以接受其它神经元的信息,也可以接受自身的信息,形成环路结构,因此也被称为循环型SNN。时间递归型SNN具有短期记忆能力,且更加符合生物神经网络结构。结构递归型SNN的输入是树/图结构,这种结构需要花费大量人工去标注。因此,在目前实际应用中SNN很少使用结构递归型拓扑结构。
图 3展示了不同SNN网络应用于机器人领域的具体拓扑形式。由于前馈型网络具有单向信息流动特性,前馈型SNN常用于对实时性要求较高的场景。如图 3(a)所示,LELE等[73]提出了一种用于环境感知的前馈型SNN,该模型可以在单个中枢模式发生器(central pattern generator,CPG)上产生多个步态,每个步态无缝转换、独立触发。步态转换速度的提升,使六足机器人能够更好地捕猎和躲避捕食者。为了提高SNN适应场景的灵活性,如图 3(b)所示,AZIMIRAD等[74]提出了一种拓扑结构可变的前馈型SNN,通过环境参数的变化来改变网络结构,使机器人适应动态环境的变化。相较于前馈型SNN,递归型SNN的优势在于更加丰富的动态特性与高计算能力。因此,递归型SNN常用于复杂动态的场景。
图3 典型的SNN网络拓扑结构
如图3(c)所示,ARENA等[75]根据昆虫大脑的蘑菇体(Mushroom Body,MB)结构设计了一种非线性时间递归SNN,通过记忆整个神经运动控制器关键参数的演化过程,来改进现有的运动基元。为了学习动态场景的变化规律,如图 3(d)所示,RUECKERT等[76]提出了一种时间递归型SNN,其中状态神经元通过R-STDP突触相互连接,通过R-STDP捕捉动态场景变化特性,帮助模型学习最佳规划策略。
2
基于SNN的机器人类脑智能控制框架
本文借鉴人类的运动反馈控制机制,给出一种基于SNN的机器人类脑智能控制框架,如图 4所示。该框架包含类脑决策模型、类脑控制策略、机器人本体和感知系统四个部分。首先,类脑决策模型部分通过分析动作目标r(t)与当前时刻关节空间和笛卡儿空间的状态向量(q(t),
现有诸多机器人类脑智能控制研究成果体现了该框架的适用性。例如,邢登鹏等[18]提出了一个多脑区模型,用于不确定性条件下的精确插销入孔任务。其中,海马体和前额皮层模型可以视为类脑决策模型。小脑模型生成类脑控制策略并发送给机器人本体。机器人本体控制器在接收到命令后,执行插销入孔的运动。力传感器和摄像头作为感知系统,负责监测环境变化,更新状态信息并反馈给类脑决策模型。此外,TIECK等[23]基于大脑的运动控制机制提出了一个多层次SNN模型,用于机械手在复杂环境中的高精度软抓取任务。其中,高级脑区模型扮演了类脑决策模型的角色。脊髓神经回路模型选择合适的抓握策略,并将其转化为电机控制命令,传输给机械手,起到了类脑控制策略生成的作用。机械手上的电机控制器在接收到命令后,执行抓取动作。最后,感知系统通过触觉传感器实时检测接触力,更新状态信息并反馈给高级脑区模型。
3
机器人类脑智能控制策略
3.1 运动控制
SNN对机器人运动控制效果的改善主要体现在运动精度、鲁棒性和实时性三个方面。下面便从这三个方面对SNN在机器人运动控制领域的研究进行分析。
3.1.1 运动精度方面
机器人的运动精度一般用定位精度和重复精度来衡量。定位精度是机器人运动控制中最基本的运动精度衡量指标。SNN进行机器人精度控制的一种简单方法是:提供一个外部训练信号,该信号在突触可塑性的影响下调整突触权重,训练SNN,从而提升机器人的运动精度。CARRILLO等[85]基于STDP搭建了一个脉冲小脑模型,用于控制两自由度机械臂。模型将关节角度、速度及目标位置作为输入,训练SNN。其中STDP的学习依赖于运动误差,即期望与实际状态之间的差异。实验表明,该模型提高了机械臂在目标到达任务中的定位精度。
为了解决STDP在处理复杂任务时容易遭受局部优化限制的问题,引入了受大脑神经调节剂启发的R-STDP学习规则。该方法利用全局奖励信号,显著地提高机器人在执行复杂任务中的运动控制精度。BING等[86]采用基于R-STDP的全连接SNN网络进行小车控制。通过事件相机(dynamic vision sensor,DVS),提取出轨迹变化的事件帧,作为输入。针对每个电机的R-STDP控制器制定对应的奖励。这些奖励将影响权重变化,从而控制小车的转弯行为。在此研究基础上,BING等[87]进一步提出了一种基于R-STDP的SNN网络模型,并采用深度Q学习(deep Q-learning network,DQN)作为学习策略,用以路径控制与避障。实验证明了基于SNN的控制器能够快速地从数据集中收集知识,提升控制效果。
SNN模型可以与经典方法结合,取长补短,从而提升整体的控制效果。LELE等[88]使用SNN与CNN相结合、事件相机与传统相机相结合的方式进行实验。结果表明,SNN与CNN相结合的方式,可以取得更高的精度及更低的延迟。因为SNN在高速移动多无人机目标定位方面恰好弥补了CNN网络的缺点。另外,SNN与深度学习结合,有望解决深度学习能耗过高的问题。DEWOLF等[89]结合SNN与深度学习,在Loihi芯片上搭建深度网络架构,用于七自由度机械臂的末端控制。实验结果显示,这种神经形态控制器在执行中心外伸任务时,相对于理想轨迹的偏离仅比分析解决方案高出4.13%,但节省了两个数量级的能量。
3.1.2 运动实时性方面
SNN的事件驱动和稀疏特性为提高系统的吞吐量和降低延迟提供了新思路[90]。特别是在嵌入式系统上,这些特性能显著缩短数据获取与处理的时间。LELE等[73]利用SNN的事件驱动特性,搭建了闭环端到端的控制系统,显著降低了跟踪任务中的延迟。在此基础上,LELE等[91]利用SNN的稀疏特性解决了六足机器人执行节律运动时遇到的高延迟问题,从而在资源受限的环境中达到70%的成功率。模仿大脑中的延迟补偿机制是另一种降低延时影响的思路。ABADIA等[92]利用小脑的生物学机制进行延迟补偿,有效解决了机器人扭矩控制中的计算和传输时间延迟问题。
SNN与强化学习结合也是提高机器人运动实时性的一个路径。OIKONOMOU等[93]开发了一种基于SNN和深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法的混合强化学习方法,用于两自由度机械臂的夹取任务。实验表明,与传统的DDPG模型相比,该混合模型在任务完成时间和成功率方面表现更好。基于上述的DDPG混合模型,OIKONOMOU等[94]又提出了一种优化机械臂实时运动控制的混合强化学习算法。其中SNN作为演员网络,提高了模型在寻找最佳动作集时的实时性和能源效率。另外,AMAYA等[95]将SNN与软演员评论家算法(soft actor-critic,SAC)结合,提高了机器人在不确定环境中的运动控制精度。
将SNN模型部署到类脑硬件平台中也是提高机器人运动实时性的手段。DUPEYROUX等[96]在微型飞行器中集成了神经形态硬件芯片Loihi,并结合SNN实现了精准着陆。在真实场景实验中,这种基于SNN的系统展示了其在处理腹侧视流场发散性方面的能力。此外,BATRES-MENDOZA等[97]结合脑机接口技术和SNN,通过受试者的心理活动控制机器人,实现了高达99.87%的识别率。
3.1.3 运动鲁棒性方面
机器人控制系统的抗干扰和抗噪声能力至关重要。控制系统的鲁棒性是指在系统面临不确定扰动的情况下,仍然可以保持较好的性能。SNN因具有突触可塑性、侧向抑制等机制,在应对干扰和噪声时具备较好的鲁棒性[98]。最初,学者们探索了SNN的基础特性,如突触可塑性和侧向抑制机制,以增强机器人系统在面对环境干扰和噪声时的运动鲁棒性。CARRILLO等[85]的研究是这一阶段的代表,他们开发了基于SNN的小脑模型,用于控制具有两自由度的机械臂。这项工作利用了SNN的自适应能力,提高了机械臂在执行精确运动任务时的性能。
SNN结合神经调节机制也是提高鲁棒性的方案之一。ABUBAKER等[99]通过引入多巴胺奖励机制,帮助SNN模型自我调整与优化。神经调节机制的引入,显著提高机器人运动的鲁棒性,尤其是有外界干扰和系统参数变化时,其效果更为突出。随后,学者们在突触可塑性和侧向抑制机制等基础上进一步拓展。ZAIDEL等[100]在SNN中引入了基于神经工程框架(neural engineering framework,NEF)的神经形态算法,并将其应用于六自由度的机械臂。该方法不仅继承了SNN的原有优势,而且在处理更复杂运动任务时表现出显著的效能提升。此后,研究者进一步探索SNN在更具挑战性应用场景中的潜力。LUQUE等[101]利用SNN构建的脉冲小脑模型,在有负载和噪声的条件下进行精确轨迹追踪测试,展现了SNN在面对相对复杂、不确定高的环境中的优越性能。
表2总结了近年来基于SNN的机器人运动控制技术的相关进展。在机器人运动控制领域,SNN展现出了显著的优势,但目前也存在着一些局限性。在运动精度方面,SNN通过外部训练信号和突触可塑性调整来提升精度,但STDP学习规则在快速变化或非预测性场景中表现不佳。在运动实时性方面,SNN的事件驱动和稀疏特性能显著降低处理延迟,尤其是在嵌入式系统中。另外,SNN结合强化学习算法具有提高实时性的潜力,但SNN的训练方法与稳定性仍存在不足。在运动鲁棒性方面,SNN的突触可塑性和侧向抑制机制的应用,使其在应对干扰和噪声时具备较好的鲁棒性。但SNN在复杂多变环境中的适应性和长期稳定性还需进一步研究。总体来说,SNN在机器人运动控制上的应用显示出潜力,但在机器人实际应用中的表现有待提升。
表2 基于SNN的机器人柔顺控制技术研究概况
类别 | 机器人平台 | 系统硬件 | 方法 | 文献 |
运动精度 | 两自由度机械臂 | 电机、基于FPGA的控制板 | SNN+STDP | 文[85] |
Pioneer P3-DX机器人 | DVS、马达、电机 | SNN+R-STDP | 文[86] | |
Pioneer P3-DX机器人 | DVS、马达、电机 | SNN+R-STDP | 文[87] | |
DJI Tello Edu无人机 | 手持DVS、惯性测量单元 | SNN+CNN | 文[88] | |
七自由度机械臂 | Loihi芯片 | SNN+深度学习 | 文[89] | |
Loihi芯片 | 六足机器人 | DVS、神经形态听觉传感器 | SNN+CPG | 文[73] |
六足机器人 | CPG、电机、树莓派处理单元 | SNN+CPG | 文[91] | |
Baxter机器人 | 驱动器,位置、速度传感组件 | SNN+小脑模型 | 文[92] | |
两自由度机械臂 | ROBOTIQ双指夹爪 | SNN+强化学习 | 文[93] | |
六自由度机械臂 | 摄像头、激光扫描仪 | SNN+强化学习 | 文[94] | |
Kuka七自由度机械臂 | 笛卡尔阻抗控制器 | SNN+强化学习 | 文[95] | |
Parrot四旋翼无人机 | Loihi芯片、自动驾驶仪 | SNN+腹侧光流场 | 文[96] | |
六足机器人 | FPGA、控制器、无线脑电系统 | SNN+脑机接口 | 文[97] | |
运动鲁棒性 | 两自由度机械臂 | 电机、基于FPGA的控制板 | SNN+STDP | 文[85] |
两轮移动机器人 | 超声波传感器、颜色检测传感器 | SNN+R-STDP | 文[99] | |
六自由度机械臂 | Dynamixel伺服执行器、微处理器 | SNN+NEF | 文[100] | |
LWR仿真机械臂 | 位置、速度、扭矩传感组件 | SNN+STDP | 文[101] |
3.2 柔顺控制
在与人或环境进行交互时,机器人面临人类行为随机性大和环境不确定性高等挑战。单纯的运动控制难以处理此类复杂场景中运动学与力学之间的关系。因此,柔顺控制应运而生[102]。根据是否考虑接触力与轨迹变化之间的关系,可将柔顺控制策略分为:运动学柔顺控制和力柔顺控制[103]。下面分别介绍近年来SNN在两种柔顺控制方式中的研究。
3.2.1 运动学柔顺控制
在结构化场景中,单一的运动控制方法可以为机器人控制提供较好的精度[104-105]。但是在面对参数不确定的外部环境时,传统方法难以建立准确模型,导致难以保证操作过程的稳定性与柔顺性。同时,延迟问题与系统响应速度也直接影响着反馈效果。
小脑模型是柔顺控制的有效方案之一。生物学机制表明,小脑负责精细运动协调和适应性控制。ABADIA等[22]在反馈控制回路核心单元中,基于小脑模型实现了一个SNN控制器。该控制器的小脑闭环控制原理框图如图 5(a)所示。该控制回路通过小脑模型实现了对机械臂6个关节(J1,J2,…,J6)的扭矩控制。首先通过逆运动学的方法将期望的运动轨迹(x,y,z)转换为机械臂关节位置与速度命令(Qd,
将基于SNN的小脑模型与肌肉制动器结合,是对上述小脑模型研究的进一步拓展。从肢体结构设计的角度进一步模仿人类生物机制,特别是使用肌肉软材料来替代传统机器人的刚性连杆。这一结合不仅在软件层面上实现对大脑神经网络的模仿,并且延伸到了硬件的构造,使得机器人在物理结构上更加贴近生物构造,从而实现更加仿生、自然的运动。ZHANG等[106]实现了一个基于小脑拓扑结构的SNN控制器。该控制器通过苔藓纤维、颗粒细胞等5种细胞模拟小脑功能,以学习肌肉致动器的逆模型并弥补控制器的输出,从而提高整个气动肌肉控制系统的响应速度。在此研究的基础上,陈欣怡等[107]提出了一种类小脑SNN模型,无需准确的先验模型,就可柔顺控制拮抗性McKibben气动肌肉对。该模型通过学习程序获得所需的协调能力,实现了一定程度上的自适应柔顺控制。
多脑区联合控制也是SNN在柔顺控制领域上应用的新趋势。这种方法更加贴近于人类大脑中多个脑区的相互协作机制。邢登鹏等[108]将海马体、小脑、前额叶皮层等多个脑区联合起来,通过SNN网络实现了“决策- 规划- 控制”的整体功能。这种方法不仅模拟了视觉皮层的感觉功能和小脑的反应功能,还融入了前额叶皮层的预测和规划功能。该模型能够在狭小的操作空间中进行基于视觉引导的精细柔顺操作,展示了SNN在复杂环境下自主精细柔顺控制的巨大潜力。另外,基于中枢神经系统的多脑区联合控制也是一种可行的解决方案。李青锴等[109]提出了一种基于中枢神经系统的仿生运动控制模型,用于控制七自由度机械臂。该仿生控制模型包含4个模块:类小脑的SNN、大脑运动皮层模块、大脑感觉皮层模块和脊髓模块。其中类小脑的SNN是核心,它利用STDP机制调整突触权重,在不同负载和轨迹条件下有效提高了机械臂的轨迹跟踪能力。
3.2.2 力柔顺控制
机器人与环境的接触控制一直是机器人领域中的一个复杂难题。接触任务需要精细的力量调节,以保证在面临不确定性时通过接触定位执行任务[110]。早期的力控制研究侧重于力精度控制。BUTTERFASS等[111]通过电气系统对多关节手进行位置控制。后续的研究中,通过在控制系统中增加力控制来实现对关节操作的精细处理。然而,这种控制方式难以实现人类抓握过程中的柔性与自适应性。
SNN可以充当反馈控制器,并结合传统的力柔顺控制架构来实现更好的控制效果。通过训练,SNN可以使相同的力柔顺动作适应不同的对象。与其它基于深度学习的仿生抓取模型[112-113]相比,其优势在于可以使用更加少量的训练数据完成多种任务。具体而言,SNN通过模仿生物大脑功能的方式,能够快速学习和适应环境变化。在结合传统的力柔顺控制架构时,SNN可以提供实时的反馈调整,使机器人在复杂且动态的环境中能够保持高效和精准的操作。TIECK等[23]基于SNN实现了一种具有在线学习功能的柔顺控制器。该控制器不需要计算逆运动学或复杂的接触点规划,只需根据抓取动作的一个示例来训练基元。在抓取动作中,柔顺控制器使用力度反馈作为控制参数,用来精确控制手指施加的力。检测机制会向柔顺控制器发送反馈信号,柔顺控制器则会提供连续的激活信号驱动执行机构,从而实现柔顺抓取动作。
利用SNN搭建多脑区联合模型,有助于提高力柔顺控制的自适应效果。在经典的销钉插孔实验中,存在许多不确定性。尤其是在进行快速插入时,会产生径向接触力,因而需要精细的力调节。为解决此问题,邢登鹏等[18]提出一种多脑区联合的SNN模型,在考虑接触预测和快速径向补偿的同时实现了高效的运动规划。该模型通过模拟海马体、小脑和前额皮层的功能构建了一个复杂的多脑区神经网络。具体来说,海马体网络负责记忆功能,预测接触力的分布并学习其时空特性。前额皮层网络负责规划功能,结合过去表现和当前评估制定最优决策命令。小脑接收决策命令后选择最优控制策略,动态补偿机器人的物理响应。
表 3总结了近年来基于SNN的机器人柔顺控制技术的相关进展。在机器人柔顺控制领域,SNN展现了独特的优势。在运动学柔顺控制方面,SNN通过模仿小脑网络结构,有效地提高了实时柔顺控制的精度。然而,当前SNN算法在面对快速变化的场景时的效果仍有待提升。基于SNN的多脑区联合控制模型在经典任务中表现较为出色,但其复杂的结构与巨大的计算成本,限制了其在真实场景下的应用。在力柔顺控制方面,SNN可以结合传统力柔顺控制架构,通过少量数据学习,帮助机器人在不确定目标属性的情况下进行自适应抓取。但SNN在处理高度动态和复杂环境中的任务时的精度还有待提高。总体而言,SNN在机器人柔顺控制领域表现出良好的仿生性与协调性潜力,但其稳定性和泛化能力在复杂环境中的应用仍需进一步研究和验证。
类别 | 机器人平台 | 系统硬件 | 方法 | 文献 |
运动学柔顺控制 | Baxter机器人 | 驱动器,位置、速度传感组件 | SNN+小脑模型 | 文[22] |
Baxter机器人 | 驱动器,位置、速度传感组件 | SNN+小脑模型 | 文[92] | |
模拟肌肉骨骼系统 | McKibben气动肌肉 | SNN+小脑模型 | 文[106] | |
模拟肌肉骨骼系统 | McKibben气动肌肉 | SNN+小脑模型 | 文[107] | |
中尺度操纵平台 | 摄像头、机械手、双轴旋转平台 | SNN+多脑区联合模型 | 文[108] | |
七自由度机械臂 | 控制器、电机驱动器、位置传感器 | SNN+多脑区联合模型 | 文[109] | |
力柔顺控制 | SVH五指机械手 | 五个手指基元 | SNN+在线学习算法 | 文[23] |
中尺度操纵平台 | 摄像头、机械手、双轴旋转平台 | SNN+多脑区联合模型 | 文[18] |
3.3 人机协同控制
在人机协同任务中,人的动作随意性很强。因而,机器人对人机交互模型的建立非常困难,尤其是在人类意图的识别和早期预测方面。在以往的研究中,意图转向模型主要是通过计算和数学推导出来的[114],生物可解释性较差。此外,对视觉信息特别是时序信号进行处理时,时间窗口难以选择并且实时性较差[115]。人脑在面对意图模糊性和随机性较强的同伴时,往往表现出较好的灵活性、协调性和平滑性。这为人类意图预测模型的研究提供了参考。SNN在生物可解释性和多模态信息处理方面具有天然优势[55, 116]。此外,脉冲神经元独特的通信方式及丰富的动力学特征赋予了SNN低功耗计算和时序信息处理的潜力[117]。下面便从人机协同的角度介绍SNN在协同控制领域的相关研究。
机器人和人的行为之间往往存在潜在的耦合关系。对人类意图的早期预测可以帮助机器人规划轨迹,避免占用人类将要使用的工作空间。人类意图的早期预测依赖于多模态的人类交流线索。现有研究主要集中于使用ANN网络进行人体运动轨迹预测。但是在ANN网络中,两层神经元之间的延迟是不变的,限制了其对多模态信息异步效应的模拟。相比之下,SNN网络中神经元间的传导延迟是可变的,因而可以更好地模拟多模态信息的异步效应。并且,当前基于ANN的人机协同控制的研究主要关注于人体运动轨迹的预测[118-119],而忽略了话轮转换(turn-taking)时间和意图的预测。
SNN可以通过结合话轮转换模型,提高在复杂人机交互场景中的早期意图预测效果。周天等[120]提出了一种基于SNN的认知话轮转换模型(cognitive turn-taking model,CTTM),用于实现外科医生的早期转向意图预测。他们所提出的CTTM模型性能大大优于当时最先进的转向预测算法。该模型在学习低于40%的线索时,达到优于人类的效果。针对人机协作的装配任务,张荣等[115]提出了一种基于融合脉冲神经网络(fusion-based spiking neural networks,FSNNs)的协同请求预测方法。该方法预测结果接近人类协作,为操作员提供了友好的交互体验。冯思棋等[121]提出了一种早期预测模型,用于装配任务中人类话轮转换的预测,其系统框架如图 6所示。该系统首先使用Kinect相机捕捉操作员的骨骼数据,这些数据经过噪声过滤和信号增强后输入到SNN模型中。SNN通过STDP机制学习操作员的动作细节,提前预测人机之间的转换意图,从而生成相应的轨迹规划和控制命令,实现高效的机器人协同操作。实验结果表明,此模型在协作任务中具有较高的可靠性和平滑性。
图6 基于SNN人机协作早期话轮转换预测系统框架
SNN通过其独特的脉冲神经元模型和时间编码方式,能够模拟大脑中神经元的动力学特性,非常适合表示和处理语音类的时间信号。因此,针对环境声音识别任务,于强等[122]设计了一个集成框架,包括稀疏编码、高效学习和鲁棒读出。受听觉神经元捕捉局部光谱- 时间(spectral-temporal)特征的启发,文[122]提出了一种简单通用的编码方案。该编码方案提取的关键点包括光谱信息和时间信息,可以稀疏且鲁棒地表示声音信号。上述框架中的SNN模型使用多脉冲学习规则进行训练,并在不同分贝的噪声水平下进行性能评估。该算法平均准确率达到98.68%。与其他算法相比,该算法具有较好的鲁棒性。并且SNN的声音样本运行时间只有0.094 ms,相对于ANN和CNN类算法,该算法具有较高的计算效率。此外,吴冀彬等[123]基于SNN开发了一套集成语音活动检测、声源定位和语音命令识别3个功能模块的系统。与其他算法相比,该系统具有较好的实时性、鲁棒性以及较低的能耗。
表4总结了近年来基于SNN的机器人协同控制技术的相关进展。目前,基于SNN的协同控制技术研究还处于初步阶段,SNN主要应用于协同控制的感知和人类意图预测层面。例如,SNN能够有效处理人体运动轨迹的预测,并在协作任务中实现高效的早期预测。虽然SNN在简单协作场景下能够超越人类的预测能力,但其在处理更加复杂和非结构化的交互场景时会遇到性能瓶颈。
表4 基于SNN的协同控制技术研究概况
类别 | 机器人平台 | 系统硬件 | 方法 | 文献 |
人机协同 | 医疗机械臂 | 肌电图、脑电图、光学传感器 | SNN+转弯预测模型 | 文[120] |
协作机械臂 | 控制器、电机 | SNN+协作请求预测模型 | 文[115] | |
六自由度机械臂 | 肌电图、脑电图、光学传感器 | SNN+协作请求预测模型 | 文[121] | |
人机交互 | 医疗机械臂 | 肌电图、脑电图、光学传感器 | SNN+转弯预测模型 | 文[120] |
协作机器人 | 麦克风 | SNN+鲁棒语音识别框架 | 文[122] | |
协作机器人 | 雷达、SNN硬件加速器、GPU | SNN+雷达检测模型 | 文[123] |
4
总结与展望
综上所述,SNN在运动控制领域展示出提高精度、降低延迟、增加稳定性的广泛前景。在柔顺控制领域,SNN应用分为运动学柔顺控制和力柔顺控制,表现出实时反馈、延迟补偿、快速在线学习的特点。在协同控制领域,SNN研究多集中于人类意图预测,在处理人体运动轨迹预测方面表现出潜力。基于SNN的机器人类脑智能控制技术取得了一些研究成果,但是该技术还有诸多值得进一步探索的研究方向,其中包括:
1) 开发适用于SNN的先进的技术与器件,用于感知与执行环节。在机器人类脑智能控制框架的4个环节中,SNN在感知和执行环节上应用较少。这是因为主流机器人的感知与执行依赖于通用传感器采集与电机驱动,它们与受生物启发的SNN相融程度并不高。而近年来配套创新技术的相继诞生为SNN在感知和执行环节上的应用提供了较大助力。例如,在感知环节,事件相机以其事件流驱动的工作方式与SNN的时间编码方式紧密结合,充分发挥了SNN低功耗的优点。在执行环节,肌肉骨骼系统能够模拟人类肌肉和骨骼的结构和运动方式,为SNN实现高水平和高生物学合理性的类人运动提供了执行层面的基础。因此开发先进技术与器件,将会进一步发挥SNN在实际应用中的潜力。
2) 探索考虑力与运动协调关系的类人柔顺控制方法。当前SNN学习算法多是单独从机器人运动学或力学的角度考虑柔顺性,而较少集中在控制过程中力与运动的协调关系上。如果让机器人实现和人体一样灵敏、协调的柔顺动作,需要SNN能更好地协调接触力与运动之间的动态关系。SNN可以学习和适应环境中的变化,更好地捕捉接触力与机器人运动之间的动态关系,进而促进实现真正类人柔顺控制的目标。因此,开发协调控制接触力和运动符合期望动态关系的SNN学习算法是一个值得探索的方向。
3) 开发并推广适用于SNN的硬件平台与通用编程框架。GPU+CUDA+Pytorch这类通用并行计算平台和编程模型不适用于SNN,导致编程效率低,影响SNN的广泛应用。因此开发具备通用性的SNN学习框架及通用SNN加速芯片是一个值得研究的领域,两者将如深度学习框架与GPU的发展一样相辅相成,助力SNN的广泛发展与应用。
具身智能是机器人发展的重要趋势之一。当前机器人受到计算资源与功耗的制约。SNN的事件驱动特性和脉冲编码机制,使得机器人在应对复杂和动态任务时表现出更强的实时性能与低功耗表现。因此,基于SNN的机器人类脑智能控制技术将有助于具身智能愿景的实现。
扫描二维码阅读原文
▼滑动查看更多
该文来源于信息与控制,欢迎转载,请全文转载并插入该公众号名片。
END