Science Robotics封面|加州理工学院实现机器人实时自主运动规划与决策

文摘   2024-12-31 11:09   辽宁  

点击蓝字关注并设为星标

2018年,Google DeepMind团队开发的AlphaZero程序利用机器学习及特定算法,成功掌握了国际象棋、日本将棋(shogi)与围棋的游戏规则,并能在规定的棋盘上确定最佳走法以赢得比赛 。

近日,加州理工学院的一个研究团队为自主机器人开发出一种类似算法——即一种规划与决策控制系统,能够使自主移动机器人在现实世界中实现全局最优。相关研究成果于2024年12月4日以封面文章发表于Science Robotics
加州理工学院控制与动力系统专业的研究生、该篇论文的共同第一作者(co-lead author)John Lathrop表示,不应寄希望于设计师亲手为机器人设计每一个动作,赋予机器人性能卓越且可靠性强的自主决策能力才是机器人研究的最终目标。为此,该团队提出了SETS(Spectral Expansion Tree Search)算法。
SETS是一种能够实现全局最优解收敛的实时且连续的空间规划算法。它利用控制理论和线性代数生成机器人的运动,以在物理环境中最大限度地发挥机器人平台的能力。
加州理工学院控制与动态系统教授、NASA喷气推进实验室的高级研究员Soon-Jo Chung表示,SETS本质上还是基于蒙特卡洛树搜索(Monte Carlo tree search,MCTS)算法。然而,在将其应用于现实世界中的机器人等连续动态系统时,由于树结构的分支特性,导致树所包含的轨迹数量呈指数级增长。若对每条轨迹逐一模拟以寻找最优解,对于某些复杂问题而言,求解过程可能需要数年乃至数百年之久。
为了克服这一问题,SETS采用了探索/利用权衡(exploration/exploitation trade-off)策略,即尝试模拟那些之前未使用过的轨迹,此过程称之为“探索”(exploration);接着,寻找之前产生过高奖励回报的路径,即执行“利用”(exploitation)。通过在探索和利用之间取得平衡,该算法能够迅速收敛至所有可能轨迹中的最优解。
Chung表示,该研究的突破性创新在于探索出一种极其高效的方法,用以寻找那些传统基于优化的方法难以捕捉的最优安全运动路径。此项工作的贡献可归纳为两点:一是验证了所提出的算法在确保最优解不变的前提下,有效实现了连续空间问题的离散化处理;二是在环境中提供一种新型的有限时间内算法的收敛性分析方法。
此外,SETS算法的一个主要特点是具备高度的通用性,基本可以应用于任意机器人平台,其特性和功能均无需单独编程修改。在该篇论文中,Chung等演示了该算法在四种完全不同的实验环境中的成功应用——这在机器人领域的论文中是非常罕见的。
●  四旋翼无人机
在第一项任务中,四旋翼无人机被要求观察四个悬停的白球并避开四个橙色球,同时在充满随机产生的危险气流或热气流的环境中航行。该项无人机实验在加州理工学院的自主系统与技术中心(CAST)进行。

●  履带式地面车辆

在第二项任务中,该算法增强了履带式地面车辆人类驾驶员的操作能力,使其能够在狭窄蜿蜒的轨道上行驶,而避免撞到侧轨。

●  航天器捕获

在第三项任务中,SETS辅助一对系绳航天器捕获并重定向第三个物体,该物体可以是另一个航天器、小行星或其他物体。

●  滑翔机

在第四项任务中,一架滑翔机在模拟环境中通过克服空气阻力成功绕道进入热气流区域,从而从周围环境中获取能量,并运行了足够长的时间来完成定向任务。
数据驱动方法和与基于梯度的方法的组合也常被用于决策。然而,它们在离线训练阶段需要大量的示教数据,这限制了它们的应用范围,仅适用于完整问题数据已知条件下的系统和场景。相比之下,SETS方法可以部署在未知问题上,且能在任何允许的算力条件下,生成一个近似最优决策的规划方案,且方案效能随时间而递增。SETS通过对精心构建的自然运动表征进行离散搜索来提供全局最优解决方案。
从系统设计的角度来看,SETS提供了许多重要优势:首先,SETS解决了广泛的马尔可夫决策过程(MDP)问题,因此可以自然地与其他自主模块进行交互,并可拓展用于新型的多样化的任务和系统。这减轻了设计人员的负担,并扩展了自主行为的操作范围;其次,由于SETS的搜索树能够进行可视化分析,因此具有高度的可解释性,并且可以由用户进行调整和验证;最后,由于SETS的计算效率足够高,可以实时运行,能够实时响应新信息并进行实时计算。基于上述优势,SETS有望成为各种自主系统中规划器的理想选择。
该项研究获得了DARPA的LINC(Learning Introspective Control)计划、美国Aerospace Corporation和韩国Supernal公司(致力于开发飞行汽车)的支持,并且还部分受到美国国家科学基金会研究生研究奖学金计划的支持。
信息来源:

https://www.sciencedaily.com/releases/2024/12/241204183134.htm

https://www.science.org/doi/10.1126/scirobotics.ado1010

Rivière B, Lathrop J, Chung SJ. Monte Carlo tree search with spectral expansion for planning with dynamical systems[J]. Science Robotics, 2024, 9(97). DOI: 10.1126/scirobotics.ado1010.

版权声明:本文来源内部整理,仅供交流学习使用,欢迎转载,请联系授权! 

END



 

欢迎关注《机器人》视频号

机器人ROBOT
《机器人》是由中国科学院主管,中国科学院沈阳自动化研究所、中国自动化学会共同主办的科技类核心期刊,主要报道中国在机器人学及相关领域具有创新性的、高水平的、有重要意义的学术进展及研究成果。
 最新文章