李超超, 邵文龙, 吕培, 王华, 徐明亮*
智能集群系统教育部工程研究中心
国家超级计算郑州中心
引用本文: 李超超, 邵文龙, 吕培, 王华, 徐明亮. 人机协同决策的异质多智能体路径规划[J/OL]. 计算机辅助设计与图形学学报: 1-17[2024-11-15]. https://www.jcad.cn/article/doi/10.3724/SP.J.1089.2024-00359
Citation: Li Chaochao, Shao Wenlong, Lyu Pei, Wang Hua, Xu Mingliang. Heterogeneous Multi-Agent Path Planning with Human-Machine Collaborative Decision-Making[J/OL]. Journal of Computer-Aided Design & Computer Graphics: 1-17[2024-11-15]. https://www.jcad.cn/article/doi/10.3724/SP.J.1089.2024-00359
随着信息技术的不断进步, 路径规划已广泛应用于室内机器人导航、海上无人舰艇和电子商务等领域. 在多智能体路径规划方面, 大多数研究关注的是具有相似物理约束和形态特征的同质智能体之间的路径规划. 在许多实际应用场景中需要不同类型的智能体协同工作才能完成任务, 如航母舰面保障作业涉及保障人员、牵引车、舰载机等复杂异质智能体, 它们各具不同的行为模式, 这种异质环境对多智能体路径规划提出新的挑战. 当前, 路径规划研究大多集中在虚拟仿真环境或者真实环境下独立进行, 但是在虚拟环境和真实环境中, 利用智能方法进行路径规划时较少考虑人的经验, 导致规划出的路径可能与实际需求不符.
针对上述挑战, 本文提出一种基于混合现实半实物电子推演沙盘的异质多智能体人机协同决策路径规划方法. 首先提出一种适用于动静态环境的异质多智能体双延迟深度确定性策略梯度路径规划方法(HMATD3), 利用基于危险度的路径引导点和RVO(reciprocal velocity obstacles)的动态避障优势, 改进基于深度强化学习(DRL)的路径规划方法, 以适用于异质多智能体的动静态环境; 然后提出一种虚实交互人机协同决策的路径规划方法(HMCDM), 使用HMATD3方法为虚拟智能体和真实智能体规划路径, 并将人类智能融入虚实交互过程进行人机协同决策, 增强人的指导作用, 显著地提升规划的安全性和合理性, 使得路径规划更加智能且符合实际应用需求.
相关工作
智能体导航问题主要分为传统路径规划、基于DRL的路径规划、传统方法和DRL融合的路径规划, 以及虚实融合的路径规划. 其中, 传统路径规划进一步分为全局路径规划和局部路径规划.
○ 传统路径规划
全局路径规划. 路径规划指在障碍物和目标点之间建立一条无碰撞最优路径. 目前, 全局路径规划主要应用在静态场景. 大多数改进方法为智能体规划的路径与静态障碍物的距离较近, 存在碰撞风险高、鲁棒性差、局部极小值和适应性差等问题. 本文对传统的A*算法进行改进, 将静态障碍物进行凸多边形膨胀, 增加智能体与静态障碍物的距离; 然后在启发式搜索过程中设置危险度价值, 提高路径规划的安全性; 最后设置相应的规则为智能体选取安全的路径引导点, 降低智能体的碰撞风险.
局部路径规划. 尽管全局路径规划解决了静态环境下的导航问题, 但其并不适用于动态环境, 因此在动静态场景中需要与动态避障方法结合. 然而, 已有大多方法的计算方式大多数是基于速度和力, 通常不能泛化未知环境. 一些工作通过融合多种传统方法进行路径规划. 虽然能够进行智能体的动静态导航, 但是场景的泛化能力有限.
近年来, DRL技术在解决复杂问题方面有着良好的表现, 在智能体导航任务中的应用呈现出快速增长的趋势, 越来越多的学者开始基于DRL理论进行路径规划. 与传统方法相比, 这类方法具有更好的自学习能力和泛化能力, 但是较少解决异质智能体导航问题.
已有许多工作使用基于传统方法和DRL方法的融合方法进行智能体路径规划. 本文利用传统路径规划和基于DRL路径规划的优势, 提出一种适用于异质多智能体路径规划的方法. 该方法用安全的路径引导点进行静态避障, 基于RVO的DRL方法进行动态避障, 为异质多智能体在动静态环境下的安全高效路径规划提供新的解决方案.
随着虚拟现实、混合现实技术的发展, 一些工作利用这些技术进行虚实交互, 控制实体智能体运动. 但是大多只适用单智能体路径规划, 通过虚拟信息控制实体运动. 本文在基于半实物电子沙盘的混合现实场景下, 使用异质多智能体路径规划方法为虚实智能体规划路径, 并通过人的经验协同优化智能体路径, 可以更直接地提高人的沉浸式介入感和人对机器智能方法的优化能力.
本文方法
实验及结果分析
结 语
李超超: 博士, 副研究员, 硕士生导师, 主要研究方向为计算机图形学、群体行为计算.
邵文龙: 硕士研究生, 主要研究方向为多智能体路径规划、人机交互.
吕 培: 博士, 教授, 博士生导师, CCF会员, 主要研究方向为计算机图形学、人工智能、虚拟现实.
王 华: 博士, 副教授, 博士生导师, CCF会员, 主要研究方向为集群行为计算与仿真、虚拟现实、人工智能.
徐明亮: 博士, 教授, 博士生导师, CCF会员, 论文通信作者, 主要研究方向为计算机图形学、人工智能、虚拟现实、科学可视化.
— END —
还没关注?点击下方“卡片”关注,获取第一时间资讯
精选报告 | 基于紧凑型线性混合半侧蒙皮权重的神经辐射场人体表示方法
开源代码 | 基于EfficientNetV2的PCB缺陷检测算法
本公众号发布的所有原创文章欢迎转发和转载,但必须注明作者和文章出处为《计算机辅助设计与图形学学报》公众号;任何媒体、网站或个人不得对本公众号原创图文进行内容修改或摘编。除本公众号原创的图文之外,本公众号发布的图文旨在学术交流,版权归原作者所有,本公众号将不承担任何法律责任;非原创内容均已对来源作出标注,如有侵权,请留言与本公众号联系,我们将及时处理。《计算机辅助设计与图形学学报》拥有最终解释权。