杨烨峰,李博扬,温志涌等 | 复杂场景中机器人高效轨迹规划与避障方法

文摘科技 2024-09-15 12:02 北京

研究团队

杨烨峰，黄涛：香港理工大学航空及民航学系，哈尔滨工业大学航天学院控制理论与制导技术研究中心

王天奇，杨雯语，陈汉：香港理工大学航空及民航学系

李博扬：澳大利亚纽卡斯尔大学工程学院

温志涌：香港理工大学航空及民航学系，无人自主系统研究中心

文章下载

Yefeng YANG, Tao HUANG, Tianqi WANG, Wenyu YANG, Han CHEN, Boyang LI & Chih-yung WEN. Sampling-eﬃcient path planning and improved actor-critic-based obstacle avoidance for autonomous robots. Sci China Inf Sci, 2024, doi: 10.1007/s11432-022-3904-9

研究意义

复杂场景下机器人的路径规划与避障问题一直是机器人领域的一个研究热点。对于全局路径规划，当机器人所处环境比较简单、开阔时，现有的诸多轨迹规划方法可以很容易地找到一条路径。但是当场景比较复杂时，很多规划算法的效率会有很大程度的下降。对于局部路径规划，当机器人模型未知，或机器人所处场景变化比较大的时候，很多传统算法不能及时有效地给出一条无碰路径。因此，解决复杂场景下的机器人路径规划和避障方法是很有研究意义的。

本文工作

为了解决上述问题，本文提出了一个完整的移动机器人路径规划-避障框架，并将主要研究分为全局轨迹规划和局部轨迹规划（避障）两部分。

首先，对于全局轨迹规划，本文使用了一种自适应聚类的方法对场景中的障碍物进行分类。分类之后，每一个障碍物聚类作为整体并计算该障碍物聚类的凸包。在得到所有障碍物凸包和凸包的边界点之后，算法可以忽略凸包内部的障碍物构型，直接使用凸包的边界点和凸包之间的连接线进行全局轨迹规划。如此设计会使得当场景中障碍物非常复杂的时候，显著提升算法效率。图1给出了算法的流程图，图2给出了算法的规划结果。

图1. 算法流程图

图2. 路径规划结果图

其次，对于局部轨迹规划，本文使用了深度强化学习来自主学习机器人的避障策略。与传统方法不同的是，强化学习框架能够实现端到端的学习，即建立传感器数据到控制指令的直接映射，进而将避障策略与控制逻辑结合为一个整体，简化了设计流程。此外，对于强化学习本身，本文使用了网络分离技术来对数据进行预处理。在学习时，本文将机器人有关运动的数据和有关激光雷达的数据分别在两个不同的网络中进行预处理，并在网络输出的前一层进行合并，通过这种设计方式来降低算法的学习时间并提高避障的成功率。

图3给出了分离之后的网络结构图。

图3. 网络结构图

图4 给出了带有网络分离 (ND-TD3，ND-DDPG) 和不带网络分离 (TD3，DDPG) 情况下的训练和测试的对比曲线图。

图4. 训练-测试对比曲线图

本文的创新点如下：

(1) 提出了一种基于自适应聚类的全局轨迹规划方法来提高复杂场景下的规划效率。通过将障碍物聚类并生成凸多边形包络的方式来提高算法的速度。

(2) 改进了深度强化学习中的网络结构，通过使用网络分离的方法来提高神经网络学习的效率与效果。

实验结果

本文所提出的控制方案在冰达机器人平台上进行了验证。整体仿真结果图如图5所示。

图5. 仿真结果图

实验结果图如图6所示。

图6. 实验结果图

http://mp.weixin.qq.com/s?__biz=MzAxNjgwMjA5Ng==&mid=2651171175&idx=1&sn=de68e3dad7f562cc01744468c4b6e34c

中国科学信息科学

《中国科学：信息科学》及其英文版《Science China Information Sciences》的宣传平台。

最新文章

陈杰院士团队 | 联盟形成问题：以能力为中心的分析和通用模型

SCIS会议 | 第54次《中国科学：信息科学》前沿学术沙龙

李莉莉,马丹等 | 基于切换Q学习事件触发的DoS攻击下切换系统反异步输出调节

陈山枝博士及其团队力作《星地融合移动通信系统与关键技术》

大模型芯片与系统专题出版 | 特邀编辑：尹首一、唐漾、涂锋斌

《中国科学: 信息科学》2024年第10期目录

北京科技大学王婕等 | 高超声速滑翔飞行器预定时间碰撞规避编队控制

北京理工大学胡程团队 | 重轨星地双基地SAR层析成像

2024年第10期目录 | SCIENCE CHINA Information Sciences

高亚军,丛杨等 | 毫米级精度水下RGB-D成像系统（MOOP）

付林,彭世国,邓飞其,朱全新 | 无穷维随机积分微分方程的均方指数稳定性

南京邮电大学林舒影,邹玉龙,肖甫,李斌 | 抵御目标窃听的全向全连接RIS辅助感知与多用户安全通信

闫永义,李海涛,冯俊娥等 | STP视角下有限状态自动机的逻辑拥堵：描述、检测及搜索

东南大学许威教授课题组：通信网络泛在智能设计

西电朱樟明课题组 | 使用极点优化技术的精度可配置Zoom型模数转换器设计

杨勋,曾建明,汪萌等 | 基于跨模态对比表征学习的鲁棒视频问答

3GPP ISAC信道建模标准化的最新进展

面向6G的超低能耗移动通信技术 | 前沿学术沙龙(第53次)会议预告

欧洲科学院院士韩清龙教授团队 | 基于累计状态误差的事件触发机制

SCIS会议 | 第16次《中国科学》信息科学前沿研讨会—信息驱动新质生产力

基于多机制协同设计的低频超宽带波段吸波体

项阅权,项林英 | 基于Gramian度量的图积网络可控性

超大面阵CMOS传感器的自适应负反馈斜坡电路设计

英国杜伦大学 | 面向6G的通感一体化新策略

开放报名 | 第三届智能超表面技术论坛

SCIS会议 | 第52次《中国科学：信息科学》前沿学术沙龙

北航李伯虎院士团队 | 工业大模型：体系架构、关键技术与典型应用

山东大学王聪团队 | 基于确定学习的采样非线性系统的神经网络输出反馈控制

上海大学谢少荣团队 | 基于有限时间耦合滑模控制的多机器人复合编队

AI设计芯片是下一个诺奖吗？

大模型芯片与系统专题 | SpikingMiniLM：面向自然语言理解的脉冲Transformer模型—浙江大学脑机智能国重

RISTA前沿大讲堂|智能反射面辅助通信网络：端到端传输模型与系统优化-华南理工大学唐杰教授

东南大学柯文俊等 | 先检测后增强：利用强化学习和数据配比提升LLMs的事实准确性

杨剑杰, 林志坚, 陈颖玚, 卢孝强, 方毅 | 随机几何建模的车联网中基于博弈论的计算卸载和资源分配

解鸿滨,赵海艳,陈虹等 | 智能车辆的全天候感知：基于WBCNet切换感知算法

会议预告 | 科学与技术前沿论坛：变革性信息技术发展

朱辉志,徐文霞,黄剑等 | 基于图卷积Transformer的并联机器人运动学正解方法

张文韬,施阳,张保勇等 | 分布式在线多步Frank-Wolfe凸优化的动态遗憾增强

董璐,韩涛,袁心,邓超 | 可变环境远程状态估计系统攻击者最优能量收集与分配策略

大模型芯片与系统专题 | 软硬协同优化：高能效存内计算的混合专家神经网络架构探索

智能超表面赋能的个性化空中联邦学习

上交大吴泳澎, 北航徐迈等 | XR通信与系统的物理层信号处理

《中国科学: 信息科学》2024年第9期目录

2024年第9期目录 | SCIENCE CHINA Information Sciences

西南交大李天瑞团队 | 基于深度强化学习的卫星动态任务实时调度时效性优化方法

电子科技大学王曾晖组 | 基于二维半导体ReSe2的高频-超高频纳米机电谐振器

基于距离-多普勒稀疏正则化的车载FMCW雷达干扰抑制与目标检测

RISTA前沿大讲堂 | 智能超表面新视角: 在6G时代扮演定位应用中的被动锚点-香港理工大学刘亮副教授

西电龚育冬,刘三阳,白艺光等 | 线上-线下多层网络中的负面影响抑制策略

2024年第9期目录 | SCIENCE CHINA Information Sciences

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉