首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

【论文荐读】具备预判避碰决策的无人艇集成智能引导和运动控制研究

文摘科技 2024-09-25 06:00 江苏

标题：Integrated Intelligent Guidance and Motion Control of USVs With Anticipatory Collision Avoidance Decision-Making

期刊：IEEE Transactions on Intelligent Transportation Systems (Early Access)

作者：Yihan Tao, Jialu Du, Frank L. Lewis

单位：College of Marine Electrical Engineering, Dalian Maritime University

1、研究背景：

无人艇技术正逐步从研究领域转向实际应用，特别是在运输和环境监测方面。为了完成这些任务，无人艇需具备良好的自主导航能力，这依赖于其避障决策能力。然而，目前针对无人艇在多动态船只的密集环境中的避障研究仍然较为稀缺。论文利用深度强化学习（DRL）对密集环境下无人艇的避障问题进行了深入研究。

2、论文创新点：

1、提出了一种基于风险预测的深度强化学习方法（RPDRL）；

2、设计了数据编码器将动态船只信息转换成雷达数据的格式，有效保留了特征又保证了维度的统一；

3、建立了一个碰撞风险评估模型来计算奖励值；

4、通过DCNN建立Actor-Critic网络。

3、研究方法：

3.1 问题建模

如图1所示，无人艇在密集环境中行驶，目的是在不发生碰撞的情况下以最短的时间驶向终点。无人艇能够探测到周围25海里动态船只的状态。静态障碍物采用多边形来近似。在tn时刻无人艇、周围船只和静态障碍物的状态为：

图1 问题建模

如图2所示，无人艇的目的是依据上述信息和策略，做出避障决策，并经过运动控制来执行避障行为。

图2 避障运动控制原理

整个问题可以抽象成一个如下式的最优化问题：

即无人艇要在到达终点且不发生碰撞的前提下，选择满足物理限制的速度和角速度，来使得构建的目标函数值最大。

3.2 论文方法

3.2.1数据编码器

应用深度强化学习范式需要状态信息的维度恒定，而这与无人艇的密集环境有冲突。将周围船只的信息表征成雷达数据，再进一步表示成257*257的雷达图片可以有效解决这个问题。具体步骤如下。

上式中，i，j是像素点的位置，k是RGB的三通道，分别表征了动态船只的三自由度。

由此状态空间可以表示为下式。

其中是动态船只的状态，是无人艇自身的状态，是静态障碍物的状态。

3.2.2 碰撞风险评估模型

论文设计了碰撞风险评估模型用于计算奖励值，具体公式如下。

当无人艇与障碍物发生碰撞，会受到-1的奖励值，当无人艇抵达终点，会受到1的奖励值。若无人艇既没有抵达终点，又没有发生碰撞，则获得上式第三行的奖励。其中是关于终点的误差，表示为下式。

上式分为三个误差，无人艇艏向角相对于终点的航向角的偏差、无人艇与终点的距离偏差以及无人艇的速度与最大速度的偏差。

碰撞风险指数分为动态碰撞指数和静态碰撞指数，计算公式如下。

其中，dCPA和tCPA分别是无人艇距离动态船只的距离和预计的时间，dSPA和tSPA是设定的安全距离和安全时间。根据高斯分布的性质，dCPA和tCPA越低，动态碰撞指数越高，无人艇距离静态障碍物越近，c越大，动态碰撞指数越大。

3.2.3 DCNN网络的建立

论文利用CNN网络建立Actor网络和Critic网络，动态船只信息经过雷达编码器进入多层卷积网络然后分别输入Actor网络输出动作，输入Critic网络输出价值。

图3 Actor-Critic网络结构图

Actor网络和Critic网络采用梯度的方法进行网络参数的更新，目标网络采用软更新的方式，计算公式如下。

3.3 实验结果

为了训练神经网络，文章设置了训练环境，其中包含0-20只动态船只，船只的数量和状态信息随机，但是与无人艇的初始距离大于2海里，动态船只采用动态窗口法控制。

无人艇的一次航行作为一个case，当最近的100个case的成功率超过75且平均奖励大于-0.25是认为策略已经收敛至最佳，训练图如下所示。

图4 训练奖励值图

从图中可以看出，算法具有较快的收敛速度，在约300回合就收敛。为了进一步测试算法的性能，论文将提出的RPDRL与MPC、VO方法进行对比，每种方法在6艘动态船只和18艘动态船只的环境中分别测试100次，实验结果如下。

图5 航行轨迹图

图6 DCPA图

图7 控制指令图

从图5-图7可知，RPDRL方法的路径更短，距离障碍物和动态船只的距离较远，推进器和舵角的控制指令也更为合理。

根据动态船只的数量将训练的100个case分类成三组：第一组0-7，第二组8-14，第三组15-20，三组的数量分别为29，35，36。统计其最小DCPA和航行距离偏差，如下图所示。

图8 最小DCPA图

图9 航行偏差图

从图8-图9可以看出，随着障碍物船只的增加，最小DCPA逐渐减小，航行偏差逐渐增加，但是RPDRL方法在三种方法表现最佳。

4、结论：

论文针对海上密集障碍物环境下的无人艇避障进行了深入研究，构建了复杂真实的障碍物环境，提出了RPDRL方法，通过对动态船只信息进行编码，既保留了特征又保证了状态空间维度的统一，且通过高斯分布来设计碰撞风险评估函数来计算奖励值。实验结果证明了所提出的RPDRL方法具备鲁棒性和有效性。

http://mp.weixin.qq.com/s?__biz=MzU1ODg5NzQ0NA==&mid=2247485372&idx=1&sn=1d11ad06077c97c60aaf8562ed0c4c8b

智能自主无人系统课题组

智能自主无人系统（IAUS）课题组坚持“面向国家重大科技需求，引领行业技术进步”的思路，专注于人工智能技术在自主无人系统、机器人、智能工程装备领域的基础和应用研究，分享和发布最新科研动态及研究成果。

最新文章

【论文荐读】基于多智能体近端策略优化的有限感知无人艇集群分布式追逃博弈

课题组硕士研究生成果发表在工业人工智能领域TOP期刊IEEE TIM

【论文荐读】滤波融合：图像-激光雷达融合的3D目标检测

【论文荐读】基于Pathways架构的自适应多尺度时间序列预测

【论文荐读】一种用于表面缺陷实时检测的高效靶向设计方法

【论文荐读】基于目标相关Transformer网络的任务导向深度学习框架在工业质量预测中的应用

【论文荐读】基于深度强化学习的VUCA环境下机器人无地图导航

课题组硕士研究生成果发表在工业人工智能领域一区TOP期刊Computers in Industry

【论文荐读】具备预判避碰决策的无人艇集成智能引导和运动控制研究

【论文荐读】面向表面缺陷检测的多分支结构多层特征融合网络

【论文荐读】一种用于粒度分析的煤粉图像分割方法

【论文荐读】水声目标识别的联合学习模型

【论文荐读】未知环境下多机器人协同探索的混合多策略快速探索随机树算法

【论文荐读】速度与输入受限的多机器人系统鲁棒避障编队导航方法

【论文荐读】基于机器视觉的目标检测技术二十年发展综述

【论文荐读】基于自适应类内和类间卷积神经网络的变速箱变工况智能故障诊断

【论文荐读】ESDMR-Net：一种具有扩展压缩和双多尺度残差连接的轻型网络

【论文荐读】基于多智能体强化学习的无人艇协同多目标围捕

【论文荐读】时间序列预测：一种具有概率分解表示的分层Transformer

【论文荐读】基于深度强化学习和分布式优化的未知环境下多机器人导航与编队控制

21级专硕王家卿《面向空地协同的无人机对地目标跟踪与自主降落研究》

21级学硕鲁宇琦《水面无人艇集群协同的侦察-驱逐-布防控制方法研究》

21级专硕夏煜《基于红外热成像的铝箔封口缺陷检测研究》

21级学硕吴建彬《退化环境下激光雷达与IMU融合的移动机器人自主探索研究》

21级学硕王浩《数据驱动的绞吸船横移挖掘过程建模及自学习控制研究》

【论文荐读】基于近端策略优化的有限感知无人艇集群避障

21级专硕杨颖《基于机器视觉的柱状产品贴标及喷码缺陷检测研究》

22级学硕李亚军《基于激光和视觉融合的移动机器人自主导航研究》

【论文荐读】基于CNN和Transformer的无人机实时目标检测网络

【论文荐读】一种能够学习多尺度上下文感知特征的通用伪装目标检测框架

【论文荐读】一种具有多级注意力机制的U-Net医疗图像分割方法

【论文荐读】一种用于表面缺陷检测的具有全局和局部特征增强的实时无锚缺陷检测器

【论文荐读】MLDFR：一种用于异常检测和定位的受损图像多级特征恢复方法

【论文荐读】基于几何线索提取和圆分解的多机器人复杂场景探索

【论文荐读】不同环境下从避障到可推动障碍物导航的课程强化学习

【论文荐读】基于机器视觉的径向圆跳动测量方法

【论文荐读】关于迁移学习驱动的智能故障诊断设计的调查、见解和展望

【论文荐读】UIU-Net: 用于红外小目标检测嵌套U-Net模型

【论文荐读】3U:面向协同目标搜索的UAV-USV-UUV网络联合设计

【论文荐读】基于深度强化学习的无人船避障方法

【论文荐读】基于优化权重谱指数的机械故障诊断自适应故障分量提取

【论文荐读】基于异步多智能体强化学习的高效实时多机器人协同探索

【论文荐读】MR-TopoMap: 通信受限条件下基于拓扑图的多机器人探索

【论文荐读】面向多智能体强化学习的共享学习方法

【论文荐读】多模态融合的自主导航方法：采用稀疏奖励和事后经验回放策略的深度强化学习

【论文荐读】基于图像增强和改进Faster R-CNN的故障卫星部件检测方法

【论文荐读】空间变形鲁棒场景中构建超分辨率文本图像的文本注意网络

【论文荐读】基于深度学习的二维激光雷达车辆检测

【论文荐读】Informer：超越Transformer的长序列时间序列预测方法

【文献综述】深度学习和深度强化学习的特征提取网络

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉