【论文荐读】3U:面向协同目标搜索的UAV-USV-UUV网络联合设计

文摘科技 2024-01-18 11:00 江苏

标题：3U: Joint Design of UAV-USV-UUV Networks for Cooperative Target Hunting

期刊：IEEE Transactions on Vehicular Technology, vol. 72, no. 3, pp. 4085-4090, March 2023

作者：Wei Wei, Jingjing Wang, Zhengru Fang, Jianrui Chen, Yong Ren, Yuhan Dong

单位：Tsinghua Shenzhen International Graduate School, Tsinghua University;School of Cyber Science and Technology, Beihang University;Department of Electronic Engineering, Tsinghua Universityan.

1、研究背景：

无人潜航器（UUV）在动态和恶劣的深海环境中广泛应用，替代人类执行观察、探索和监测任务。然而，仅依赖UUV进行水下目标搜索存在成功率低的问题，因为其需要频繁进行自身位置更新。在合作目标搜索任务中，无人机（UAV）具有较低成本、快速部署和可控机动性，其在大范围监视和深海目标搜索中发挥重要作用。UAV-UUV的联合可以提高水下目标的定位精度。然而，UAV和UUV之间的通信效率受到水中电磁信号衰减的限制，无人水面艇（USV）作为海面载具，其具有灵活性和低成本，可作为“桥梁”在空中和水下之间传递信息，能够建立基于声传输的水面-水下目标搜索网络，避免了UUV从水面到水下的周期性往返，提高了导航和控制性能。因此，有必要联合设计UAV-USV-UUV(3U)异构系统来进行协同水下目标搜索。

2、论文创新点：

（1）提出了一种兼顾系统连通性和跨层资源分配的水下目标搜索联合3U异构系统。

（2）将运动约束问题建模为马尔可夫决策过程，并通过DQN方法进一步实现。通过联合优化无人机的位置，UUV的轨迹以及3U系统的互联性来指导水下目标搜索任务。

（3）仿真结果表明，该方案在系统资源分配和互联性之间取得了良好的平衡，具有较高的水下目标搜索成功率。

3、研究方法：

本文提出了一种联合设计的无人机/无人水面艇/无人水下潜航器(UAV-USV-UUV)网络，也称为3U网络，用于协同水下目标搜索。该3U异构系统在水下目标搜索任务中的系统模型如图1所示：

图1 面向协同目标搜索的3U网络

该系统由一架UAV、一架USV和多架UUV组成，为了提供大致的搜索范围，一架无人机作为空中监视器，飞行高度为h，搜索半径为r。采用M艘无人潜航器执行水下任务，作业深度为d。同时，无人水面艇作为无人潜航器与无人机之间的通信中继器。定义UAV坐标U = (ux, uy, uz) ，USV坐标S = (sx, sy, sz)，UUV坐标G = (gx, gy, gz)以及目标坐标W = (wx, wy, wz)。UAV与USV之间的连接基于电磁（EM）通道，而UAV与USV之间的信号传输使用声学通道。当UUV接收到无人机采集到的目标的大致位置W = (wx, wy, wz)时，迅速组成猎群对目标进行追击。为了便于3U的能效，在每个时隙将UUV的当前能量状态传回无人机，无人机动态调整目标搜索区域。

（1）UAV：UAV与USV之间的通信链路被合理地建模为line of sight(LoS)路径，h与r的关系即：

（2）USV：USV作为无线通信中继器，在UAV和UUV之间传输控制和目标信息，电磁信号成功传输的概率Pc代表UAV和USV之间的连通性，即：

其中，R是信噪比（SINR）,Ta是R的阈值，指数a表示路径损耗指数，pa是发射功率，σ2表示噪声功率，It表示信号干扰

对于水下连接，假设每个UUV都可以与USV和其他UUV连接，水下潜航器的连通性即为：

（3）UUV：水下声通道受水声传播衰减的支配，声路损耗与载流子频率f和距离l的关系可由下式得出：

吸收系数y和载流子频率f的关系即：

运动总能耗可以表示为EUUV=Em + Ec，其中Em运动能耗，Ec为通信能耗。

（4）目标：当目标进入搜索区域时，狩猎任务开始。假设目标能够感知到UUVs的接近，并以Vt速度逃离，即：

目标的安全半径区为r2被定义为：

如果存在UUV进入目标安全半径区的时间瞬间t，即||G(t)−W(t)|| < r2，则认为目标被UUV捕获。

此外，本文通过联合优化无人机的位置、轨迹以及互联性，提出了一种面向能量的目标搜索狩猎模型，提出能量最小公式。在3U系统中，首要目标是最小化总消耗能量EUUV。因此，3U能耗优化问题可定义为:

其中6a为无人机悬停高度约束，6b为UAV-USV连通性约束，6c为USV-UUV连通性约束，6d为环绕约束，6e为能量平衡约束。

最后，本文设计了DQN算法来解决能量优化问题，同时引导UUV对目标进行追捕。应用于UUV的DQN模型由状态、动作、奖励和Q值组成：

State：包含了所有无人系统的位置信息，目标逃跑的方向，以及无人潜航器的总航程L。

Action：动作空间定义为一组移动方向，将2π平面划分为8个离散方向。

Reward：奖励r(t)可以定义为条件函数，允许其学习广义策略行为，在一定条件下自动导航。奖励R1对应于目标在UUV搜索范围内时的环绕约束(6d)，奖励R2使UUV逐步接近目标。如果系统违反了优化问题(6)中的约束，它将得到一个负奖励R3。

Q-value：当UUV在状态st下采取行动a(t)时，Q值将迭代更新，其中0≤χ≤1是减少未来奖励权重的折扣因子，s’和a’是下一个时间步长的状态和动作。

仿真结果

本文基于Pytorch实现了DQN方法，其中DQN的结构是用包含两个隐藏层的全连接神经网络建立的。3U系统采用了基于DQN的寻优策略，迭代次数为10的4次方。此外，讨论了学习率ξ = 0.01和ξ = 0.001，折扣系数χ = 0.95的DQN算法的性能。在本仿真中，通过与蚁群算法（ACO）的比较，验证了基于DQN的方法的外部性能。为了匹配DQN的10的4次方次迭代，在蚁群算法中使用了100个种群和100次迭代。此外，现实中通信能量Ec远小于运动能量Em，因此我们在评估部分使用Em来表示EUUV。

如图2（a）所示，DQN (ξ = 0.001)和DQN (ξ = 0.01)的能耗始终低于ACO。当h发生变化时，DQN总能找到最优路径，以最小的能量快速寻找目标，并保持连通性，证明了DQN的有效性。但随着h的增大，搜索范围变大时，目标搜索任务会变得更加复杂。因此，自DQN算法收敛以来，DQN的平均搜索时间稳步增加(ξ = 0.01)。对于蚁群算法，由于每次迭代中种群间的并行搜索机制，使得平均搜索时间相对较小。

随机产生两个静态障碍物和一个动态障碍物。如图3所示，随着训练的推进，无人艇从一开始的原地转圈，训练到69步时无人艇已经逐渐学会向目标点靠近但是会与动态船只发生碰撞，训练到176步时无人艇已经能够实现避障，但是路径不光滑，到最后的2184步时无人艇的避障路线也变得光滑。如图4所示，随着训练的推进，无人艇的航向角和舵角也趋于稳定。

图2 (a)VG为7.8kn时，不同算法在不同h下的最小总能耗EUUV与寻找最优路径的平均时间

DQN在不同VG下也总能找到能耗最小的优化路径，ACO的性能不如DQN ，此外，DQN和ACO的平均时间都由于VG的提高而稳步下降。

图2 (b)h为100m时，不同算法在不同VG下的最小总能耗EUUV与寻找最优路径的平均时间

仿真实验进一步研究h和VG对路径连通性的影响。由于EM通道Pc和水声通道的路径连通性与UAV和USV,USV和UUV之间的距离呈负相关，因此分别在10的4次方迭代中以平均||U−S||和平均||S−G||来测量Pc和。

如图3（a）所示，不同ξ的DQN算法对路径连通性的影响差异不大，与ACO算法相比，DQN (ξ = 0.001)和DQN (ξ = 0.01)都可以获得更高的Pc和。DQN算法的平均||U−S||随着h的增大而增大，从而导致Pc的减小。此外，由于h对USV和UUV之间的连通性影响很小，DQN的平均||S−G||是光滑的。如图3（b）所示，随着VG的增长，平均||U−S||逐渐下降。这主要是因为随着VG的增大，USV行驶距离变短，因此UAV与USV之间的距离减小，Pc可以稳步提高。平均||S−G||随着VG的增大而增大。因为VG的增加会直接影响UUV和USV之间的距离，因此水下通道的连通性变差。

图3 不同h和VG下的路径连通性

如表1所示，与蚁群算法相比，改进DQN算法优化后的能耗最小。能量消耗随着H的增长而增加，DQN算法总能找到比ACO算法更好的最小能量消耗方案。Pc和随H的增加而变差。当H = 50、75和100时，DQN方法的成功率均大于95%。相比之下，蚁群算法的成功率总是相对较低。Double DQN算法和Dueling DQN算法能够以时间复杂度为代价提高水下目标搜索任务的成功率。

表1 UUV与目标不同初始距离H时的3U系统和目标搜索表现

4、结论：

本文提出了一种联合设计的无人机/无人水面艇/无人水下潜航器(UAV-USV-UUV)网络，也称为3U网络，用于协同水下目标搜索，提出了一种考虑了轨迹调度和路径连通性的3U系统联合设计和能量优化问题。然后，基于改进的DQN算法，解决了保持连通性和获得接近最优UUV轨迹的问题。仿真结果表明，基于DQN的能量优化方案比蚁群算法具有更高的能量效率，具有较高的水下目标搜索成功率。在执行协同目标搜寻任务时，可以保证3U系统异构车辆之间的连通性。此外，由于DQN算法可以帮助3U系统学习异构车辆之间的合作以及与目标的追击-逃避博弈，因此基于DQN的3U系统解决方案在大多数情况下可以获得95%以上的目标狩猎成功率。

http://mp.weixin.qq.com/s?__biz=MzU1ODg5NzQ0NA==&mid=2247484706&idx=1&sn=3a9461802f0a609e8f2f74fa347c4d16

智能自主无人系统课题组

智能自主无人系统（IAUS）课题组坚持“面向国家重大科技需求，引领行业技术进步”的思路，专注于人工智能技术在自主无人系统、机器人、智能工程装备领域的基础和应用研究，分享和发布最新科研动态及研究成果。

最新文章

【论文荐读】基于多智能体近端策略优化的有限感知无人艇集群分布式追逃博弈

课题组硕士研究生成果发表在工业人工智能领域TOP期刊IEEE TIM

【论文荐读】滤波融合：图像-激光雷达融合的3D目标检测

【论文荐读】基于Pathways架构的自适应多尺度时间序列预测

【论文荐读】一种用于表面缺陷实时检测的高效靶向设计方法

【论文荐读】基于深度强化学习的VUCA环境下机器人无地图导航

课题组硕士研究生成果发表在工业人工智能领域一区TOP期刊Computers in Industry

【论文荐读】具备预判避碰决策的无人艇集成智能引导和运动控制研究

【论文荐读】面向表面缺陷检测的多分支结构多层特征融合网络

【论文荐读】一种用于粒度分析的煤粉图像分割方法

【论文荐读】水声目标识别的联合学习模型

【论文荐读】未知环境下多机器人协同探索的混合多策略快速探索随机树算法

【论文荐读】速度与输入受限的多机器人系统鲁棒避障编队导航方法

【论文荐读】基于机器视觉的目标检测技术二十年发展综述

【论文荐读】基于自适应类内和类间卷积神经网络的变速箱变工况智能故障诊断

【论文荐读】ESDMR-Net：一种具有扩展压缩和双多尺度残差连接的轻型网络

【论文荐读】基于多智能体强化学习的无人艇协同多目标围捕

【论文荐读】时间序列预测：一种具有概率分解表示的分层Transformer

【论文荐读】基于深度强化学习和分布式优化的未知环境下多机器人导航与编队控制

21级专硕王家卿《面向空地协同的无人机对地目标跟踪与自主降落研究》

21级学硕鲁宇琦《水面无人艇集群协同的侦察-驱逐-布防控制方法研究》

21级专硕夏煜《基于红外热成像的铝箔封口缺陷检测研究》

21级学硕吴建彬《退化环境下激光雷达与IMU融合的移动机器人自主探索研究》

21级学硕王浩《数据驱动的绞吸船横移挖掘过程建模及自学习控制研究》

【论文荐读】基于近端策略优化的有限感知无人艇集群避障

21级专硕杨颖《基于机器视觉的柱状产品贴标及喷码缺陷检测研究》

22级学硕李亚军《基于激光和视觉融合的移动机器人自主导航研究》

【论文荐读】基于CNN和Transformer的无人机实时目标检测网络

【论文荐读】一种能够学习多尺度上下文感知特征的通用伪装目标检测框架

【论文荐读】一种具有多级注意力机制的U-Net医疗图像分割方法

【论文荐读】一种用于表面缺陷检测的具有全局和局部特征增强的实时无锚缺陷检测器

【论文荐读】MLDFR：一种用于异常检测和定位的受损图像多级特征恢复方法

【论文荐读】基于几何线索提取和圆分解的多机器人复杂场景探索

【论文荐读】不同环境下从避障到可推动障碍物导航的课程强化学习

【论文荐读】基于机器视觉的径向圆跳动测量方法

【论文荐读】关于迁移学习驱动的智能故障诊断设计的调查、见解和展望

【论文荐读】UIU-Net: 用于红外小目标检测嵌套U-Net模型

【论文荐读】3U:面向协同目标搜索的UAV-USV-UUV网络联合设计

【论文荐读】基于深度强化学习的无人船避障方法

【论文荐读】基于优化权重谱指数的机械故障诊断自适应故障分量提取

【论文荐读】基于异步多智能体强化学习的高效实时多机器人协同探索

【论文荐读】MR-TopoMap: 通信受限条件下基于拓扑图的多机器人探索

【论文荐读】面向多智能体强化学习的共享学习方法

【论文荐读】多模态融合的自主导航方法：采用稀疏奖励和事后经验回放策略的深度强化学习

【论文荐读】基于图像增强和改进Faster R-CNN的故障卫星部件检测方法

【论文荐读】空间变形鲁棒场景中构建超分辨率文本图像的文本注意网络

【论文荐读】基于深度学习的二维激光雷达车辆检测

【论文荐读】Informer：超越Transformer的长序列时间序列预测方法

【文献综述】深度学习和深度强化学习的特征提取网络

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉