论文推荐|基于逃逸角的多ASV微分博弈协同围捕方法

文摘   2024-11-01 17:01   陕西  



水下无人系统学报

Journal of Unmanned Undersea Systems

2024年第4期








基于逃逸角的多ASV微分博弈协同围捕方法


署名作者:

杨惠珍1,2, 李建国1,2, 吴天宇1,2, 王子江1,2, 杨钧1,2

作者单位:

1. 西北工业大学 航海学院, 陕西 西安, 710072
2. 水下信息与控制重点实验室, 陕西 西安, 710072

基金项目:

水下信息与控制重点实验室基金项目资助(2021-JCJQ-LB-030-03).


阅读原文


摘要

针对多个自主水面航行器(ASV)围捕单个主动逃逸的对抗性目标问题, 利用微分博弈理论建立了多ASV协同围捕问题博弈模型, 在含有距离项的支付函数中引入由逃逸角构成的合围项, 从而降低目标中途逃逸的概率; 然后将围捕问题转换为求解可实现策略的优化问题, 利用粒子群优化(PSO)算法求解满足纳什均衡的最优策略, 仿真和湖上试验结果均证明了基于PSO的微分博弈围捕算法的有效性。  


引言

追逃博弈在高速导弹拦截、协同制导、机器人监视和救援搜索等军事和民用领域有着广泛的应用[1-2]。根据参与追逐的围捕者速度大于、等于或小于逃跑者速度可将追逃博弈分为3类[3]。Makkapati[4]和Wei[5]等研究了围捕者速度大于或等于逃跑者的情况。目前针对高速逃跑者的研究较少, 因此, 实现对高速逃跑者的围捕具有研究价值。Isaacs[6]首次利用阿波罗尼乌斯圆来解决具有速度优势逃跑者的追逃问题。

最初博弈问题只涉及1个围捕者和1个逃跑者, 为了实现多参与者围捕具有速度优势的逃跑者, 需要对围捕初始条件进行一定约束[7]。有一种思路是在逃跑者逃跑初期就形成包围态势, 而逃跑者从相邻围捕者的缝隙逃走[8], 减少缝隙的方法有几何法、仿生法、Voronoi图和层次分解法, 其中几何方法具有计算速度快的优势, 常用于求解该类问题[9]

Liang等[10]讨论了一类特殊的三人追逃博弈, 得到了三人追逃博弈的获胜区域。Jin等[11]研究了围捕者将逃跑者封闭在1个凸多边形内来合作遏制逃跑者。Fang[12]和Wang[13]等给出围捕者总能捕捉到逃跑者的必要条件为: 1) 围捕者与逃跑者的速度之比大于; 2) 逃跑者的位置应位于凸多边形中, 凸多边形由多个围捕者的位置和逃跑者形成的相邻阿波罗尼乌斯圆组成, 每个围捕者应相交或相切。Ramana等[14]利用阿波罗尼乌斯圆的思想, 制定了高速逃跑者的逃逸策略: 逃跑者先采用一种策略, 迫使编队与一群围捕者的所有可接受策略形成差距; 然后利用这个间隙逃脱。该策略建立在完美包围编队的概念上, 并提出了构建该阵型所需条件。Wang等[15]通过非均匀围捕者合作捕获了一个高速逃跑者, 并设计了3种行为, 即向逃跑者移动、避障和用非均匀的阿波罗尼乌斯圆来进行狩猎。Vechalapu[16]开发了一种新的追击策略, 通过与相交的阿波罗尼乌斯圆创建陷阱来合作捕获逃跑者, 这种方法可以调整临界速度比和捕获时间, 因此比合作追击策略更有效。Fang等[17-18]引入占据角度的概念来表示追求者支配的空间, 分别针对逃跑者和围捕者设计了逃逸算法和追击算法, 并将围捕逃逸扩展到三维空间。Yan等[19]研究了追踪者以不确定速度移动情况下的多自主水面航行器(autonmous surface vehicle, ASV)追逐规避问题。Han等[20]构建了无人水下航行器(unmanned undersea vehicle, UUV)的运动学模型和控制器, 将UUV的控制特性引入追逃博弈的策略中。Wang等[21]将代价函数设计为圆心之间的距离, 得到了围捕者的合作围捕策略, 但其在支付函数设计过程中只考虑了距离描述, 容易造成围捕过程中逃跑者的中途丢失。

文中提出一种改进的多ASV微分博弈协同围捕算法, 通过引入逃逸角的概念实现围捕者对逃跑者控制能力的描述, 设计了微分博弈的支付函数, 同时将围捕和逼近问题转为求解纳什均衡的最优策略问题, 通过逃逸角“均匀化”机制完成对目标在整个过程中的“监控”, 防止目标中途逃逸, 提高了群体捕获概率。在此基础上, 基于Ardupilot软件与机器人操作系统(robot operating system, ROS)设计开发了一套ASV实验平台, 开展了多机协同围捕实验研究, 实验结果证明了所提围捕算法的有效性。



结束语


文中基于几何关系对ASV协同围捕问题中影响目标逃逸的因素进行分析, 引入逃逸角和占领角等概念, 基于微分博弈理论建立围捕和逃逸对抗双方的博弈模型, 将逃逸角引入微分博弈支付函数中, 与PSO算法结合, 实现了对最优围捕策略的求解。仿真实验和实物试验表明, 与基于追逃距离的围捕算法相比, 同时包含逃逸角和距离的算法通过缩小相邻逃逸角之间的差值来实现对逃跑者围捕过程的控制作用, 在对抗性目标围捕具有明显优势, 保证了主动逃逸目标在整个过程中可逃逸角一直收敛为零, 且避免了中途逃逸, 提高了群体捕获率, 从而实现对运动速度更快的主动逃逸目标的围捕。

文中围捕的框架是将围捕简化为路径点规划和航点跟踪2个层次, 实际上割裂了系统分析的总体性, 下一步需要将ASV底层运动控制模型直接引入围捕分析问题, 并加入参数辨识, 完成整体从ASV底层执行机构输入到围捕策略的全部环节。

1

 END

1









参考文献略

文章有删减,原文刊登于《水下无人系统学报》2024年第32卷第4期,点击阅读原文可查看。



 最新文章