随着移动机器人被广泛应用于智能制造和仓储物流等领域,单一传感器不能满足复杂环境下移动机器人感知需求。多传感器系统能够综合利用不同传感器的信息,从而提供更全面、准确的环境感知。然而,多传感器产生的海量数据给计算机的处理能力带来了巨大挑战,其次现有的移动机器人导航严重依赖地图等先验知识。
图1 移动机器人多传感器融合
为解决上述问题,本文主要研究内容如下:
(2)针对移动机器人自主导航依赖地图的问题,研究基于强化学习的自主导航方法。对此,首先建立了基于强化学习的移动机器人导航模型,根据TD3算法设计了移动机器人导航方法。然后,设计了基于共享经验池的学习策略,采用优先经验回放机制增加样本效率。最后,设计了移动机器人导航模型训练方案,并在仿真环境下测试模型,验证了本文提出的算法在导航成功率和效率方面具有显著的提升。
(3)针对基于深度强化学习的自主导航模型收敛慢、泛化能力弱等问题,研究基于联邦学习的分布式学习算法。对此,首先分析了联邦平均算法,结合移动机器人导航算法,设计了移动机器人联邦强化学习算法。然后,设计成长率评价指标,通过成长率动态调整移动机器人模型聚合的权重,并根据移动机器人的学习状态值调整模型聚合的时机,优化系统的模型更新频率。最后,通过实验验证了本文提出的算法在降低通信负担的同时,收敛速度更快,在多种环境下导航效果更好。
(4)完成算法的迁移部署与实车实验。首先,自主搭建移动机器人实验平台,将导航模型迁移到移动机器人实验平台上进行导航实验。为了进一步验证本文算法的可迁移性和扩展性,在多台TurtleBot3机器人上进行多机器人环境下导航实验。实验结果表明,本文算法能够迁移部署到真实移动机器人,并顺利执行自主导航任务。