原文信息
中文摘要
本文主要集中于为一类由欧拉-拉格朗日公式建模的不确定机械系统开发学习型控制器。这类系统能够描述一大类工程系统的行为,如车辆系统、机械手和卫星。所有这些系统通常都具有高度非线性的特征,存在重大的建模不确定性和未知扰动,因此,基于精确模型的非线性控制方法变得不可行。为应对这一挑战,研究了一种基于演员-评论家框架的强化学习(RL)自适应控制方法,以补偿不确定的机械动力学。通过连续的鲁棒符号误差积分(RISE)控制方法,规避了强化学习造成的近似误差和外部未知扰动。与经典的鲁棒符号误差积分控制律不同,本文使用了tanh(·)函数代替sign(·)函数,以获得更平滑的控制信号。所开发的控制器只需很少的动态模型先验知识,对未知动力学和外部扰动具有鲁棒性,并能实现渐近输出跟踪。最终,通过机械系统动力学自动分析(ADAMS)和MATLAB/Simulink模型对三自由度(3-DOF)机械手进行协同仿真,并在实时电机伺服系统上进行实验,用以验证所提方法的性能。
扫描二维码
查看下载全文
原文链接:
https://doi.org/10.1016/j.dt.2023.05.016
主要结论
本文设计了一种基于强化学习的前馈补偿控制器,结合鲁棒符号误差积分控制方法,应用于不确定的机械系统。通过研究强化学习自适应控制策略,可对不确定的机械动力学进行补偿。通过改进的鲁棒符号误差积分控制方法,可规避强化学习造成的近似误差和外源扰动。研发的控制器对不确定动力学和外部扰动具有鲁棒性,控制器设计所需的动态模型先验知识非常少。通过李雅普诺夫稳定性分析,实现了渐近输出跟踪,并提供了权重参数的均匀最终有界性。协同仿真和实验验证了开发控制框架的有效性。
未来预计在多自由度机器人实验平台上实施该控制方法,以便进一步验证其跟踪性能。
论文选图
编辑:陈微,曹文丽
审核:田丽
Defence Technology
往期目录
期刊
简介
《Defence Technology》是由中国兵工学会主办的科技类综合性学术期刊,目前已被SCI、EI、Scopus、中国科技核心期刊数据库、中国引文数据库核心版和瑞典开放获取指南等多家数据库收录,期刊主要发表基础理论、应用科学和工程技术领域高水平原创性学术论文,包括理论研究、数值模拟和实验研究类文章。
添加防务技术DT_小编微信
欢迎添加“防务技术DT_小编”为好友!