山东大学王聪团队 | 基于确定学习的采样非线性系统的神经网络输出反馈控制
文摘
科技
2024-10-13 12:04
北京
研究团队
曾雨:华南理工大学自动化科学与工程学院
张付凯,陈填锐,王聪:山东大学控制科学与工程学院
文章下载
Yu ZENG, Fukai ZHANG, Tianrui CHEN & Cong WANG. Deterministic learning-based neural output-feedback control for a class of nonlinear sampled-data systems. Sci China Inf Sci, 2024, doi: 10.1007/s11432-023-3996-3
在第四次工业革命的推动下,设备和系统的复杂化、精密化程度越来越高,这对系统运行过程中的控制性能提出了更高的要求。然而,复杂非线性动态环境下的高性能控制问题在当前仍然极具挑战性。这些挑战包括采样非线性系统控制器设计中的复杂性及非因果问题,系统状态不完全可测带来的困难,以及在动态过程中的知识学习和重新利用等问题。另一方面,满足对被控系统的瞬态(如响应速度和收敛速度)和稳态(如收敛精度)的某些性能要求也带来新的挑战。 然而,迄今为止,大多数预设性能控制(PPC)方法是针对连续时间系统设计的,因此不能直接应用于离散时间/采样数据系统。已有工作主要集中在解决系统稳定性和跟踪控制问题上,缺乏学习能力,而学习能力要求在动态过程中对知识进行学习和重新利用,这在智能控制系统中至关重要。因此,研究带预设性能的采样非线性系统的输出反馈学习与控制策略具有重要的理论意义和应用价值。为了解决上述问题,本文基于确定学习理论研究了一类带预设性能的采样非线性系统的输出反馈控制问题。首先,基于转换后的系统动力学的欧拉离散化模型,利用采样数据观测器获得不可测状态。在此基础上设计了一种自适应神经网络控制器,以保证跟踪误差的预设性能。设计过程中遇到的非因果问题通过使用命令滤波器得以解决。然后,证明了变换后的无约束误差指数收敛于原点的小邻域内。基于变换规则,这保证了原约束跟踪误差是收敛的。当系统信号收敛到其回归参考轨迹时,神经网络满足部分持续激励(PE)条件。在此条件下证明了一个由跟踪误差和神经网络权值估计误差组成的离散线性时变(DLTV)系统是指数收敛的。当神经网络权值收敛时,对采样数据闭环动力学的精确建模得以实现。最后,构造了基于知识的控制器,其既提高了控制性能,又保证了跟踪误差的预设性能。(1) 利用变换后的系统动力学的欧拉离散化模型,基于采样数据观测器和命令滤波器,设计了离散神经网络输出反馈控制器,保证系统在瞬态和稳态下均能达到规定的跟踪性能。(2) 基于对状态的估计和输出信号的收敛性,证明了神经网络输入信号的回归特性。该结果保证了径向基函数神经网络满足部分PE条件,在此基础上证明了一类DLTV系统是指数稳定的。 (3) 利用学到的知识设计了基于知识的输出反馈控制器,该控制器不需要在线调节神经网络权值,提高了控制性能,同时保证了跟踪误差满足预设性能。仿真实验中的控制方案分为两个阶段,即带预设性能的闭环学习控制阶段和基于知识的控制阶段。在学习阶段,通过构造自适应神经网络控制器实现稳定控制,并使跟踪误差在满足预设性能的条件下收敛,结果如图1所示。基于信号的收敛性,径向基函数神经网络的部分PE条件得以满足,这保证了神经网络权值部分收敛到其最优值,如图2所示。神经网络权值收敛后,可以利用常值神经网络对未知闭环动力学进行准确逼近,如图3所示。图3 利用常值神经网络对未知闭环动力学进行准确逼近在基于知识的控制阶段,构造了常值神经网络控制器。图4是带预设性能的自适应神经网络控制器和基于知识的控制器的控制效果对比,从中可以看出,该控制器可以在实现稳定跟踪控制的同时使跟踪误差满足预设性能。特别地,由于不需要参数的在线调节,利用该控制器可以获得更好的瞬态性能。