山东大学王聪团队 | 基于确定学习的采样非线性系统的神经网络输出反馈控制

文摘科技 2024-10-13 12:04 北京

研究团队

曾雨：华南理工大学自动化科学与工程学院

张付凯，陈填锐，王聪：山东大学控制科学与工程学院

文章下载

Yu ZENG, Fukai ZHANG, Tianrui CHEN & Cong WANG. Deterministic learning-based neural output-feedback control for a class of nonlinear sampled-data systems. Sci China Inf Sci, 2024, doi: 10.1007/s11432-023-3996-3

研究意义

在第四次工业革命的推动下，设备和系统的复杂化、精密化程度越来越高，这对系统运行过程中的控制性能提出了更高的要求。然而，复杂非线性动态环境下的高性能控制问题在当前仍然极具挑战性。这些挑战包括采样非线性系统控制器设计中的复杂性及非因果问题，系统状态不完全可测带来的困难，以及在动态过程中的知识学习和重新利用等问题。另一方面，满足对被控系统的瞬态（如响应速度和收敛速度）和稳态（如收敛精度）的某些性能要求也带来新的挑战。

然而，迄今为止，大多数预设性能控制（PPC）方法是针对连续时间系统设计的，因此不能直接应用于离散时间/采样数据系统。已有工作主要集中在解决系统稳定性和跟踪控制问题上，缺乏学习能力，而学习能力要求在动态过程中对知识进行学习和重新利用，这在智能控制系统中至关重要。因此，研究带预设性能的采样非线性系统的输出反馈学习与控制策略具有重要的理论意义和应用价值。

本文工作

为了解决上述问题，本文基于确定学习理论研究了一类带预设性能的采样非线性系统的输出反馈控制问题。首先，基于转换后的系统动力学的欧拉离散化模型，利用采样数据观测器获得不可测状态。在此基础上设计了一种自适应神经网络控制器，以保证跟踪误差的预设性能。设计过程中遇到的非因果问题通过使用命令滤波器得以解决。然后，证明了变换后的无约束误差指数收敛于原点的小邻域内。基于变换规则，这保证了原约束跟踪误差是收敛的。

当系统信号收敛到其回归参考轨迹时，神经网络满足部分持续激励（PE）条件。在此条件下证明了一个由跟踪误差和神经网络权值估计误差组成的离散线性时变（DLTV）系统是指数收敛的。当神经网络权值收敛时，对采样数据闭环动力学的精确建模得以实现。最后，构造了基于知识的控制器，其既提高了控制性能，又保证了跟踪误差的预设性能。

本文的创新点如下：

(1) 利用变换后的系统动力学的欧拉离散化模型，基于采样数据观测器和命令滤波器，设计了离散神经网络输出反馈控制器，保证系统在瞬态和稳态下均能达到规定的跟踪性能。

(2) 基于对状态的估计和输出信号的收敛性，证明了神经网络输入信号的回归特性。该结果保证了径向基函数神经网络满足部分PE条件，在此基础上证明了一类DLTV系统是指数稳定的。

(3) 利用学到的知识设计了基于知识的输出反馈控制器，该控制器不需要在线调节神经网络权值，提高了控制性能，同时保证了跟踪误差满足预设性能。

实验结果

仿真实验中的控制方案分为两个阶段，即带预设性能的闭环学习控制阶段和基于知识的控制阶段。在学习阶段，通过构造自适应神经网络控制器实现稳定控制，并使跟踪误差在满足预设性能的条件下收敛，结果如图1所示。

图1 跟踪误差的收敛情况

基于信号的收敛性，径向基函数神经网络的部分PE条件得以满足，这保证了神经网络权值部分收敛到其最优值，如图2所示。神经网络权值收敛后，可以利用常值神经网络对未知闭环动力学进行准确逼近，如图3所示。

图2 神经网络权值的收敛情况

图3 利用常值神经网络对未知闭环动力学进行准确逼近

在基于知识的控制阶段，构造了常值神经网络控制器。图4是带预设性能的自适应神经网络控制器和基于知识的控制器的控制效果对比，从中可以看出，该控制器可以在实现稳定跟踪控制的同时使跟踪误差满足预设性能。特别地，由于不需要参数的在线调节，利用该控制器可以获得更好的瞬态性能。

图4 跟踪误差的收敛情况

http://mp.weixin.qq.com/s?__biz=MzAxNjgwMjA5Ng==&mid=2651171540&idx=1&sn=fd8882a8dd79660b39bcea254b76499d

中国科学信息科学

《中国科学：信息科学》及其英文版《Science China Information Sciences》的宣传平台。

最新文章

基于多奖励DQN框架的UAV-RIS辅助太赫兹通信系统波束赋形预测

2024年第11期目录 | SCIENCE CHINA Information Sciences

SCIS入选中国科技期刊卓越行动计划二期英文领军期刊！

司徒立文,鹿振宇,杨辰光 | 面向装配任务的宽度学习机器人遥操作系统

北京交通大学于永光团队 | 分数布朗运动驱动的多智能体系统的均方一致性控制

马亚静,李占杰,岳东等 | 基于非单调Lyapunov函数的切换事件触发控制

电子科大邹权团队 | SBSM-Pro：用于蛋白质序列分析的支持生物序列机

北京量子研究院龙桂鲁课题组 | 基于格密码的量子通信网络接入认证方案

SCIS会议 | 第55次《中国科学：信息科学》前沿学术沙龙

征稿启事 | 面向低空经济的低空网络技术创新与应用专题（中文版）

刘志卿,池荣虎,黄彪,侯忠生 | 非线性非仿射系统的有限时间PID控制

安徽大学何舒平团队 | 基于策略迭代的马尔可夫跳变系统自适应优化控制：不依赖转移概率的异步方法

张志鹏,夏承遗,齐国元,付俊 | 无歧义加权自动机的多步状态不透明性

抗后门攻击的标识加密| 国防科大陈荣茂团队&香港科大黄欣沂教授

电子科大王子南团队 | 拉曼光纤随机激光器的时-谱域相关度演变研究

上交大闵雄阔, 翟广涛等 | 视频感知质量评价综述

会议资讯 | 第三届智能超表面技术论坛

陈杰院士团队 | 联盟形成问题：以能力为中心的分析和通用模型

SCIS会议 | 第54次《中国科学：信息科学》前沿学术沙龙

李莉莉,马丹等 | 基于切换Q学习事件触发的DoS攻击下切换系统反异步输出调节

陈山枝博士及其团队力作《星地融合移动通信系统与关键技术》

大模型芯片与系统专题出版 | 特邀编辑：尹首一、唐漾、涂锋斌

《中国科学: 信息科学》2024年第10期目录

北京科技大学王婕等 | 高超声速滑翔飞行器预定时间碰撞规避编队控制

北京理工大学胡程团队 | 重轨星地双基地SAR层析成像

2024年第10期目录 | SCIENCE CHINA Information Sciences

高亚军,丛杨等 | 毫米级精度水下RGB-D成像系统（MOOP）

付林,彭世国,邓飞其,朱全新 | 无穷维随机积分微分方程的均方指数稳定性

南京邮电大学林舒影,邹玉龙,肖甫,李斌 | 抵御目标窃听的全向全连接RIS辅助感知与多用户安全通信

闫永义,李海涛,冯俊娥等 | STP视角下有限状态自动机的逻辑拥堵：描述、检测及搜索

东南大学许威教授课题组：通信网络泛在智能设计

西电朱樟明课题组 | 使用极点优化技术的精度可配置Zoom型模数转换器设计

杨勋,曾建明,汪萌等 | 基于跨模态对比表征学习的鲁棒视频问答

3GPP ISAC信道建模标准化的最新进展

面向6G的超低能耗移动通信技术 | 前沿学术沙龙(第53次)会议预告

欧洲科学院院士韩清龙教授团队 | 基于累计状态误差的事件触发机制

SCIS会议 | 第16次《中国科学》信息科学前沿研讨会—信息驱动新质生产力

基于多机制协同设计的低频超宽带波段吸波体

项阅权,项林英 | 基于Gramian度量的图积网络可控性

超大面阵CMOS传感器的自适应负反馈斜坡电路设计

英国杜伦大学 | 面向6G的通感一体化新策略

开放报名 | 第三届智能超表面技术论坛

SCIS会议 | 第52次《中国科学：信息科学》前沿学术沙龙

北航李伯虎院士团队 | 工业大模型：体系架构、关键技术与典型应用

山东大学王聪团队 | 基于确定学习的采样非线性系统的神经网络输出反馈控制

上海大学谢少荣团队 | 基于有限时间耦合滑模控制的多机器人复合编队

AI设计芯片是下一个诺奖吗？

大模型芯片与系统专题 | SpikingMiniLM：面向自然语言理解的脉冲Transformer模型—浙江大学脑机智能国重

RISTA前沿大讲堂|智能反射面辅助通信网络：端到端传输模型与系统优化-华南理工大学唐杰教授

东南大学柯文俊等 | 先检测后增强：利用强化学习和数据配比提升LLMs的事实准确性

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉