控制系统可控性检验理论的变革：从模型驱动到数据驱动

文摘 2024-11-17 00:00 北京

数据是人工智能的三大支柱之一。近年，随着人工智能的崛起与应用，以数据为核心的系统表征方法快速进入控制领域，这导致控制系统的设计正经历从模型驱动控制（modelic control，即model-driven control）到数据驱动控制（datatic control，即data-driven control）的范式变革（如图1）。对于控制系统而言，可控性是它的一项基本特性，判定可控性是控制理论的核心问题之一。以模型驱动的控制系统为例，其可控性检验依赖于已知的动力学模型，这些模型可以在状态空间上提供系统行为的连续描述。然而，对于真实世界中多数高维度、高复杂、非线性系统而言，它们的动力学模型通常无法直接获取，只能通过一定数量的状态转移数据点进行描述。例如，将强化学习方法用于求解工业对象的最优控制器时，本身就是解决一个数据驱动控制问题，典型的例子包括赛车控制^[2]和无人机控制^[3]。对于数据驱动的控制系统（datatic control system），数据点只能给出离散化的系统行为描述，而数据点之间的系统信息无法直接得知，因此传统基于模型的可控性检验方法并不适用于数据驱动的控制系统。

图1 模型驱动和数据驱动范式对比

在基于模型的系统中，已有广泛的研究关注可控性判定理论。可控性概念最早由卡尔曼滤波的发明者Rudolf Kalman教授在20世纪60年代提出，其后控制理论学者波波夫（Popov）、贝列维奇（Belevitch）和豪特斯（Hautus）共同提出了适用于线性时不变系统的PBH检验方法，构建了线性系统可控性检验的统一框架。虽然模型驱动的控制系统在可控性检验理论上已相对完善，但对于数据驱动的控制系统，由于只能依赖离散数据点，系统行为描述的完整性受到限制，用于datatic system的可控性判定理论仍然是缺失的。

针对上述问题，清华大学李升波教授团队首次提出了微域可控性（即ϵ-可控性）概念及其检验方法，专注于解决数据驱动控制系统空间描述不完整带来的可控性检验挑战。传统的可控性是指系统状态能在有限时间内从任何初始点精确地转移到目标状态，又称精确可控性（exact controllability）。与之不同，ϵ-可控性将精确的点对点可控性延伸至点对邻域的形式，关注系统状态是否能够转移到目标状态附近的一个小邻域内，而非精确转移到目标点。这一概念将状态转移信息从离散数据点延拓到数据点之间的连续空间中。

图2 ϵ-可控性与精确可控性的区别

那么我们称状态对目标状态是ϵ-可控的。所有ϵ-可控的状态组成的集合称为ϵ-可控集。

微域可控性，即ϵ-可控性是对精确可控性的一种推广。特别地，当ϵ等于0时，ϵ-可控性退化为精确可控性。ϵ-可控性允许系统状态靠近目标点时存在一定范围的误差，这一特点尤其适合状态转移信息离散的数据驱动系统，同时也符合实际控制任务中带容许误差范围的要求。由ϵ-可控性的定义可以推出一项重要定理，它是数据驱动系统可控性检验的理论基础，即可控性反向传播（controllability backpropagation）定理。

这一定理给出了ϵ-可控性检验的基本原理：从目标状态出发，沿系统轨迹的反方向递推，不断利用前一个ϵ-可控状态推出后一个ϵ-可控邻域，直到找到所有ϵ-可控状态。从这一原理出发，研究团队提出了ϵ-可控性的首个检验算法——MECS（Maximum Expansion of Controllable Subset）。MECS算法是一个树搜索算法，它通过迭代执行四个步骤搜索给定数据集中所有的ϵ-可控状态。第一步是选择（Selection）：选出半径最大的未访问邻域。第二步是扩展（Expansion）：找出单步可达选定邻域的所有状态，并加入搜索树中。第三步是评估（Evaluation）：利用可控性反向传播定理，计算上述状态的邻域半径。第四步是修剪（Pruning）：移除被包含在其他叶节点中的邻域以减少冗余扩展。

图3 MECS算法的四个步骤

研究团队在典型数据驱动控制系统上对MECS算法进行了测试验证。下图展示了MECS算法在一个跟车系统（car-following system）中的可控性检验结果。该系统是一个二维线性系统，其状态为，为前后两车的距离与期望距离之差，是对时间的导数。系统的目标状态位于原点。实验结果表明，MECS算法可以有效识别出数据集内的ϵ-可控状态。此外，系统的可控度（可控状态的占比）随ϵ的增大而提升。

图4 跟车系统的数据轨迹及ϵ-可控状态

图5 跟车系统的可控度随ϵ的变化

综上所述，该研究为数据驱动系统的可控性检验提供了理论基础和实用工具，对分析数据驱动系统的特性具有重要价值，为数据驱动控制算法的设计奠定了基础。未来的研究方向包括进一步降低可控性检验算法的时间复杂度，并探讨在系统存在扰动或观测噪声时的可控性检验方法。团队同时在数据驱动系统的稳定性和标准型方面取得了重要进展，并已在arXiv平台发布了两篇相关论文^[4][5]，进一步完善了数据驱动控制的理论基础。

参考文献

[1] Yang, Y., Tao, L., Wang, L., & Li, S. E. (2024). Controllability test for nonlinear datatic systems. Communications in Transportation Research, 4, 100143.

[2] Wurman, P. R., Barrett, S., Kawamoto, K., MacGlashan, J., Subramanian, K., Walsh, T. J., ... & Kitano, H. (2022). Outracing champion Gran Turismo drivers with deep reinforcement learning. Nature,602(7896), 223-228.

[3] Kaufmann, E., Bauersfeld, L., Loquercio, A., Müller, M., Koltun, V., & Scaramuzza, D. (2023). Champion-level drone racing using deep reinforcement learning. Nature, 620(7976), 982-987.

[4] Yang, Y., Zheng, Z., & Li, S. E. (2024). On the stability of datatic control systems. arXiv preprint arXiv:2401.16793.

[5] Zhan, G., Zheng, Z., & Li, S. E. (2024). Canonical form of datatic description in control systems. arXiv preprint arXiv:2403.01768.

http://mp.weixin.qq.com/s?__biz=MzU2ODgzMTM5NA==&mid=2247500042&idx=1&sn=eec6723925f844e99a5aa9a24bd319f8

CAAI认知系统与信息处理专委会

CAAI认知系统与信息处理专委会成立于2014年，胡德文教授担任专委会主任，孙富春教授担任荣誉主任，方斌教授担任秘书长。专委会不断吸纳业界人才，会员1000余名。创建了“认知系统与信息处理国际会议”、“机器人智能论坛”等品牌活动。

最新文章

第九届认知系统与信息处理国际会议（ICCSIP 2024）即将在常州召开！

具身触觉社区“新锐论前沿” 第一期活动成功举办

柔性仿人手指全覆盖磁皮肤，具备接触觉和运动觉的双模态感知能力

迄今结构最简洁的双向刚度仿人手指关节，设计灵感源自卷尺

大面积柔性磁触觉感知

超人手功能的软体指尖：磁触觉感知兼具吸附抓取能力

控制系统可控性检验理论的变革：从模型驱动到数据驱动

强化学习和模型预测控制的区别与联系

强化学习经典教材的配套源代码上线了

推荐清华大学李升波教授撰写的强化学习英文专著

Nature Communications 基于触觉手套的深度学习驱动视触觉动态重建方案

Springer英文专著分享：结合穿戴技术的机器人操作与学习

Nature Communications 麻省理工学院计算机科学与人工智能实验室研制“触觉反馈”智能数据手套

ICRA 2024: 使用Masked Visual-Tactile 对机器人操作预训练

Science Robotics 封面论文：视触觉传感器的手内操作

Advanced Functional Materials 人工皮肤—基于视触觉传感的三维重建技术：材料、方法和评估

Advanced Intelligent Systems 综述论文：视触觉传感器的力测量技术

Advanced Intelligent Systems视触觉传感器在矿物/岩石识别中的应用探索

IEEE Sensors 视触觉传感器的硬件技术综述

IEEE JSTSP综述：从信号处理领域分析视触觉传感器的研究

不列颠哥伦比亚大学（The University of British Columbia）刘超助理教授招生公告~

新加坡国立大学机器人方向（AdaComp 研究组）科研实习机会

斯坦福李飞飞吴佳俊团队建立HourVideo，揭示当前模型在长视频理解上与人类水平的差距

具身触觉社区 | “新锐论前沿” 第一期活动预告

清华大学张钹院士发表人民日报最新文章：具身智能—人工智能与机器人发展的重要推力

高教出版社《具身智能导论》正式出版

中文专著《机器人触觉感知原理与方法》正式出版

具身触觉社区 | “新锐论前沿” 第一期活动预告

美国《福布斯》刊登文章：2025年人工智能（AI）的十大趋势

2024 AI年度报告发布，附十大预测：人形机器人热度下降，英伟达维持霸主地位

Science Robotics 综述揭示演化研究新范式，从机器人复活远古生物！

CoRL2024 聚焦「视听触感官」协同配合的具身智能操作

Nature正刊：西湖大学姜汉卿教授与John A. Rogers-黄永刚-解兆谦联合开发新型的多模态触觉反馈智能穿戴装置

Nature正刊：利物浦大学的研究人员开发了人工智能驱动的移动机器人，可以高效地进行化学合成研究

Science Robotic 综述论文：通过机器人技术了解自我意识

Science Robotics 对机器人的意图归因将会影响人机协作感

Science Robotics 专刊总结：借助机器人技术推进科学发现

IEEE TRO综述论文：抓取合成领域的深度学习方法

NeurIPS 2024 | 机器人操纵世界模型来了，成功率超过谷歌RT-1 26.6%

高教出版社《具身智能导论》正式出版

具身智能综述：鹏城实验室&中大调研近400篇文献，深度解析具身智能

具身智能的视觉-语言-动作模型综合综述论文

谷歌、CMU等研究综述：面向通用机器人的基础模型

机器人神经场的全面盘点：导航/自动驾驶/姿态估计应用一览无余

CMU, UC Berkeley等团队结合神经辐射场的视触觉感知，用于手内操作

Nat. Mach. Intell. | 用化学工具扩充大型语言模型

清华叉院高阳团队首次发现具身智能Scaling Laws

Advanced Functional Materials 人工皮肤—基于视触觉传感的三维重建技术：材料、方法和评估

Advanced Intelligent Systems 综述论文：视触觉传感器的力测量技术

Advanced Intelligent Systems视触觉传感器在矿物/岩石识别中的应用探索

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉