穹彻与上海交大联合提出机器人操作野外学习框架，一起来看→

创业 2025-01-20 20:04 上海

机器人操控已成为机器人学习领域的重要研究方向，受到广泛关注。随着深度学习等技术的快速发展，机器人操控能力已从传统的抓取和放置任务扩展至更加复杂和精细的操作。然而，目前的大多数研究仍聚焦于机器人末端执行器（相当于人类的手部）与环境的交互。团队希望进一步探索机器人是否可以高效利用手臂的其他部位（除手部外）来完成类似抓取、支撑等任务。

这些任务通常需要精确的关节级控制，以调节机器人的整体姿势。为此，穹彻智能携手上海交通大学卢策吾团队共同开发了AirExo，这是一种低成本、高适应性且便携的双臂外骨骼系统。该设备不仅支持双臂机器人的遥操作完成数据采集，还能够在现实（野外）环境 (in-the-wild) 中收集演示数据。

图 1：团队提出的基于低成本外骨骼AirExo的野外学习框架，使人类操作者不仅能够控制双臂机器人收集遥操作演示数据，还能直接记录野外演示数据。与传统遥操作演示数据相比，该框架充分利用了广泛且经济的野外演示数据进行策略学习，从而使训练出的策略比仅依赖更多遥操作演示数据的策略更具通用性和鲁棒性。

在野外学习框架下，团队展示了仅通过3分钟的遥操作演示，结合AirExo收集的广泛和多样化的野外数据，所训练的机器人策略不仅能够媲美通过超过20分钟遥操作演示学习的策略，甚至在某些情况下表现得更为出色。实验结果表明，该方法能够在任务学习的各个阶段帮助模型获得更通用、更稳健的策略，尤其是在扰动条件下，显著提高任务完成的成功率。

项目地址：airexo.github.io

机器人是如何进行学习的？

模仿学习在机器人学习中得到了广泛应用，特别是在通过观察和模仿人类专家演示来训练机器人执行各种任务时。行为克隆是其中最简单的实现方法之一，它通过监督学习直接从演示中学习策略，而无需考虑任务的意图和结果。

在机器人操控中，遥操作演示数据尤为重要，特别是对于基于模仿学习的算法。这些演示数据通常通过人类遥操作机器人执行任务的方式收集，是一种自然且常见的获取方法。然而，传统的机器人系统往往价格昂贵且缺乏便携性，给大规模数据收集带来了显著挑战。

为了解决这一问题，先前的研究开始探索从交互式人类演示中学习的可行性，从而推动了机器人操控在野外学习场景中的应用。这些研究不仅降低了数据收集的成本和复杂性，还为机器人学习的普及开辟了新的可能性。

AirExo：开源、便携、适应性强、低成本且稳健的外骨骼系统

外骨骼产品设计

基于低成本、高适应性、强便携性、持久耐用及易维护这五大核心目标，团队开发了AirExo。该系统的设计已针对机械臂规格进行了优化，实验中使用了Flexiv Rizon机械臂。AirExo还具备高度的可调性，可轻松适配其他机器人（如UR5、Franka Panda和Kuka IIWA 7R800，见图2）。

图 2：AirExo模型适用于不同类型的机器人。需注意，关节的内部结构是标准化的，只有连杆部分根据不同的机械臂配置进行了调整。

AirExo由两只对称的外骨骼设备组成，每个单臂的初始7个自由度（DoF）对应于机械臂的关节自由度，末端设计有可选的双指夹爪，用于模拟末端执行器的功能。为优化穿戴体验和任务效率，AirExo的尺寸设计为机器人尺寸的80%，更符合人类手臂的比例，并结合人体工学设计，有效减轻操作员手臂负担并增强灵活性。

AirExo的关节采用双层结构，外壳分为预关节和后关节，通过金属阻尼枢轴连接，实现稳定的关节运动。每个关节配备高精度角度编码器，能够实现精确的运动捕捉，确保低延迟与高精度的性能表现。除紧固件和电子元件外，所有部件均采用PLA塑料通过3D打印制作。这种材料具有高强度和低密度的特点，确保外骨骼既轻便且坚固，满足多样化应用需求。

校准与遥操作

AirExo的校准过程简便高效。通过将机器人手臂置于特定位置，并同步调整外骨骼的姿态，即可记录机器人的关节位置与外骨骼编码器的读数。在遥操作过程中，外骨骼编码器读数可实时转换为对应的机器人关节位置，确保操作的精准性与可靠性。

经过校准，外骨骼能够覆盖机器人手臂的大部分有效角度范围，从而满足绝大多数任务的需求。对于超出常规范围的特殊任务，可通过调整控制系数扩展操作范围，并在任务特定的运动学约束下进一步提升性能，确保更高的灵活性与适应性。

使用AirExo的野外学习框架

在全臂操控学习中，AirExo通过安装摄像头模拟机器人摄像头的位置。这种配置使遥操作演示与现实（野外）环境演示的图像结构高度相似，有助于策略的有效学习。团队提出了在现实环境中，基于AirExo的全臂操控两阶段训练方法：

第一阶段：预训练

在此阶段，团队利用大量人类演示数据以及外骨骼编码器记录的动作数据对策略进行预训练，从而学习任务的高层次策略。

第二阶段：微调

在此阶段，通过包含机器人动作的遥操作演示进一步优化策略，增强其实际执行能力。

研究表明，外骨骼尺寸的调整对策略学习的影响非常有限，因为核心运动学结构未发生变化。此外，AirExo提供的视觉-动作配对数据足以支持预训练阶段，无需对人类演示与机器人图像进行精确对齐。实验结果进一步表明，预训练显著提高了机器人的任务性能，并大幅提升了遥操作的样本效率。

实验验证

团队通过两个全臂操作任务对所提出的学习方法进行了性能评估，所有演示数据均由AirExo收集完成。

A. 收集球任务

任务：在该任务中，桌子两侧随机放置两组棉球（每组40个），要求操作机器人双臂将所有棉球收集到指定的中央三角形区域内。任务过程中涉及多样化且复杂的接触操作，如图3所示。

图 3：收集球任务的定义：任务目标是将球收集到中央三角区域，该区域以浅蓝色突出显示。红色虚线箭头表示机器人手臂的动作。团队使用海绵垫包裹机器人手臂外表面，以减少接触产生的机械故障。值得注意的是，任务的多模态性使得操作可以通过沿蓝色箭头或橙色箭头的路径完成。

团队将任务完成率定义为被成功收集到中央三角形区域内的球的比例（若球正好落在边界线上，则计为一半），这一指标同时计算左臂和右臂的完成情况。任务成功率则定义为任务完成率超过某个阈值δ的比例。本实验中，团队设置δ为40%、60%和80%。此外，碰撞率被用来衡量操作的精确性的指标。

在评估中，团队采用了VINN及其变体（如使用不同视觉表征的版本）作为非参数方法，其他对比方法包括ConvMLP、BeT和ACT。这些方法均适用于关节空间控制，或可通过简单调整以适应关节空间控制需求。

团队将提出的野外学习框架应用于ACT方法：利用野外演示数据进行初步训练，并结合遥操作演示数据对策略进行微调，从而实现性能优化。

表 1：收集球任务的实验结果

实验结果如表1所示。在使用50次遥控演示进行策略训练时，VINN在所有非参数方法中表现最佳，而ACT在所有参数方法中表现最佳。尽管BeT在基于状态的仿真环境中表现出色，但在现实世界应用中却因碰撞问题表现较差。团队认为，这可能是由于BeT缺乏有效的状态提取器，难以应对复杂的图像输入。

当训练数据减少至10次遥操作演示时，VINN和ACT的性能均有所下降。然而，通过应用团队提出的野外学习框架，ACT在仅使用10次遥控演示的情况下，仍能达到与50次演示相当的性能。这一结果证明，该框架显著提升了策略的样本效率。

图 4：收集球任务中各方法的分析。将整体完成率超过80%定义为成功。(a) 分析了每个方法在每次试验中的失败原因。(b) 将不准确率（左臂和右臂）均匀分配到左臂不准确率和右臂不准确率中，并绘制了不同方法的失败模式对比图。(x, y) 表示策略是通过y次野外演示和x次遥控演示进行训练的。虚线表示具有相同成功率的等高线，浅蓝色背景区域表示左臂和右臂之间更加平衡的策略。(c) t-SNE可视化展示了真实动作和带/不带野外学习的策略动作在验证集上的表现。

进一步分析实验中的失败案例（如图4所示），团队发现ACT策略在两臂动作间存在不平衡现象，尤其是在遥操作演示数量较少的情况下。通过引入野外学习框架，策略能够在两臂间实现更均衡的准确性，同时对右臂动作的学习表现出更强的专注性（如图3(c)所示）。团队认为，这得益于AirExo提供的多样化且高精度的野外演示数据，使策略在预训练阶段能够掌握高层次的策略知识，从而在微调阶段更高效地优化具体动作。

B. 从遮帘架抓取任务

该任务要求机器人用右臂推开遮帘，抓取遮帘下的棉质玩具并将其放入箱子中。任务分为多个阶段（如图5所示），并以每个阶段结束时的平均成功率作为评估指标。实验选用VINN和ACT两种方法，同时结合团队提出的野外学习框架应用于ACT策略进行测试。

图 5：遮帘架抓取任务的定义。机器人需要：（a）用右臂伸向透明遮帘，（b）推开遮帘，然后（c）用左臂接近物体，（d）抓取物体，最后（e）投掷物体。

表 2：遮帘架抓取任务的实验结果

如表2所示，随着遥操作演示次数的减少，VINN和ACT的成功率均有所下降，特别是在“throw”阶段表现尤为明显。然而，结合野外学习框架后，ACT在“grasp”和“throw”阶段的成功率显著提升，甚至超越了使用50次遥操作演示训练的效果。值得注意的是，仅通过10次遥操作演示，ACT即可达到与50次演示相当的表现。这充分证明了野外学习框架在提升多阶段全臂操作任务成功率方面的有效性。

鲁棒性分析

表 3：遮帘架抓取任务的鲁棒性实验结果

为评估野外学习框架对策略鲁棒性和泛化能力的提升，团队设计了三种环境扰动进行实验。表3显示，野外学习框架通过多样化的野外演示，显著增强了策略的鲁棒性，使其能够更有效地适应不同类型的环境扰动。这一结果表明，该框架在应对复杂场景和未知变化方面具备优越性。

结论与未来展望

团队开发的AirExo，一款开源、低成本、通用、便携且稳健的外骨骼设备，支持双臂机器人的关节级遥操作和野外环境中的全臂操控学习。为减少对资源密集型遥操作演示的依赖，团队提出了一种全新的野外学习框架。

实验结果表明，通过该框架学习的策略能够更深刻地理解任务需求，在多阶段全臂操控任务中展现出卓越性能，甚至优于仅依赖大量遥操作演示从零开始训练的策略。此外，在多种扰动条件下，使用改框架训练的策略表现出更高的鲁棒性。

未来，团队计划进一步研究如何缩小野外人类演示数据与机器人遥操作数据之间的图像差距，以实现机器人直接通过AirExo在野外演示中学习，从而进一步降低学习成本。

来源：穹彻智能

▼往期精彩回顾▼

高新技术企业431家，专精特新企业123家……闵行这里如何发展新质生产力？

“大零号湾科学读书会·科普书单”首期发布！

轨交23号线“大零号湾”区域有新进展

2026年投入运营！利洁时在闵行建设全球科创研发中心

大零号湾通用机器人概念验证科创论坛暨签约仪式举办

“大零号湾科学读书会”文化品牌正式启动

分享、点赞、“在看”

传递给更多人

科创闵行

介绍闵行科技政策、科技创业环境、科技园区等情况；对企业在科技创业、科技金融、知识产权、科技项目、高新技术、技术交易、科技人才等方面提供专业化的服务。

最新文章

“大零号湾”开年首月展新篇，奋进开启新征程

大零号湾：梦想启航的科技新天地

《科学教育与科学传播发展报告（2024）》发布

新华社报道：浦江第一湾策源第一站 “大零号湾”向世界级“科创湾区”迈进

《2024上海科技进步报告》出炉！快来看看2024上海科技有哪些新进步→

大零号湾·国盛健康云城·2025迎新沙龙暨开园仪式举办

上海：干字当头，扎实推动高质量发展

突破4000亿元！闵行经济总量迈上新台阶

【大零号湾】开年顶刊！交大团队Cell发文，解决这项难题

非夕携手百年日企KURABO，联合打造自适应机器人解决方案

“两院院士评选2024年中国/世界十大科技进展新闻”揭晓

闵行科技馆2025年春节期间开放时间安排

明天15:00直播！智慧天际·未来产业的新蓝海（低空经济专场）

培训班一茬接一茬…闵行干部进入“学习季”，为新年开局冲刺加油充电

闵行又一生产研发运营总部项目正式启动

节卡机器签署这一全球战略合作，共创全球智能机器人新未来

加速世界级科创湾区崛起，他们的目标是……

50亿元专项资金！闵行这里打造世界级“科创湾区”

星际旅行、遨游敦煌……这场科技周带你进入虚拟世界

划重点！2025年上海市《政府工作报告》里的科技“含金量”→

穹彻与上海交大联合提出机器人操作野外学习框架，一起来看→

高新技术企业431家，专精特新企业123家……闵行这里如何发展新质生产力？

“大零号湾科学读书会·科普书单”首期发布！

轨交23号线“大零号湾”区域有新进展

2026年投入运营！利洁时在闵行建设全球科创研发中心

大零号湾通用机器人概念验证科创论坛暨签约仪式举办

“大零号湾科学读书会”文化品牌正式启动

2025年度闵行区关键核心技术攻关“揭榜挂帅”需求榜单已发布！

聚焦银发产业，千余人齐聚闵行，他们发现了什么？

从跟跑到并跑，中国研发的众多靶向药物将为肺癌患者带来希望

从云南大关到“大零号湾”，两地孩子们“Citywalk之约”实现了！

2025全国颠覆性技术创新大赛正式启动！欢迎报名！

【大零号湾】上海交大一年发了多少篇NSC论文？

人类如何叩开化学的大门求索“灵丹妙药”？他们这么说——

“让仰望星空不再昂贵”…大零号湾首发这一榜单，上榜企业和企业家有多厉害？

这家高企获近百项专利！在这里找到了新的“合伙人”

【大零号湾】这个商业体预计上半年焕新迎客！

正式启用！闵行这里将打造机器人产业集群

“大零号湾”重磅榜单首次发布，一批优质企业与优秀企业家入选！

“大零号湾”一家企业上榜！产品应用于汽车、新能源等行业

【聚焦两会】今年预计突破320亿元！闵行生物医药产业如何“串链成珠”？

正式开工！又一生物医药企业扎根闵行

【大零号湾】中国首批高等级商用客运eVTOL确定订单来自这家企业

【政策速递】闵行区产业高质量发展政策意见（试行）来了→

《文汇报》要闻报道：加快建设“大零号湾”未来产业先导区

秒懂！闵行区政府工作报告名词解释

将“大零号湾”打造成世界级“科创湾区”……市政府常务会议研究了这些重要事项

【聚焦两会】步入2025年，闵行的“确定性”在哪里？

关于中试基地建设，他说——

闵行区知识产权协会落地“大零号湾”！首期专场主题沙龙活动预告

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉