浙大工控所智能无人系统团队发布大规模富语义灵巧手抓取动作轨迹数据集GraspM3

文摘 2025-01-22 00:03 云南

近几年，机器人抓取与操控领域，特别是灵巧手的研究取得了显著进展，相关数据集的丰富性和多样性成为推动该领域研究与应用的关键基础。然而，与传统的机器人夹爪相比，灵巧手由于其高维度、多自由度的特点，使得抓取任务面临独特的挑战。

灵巧手的多指结构涉及大量自由度，这不仅增加了规划和控制的复杂性，还要求在抓取过程中动态调整手指姿态，以应对物体或环境的变化，同时保持稳定性和自然的姿势。另一方面，抓取需要符合特定的交互需求，同一个物体根据不同的需求会有不同的抓取方式。在动作轨迹之外，需要获取不同抓取轨迹的语义描述。为了推动这一领域的发展，浙江大学工业控制研究所智能无人系统团队叶琦研究组基于抓取动作生成和轨迹优化生成了一个全新的大型富语义抓取动作数据集——GraspM3。

图1 GraspM3抓取轨迹仿真演示

什么是GraspM3？

GraspM3是一个大规模灵巧手抓取动作数据集，包含超过 8,000个物体和 1,000,000 条抓取运动轨迹，并且经过精心设计和标注。无论是对机器人抓取的基础研究，还是实际工业应用，GraspM3都提供了一个更加全面的数据资源。

图2 单个物体的不同抓取轨迹和姿态（手机，印章）

数据集的核心亮点

1、百万数量级的抓取轨迹数据集中包含1,152,000 条基于shadow hand[1]的机械手抓取动作轨迹和212,360条基于mano hand[2] 的人手抓取轨迹，涵盖了各种抓取方向和抓取姿态（如图2）。

2、多样性极高的物体库 GraspM3涵盖了8,152 个物体，种类丰富，从日常生活中的常见物品到工业环境中的复杂物体一应俱全。这些物体均来源于高质量的 3D 模型数据库[3,4,5,6]。

3、自然平滑的抓取动作在轨迹优化过程中，我们引入了人手抓取动作的先验知识，生成的轨迹能够以类似人类的自然方式实现抓取。即使是针对剪刀、手表、杯子等具有复杂结构的物体（图4，图5），我们的优化算法也能够生成稳定、自然的抓取动作。这些抓取动作在到达交互姿态时避免了不必要的碰撞，同时在运动过程中保持了动作的自然性和合理性，展现了高水平的动态流畅性。

4、详尽的语义标注如图3所示，我们利用大语言模型，针对每个轨迹样本，都进行详细的语义标注，其中主要包括：

o物体类别：明确分类了每一个物体，例如日用品、工具、玩具等。

o抓取方向：基于第一视角下的观察，对每条抓取动作的方向进行了细致的描述。我们将描述的的关键词要分为8个（上，下，左，右，左下，右下，左上，右上，），根据动作序列的起始位置到目标位置的方向向量来提取不同的描述用词。

o抓取类型：根据手物交互姿态，手指关节的弯曲程度，提取不同的描述用词，包括，轻柔抓握(Gentle Grasp)，捏握(Pinch Grasp) ，力量抓握(Power Grasp)，精细抓握(Precision Grasp)。

图3 语义标注流程图

接触细节：详细记录了抓取过程中的接触点和接触区域分布。针对灵巧手不同的部位接触区域的大小进行详细的描述，根据不同的接触区域面积提供不同的程度的描述用词，包括点触 (point contact)，指腹触碰 (pad contact), 部分贴合(partial fitting)，完全贴合(complete fitting). 我们相信对接触细节的描述有助于帮助研究人员分析抓取成功与失败的原因。

强大的仿真验证我们基于 NVIDIA Isaac Gym[7] 和RaiSim[8]两个不同的仿真环境，对每个物体的抓取轨迹做数据增强，并进行大规模仿真验证，并从中过滤出抓取成功的样本，为后续的研究工作以及实物实验提供更加强有力的数据支撑。最终我们从现有的抓取轨迹样本中过滤出1,129,300条在仿真中的可靠轨迹数据

图4 Isaac Gym仿真环境下的Shadow Hand抓取（花瓶，手机，剪刀，球鞋，手表，乒乓球拍）

图5 RaiSim仿真环境下的MANO Hand抓取（剪刀，平底锅，酒杯）

生成方法介绍

GraspM3数据集的创建方法如下图所示。针对灵巧手抓取面临高自由度（DOFs）和复杂抓取接触的问题，我们基于之前的工作[7,8]提出了一种基于抓取姿态合成和运动规划的两阶段的方法策略，如图4所示。

图6两阶段算法流程图

第一阶段（Grasp Synthesis），我们提出一种新颖的因式分解方法[9]，其核心思想是通过中间接触图来处理物体与抓取姿态之间的非线性映射从而为避免在高维物体点云空间中的学习困难问题，具体来说，我们设计了一种基于潜在扩散的接触图生成方法，通过假设抓取姿势完全受限于给定的接触图，将映射分解为两个连续的步骤：1）我们首先学习接触图分布以生成用于抓取的潜在接触图；2）然后学习从接触图到抓取姿势的映射。最终第一阶段能够根据不同物体的点云输入，生成不同的抓取姿态，并且提供对应的接触图信息。

第二阶段（Motion Planning），我们提出一种创新的轨迹优化方法（TPNP）[10]，利用第一阶段的静态抓取，物体以及接触图信息，能够高效地规划出一条灵巧手抓取轨迹，并且可以有效避其过程中出现不自然的姿态。

数据集的潜在应用

机器人交互学习 GraspM3可作为深度学习和强化学习的训练和测试数据源，为机器人手的抓取能力提升提供支撑。

仿真抓取大规模验证提供了一个标准化的基准，用于评估抓取策略和算法的性能。

现实场景模拟语义标注和多样化的物体使数据集能够涵盖现实场景中的复杂性和多样性，有助于缩小仿真与现实之间的“域差距”。

未来展望

GraspM3的发布为研究人员和开发者提供了丰富的资源支持。我们希望这一数据集能够激发更多创新，为机器人抓取技术的发展注入新的动力。如果您对GraspM3数据集感兴趣，欢迎联系或访问我们的相关网站以获取更多信息！并希望您能引用我们的相关工作[7,8]，以共同推动这一领域的进步。

GraspM3数据集和仿真代码链接

代码地址:https://github.com/lihaoming45/GraspM3

网页链接：https://lihaoming45.github.io/GraspM3/index.html

生成方法相关链接：

https://lihaoming45.github.io/contact2grasp/index.html

https://lihaoming45.github.io/tpgp.github.io/

最新文章

Nature Communications 中国科大成功研发19自由度仿生灵巧手

Science 正刊：3D打印新型构架材料

北京大学与智元机器人联合实验室发布OmniManip：显著提升机器人3D操作能力

Science of Learning 脑控编外机器人训练后的运动学习泛化

《Adv. Manuf.》综述：基于EAP柔性触觉反馈人机界面研究进展

π0：仅有3B数据模型打通Franka等7种机器人形态适配，实现0样本的完全由模型自主控制方法

Science Advances 用于独立检测压力和温度的3D主动矩阵多模态传感器阵列

浙大工控所智能无人系统团队提出基于接触图扩散模型与时序参数优化的灵巧手抓取轨迹生成方法（IJCAI23,ICRA 24）

浙大工控所智能无人系统团队发布大规模富语义灵巧手抓取动作轨迹数据集GraspM3

2025年国自然工程与材料科学部、信息科学部、医学科学部和交叉科学部资助领域和注意事项

【20250114】清华大学发布人体全身肌骨模型，使用分层低维表示对人体全身肌骨系统和运动控制过程进行建模

Science / Nature 假肢手研究集锦

Science Robotics论文分享：融合运动神经元和姿势协同作用的假肢手

Science Robotics 封面论文：高度集成的仿生手，具有神经控制和反馈功能，适用于日常生活

Science Robotics封面论文：假肢手的交互控制新思路，磁性植入让截肢者重获灵巧抓握功能

Science Robotics 文章分享：脑机接口唤起的触觉感知改善了假肢手控制

Nature machine intelligence论文分享：智能假肢手的人机共融抓取

Nature Human Behaviour 非仿生控制策略让你的仿生假肢实现任意控制

Science Robotics论文分享：融合运动神经元和姿势协同作用的假肢手

Science Robotics最新封面：外骨骼“外挂”让手指弹奏钢琴更灵巧

中国工程院发布中国工程科技2040发展战略研究

Nature Reviews Bioengineering|综述|可穿戴柔性微流控传感技术

Nature Communications 低温打印多材料软水凝胶机器人

综述：大语言模型在机器人导航中的最新进展！

机器人避障不再“智障”：HEIGHT——拥挤复杂环境下机器人导航的新架构

Nature Biomedical Engineering 加州理工学院让瘫痪患者能够更精准地用意念控制电脑设备

力肌图（FMG）传感器用于人机交互协作

Science Robotics 通过培养多元化和包容性领导力来加快机器人技术的创新步伐

智元机器人推出EnerVerse架构，基于未来空间生成引导机器人动作规划，赋能具身智能新高度

国际数据公司IDC发布2025年具身智能机器人发展趋势

IF=24.5! 综述：机器人纹理识别触觉感知和机器学习进展

Nature Communications 纸基功能材料做的触觉传感器

斯坦福大学李飞飞教授团队ARCap: 利用增强现实反馈收集高质量的人类示教以用于机器人学习

Science Advances 普渡大学开发了新型机器人变形软体表面

Nature Review Materials 提出了针对柔性可变性结构的评估指标

CMU卡内基梅隆大学「软体机器人动态手旋转笔」

普林斯顿大学和斯坦福大学联合开发家庭服务机器人TidyBot++

清华大学、字节跳动等单位联合发布最新视觉语言动作模型RoboVLMs

百万真机数据集开源项目AgiBot World，也是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集

Science Advances：一种多功能软变形和触觉显示器

浙大刘勇教授团队摘得2024年中关村仿生机器人大赛的多足仿生机器人赛道障碍赛桂冠

Science Advances 美国北卡罗来纳州立大学的科研团队开发出一种能随磁场变形的新型超材料

Science Advances 多磁性微型机器人控制系统，在复杂3D环境独立控制多个机器人

回顾2024，展望2025！中国人工智能学会认知系统与信息处理专委会恭祝您新年快乐！

2024年度最受关注的TOP 10文章

【回望·前瞻】《2024具身智能科技前沿热点》正式发布！

Science Robotics 2024年度封面论文集锦

2024年深圳智能机器人灵巧手大赛，清华大学孙富春教授团队获冠军

“具身触觉”社区2024年度学术活动总览

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉