浙大工控所智能无人系统团队提出基于接触图扩散模型与时序参数优化的灵巧手抓取轨迹生成方法（IJCAI23,ICRA 24）

文摘 2025-01-22 00:03 云南

研究背景与挑战

在类人机器人的研究中，灵巧手的抓取能力是评估其智能化水平的重要指标之一。作为类人手的核心技术，灵巧抓取不仅涉及多自由度关节的协调控制，还需要处理复杂的接触关系以及高维动作空间中的轨迹规划（如图1所示）。

图1 灵巧手抓取轨迹可视化

尤其是在面对各种形状和材质的物体时，如何高效地控制灵巧机械手并实现自然、稳定的抓取动作，成为机器人学领域的一大难题。灵巧手抓取的挑战性主要源于以下几个方面：

高维运动空间：灵巧手通常具有多个自由度，每个自由度需要精确协调，以完成复杂的抓取任务。

复杂的接触关系：灵巧机械手的手指需要与物体表面进行多点接触，这些接触点的选择和调整直接影响抓取的成功率和稳定性。由于物体的形状多样、表面特征复杂，手指的接触位置需要动态调整，以适应不同的抓取任务。

手指之间动态协调：灵巧机械手的抓取动作需要多个手指和关节之间的协同运动，这对轨迹规划提出了更高的要求。如果抓取轨迹不够自然，动作僵硬、使得接触力不均从而导致抓取失败。

方法介绍

针对上述这些困难与挑战，本工作提出了一种基于两阶段的灵巧抓取轨迹优化方法。如图2所示，第一阶段利用接触图生成来获得稳定的交互姿态；第二阶段则在此基础上，引入时序参数对抓取轨迹进行优化规划。通过这种两阶段策略，本方法能够从复杂输入高效生成自然平滑的抓取轨迹。

图2 灵巧抓取轨迹优化两阶段算法流程

静态抓取生成

第一阶段（Grasp Synthesis）主要针对静态抓取姿势的生成。为此，我们提出了一种新颖的因式分解方法，利用中间接触图有效处理物体与抓取姿态之间的非线性映射。为克服高维物体点云空间中的学习挑战，我们设计了一种基于潜在扩散的接触图生成方法。通过这一机制，第一阶段能够根据不同物体的点云输入生成适应性的抓取姿态，同时提供相应的接触图信息，为后续灵巧手轨迹规划奠定基础。

图3 展示了我们的接触图生成模型 DiffContact 的架构。

这是一种基于条件潜在扩散的生成模型，主要包含以下三个核心模块：

1. Condition-Encoder负责提取对象的形状特征，作为条件输入，确保生成的接触图能够准确反映对象的特性。

2. Generator通过将抓取接触映射到潜在空间中，实现降维，同时保留抓取接触的主要特征，以简化学习过程。并且其解码器能够将潜在空间的编码向量映射回接触图表示。

3. Diffuser通过逆转高斯分布 N(0,I)的渐进噪声扩散过程，学习接触潜在分布，并将潜在向量与对象形状特征相结合，从而生成适应不同对象输入的真实接触图。

通过在潜在空间中操作，DiffContact 有效降低了生成复杂接触图时的高维学习难度。不仅能够高效捕捉底层抓取模式，还能保留接触图的关键结构信息，显著提升接触图生成的质量和适应性。这种设计为灵巧抓取的研究提供了强大的支持。

在DiffContact中生成的高质量接触图后需要进一步转换为可用于实际抓取的具体姿势。为此，我们引入 GraspNet 模型，将接触图精准映射为抓取姿势。如图4所示，GraspNet 模型，将对象的点云O和其生成接触图 C′作为输入，通过学习两者之间的关系，预测合适的抓取姿态。

最后我们引入了局部穿透感知优化策略（Partical-Aware Pentration Refinement, PAP）优化模块，通过对局部穿透区域的检测和优化来进一步提升姿势的合理性和实用性。

图4 抓取姿态映射网络（GraspNet）

基于时序参数和姿态先验的轨迹规划

第二阶段（Motion Planning）聚焦于抓取轨迹规划。我们提出一种新颖的优化策略, 基于时序参数表示和人类抓取先验的轨迹优化方法（TPNP）。这一策略充分利用第一阶段生成的静态抓取姿态、物体形状和接触图信息，高效地规划出自然流畅的抓取轨迹，并有效避免其优化过程中出现不自然姿态。算法框架如图5所示。

图5 基于时序参数抓取先验的轨迹优化算法TPNP

与传统方法不同，我们的核心创新在于轨迹建模方式：并非逐步优化每个运动阶段的姿态参数，而是通过一个控制关节运动节奏的时序参数化函数（Temporal Parametric Mapping）对整个抓取轨迹进行统一建模。这种方法不仅减少了高自由度手部系统的优化复杂度，还能更准确地捕捉自然抓取动作的节奏变化。

在抓取过程中，尽管灵巧手的自由度极高，所有手指的运动本质上都遵循一个向内移动至目标姿态的协调节奏。为解决手部姿态不自然的挑战，我们设计了一个手部姿势网络（Neural Poser Network）。该网络先通过学习人类抓取动作的先验知识，将手部姿态编码到潜在空间中，再在潜在空间中进行优化。同时，结合接触图约束的碰撞感知机制和多阶段联合优化策略，我们进一步提升了轨迹的合理性和自然性。

此外，考虑到在轨迹优化过程中忽略目标位姿通常会导致次优解决方案。因此，我们提出目标姿态联合优化（Joint Target Optimization, JTO）来共同细化目标姿态和抓取动作。最终，这种创新方法使灵巧手能够以协调流畅的运动完成抓取，展现出接近人类的自然抓取能力。

高质量的接触图和抓取姿态生成

图6 生成接触图及对应的抓取姿态可视化

图6的可视化结果展示了我们方法在接触图和抓取姿态生成上的卓越性能。如图4所示，通过 DiffContact 模型生成的接触图能够准确捕捉物体的关键接触区域，具有清晰的结构和合理的分布。同时，与接触图对应的抓取姿态自然且稳定，展现了对物体形状和抓取先验的深度理解。这种高质量的生成能力为后续轨迹优化提供了可靠基础，使得灵巧手能够应对不同物体对象的抓取需求。

为了验证 DiffContact模型是否能够有效学习接触的潜在分布，我们对其学习到的潜在空间进行了进一步分析。具体来说，我们使用DiffContact 针对同一物体生成两种不同的接触图类型及其对应的潜在向量，分别命名为 TypeA 和 TypeB。通过在两者对应的潜在向量之间进行插值，生成一系列新向量，并将这些新向量解码为新的接触图。最后，我们将生成的接触图输入到 GraspNet 中，获得相应的抓取姿势，并观察这些新向量对应的抓取姿势和接触图是否合理且变化一致。

图7 不同接触图和对应抓取（TypeA 和 TypeB）之间的插值变化

如图7所示，我们可以清晰地看到，鼠标上的黄色箭头和圆圈标注了接触图与抓取姿势之间的细微差异。随着接触区域逐渐展开，中指平稳地移动到目标位置。此外，抓取手机时，手部姿势从握持逐步过渡为按压，展现了自然且平滑的过渡和协调性。这些实验结果证明了 DiffContact 模型在处理复杂抓取任务时的鲁棒性和生成能力

自然合理的抓取轨迹

图8 抓取轨迹可视化

我们的方法通过两阶段优化实现了从接触图到抓取轨迹的高效生成，最终产生了自然合理的抓取动作。我们对TPNP中的每个模块的都进行了独立验证，其中Baseline表示目标位姿和起始位姿之间的线性插值，没有使用优化策略的可视化结果。如图8所示，可以看出经过我们方法得到灵巧手的抓取轨迹在整个运动过程中展现出流畅性与协调性。例如，在抓取复杂形状物体（如剪刀）时，手部各关节按照合理的节奏逐步调整至目标姿态，在动态抓取过程中，轨迹平滑且精准，手部能够快速适应不同的抓取需求。

最新文章

Nature Communications 中国科大成功研发19自由度仿生灵巧手

Science 正刊：3D打印新型构架材料

北京大学与智元机器人联合实验室发布OmniManip：显著提升机器人3D操作能力

Science of Learning 脑控编外机器人训练后的运动学习泛化

《Adv. Manuf.》综述：基于EAP柔性触觉反馈人机界面研究进展

π0：仅有3B数据模型打通Franka等7种机器人形态适配，实现0样本的完全由模型自主控制方法

Science Advances 用于独立检测压力和温度的3D主动矩阵多模态传感器阵列

浙大工控所智能无人系统团队提出基于接触图扩散模型与时序参数优化的灵巧手抓取轨迹生成方法（IJCAI23,ICRA 24）

浙大工控所智能无人系统团队发布大规模富语义灵巧手抓取动作轨迹数据集GraspM3

2025年国自然工程与材料科学部、信息科学部、医学科学部和交叉科学部资助领域和注意事项

【20250114】清华大学发布人体全身肌骨模型，使用分层低维表示对人体全身肌骨系统和运动控制过程进行建模

Science / Nature 假肢手研究集锦

Science Robotics论文分享：融合运动神经元和姿势协同作用的假肢手

Science Robotics 封面论文：高度集成的仿生手，具有神经控制和反馈功能，适用于日常生活

Science Robotics封面论文：假肢手的交互控制新思路，磁性植入让截肢者重获灵巧抓握功能

Science Robotics 文章分享：脑机接口唤起的触觉感知改善了假肢手控制

Nature machine intelligence论文分享：智能假肢手的人机共融抓取

Nature Human Behaviour 非仿生控制策略让你的仿生假肢实现任意控制

Science Robotics论文分享：融合运动神经元和姿势协同作用的假肢手

Science Robotics最新封面：外骨骼“外挂”让手指弹奏钢琴更灵巧

中国工程院发布中国工程科技2040发展战略研究

Nature Reviews Bioengineering|综述|可穿戴柔性微流控传感技术

Nature Communications 低温打印多材料软水凝胶机器人

综述：大语言模型在机器人导航中的最新进展！

机器人避障不再“智障”：HEIGHT——拥挤复杂环境下机器人导航的新架构

Nature Biomedical Engineering 加州理工学院让瘫痪患者能够更精准地用意念控制电脑设备

力肌图（FMG）传感器用于人机交互协作

Science Robotics 通过培养多元化和包容性领导力来加快机器人技术的创新步伐

智元机器人推出EnerVerse架构，基于未来空间生成引导机器人动作规划，赋能具身智能新高度

国际数据公司IDC发布2025年具身智能机器人发展趋势

IF=24.5! 综述：机器人纹理识别触觉感知和机器学习进展

Nature Communications 纸基功能材料做的触觉传感器

斯坦福大学李飞飞教授团队ARCap: 利用增强现实反馈收集高质量的人类示教以用于机器人学习

Science Advances 普渡大学开发了新型机器人变形软体表面

Nature Review Materials 提出了针对柔性可变性结构的评估指标

CMU卡内基梅隆大学「软体机器人动态手旋转笔」

普林斯顿大学和斯坦福大学联合开发家庭服务机器人TidyBot++

清华大学、字节跳动等单位联合发布最新视觉语言动作模型RoboVLMs

百万真机数据集开源项目AgiBot World，也是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集

Science Advances：一种多功能软变形和触觉显示器

浙大刘勇教授团队摘得2024年中关村仿生机器人大赛的多足仿生机器人赛道障碍赛桂冠

Science Advances 美国北卡罗来纳州立大学的科研团队开发出一种能随磁场变形的新型超材料

Science Advances 多磁性微型机器人控制系统，在复杂3D环境独立控制多个机器人

回顾2024，展望2025！中国人工智能学会认知系统与信息处理专委会恭祝您新年快乐！

2024年度最受关注的TOP 10文章

【回望·前瞻】《2024具身智能科技前沿热点》正式发布！

Science Robotics 2024年度封面论文集锦

2024年深圳智能机器人灵巧手大赛，清华大学孙富春教授团队获冠军

“具身触觉”社区2024年度学术活动总览

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉