扫描上方二维码即可报名
近日,2024世界机器人大会落下帷幕,“最强打工人”国内首个大模型机器人优必选Walker S、具有超强稳定性和灵活性的宇树科技人形机器人G1、高仿真人形交互机器人数字华夏“夏澜”等27款人形机器人亮相,成为本次大会焦点。这些创新成果反映机器人产业的探索方向已突破传统的“特定任务+固定程序”模式,开始转向“泛化任务+训练数据”的新范式探索,也意味着具身智能领域对于数据的需求量正呈指数级增长。
中国信息通信研究院与北京人形机器人创新中心有限公司在本次大会上联合发布《具身智能发展报告(2024年)》。报告指出,缺乏数据成为具身智能能力突破的重要壁垒。一方面,真实数据面临获取成本过高,广泛、高质量和多样化的挑战;另一方面仿真合成数据面临“Sim2Real Gap”,即机器人在模拟环境中的训练结果在现实世界部署落地之间的误差挑战。
数据对具身智能在能力提升和应用探索的重要性不言而喻,因此如何获取低成本高质量的数据成为具身智能领域亟待解决的核心难题。大语言模型的训练数据可以采用人类在互联网中生产的数字内容,而具身智能的训练数据包括动作、视觉、触觉和语音信息等多模态数据,这类多模态数据并不像大语言模型的数据那样是原生的,仅需要清洗和标注即可使用。因此,具身智能的数据获取需要搭建专门的数据生产工具。
而且,因为具身智能训练所需的数据是多模态数据,所需的数据量级相比语言模型也更高。为解决这一题难题。目前,具身智能训练数据按照采集方式主要分为真实数据和仿真数据两大类。仿真数据具备快速获取、可规模化和成本较低的显著优势,不过,仿真环境完全还原真实环境还有挑战,目前得到的仿真数据的模拟质量仍显粗糙,影响复杂任务效果。真实数据不可或缺,尤其在执行复杂任务中,其真实性与完整性是模型有效性的关键,真实数据的主要获取方式是模仿学习,近年来,众多研究机构纷纷提出模仿学习框架,但仍然存在数据通用性等问题。
为解决这一难题,近年来,国内外众多研究机构做了大量工作。谷歌接连推出RT-1、RT-2,并联合全球机构汇集22种不同机器人类型数据,构建最全面的具身智能数据集Open X-Embodiment;以斯坦福Chelsea Finn实验室发布的Mobile ALOHA为代表的模仿学习惊艳全网,首次提出低成本全身远程操作系统来收集数据,UMI、DexCap、伯克利FMB等模仿学习的工作也相继发布。仿真数据领域,英伟达Isaac Sim、Gazebo 、PyBullet等通用模拟器日渐成熟,SAPIEN、RDUniverse、BEHAVIOR等专业化仿真引擎方兴未艾,越来越多的团队正在尝试跨越Sim 2 real Gap。
全球具身智能提速发展,国外Google DeepMind、Tesla、Figure AI、Physical Intelligence 等先锋企业不断迭代推出更先进的AI机器人。国内,百度、腾讯等巨头纷纷加大布局,优必选、宇树科技等老牌足式机器人企业推出更加适应具身智能的本体产品,银河通用、星尘智能等创业公司横空出世。在众多具身智能的落地产品中,我们可以预见:
随着现实商业化应用对具身智能提出更高的要求,更优更快的获取多模态数据的需求将迎来井喷。
真实数据与仿真数据优势互补,二者组合的数据集有可能是具身智能训练数据的有效解法。
具身智能领域极有可能诞生如Scale AI这样的明星数据公司。
9月12日,本周四晚20:00,热爱创新的嘉程资本开启嘉程创业流水席第232席!我们邀请了上海交通大学助理教授李永露、香港大学博士罗谦一起深度探讨具身智能与机器人数据的最新趋势!欢迎具身智能上下游的从业者、创业者、投资人和行业专家一起参加!
再次邀请上车!
主题:探讨具身智能与机器人数据的最新趋势
时间:2024年9月12日20:00-22:00
形式:腾讯会议
名额:为保证活动私密性和讨论质量,限100位!
本场活动免费参加!
往期嘉程创业流水席线上活动现场
往期回顾
嘉程资本
握手未来商业领袖
BP 请发送至 BP@jiachengcap.com
微信ID:NextCap2017