新一轮科技浪潮的推动下,具身智能(Embodied Intelligence, EI)这一智能系统与物理实体相结合的科技创新产物,正悄然改变着世界。它不仅超越了单纯的技术革命范畴,更预示着未来对人类生活方式、制造模式乃至社会结构都将带来一次深刻的重塑。
据不完全统计,仅2024年上半年,关于具身智能的研讨已多达500余次。来自不同领域的行业精英、产业高管、高校学者,都在试图找到具身智能技术进化的规律性与确定性。
尽管从2020年以来,斯坦福、伯克利、MIT、CMU、谷歌、微软、亚马逊、OpenAI、英伟达等众多学者与企业家,对该领域的进化路径孜孜以求。但至今尚未找到机器人或具身智能的通用大模型Scaling Law。
尽管训练参数还在“无限”增加,这一现状甚至不可避免地导致算力需要“无限”增加,能源也需要“无限”增加,相关大模型的单次训练成本已经少则1千万美元,多则接近上亿美元。但大力并没有出奇迹,诸如功能、安全、质量以及实时性等关键指标并没有明显提高。
一种对技术与供应链迭代的“无力感”,在业界蔓延。7月22日,马斯克在推特上宣布,特斯拉Optimus人形机器人二代因未能获得高性价比的成熟供应链支持,而推迟发布。据悉,这代机器人将自主设计全新双手、FSD芯片等核心零部件,以便提高30%的行走速度、减轻10kg的重量,并将成本控制在1万美元,售价控制在2万美元左右。但供应链因素直接导致了马斯克的梦想,被延迟实现。
在中国,人形机器人也是热闹非凡,一级市场可落地产品尚待成熟,二级市场却已率先上扬;人形样机尚未明确具体的应用场景,量产之路也大受供应链掣肘,人形机器人的价格战却已打响。此外,随着7月武汉萝卜无人出租车在指定区域以低速模式尝试商业化短途打车服务,人们开始对未来社会的就业问题产生担忧。
以下是CAN+赛博坦机器人学院名誉院长、北航机器人研究所名誉所长、中关村智友研究院院长王田苗对具身智能的一些思考:
什么是具身智能?
沿着热潮的方向出发,你会发现,当下几乎所有的困惑与纠结都聚焦在人形机器人身上。这个“笨手笨脚的家伙”距离能力爆发到底还要多久?人类还有没有超级场景留给它?未来,真如马斯克所言,全球将有200亿台套人形机器人的市场吗?也许,将视野打开,答案也跃然纸上了。
我想,拥有智慧大脑的人形机器人,固然是具身智能的一种形态。但是具身智能并不局限于“AI+人形机器人”这一范畴,它同样涵盖“AI+通用机器人结构”、“AI+高端制造装备”等多种形式。
自1950年图灵在其论文《计算机器与智能》中提出“非具身或具身智能”概念以来,具身智能这一概念逐渐被广义理解为:智能系统通过物理实体(机器人、无人机、无人车、制造装备甚至各类终端设备等)与环境互动时所展现的一种智能能力。简单理解,具身智能是生成式AIGC与机器人RT的融合,通过人机或环境交互,基于底层模型与数据驱动的离线或在线感知学习、认知判断、智能控制等技术,提升智能机器在本体层、环境层、任务层的人机交互、决策推理及操作行动等智能化水平,并增强其适应不同环境的泛化能力。
而具身智能突出的特点主要体现在两个方面:一方面,它具备人机交互、自然语言理解与认知能力,通过机器学习或大模型,让机器按照人的意图,将目标分解系列化的子目标或思维链,以完成相应的复杂任务;另一方面,具身智能可通过感知、认知、决策,与时变环境及对象进行实时校准互动,在非结构化的复杂环境中,它能够实时在线学习、识辨或修正补偿时变环境。由此看来,只要把感知、学习、判断和认知能力有效嵌入到任何形态的硬件中,都可以被视为广义上的具身智能。
将具身智能落地到服务、制造、商务等多元化的场景中,面对错综复杂的动态环境,我们进而发现具身智能以其自主感知、快速决策、行动与学习迭代的技术能力,展现出前所未有的灵活性和适应性潜力。这不仅有望为传统工业带来新一轮革命性影响,更是未来社会的长期刚性需求。
在这个“布局未来”的过程中,具身智能领域的企业百花齐放,他们各自在奋斗与攻克中展现独特风采。有的专注于人形机器人的研发,力求在人机交互、情感识别等方面取得突破;有的则深耕于高端制造装备领域,通过优化算法、提升精度和效率,推动制造业的智能化升级。
从无人快递车,到无人外卖车,再到如今的萝卜快跑;从智能家电,到智能家居,再到智慧城市;从智能装备,到智能制造,再到柔性供应链……实际上,具身智能已经潜移默化的深入到人类社会的方方面面。
基于上述分析,我愈发认定:具身智能将成为未来新质生产力的一个重要引擎。其将AIGC+RT两者结合,极大的推动了机器人、制造装备、智能终端以及其大脑的进一步进化、泛化与迁移,有望将“一脑多机”与“一脑多型”的技术创想变为现实。我们相信,语言“认知”世界,具身智能工具“改造”世界!它终将改变人、工具、社会三者之间的生产关系,极大提高生产力效率,这一变革不仅对促进我国实体经济的高质量增长发挥作用,更将对未来国际产业竞争格局与我国综合新质生产力的发展产生重大影响。
具身智能百花齐放,
创新的热点方向又有哪些?
大脑--通用机器人结构:人形机器人/模块化复合型机器人;数据模拟器与制造工厂--复杂操作分解与机器人动作库的仿真生成数据集;端到端算力芯片--低功耗专用小模型GPU与编译器。 小脑--运动、操作、技能等多品类小脑,AI不只一个,包括实时专业技能操作、复杂智能行为分解与控制、实时安全评测等小模型控制器,这些模型将广泛应用于焊接、清洁、搬运、抛光、打磨、炒菜、保健等领域,以闭源小模型或轻量化模型的形式存在,相关关键训练数据保密,确保模型的独特性与安全性。 空间智能--在空间智能领域,通过视觉、听觉、触觉等多维感知对空间信息的获取、识别、语义理解与表达,并结合Agent代理,将提升机器人的智能交互能力;脑机接口--该领域的在生理解剖学的研究、脑机大模型的构建、微针电极传感器的应用,以及植入式机器人的开发,有望为未来的具身智能开辟新路径。 肢体与上游核心部件--深入这些方向的正向设计,将有效增强机器人的环境适应性与操作灵活性,具体包括高动态、高精度、高负载的电机驱动与丝杠减速器一体化单元,刚柔耦合新材料灵巧手,新型人工肌肉与电子皮肤,低成本生物传感器等。 垂直应用App--工业L2/L3智能工作站,商务L3/L4智能复合型机器人,消费家政L4/L5通用机器人或智能体;免编程与安全算法--编译器与隐私计算等;数据服务--垂直模型专用技能数据服务公司;运营服务--“劳动”租赁派遣公司;制造技术--3D打印,复合材料,热气涨技术,光聚合加工,高效快充电池技术等。法律--就业、隐私、伦理、道德、法律等。
迷雾重重:具身智能的挑战性问题
挑战性问题一:什么是人形机器人的最佳结构?如何评价人形机器人的能力?未来会不会像马斯克所言:人形机器人市场将会有100亿甚至200亿台套?以全电驱动为主的人形机器人,其相应供应链该如何迭代?有没有更好的驱动模式及其核心部件?
挑战性问题二:我们能否找到具身智能的Scaling Law?是否存在统一的机器人或具身智能基础大模型?使具身智能工具能够像人类一样拥有灵巧运动、感知识别、认知推理等多方面能力。
挑战性问题三:为什么中国机器人或具身智能出现了明显的“内卷”现象?就在几天前,某公司以3.85万的低价开售人形机器人,在缺乏应用场景,尚未建立起标准化的供应链以帮助实现量产的情况下,行业再现“价格屠夫”。人们不禁要问:未来,机器人/具身智能的前景究竟如何?
冷静思考,坚定前行:
开启科技创新的加速之旅
如今,科技创新的浪潮以前所未有的速度席卷全球,显著缩短了从科研探索到商业应用的周期。昔日需数十载方能达成的技术飞跃,如今几年间甚至更短便能触手可及。
科技创新的加速,不仅体现在时间维度上,更体现在探索的深度与覆盖的广度上。当多学科交叉融合成为新常态,基础科学、工程技术、经济学及人文社科等领域的深度融合,构建了一个多元共生、相互推动的创新生态,驱动着科技与产业不断向前跃进。新技术、新业态、新模式不断涌现,不仅为传统产业注入创新活力,同时也催生了一批高技术含量、高附加值、高成长性的新兴产业,成为推动未来经济发展的新引擎。