谁能进入下一轮?具身智能「练习生」的技术储备和商业路径有何异同?

科技   2024-11-16 15:30   北京  
本文来自PRO会员通讯内容,文末关注「机器之心PRO会员」,查看更多专题解读。


近两年大量具身智能初创公司涌现,其中不乏有团队融资过亿,还有的获得了大量头部 AI 公司或科技巨头的青睐。在具身智能仍是个新领域的当下,这些创业「练习生」千帆竞发,以各自的技术理念和发展策略试图在具身智能未来破千亿的蓝海市场走得更远。

目录

01. 具身智能市场现在有多火热?

具身智能创企融资规模如何?明星「练习生」都有哪些头部资源支持?
02. 具身智能「练习生」的技术储备和路径有何异同?
谁在在走端到端路线?分层具身模型有哪些区别?「练习生」都有哪些技术储备?
03. 具身智能走到下一步还差什么?
硬件要怎么追上大脑?空间智能是必要条件?练习生
 01  具身智能市场现在有多火热?
具身智能在 2022 年被李飞飞比喻成视觉领域的一颗「北极星」,而后被认为是通往 AGI 的有效路径。以大语言模型的突破为契机,通过赋予 AI 身体,使其能够和世界交互,再将大脑升级为世界模型,让机器人能够灵活应对未见过的任务,适应工业、居家生活、医疗、养老等不同场景。这样的概念佐以技术进展让具身智能的市场规模不断膨胀,并涌现了大量的创业团队。这些具身智能「练习生」或是在机器人领域长期深耕,具有丰富的技术储备,或者在浪潮中入局,以深厚的学术背景和创新的技术成果吸引大量资本。

1、 具身智能在 2024 年成为了大模型之后的又一个科技热点,其市场规模也在不断膨胀,预估在 2035 年可达万亿。

① 以马斯克为代表,业界大部分声音认为人形是通用机器人最合适的形态,也是许多具身智能公司关注的方向。国际投资银行高盛预测,到 2035 年,人形机器人市场规模有望达到 1540 亿美元(约 1.1 万亿元人民币)。

2、在具身智能热潮下,许多头部公司均有相应布局,国内外也有大量创业公司涌现。网易数据则显示,从 2023 年至 2024 年 8 月,中国以具身智能概念创业公司就超过 50 家。

① OpenAI 投资了 Figure 和 1X,英伟达成立通用具身智能体研究 GEAR,推出通用人形机器人平台,为机器人训练构建底层基础设施。马斯克更是宣称计划于明年实现 Optimus 机器人的限量生产,2026 年实现大规模生产。

② 除了 Figure AI 和 1X,国外的明星创业公司还有 Physical Intelligence、Skild AI 等,这两家公司在 2024 年均筹集的大量资金,前者融了 4 亿美元,后者融了 3 亿美元。

③ 国内的知名创业公司有智元机器人、穹彻智能、星动纪元、银河通用等等。

3、在具身智能创业浪潮中,不乏学界的明星研究员组团创业,学术背景隐隐成为了一种通行证。

① 最具代表性的明星学者创业公司是 2024 年 3 月成立的 Physical Intelligence。该公司由 Sergey Levine、Karol Hausman、Chelsea Finn 等来自 UC Berkley、斯坦福大学教授团队和谷歌科学家等科研和技术大牛组成,刚成立就获得来自于 Thrive Capital 、Open AI、红杉资本等资方的 7000 万美元融资,11 月又获得了新一轮 4 亿美元融资。

② 另一家学术明星创业团队是斯坦福教授李飞飞成立的 World Labs。其团队创始成员均是 CV 和图形学领域的技术专家。在成立不久后完成约 1 亿美元融资,而后又在今年 9 月完成了 2.3 亿美元新一轮融资,AI 大牛 Geoffrey Hinton、Jeff Dean、谷歌前 CEO Eric Schmidt 等均有参投。

③ 国内创企中,包含穹彻智能、银河通用、星尘智能、星海图、星动纪元在内的许多具身智能「练习生」的创始人均有深厚的学术背景。

④ 有分析称,来自高校、科研机构的研究者入局创业后,形成了由教授、毕业生组成的“学院派”,而这些公司和团队成员之间,形成了以斯坦福、伯克利、清华、浙大等顶尖学府为核心节点、由教授和毕业生组成的关系网络。[17] 

4、具身智能创业公司中,许多相对较早成立的团队定位于机器人市场,但大部分公司均是在 LLM 取得突破后投身创业的新入者。

① 除了波士顿动力,相对早一批创业的具身智能创企有 1X(2014)、Covariant(2017)、宇树科技(2016)等,成立于 2003 年的特斯拉则在 2021 年宣布入局,组建人形机器人团队,后在 2022 年推出 Optimal。

② 2022 年后成立的则有 Figure AI、 PI、银河通用、智元机器人等。

 02  具身智能「练习生」的技术储备和路径有何异同?
具身智能是耦合 “本体”和“智能体”而成,能够在复杂环境中执行任务的智能系统。就如何让具身智能系统具备多模态感知、具身决策与规划和操纵执行能力,也有许多说法将这些技术分为「大脑」「小脑」乃至更细节的脑干。当下流行的构建具身智能模型的路线大体可以分成端到端和分层模型两类,但如何整合本体、智能体、数据、学习和进化架构等核心要素,各家「练习生」们的技术理念则各有特点。


 关注👇🏻「机器之心PRO会员」,前往「收件箱」查看完整解读 



👀 往期回顾 👀 

 01  微调失格?持续反向传播算法将解锁新的训练范式吗?
当前深度学习有什么根本缺陷?微调将来不存在了?Dynamic DL 是什么?反向传播算法是什么?持续学习在 LLM中有哪些进展?反向传播算法会解锁新的训练范式吗?...
 02  从卷文本到卷多模态:国内的大模型公司都在忙什么?
MLLM 和 LMM 两种不同思路,哪种更有可能实现多模态交互?未来的通用智能是否一定是多模态智能?在多模态的竞争中,AI 大模型创企、科技大厂、多模态大模型服务厂商推出的产品表现如何?在布局上,有哪些异同?为什么说虽然产品数据表现亮眼,但距离实现 PMF 还仍有很长的一段路要走?...
 03  Scaling 范式变了?Self-Play 还值得 All In 吗?
OpenAI 的 o1 模型有质的突破吗?Scaling Law 的范式要变了吗?Self-Play 在新范式中重要吗?传统 Self-Play 技术发展如何?Self-Play+LLM 已经能训出更强的模型了吗?...
 04  Machine Psychology,解构 LLM 还是心理学更靠谱吗?
什么是 Machine Psychology?为什么要做 Machine Psychology?做 Machine Psychology 有哪些路线?哪些心理学理论可以用于 LLMs 研究?Machine Psychology 要如何应用?Machine Psychology 下一步要怎么走?...


更多往期专题解读内容,关注「机器之心PRO会员」服务号,点击菜单栏「收件箱」查看。

机器之心
专业的人工智能媒体和产业服务平台
 最新文章