正文:
目前全球范围内,具身智能大模型赛道有两家独角兽:[Physical Intelligence]和[Skild AI],马逊创始人杰夫·贝索斯、红杉资本是两家公司共同投资方。
2025年1月29日,据彭博社等多家海外媒体报道,具身智能大模型领域初创公司【Skild AI】有望获得软银集团(SoftBank Group Corp.)领投的新一轮5亿美元融资,投后估值将达到40亿美元(约290亿元人民币),目前谈判仍处于初期阶段。
若本次融资成功,[Skild AI]将重新成为估值最高具身智能大模型初创公司(2024年11月5日,机器人通用大模型初创公司[Physical Intelligence]完成4亿美元新一轮融资,投后估值约为24亿美元,取代[Skild AI]15亿估值成为估值最高具身智能大模型初创公司)。
接下来小编将详细介绍[Physical Intelligence]和[Skild AI]两家公司。
[Skild AI]于2023年5月匹兹堡成立,由两位前美国卡内基梅隆大学教授 Abhinav Gupta 和 Deepak Pathak共同创立,他们同为印度裔、也都曾是 Meta 的 AI 研究人员创立,公司长期目标是开发扎根于物理世界的通用人工智能 (AGI),以打造一个通用、灵活、智能的人形机器人产品(“通用机器人大脑”)。
2024年7月9日,Skild AI宣布完成了总额3亿美元A 轮融资,投后估值高达15亿美元,成为当时估值最高的机器人具身智能大模型初创公司(后续被Physical Intelligence打破)。
Skild AI设想了一个类似 OpenAI 的未来:通过微调,就可以在 Skild 基础模型上构建不同的用例和产品;这正是他们颠覆机器人行业的方式。最终,他们希望抵达机器人 AGI,人们可以在物理世界中,与之互动。
核心产品:Skild Brain
团队构成:公司由两位前美国卡内基梅隆大学教授 Abhinav Gupta 和 Deepak Pathak共同创立,他们同为印度裔、也都曾是 Meta 的 AI 研究人员;团队主要来自 Meta、特斯拉、英伟达、亚马逊、谷歌以及卡内基梅隆大学、斯坦福大学、加州大学伯克利分校和UIUC等名校。
构建「通用的」机器人基础模型| 图片来源:Skild AI
技术层面:Skild AI正在构建一个共享的通用大脑,为机器人提供一种基础模型,作为“通用大脑”;Skild Brain是一个可扩展的机器人基础模型,具备使用性和灵活性的能力,能够使机器人在不同硬件、场景、任务之间自适应。
这个“通用大脑”可以与包括人形机器人在内的任何类型机器人进行集成,以通用AI技术使机器人执行动作,从而在不同场景中处理各种任务,可以在家庭和工业环境中灵巧地操纵物体,可以在任何物理环境中导航。
Skill AI团队透露,相比竞争对手,其数据点至少多出1000倍,这一优势使得Skild AI的模型能够更好地理解和适应复杂多变的物理世界。
公司采用多种数据收集技术,既有一些常规操作,也有两位创始人多年研究工作中开发的专有技术:
让人类远程操作机器人,然后收集这些操作数据;
让机器人执行随机任务,试错学习,并记录这些丰富的数据信息;
利用大量公共视频训练模型;
从模拟环境中收集的数专有技术;
2022 年,两位创始人通过各种机器学习和不同源数据中学习等手段,将从不同源数据中学习(如从视频、基于好奇心、真实世界学习)整合到一个连贯系统中,大大提高了模型的学习效率和适应能力。
产品进展:目前没有商业化进展。
融资层面:2024年7月9日,具身智能领域初创公司Skild AI宣布,公司完成了总额3亿美元A 轮融资,投后估值高达15亿美元;本轮融资由众多科技巨头、顶级风险投资公司与学术机构共同参与,包括 Lightspeed Venture Partners(领投)、Coatue(领投)、软银集团和杰夫·贝索斯的 Bezos Expeditions,Felicis Ventures、红杉资本、Menlo Ventures、General Catalyst、CRV、亚马逊、SV Angel 和卡内基梅隆大学等。
[Physical Intelligence](简称 PI或 π )拥有全球具身智能领域“最强创始团队,由UC Berkley、斯坦福大学教授团队和谷歌科学家等科研和技术大牛于2024年3月成立,公司致力于创建可以为各种机器人和机器增添高级智能的软件,最终目标是创建一种作为通用机器人系统的AI模型(机器人通用大脑)。
公司成立仅一个月时,官网还没有建(至今也没有建)就获得来自于Thrive Capital 、Open AI、红杉资本、Greenoaks Capital Parners、Lux Captital和Khosla Ventures7000 万美元融资,投后估值4亿美金;2024年11月5日,完成4亿美元新一轮融资,本轮投资由亚马逊创始人杰夫·贝索斯、风险投资公司Thrive Capital和Lux Capital领投,OpenAI、Redpoint Ventures和Bond等参投,投后估值约为24亿美元; 同时取代[Skild AI],成为估值最高具身智能大模型赛道初创企业。
2024年10月31发布成立以来首个机器人通用的机器人基础模型π0( pi-zero);11月15日,国内“腾讯系”知名人形机器人初创企业【星尘智能】发布搭载π0( pi-zero)的旗下轮式仿生人形机器人Astribot S1最新视频,“最强”家庭机器人来了!!
机器人基础模型π0被称为一种用于通用机器人控制的视觉-语言-动作流模型,参数量只有3B,就能控制机器人,帮你搞定各种家务。
具体视频展示:
据官方介绍:π0与 LLM 不同,它跨越图像、文本和动作,并通过训练机器人的具身经验来获得物理智能,通过学习新颖的架构直接输出低级运动命令;它可以控制各种不同的机器人,并且可以提示执行所需的任务,也可以进行微调以使其专门用于具有挑战性的应用场景。
注:Paper(原版以及翻译)已上传至“机器人头条”知识星球,可加入星球查看
π0模型的核心技术点包括以下几个方面(仅列举部分):
π0模型基于预训练的视觉-语言模型(VLM),这使得它能够继承互联网规模的语义知识。
模型使用流匹配技术(Flow Matching)来生成连续的动作分布,这使得它能够处理高频率的动作执行,适合于灵巧任务;为了使模型能够控制机器人产生连续动作,π0引入了一个专门的动作专家(Action Expert)模块,该模块能够通过流匹配产生精细的、连续的动作指令。
π0模型通过结合多种机器人类型的数据进行训练,这使得模型能够适应不同的机器人配置和动作表示,包括单臂、双臂系统以及移动操纵器。
模型采用预训练后微调的训练方法,先在大型多样化语料库上预训练,然后在更狭窄、更精细策划的数据上微调,以诱导期望的行为模式,且展示了良好的零样本控制能力(Zero-Shot Control)。
多模态输入和混合专家模型(Mixture of Experts):π0模型采用了混合专家架构,其中不同的“专家”处理不同的输入类型,如图像、文本和机器人状态。
Pi可称为最强创始团队,没有素人,全是行业大牛
左到右,依次是Sergey Levine、Chelsea Finn、Karol Hausman
联合创始人Chelsea Finn:现任斯坦福计算机科学与电气工程系助理教授(ALOHA家务机器人项目导师),重点研究通过学习和交互来发展机器人等智能体的广泛智能行为,谷歌学术论文引用数超4.7万;曾在谷歌大脑担任过5年研究科学家,开发机器人深度预测模型;MIT 大学毕业后在伯克利取得博士学位,博士导师则是Sergey Levine
联合创始人兼CEO Karol Hausman:之前担任谷歌大脑的高级研究科学家,同时也是斯坦福大学的兼职教授;因 “对可扩展的机器人学习算法做出重大贡献”,获得过 2023 IEEE 奖项;
联合创始人Sergey Levine:现任UC Berkley电气工程与计算机科学系助理教授,专注于研究让自主智能体通过学习获得复杂行为的通用算法,集中在机器学习决策和控制领域;并开发端到端深度神经网络训练策略,曾带领团队与谷歌联合开发 RT-X 机器人项目,被认为是强化学习领域的领军人物之一。
联合创始人:Brian Ichter:先后在谷歌大脑和谷歌DeepMind的机器人团队任职;
联合创始人Lachy Groom :支付公司 Stripe 前高管、著名科技投资人
Suraj Nair:丰田研究院ML研究团队的研究科学家,从事ML、机器人和CV交叉领域的工作;
Quan Vuong:加州大学圣地亚哥分校四年级博士生;
Physical Intelligence和Skild AI巨额融资和高估值,无不体现国外资本对具身智能大模型(机器人通用大脑)重视。
人工智能和大模型技术突破性发展催生了本身具身智能浪潮,但同时大模型发展瓶颈也同样是人形机器人商业化核心壁垒;相较于上游机器人核心零部件基本成熟,软件算法进步是推动人形机器人功能提升和应用场景拓展的关键。
全球具身智能大模型(机器人通用“大脑”)公司背景大体可分为:科技大厂(英伟达、OpenAI等)和科研院校背景创业团队(Physical Intelligence、Skild AI等)。
国外科技大厂对具身智能大模型极其重视,并早已入局(如谷歌、英伟达等;谷歌已完成多次技术迭代,从Saycan到RT-H);国内科技大厂重视程度远不如国外且入局较晚,目前也逐步切入具身智能赛道,更多以对外投资为主,内部对具身智能大模型研发投入极其有限,国内大厂并没有针对人形机器人推出专门大模型。最终结果,目前国内外在具身智能基础模型方面差距仍然较大,无论是大语言模型、多模态模型还是仿真器,这些关键技术主要掌握在OpenAI、英伟达、特斯拉等海外巨头手中。目前人形机器人本体初创企业在大脑层面投入很少,多是依托科技大厂多模态大模型赋能。
目前国外人形机器人本体公司融资已经处于停滞状态,具身大模型初创公司如今备受资本青睐(如:Skild AI、Physical Intelligence、Covariant等,皆已获巨额融资);国内具身大模型初创公司重视程度虽不如人形本体公司,但目前也开始进入资本视野,已涌现出一轮融资潮。
... ... ...
本文仅展示极少部分,接下来,小编将详细盘点具身智能大模型领域,全球初创公司(PI、Skild AI、Covariant、有鹿机器人、X Square等)介绍及产品进展、全球科技巨头/大厂(谷歌、英伟达、微软、OpenAI、华为、阿里、腾讯、字节等)现阶段产品进展、人形机机器人本体厂家与科技巨头/大厂合作现状以及科技巨头入局人形机器人本体赛道现状。
... ... ...
本文内容仅展示一部分,更多详细解读,扫码加入星球,查看完整版文章:[原创]具身智能大模型赛道:科技巨头技术进展、初创公司盘点,第一款“机器人通用大脑”花落谁家(文字6W+),并深度了解“具身智能&人形机器人”赛道
近期精选文章:
1、马斯克、黄仁勋共同“打响”2025年全球人形机器人商业化第一枪!!
6、马斯克:相较于软件算法,本体结构设计才是人形机器人规模量产关键!!
8、大厂高管疯狂涌入、爆火CES,具身智能陪伴机器人赛道迎来“爆发期”!!
10、ToB、ToC or ToG,全球人形机器人产品优选落地场景梳理!
11、人形机器人构型之争:五指灵巧手 or 夹爪,双足 or 轮式