温馨提示:点击下方图片,查看公众号“Robot猎场备忘录”运营团队(12月整理)原创报告(共195页)
正文:
率先实现端到端具身大模型商业化、国内唯一具备全栈AI系统能力的具身智能领域初创公司【智平方】于2025年1月7日完成数亿元 Pre-A轮战略融资,由达晨财智与敦鸿资产联合领投,基石资本跟投,打响2025年具身智能大模型领域初创公司融资第一枪。
【智平方】(公司全称:智平方(深圳)科技有限公司)于2023年4月深圳成立的RoboService公司,致力于研发生产通用智能具身终端,为千行百业、千家万户提供全场景、高可靠的服务;是全球最早提出并系统性研发物理世界AGI,把大模型从数字世界推广到物理世界的科技企业。
创始团队(国内唯一具备全栈AI系统能力的具身智能创业团队):
(创始人兼CEO)郭彦东博士:国家级创新领军专家(未来智能终端方向)、本硕士毕业于北京邮电大学,博士毕业于美国普渡大学电子与计算机工程学院(ECE),师从AI领域的美国工程院院士Jan P. Allebach和Charles A. Bouman;毕业后,加入美国微软总部担任研究员;2018年,加入小鹏汽车,担任首席科学家,负责AI视觉与感知的研发;2020年,加入OPPO,出任首席科学家,专注于智能感知和交互技术;拥有硬核AI研发与智能硬件行业的复合背景,产业经验横跨中美。
公司还汇聚了AI、机器人和智能终端领域的顶尖人才,核心成员来自微软、小鹏、OPPO、Momenta等国际领先企业,以及清华大学、北京大学、中科院、加州伯克利大学、哥伦比亚大学等知名学府。
核心技术:
智平方的国产具身大模型AI2R Brain,在通用空间感知、泛化操作成功率上大幅超越硅谷头部模型。
2023年初,公司便基于多年knowhow积累,发力空间感知基础模型的研发,率先突破行业瓶颈;(2024年4月,李飞飞教授成立World Labs 并聚焦空间智能研发)
2024年6月,智平方与北京大学合作推出了针对操作机器人的 RoboMamba 端到端具身大模型。这一模型不仅比 PI 的 OpenVLA 更早公开应用,还在未见任务(Unseen Task)的泛化能力上显著超越 Google 的 RT 系列模型。
在端到端布局方面,郭彦东博士认为,以智平方AI2R Brain为代表的空间感知基础模型与语言模型串接的架构,以及端到端的数据驱动范式,将成为推动具身智能技术突破的关键路径,从而实现对物理环境适应、人机交互与任务执行的高泛化性。
核心产品:
商业化进展:
据官方介绍,公司已签约多家国内外一线车企、高端制造企业及互联网巨头,获得大量商业订单,并于2024年实现数千万确认收入,成为国内最早进行商业推广的通用智能机器人公司。
小编视角:作为国内少有的具身智能大模型和人形本体同时布局的具身智能领域创企,并已初步实现商业化,未来可期。
目前全球范围内,具身智能大模型赛道有两家独角兽:[Physical Intelligence]和[Skild AI]。
Physical Intelligence(简称 PI或 π )拥有全球具身智能领域“最强创始团队,由UC Berkley、斯坦福大学教授团队和谷歌科学家等科研和技术大牛于2024年3月成立,公司致力于创建可以为各种机器人和机器增添高级智能的软件,最终目标是创建一种作为通用机器人系统的AI模型(机器人通用大脑)。
公司成立仅一个月时,官网还没有建(至今也没有建)就获得来自于Thrive Capital 、Open AI、红杉资本、Greenoaks Capital Parners、Lux Captital和Khosla Ventures7000 万美元融资,投后估值4亿美金;11月5日,完成4亿美元新一轮融资,本轮投资由亚马逊创始人杰夫·贝索斯、风险投资公司Thrive Capital和Lux Capital领投,OpenAI、Redpoint Ventures和Bond等参投(注10月末,外媒报道,公司计划筹集3亿美元),投后估值约为24亿美元; 同时取代另外一家机器人通用大模型初创公司【Skild AI】,成为具身智能赛道初创企业最快晋升独角兽企业(Skild AI于2023年5月成立,今年7月份完成3亿美元A轮融资,投后估值高达15亿美元);亚马逊创始人杰夫·贝索斯、红杉资本是两家公司共同投资方。
2024年10月31发布成立以来首个机器人通用的机器人基础模型π0( pi-zero);11月15日,国内“腾讯系”知名人形机器人初创企业【星尘智能】发布搭载π0( pi-zero)的旗下轮式仿生人形机器人Astribot S1最新视频,“最强”家庭机器人来了!!
机器人基础模型π0被称为一种用于通用机器人控制的视觉-语言-动作流模型,参数量只有3B,就能控制机器人,帮你搞定各种家务。
具体视频展示:
据官方介绍:π0与 LLM 不同,它跨越图像、文本和动作,并通过训练机器人的具身经验来获得物理智能,通过学习新颖的架构直接输出低级运动命令;它可以控制各种不同的机器人,并且可以提示执行所需的任务,也可以进行微调以使其专门用于具有挑战性的应用场景。
注:Paper(原版以及翻译)已上传至“机器人头条”知识星球,可加入星球查看
π0模型的核心技术点包括以下几个方面(仅列举部分):
π0模型基于预训练的视觉-语言模型(VLM),这使得它能够继承互联网规模的语义知识。
模型使用流匹配技术(Flow Matching)来生成连续的动作分布,这使得它能够处理高频率的动作执行,适合于灵巧任务;为了使模型能够控制机器人产生连续动作,π0引入了一个专门的动作专家(Action Expert)模块,该模块能够通过流匹配产生精细的、连续的动作指令。
π0模型通过结合多种机器人类型的数据进行训练,这使得模型能够适应不同的机器人配置和动作表示,包括单臂、双臂系统以及移动操纵器。
模型采用预训练后微调的训练方法,先在大型多样化语料库上预训练,然后在更狭窄、更精细策划的数据上微调,以诱导期望的行为模式,且展示了良好的零样本控制能力(Zero-Shot Control)。
多模态输入和混合专家模型(Mixture of Experts):π0模型采用了混合专家架构,其中不同的“专家”处理不同的输入类型,如图像、文本和机器人状态。
Pi可称为最强创始团队,没有素人,全是行业大牛
左到右,依次是Sergey Levine、Chelsea Finn、Karol Hausman
联合创始人Chelsea Finn:现任斯坦福计算机科学与电气工程系助理教授(ALOHA家务机器人项目导师),重点研究通过学习和交互来发展机器人等智能体的广泛智能行为,谷歌学术论文引用数超4.7万;曾在谷歌大脑担任过5年研究科学家,开发机器人深度预测模型;MIT 大学毕业后在伯克利取得博士学位,博士导师则是Sergey Levine
联合创始人兼CEO Karol Hausman:之前担任谷歌大脑的高级研究科学家,同时也是斯坦福大学的兼职教授;因 “对可扩展的机器人学习算法做出重大贡献”,获得过 2023 IEEE 奖项;
联合创始人Sergey Levine:现任UC Berkley电气工程与计算机科学系助理教授,专注于研究让自主智能体通过学习获得复杂行为的通用算法,集中在机器学习决策和控制领域;并开发端到端深度神经网络训练策略,曾带领团队与谷歌联合开发 RT-X 机器人项目,被认为是强化学习领域的领军人物之一。
联合创始人:Brian Ichter:先后在谷歌大脑和谷歌DeepMind的机器人团队任职;
联合创始人Lachy Groom :支付公司 Stripe 前高管、著名科技投资人
Suraj Nair:丰田研究院ML研究团队的研究科学家,从事ML、机器人和CV交叉领域的工作;
Quan Vuong:加州大学圣地亚哥分校四年级博士生;
Skild AI于2023年5月匹兹堡成立,由两位前美国卡内基梅隆大学教授 Abhinav Gupta 和 Deepak Pathak共同创立,他们同为印度裔、也都曾是 Meta 的 AI 研究人员创立,公司长期目标是开发扎根于物理世界的通用人工智能 (AGI),以打造一个通用、灵活、智能的人形机器人产品(“通用机器人大脑”)。
2024年7月9日,Skild AI宣布完成了总额3亿美元A 轮融资,投后估值高达15亿美元,成为当时估值最高的机器人具身智能大模型初创公司。
Skild AI设想了一个类似 OpenAI 的未来:通过微调,就可以在 Skild 基础模型上构建不同的用例和产品;这正是他们颠覆机器人行业的方式。最终,他们希望抵达机器人 AGI,人们可以在物理世界中,与之互动。
核心产品:Skild Brain
团队构成:公司由两位前美国卡内基梅隆大学教授 Abhinav Gupta 和 Deepak Pathak共同创立,他们同为印度裔、也都曾是 Meta 的 AI 研究人员;团队主要来自 Meta、特斯拉、英伟达、亚马逊、谷歌以及卡内基梅隆大学、斯坦福大学、加州大学伯克利分校和UIUC等名校。
构建「通用的」机器人基础模型| 图片来源:Skild AI
技术层面:Skild AI正在构建一个共享的通用大脑,为机器人提供一种基础模型,作为“通用大脑”;Skild Brain是一个可扩展的机器人基础模型,具备使用性和灵活性的能力,能够使机器人在不同硬件、场景、任务之间自适应。
Skill AI团队透露,相比竞争对手,其数据点至少多出1000倍,这一优势使得Skill AI的模型能够更好地理解和适应复杂多变的物理世界。
产品进展:目前没有商业化进展。
Physical Intelligence和Skild AI巨额融资和高估值,无不体现国外资本对具身智能大模型(机器人通用大脑)重视。
人工智能和大模型技术突破性发展催生了本身具身智能浪潮,但同时大模型发展瓶颈也同样是人形机器人商业化核心壁垒;相较于上游机器人核心零部件基本成熟,软件算法进步是推动人形机器人功能提升和应用场景拓展的关键;
国外,科技大厂对具身智能大模型极其重视,并早已入局(如谷歌、英伟达等;谷歌已完成多次技术迭代,从Saycan到RT-H);国内科技大厂目前也逐步切入具身智能赛道,推出相应具身智能大模型,但目前对具身智能大模型研发投入极其有限,华为目前国内佼佼者。
目前国外人形机器人本体公司融资已经处于停滞状态,具身大模型初创公司如今备受资本青睐(如:Skild AI、Physical Intelligence、Covariant等,皆已获巨额融资);国内具身大模型初创公司重视程度虽不如人形本体公司,但目前也开始进入资本视野,已涌现出一轮融资潮(如:[星海图]完成超2亿元Pre-A轮融资以及[千寻智能]、[穹彻智能]、[自变量机器人]亿级融资,[星云智慧]、[灵初智能]千万级融资)。
小编往期文章:投具身智能大模型还是人形机器人本体,资本面临两难抉择中有提到目前全球具身智能赛道资本趋势:人形机器人本体商业化遇阻,渐渐向具身智能大模型公司(机器人通用大脑)倾斜。
小编近日已整理2024年全年全球具身智能赛道人形本体和具身大模型公司融资梳理表,明显可以看到随着时间推移具身智能大模型初创企业融资额、融资频率皆逐渐增多。
注:完整版表格,前往“机器人头条”知识星球查看
目前人形机器人本体初创企业多是依托科技大厂多模态大模型赋能,如:Figure AI旗下Figure 02和1X Technologies旗下EVE、NEO均接入OpenAl端到端的大语言-视觉(VLM)模型、Apptronik旗下Apollo接入英伟达 GR00T人形机器人通用模型、乐聚机器人旗下“夸父”接入华为盘古具身智能大模型、优必选旗下walker S接入百度文心一言大模型、星动纪元旗下“小星”系列接入阿里通义千问和智谱清言两家大模型、智元机器人多模态通用大模型用的是讯飞星火大模型(操作大模型自研)等。
... ... ...
本文仅展示极少部分,接下来,小编将详细盘点具身智能大模型领域,全球科技巨头/大厂(谷歌、英伟达、微软、OpenAI、华为、阿里、腾讯、字节等)现阶段产品进展、全球初创公司(PI、Skild AI、Covariant、有鹿机器人、X Square等)介绍及产品进展、人形机机器人本体厂家与科技巨头/大厂合作现状以及科技巨头入局人形机器人本体赛道现状。
... ... ...
本文内容仅展示一部分,更多详细解读,扫码加入星球,查看完整版文章:[原创]具身智能大模型赛道:科技巨头技术进展、初创公司盘点,第一款“机器人通用大脑”花落谁家(文字5W+),并深度了解“具身智能&人形机器人”赛道
近期精选文章:
1、黄仁勋:人形机器人在内,仅有三种机器人有望实现大规模生产!马斯克:YES!!
5、马斯克:相较于软件算法,本体结构设计才是人形机器人规模量产关键!!
9、ToB、ToC or ToG,全球人形机器人产品优选落地场景梳理!
11、人形机器人构型之争:五指灵巧手 or 夹爪,双足 or 轮式