抛弃「英伟达」,牵手「谷歌」,知名人形机器人公司全力加速产品迭代!

科技   2024-12-24 13:44   山东  

温馨提示点击下方图片,查看公众号“Robot猎场备忘录”运营团队(12月整理)原创报告(共195页)

说明:欢迎约稿、刊例合作、行业人士交流行业交流记得先加入“机器人头条”知识星球,后添加(微信号:lietou100w)微信,备注“称呼+所在公司+职位”或者“已加入星球”(非备注,不添加);若有侵权请联系编辑运营(微信:Anna_J100)删除,若转载请注明出处;
——

正文:

12月20日,知名人形机器人公司【Apptronik宣布:将与 【Google DeepMind】携手 ,针对动态现实环境的复杂作业挑战,共同研发新一代人形机器人;此次合作将结合谷歌的尖端 AI 技术与 Apptronik 的成熟机器人硬件,进一步提升人形机器人的功能性和安全性,让其能够胜任现实世界中的复杂任务。
Apptronik 创始人兼CEO Jeff Cardenas 表示:“通过结合 Apptronik 的尖端机器人平台与谷歌 DeepMind 的 AI 专业知识,我们正在创造智能、多功能且安全的机器人,这些机器人将变革行业并改善生活。
值得注意的是,Apptronik是英伟达合作伙伴之一,旗下人形机器人Apollo已接入英伟达 GR00T人形机器人通用模型;今年3月,公司CEO携Apollo完成综艺首秀,并展示Apollo最新进展(对话交流、跳舞样样通);而此次牵手谷歌,也同时意味着将放弃英伟达。
[Apptronik]于2016年从德克萨斯大学奥斯汀分校(University of Texas at Austin)的Human Centered Robotics Lab分拆出来;在实验室期间,该团队被选中在2012年至2013年的DARPA机器人挑战赛期间为NASA人形机器人Valkyrie工作;2023年9月,Apptronik推出最新的人形机器人设计Apollo。

Apollo被设计优先用于替代仓库、工厂等场所中的简单辅助工作,最终将扩展到建筑、油气、电子产品制造、零售、家庭送货、老年护理等无数领域,Apptronik公司宣称Apollo是“第一个专门用于友好交互、大批量制造、高承载能力和安全性的商业人形机器人”。

Apptronik还是少有的营收大于融资的人形机器人企业公司创始人Jeff Cardenas于10月份接受采访时表示:公司总共只获得了 2800 万美元的资金,到了今年春天,当他们筹集到更多资金时(4 月份,完成 3700 万美元新一轮融资),Apptronik 的收入实际上已经超过了迄今为止筹集到的收入;并透露,公司正在筹集超过 1 亿美元新一轮融资,以应对现阶段其他人形机器人本体厂商竞争。同时表示,目前已与十几家其他公司达成了协议,并与几十家客户进行合作谈判,预计将在2025年底之前准备好从试点项目转向商业发布
目前公司公开的战略合作客户有:
  • 2024年3月16日,公司宣布与梅赛德斯·奔驰已达成一项商业协议,旗下人形机器人Apollo正式进入奔驰生产线;

  • 2024年6月初,公司宣布与著名物流合同公司【GXO】建立战略合作,旗下人形机器人Apollo后续将进入仓库完成部分工作;这也是【GXO】引入的第二家人形机器人企业(第一家是Agility Robotics)。


本次合作,对于谷歌DeepMind同样意义非凡,是谷歌入局人形机器人本体赛道的开端。

特斯拉入局人形机器人赛道和人工智能、大模型技术突破性进展催生了本次具身智能浪潮;2024 年人形机器人最具突破性的进展主要体现在具身智能领域,LLM多模态大模型的发展给机器人产业带来新一轮的机遇,通用人工智能(AGI)给人形机器人带来巨大变革。

目前人形机器人本体初创企业多是依托科技大厂多模态大模型赋能,如:Figure AI旗下Figure 02和1X Technologies旗下EVE、NEO均接入OpenAl端到端的大语言-视觉(VLM)模型、Apptronik旗下Apollo以往接入英伟达 GR00T人形机器人通用模型、乐聚机器人旗下“夸父”接入华为盘古具身智能大模型、优必选旗下walker S接入百度文心一言大模型等。

全球科技大厂入局具身智能典型代表为[英伟达]和[特斯拉];[特斯拉]被称为人形机器人赛道引领者,旗下人形机器人Optimus更是行业标杆;[英伟达]从芯片和中间件层面入局,核心目的是打造底层开发生态,成为具身智能领域当之无愧最强“卖铲人”,且目前有切入人形本体制造迹象。

而这一切皆没有谷歌身影。

作为最早研究大模型的谷歌,旗下具身智能大模型产品已从Saycan迭代到RT-H,并作为曾经收购波士顿动力的早起人形本体入局者,然而却在这波具身智能浪潮中呼声很低,除了展示科研成果外,既没有与人形机器人本体厂商建立合作,又没有入局本体赛道;而本次与Apptronik合作,也意味着谷歌将正式切入人形机器人本体赛道。

接下来,小编将详细盘点具身智能大模型领域,全球科技巨头/大厂(谷歌、英伟达、微软、OpenAI、特斯拉、华为、阿里、腾讯等)现阶段产品进展、全球初创公司(PI、Skild AI、Covariant、有鹿机器人、X Square等)介绍及产品进展、人形机机器人本体厂家与科技巨头/大厂合作现状:

谷歌:从Saycan到RT-H,软件领军者,步步为营,模型高速迭代

2017 年,提出的Transformer架构,是大语言模型(LLM)的最底层的基座,是大模型的基础;

2022年4月,谷歌推出Say-can模型;将任务拆分成两个部分,先是“Say”,之后是“Can”;Say-can模型首次引入大语言模型帮助理解任务,选择合适的任务规划;但机器人的动作仍然是预设好的,因此只能完成特定任务;底层技能通用性和泛用性较差,只能输出高级指令。

2022年12月,谷歌推出了动作控制的端到端模型RT-1(Robotics Transformer 1);RT-1模型,将任务通过Saycan拆分成具体的任务,然后使用RT-1去执行;本质上是模仿学习,无法超越数据集的遥操作,严格意义上不是“大模型”;

2023年3月6日,谷歌推出多模态视觉语言具身大模型(VLM)PaLM-E该模型让机器人能够接收持续的多模态的输入,并具有一定的推理能力,具备5620亿的参数模型,但本质为大语言模型,对于动作的完成和指导较弱;

2023 年7月28日,谷歌推出全球首个控制机器人视觉-语言-动作(VLA)大模型RT-2 (Robotics Transformer2),可以从网络和机器人数据中学习,并将这些知识转化为机器人控制的通用指令。除了泛化能力之外,RT-2还具备推理(Reasoning)、符号理解(Symbol understanding)和人类识别(Human recognition能力。

2023年10月,谷歌推出RT-X,具身智能大数据集Open X加持的RT-2与RT-1(分别为 RT-1-X 和 RT-2-X),创造了新的具身智能大数据集OpenX,并用此数据集训练前述的机器人模型RT-1和RT-2得到新的模型RT-1-X与RT-2-X;

2024年1月,谷歌研究成果三连发数据收集的AutoRT系统、提高决策深度的SARA-RT 和提高泛化能力的RT-Trajectory 模型

2024年3月,谷歌推出RT-H;它能通过将复杂任务分解成简单的语言指令,再将这些指令转化为机器人行动,来提高任务执行的准确性和学习效率。


... ... ...

本文仅展示极少部分,接下来,小编将详细盘点具身智能大模型领域,全球科技巨头/大厂(谷歌、英伟达、微软、OpenAI、华为、阿里、腾讯、字节等)现阶段产品进展、全球初创公司(PI、Skild AI、Covariant、有鹿机器人、X Square等)介绍及产品进展、人形机机器人本体厂家与科技巨头/大厂合作现状。

... ... ...

本文内容仅展示一部分,更多详细解读,扫码加入星球,查看完整版文章[原创]具身智能大模型赛道:科技巨头技术进展、初创公司盘点,第一款“机器人通用大脑”花落谁家(文字5W+)并深度了解“具身智能&人形机器人”赛道


注:深度了解“具身智能&人形机器人”赛道,加入知识星球“机器人头条”交流学习


——

近期精选文章:

1、黄仁勋:人形机器人在内,仅有三种机器人有望实现大规模生产!马斯克:YES!!

2、「英伟达」整合机器人零部件供应商,进军人形机器人整机制造!

3、人形机器人创企九死一生:商业化卡点梳理

4、自动驾驶行业精英,正疯狂涌入具身智能赛道!

5马斯克:相较于软件算法,本体结构设计才是人形机器人规模量产关键!!

6、投具身智能大模型还是人形机器人本体,资本面临两难抉择

7、核心创始团队离开,「小米」、「小鹏」能否扛起国内人形机器人大旗

8、2024,留给人形机器人的时间真不多了!

9、ToB、ToC or ToG,全球人形机器人产品优选落地场景梳理!

10、知名人形机器人公司创始人离职!千台量产能否如约完成?

11、人形机器人构型之争:五指灵巧手 or 夹爪,双足 or 轮式

12、浅谈,华为入局人形机器人赛道

13、北京、上海,争当人形机器人商业化“第一城”!

猎场备忘录
Robot/Ads/Cloud/AI+行业资讯/求职/面试/备忘录/随笔…♬
 最新文章