温馨提示:点击下方图片,查看公众号“Robot猎场备忘录”运营团队(12月整理)原创报告(共195页)
正文:
继人形机器人、具身智能大模型(机器人“大脑”),AI陪伴机器人成为2024年具身智能赛道最后收益者。
相较于难落地的人形机器人,具身智能大模型加持下的的陪伴机器人,更有望率先进入ToC家庭场景。
近两年,AI陪伴产业发展迅猛,是人工智能领域当下成长最快速增长的赛道之一。根据Precision Reports的数据显示,2023年全球陪伴机器人市场规模预估为920,311万美元市场规模,未来5年年复合增长率预计达到25.68%;随着具身智能技术发展,今年四季度(尤其12月),AI陪伴机器人赛道迎来一波融资潮和科技大厂背景技术大牛和高管创业潮。
12月30日,由哈工大机器人研究所博士、连续创业者李蕴洲(博士)于2021年12月成立的AI陪伴机器人公司[深圳玄源科技有限公司](X-ORIGIN-AI)完成数千万元天使轮融资,本轮融资由阿尔法公社领投;据媒体透露,公司首款AI陪伴机器人产品已经研发完成,并已实现量产,预计将于2025年3月上线海外众筹平台Kickstarter,也将同步开启国内市场。
X-ORIGIN-AI首款机器人产品图
12月23日,由[追觅科技]原中国区执行总裁郭人杰继于12月19成立具身智能机器人公司【苏州乐享智能科技有限公司】完成首轮融资,投资方包括IDG资本、经纬创投、真格基金和Monolith等,投后估值约5亿元(有媒体报道:公司在首轮融资时,有多家机构给出投资 offer,为更快敲定份额,有投资方主动抬高估值);公司处于创业早期,目前公司仅透露后续产品定位为消费级机器人,但没有具体细分(陪伴机器人、ToC场景人形机器人等);小编估计大概率为陪伴机器人。
12月,由OpenAI前资深算法负责人江旭于2024年8月创建机器人公司【Light Robotics】(亮源新创)也正式进入大众视野,公司致力于打造To C的具身智能陪伴机器人;目前公司已在深圳、新加坡(总部)设有办公室,团队搭建中。
12月,AI陪伴机器人研发商【可触未来(东莞市)智能硬件有限公司】(TangibleFuture)完成数百万元天使轮融资,旗下首款机器人LOOI已经完成首批众筹产品发货,并在本月完成主流市场的现货交付。
LOOI机器人
11月,原小鹏汽车内饰设计负责人孙兆治创立的AI陪伴机器人公司【上海珞博智能科技有限公司】刚完成约千万元天使轮融资;据介绍,公司目前已完成前三轮原型机的设计开发,首款产品定位为“AI潮玩”,并预计将于明年发布和量产。
珞博智能的陪伴机器人产品demo。
此外,优必选、科大讯飞、深兰科技也已布局家庭场景的陪伴机器人。在海外市场,亦有初创公司瞄准陪伴机器人市场。
目前市面上的AI玩具、AI桌面机器人等产品功能较为同质化,都是以对话方式调用大模型,绝大多数仅仅是大模型“套壳”,无法提供真正的“情绪价值”和产生真正意义上的“陪伴”,可以理解为会动的智能音箱。
因此提到AI陪伴机器人,就不得不提到具身智能大模型;大模型决定了人形机器人泛化能力,是现阶段人形机器人商业化核心壁垒,同样也是AI陪伴机器人商业化核心壁垒。
具身智能领域初创公司主要分三种:专注于具身智能大模型、人形机器人整机和两者同时涉及;全球范围内,专注于人形机器人本体初创公司最多;具身智能大模型因涉及芯片、软件、AI算法,资金投入远高于人形机器人本体,目前更多是科技大厂间博弈。
国外科技大厂早已布局具身智能大模型方向研究(如谷歌、英伟达等);现阶段来看,国内相较于国外,在具身智能大模型具身智能领域的差距仍然较大,无论是大语言模型、多模态模型还是仿真器,这些关键技术主要掌握在OpenAI、英伟达、特斯拉等海外巨头手中;值的注意的是,国内大厂并没有针对人形机器人推出专门大模型,可以理解为目前国内没有一个团队真正从机器人出发,去做适配具身智能的大模型。目前绝大多数人形机器人本体初创企业走分层端到端大模型路线,依托科技大厂多模态通用大模型赋能,自研操作小模型;并且大多数人形本体初创公司在AI层面投入极少。
接下来,小编将详细盘点具身智能大模型领域,全球科技巨头/大厂(谷歌、英伟达、微软、OpenAI、特斯拉、华为、阿里、腾讯等)现阶段产品进展、全球初创公司(PI、Skild AI、Covariant、有鹿机器人、X Square等)介绍及产品进展、人形机机器人本体厂家与科技巨头/大厂合作现状:
谷歌:从Saycan到RT-H,软件领军者,步步为营,模型高速迭代
2017 年,提出的Transformer架构,是大语言模型(LLM)的最底层的基座,是大模型的基础;
2022年4月,谷歌推出Say-can模型;将任务拆分成两个部分,先是“Say”,之后是“Can”;Say-can模型首次引入大语言模型帮助理解任务,选择合适的任务规划;但机器人的动作仍然是预设好的,因此只能完成特定任务;底层技能通用性和泛用性较差,只能输出高级指令。
2022年12月,谷歌推出了动作控制的端到端模型RT-1(Robotics Transformer 1);RT-1模型,将任务通过Saycan拆分成具体的任务,然后使用RT-1去执行;本质上是模仿学习,无法超越数据集的遥操作,严格意义上不是“大模型”;
2023年3月6日,谷歌推出多模态视觉语言具身大模型(VLM)PaLM-E;该模型让机器人能够接收持续的多模态的输入,并具有一定的推理能力,具备5620亿的参数模型,但本质为大语言模型,对于动作的完成和指导较弱;
2023 年7月28日,谷歌推出全球首个控制机器人视觉-语言-动作(VLA)大模型RT-2 (Robotics Transformer2),可以从网络和机器人数据中学习,并将这些知识转化为机器人控制的通用指令。除了泛化能力之外,RT-2还具备推理(Reasoning)、符号理解(Symbol understanding)和人类识别(Human recognition能力。
2023年10月,谷歌推出RT-X,具身智能大数据集Open X加持的RT-2与RT-1(分别为 RT-1-X 和 RT-2-X),创造了新的具身智能大数据集OpenX,并用此数据集训练前述的机器人模型RT-1和RT-2得到新的模型RT-1-X与RT-2-X;
2024年1月,谷歌研究成果三连发数据收集的AutoRT系统、提高决策深度的SARA-RT 和提高泛化能力的RT-Trajectory 模型。
2024年3月,谷歌推出RT-H;它能通过将复杂任务分解成简单的语言指令,再将这些指令转化为机器人行动,来提高任务执行的准确性和学习效率。
... ... ...
本文仅展示极少部分,接下来,小编将详细盘点具身智能大模型领域,全球科技巨头/大厂(谷歌、英伟达、微软、OpenAI、华为、阿里、腾讯、字节等)现阶段产品进展、全球初创公司(PI、Skild AI、Covariant、有鹿机器人、X Square等)介绍及产品进展、人形机机器人本体厂家与科技巨头/大厂合作现状。
... ... ...
本文内容仅展示一部分,更多详细解读,扫码加入星球,查看完整版文章:[原创]具身智能大模型赛道:科技巨头技术进展、初创公司盘点,第一款“机器人通用大脑”花落谁家(文字5W+),并深度了解“具身智能&人形机器人”赛道
近期精选文章:
1、黄仁勋:人形机器人在内,仅有三种机器人有望实现大规模生产!马斯克:YES!!
5、马斯克:相较于软件算法,本体结构设计才是人形机器人规模量产关键!!
9、ToB、ToC or ToG,全球人形机器人产品优选落地场景梳理!
11、人形机器人构型之争:五指灵巧手 or 夹爪,双足 or 轮式