温馨提示:点击下方图片,查看公众号“Robot猎场备忘录”运营团队(12月整理)原创报告(共195页)
正文:
风靡国外科技网络,马斯克惊叹,国内AI玩具机器人在国外“出圈”了。
近日,海外科技博主将[乐森机器人]“威震天”变形金刚机器人发布在X平台,以其流畅的全自动变形能力瞬间火遍国外科技圈;全球首富、特斯拉CEO马斯克更是该产品视频下评论:"It's awesome!(真是太牛了)";随后转发,并感慨:"Robots gonna be so crazy in the future!"
最终的结果是:马斯克的推文在短短 48 小时内就获得了近1亿的浏览量,而这款售价高达 1700 美元的玩具机器人也随之售罄。
国内消费级机器人厂商【乐森机器人】发布许久、一直不温不火的“威震天”变形金刚机器人在2024年年末火遍国外网络,终于“出圈”了。
据[乐森机器人]官网介绍,该产品搭载了36颗伺服马达、多达118颗芯片、内置六轴IMU(惯性检测单元,俗称陀螺仪)、4个驱动单元的一体式履带、超过4500个零部件、多达13种智能关节,能全自动变形,人形态还能双足行走,可进行语音操控,实现轻松交互,产品定位为亲自玩具。
【乐森机器人(深圳)有限公司】于2011年深圳成立,目前已完成7轮融资,主要应用场景是教育、编程。
Statista的数据:2023年全球玩具行业市场规模接近900亿美元;据权威机构Gartner预测,到2025年,AI驱动的玩具和娱乐设备将占全球玩具市场的15%以上。
提到AI加持玩具机器人,就不得不提另外一个赛道AI陪伴机器人;甚至具身智能大模型加持下,玩具机器人完全可以理解为陪伴机器人,同属于消费级机器人。
今年上半年,国内AI陪伴机器人研发商【可触未来(东莞市)智能硬件有限公司】(TangibleFuture)旗下首款机器人LOOI同样火遍科技网络。
LOOI机器人
自今年2月以来,LOOI机器人上线Kickstarter众筹平台,期间收获了广泛关注以及埃隆·马斯克的点赞互动,以客单价129美元的价格募集总数量超4000台,募集金额超目标百倍,是为数不多收获全球C端消费者青睐的个人机器人产品;并在2024年12月完成首批众筹产品发货和流市场的现货交付。
相较于难落地的人形机器人,具身智能大模型加持下的的消费级机器人,更有望率先进入ToC家庭场景;继人形机器人、具身智能大模型(机器人“大脑”),消费级机器人成为2025年具身智能赛道最先收益者。
2024年四季度(尤其12月),AI陪伴机器人赛道迎来一波融资潮和科技大厂背景技术大牛和高管创业潮。
12月30日,由哈工大机器人研究所博士、连续创业者李蕴洲(博士)于2021年12月成立的AI陪伴机器人公司[深圳玄源科技有限公司](X-ORIGIN-AI)完成数千万元天使轮融资;12月23日,由[追觅科技]原中国区执行总裁郭人杰继于12月19成立具身智能机器人公司【苏州乐享智能科技有限公司】完成首轮融资,投后估值约5亿元;12月8日,OpenAI前资深算法负责人江旭创建具身智能陪伴机器人【Light Robotics】(亮源新创);11月,原小鹏汽车内饰设计负责人孙兆治创立的AI陪伴机器人公司【上海珞博智能科技有限公司】刚完成约千万元天使轮融资。
此外,优必选、科大讯飞、深兰科技也已布局家庭场景的AI机器人。在海外市场,亦有初创公司瞄准AI机器人市场。
目前市面上的AI玩具、AI桌面机器人、AI陪伴机器人等消费级机器人产品功能较为同质化,都是以对话方式调用大模型,绝大多数仅仅是大模型“套壳”,无法提供真正的“情绪价值”和产生真正意义上的“陪伴”,可以理解为会动的智能音箱。
因此提到AI机器人,就不得不提到具身智能大模型;大模型决定了人形机器人泛化能力,是现阶段人形机器人商业化核心壁垒,同样也是AI机器人商业化核心壁垒。
美国人工初创智能公司Embodied推出了全球首个AI大模型赋能的陪桌面机器人Moxie,并火遍美国;Moxie不仅拥有着一个表情丰富的显示屏,全身上下三段式的可动结构,以及一双足够灵活的手臂组件;在接入大模型后,Moxie不仅能够理解使用者的话语,识别他们的情感,听到并处理用户所说的内容,还能通过摄像头检测使用者的面部表情和语调,基于对话和问题做出回应,并伴有相应的手臂、眉毛和嘴部动作。
12月24日,金科汤姆猫携手西湖心辰团队发布旗下首款AI儿童情感陪伴机器人——汤姆猫AI童伴,官方宣称,该款玩具结合人工智能技术与“会说话的汤姆猫”经典IP形象,为儿童提供深度陪伴和情感支持,共有经典款、豪华款、尊享款三个版本,售价分别为1499元、1699元、1999元。
官方特别强调了这款产品的情绪感知能力,声称AI汤姆猫能够捕捉使用者的情绪变化,并作出相应反应,例如在孩子心情不佳的时候,汤姆猫交流的语音、语调、语速甚至语气助词都会跟着对话当下的情景或情绪发生变化。
具身智能大模型因涉及芯片、软件、AI算法,资金投入远高于人形机器人本体,目前更多是科技大厂间博弈。国外科技大厂早已布局具身智能大模型方向研究(如谷歌、英伟达等);现阶段来看,国内相较于国外,在具身智能大模型具身智能领域的差距仍然较大,无论是大语言模型、多模态模型还是仿真器,这些关键技术主要掌握在OpenAI、英伟达、特斯拉等海外巨头手中。
接下来,小编将详细盘点具身智能大模型领域,全球科技巨头/大厂(谷歌、英伟达、微软、OpenAI、特斯拉、华为、阿里、腾讯等)现阶段产品进展、全球初创公司(PI、Skild AI、Covariant、有鹿机器人、X Square等)介绍及产品进展、人形机机器人本体厂家与科技巨头/大厂合作现状:
谷歌:从Saycan到RT-H,软件领军者,步步为营,模型高速迭代
2017 年,提出的Transformer架构,是大语言模型(LLM)的最底层的基座,是大模型的基础;
2022年4月,谷歌推出Say-can模型;将任务拆分成两个部分,先是“Say”,之后是“Can”;Say-can模型首次引入大语言模型帮助理解任务,选择合适的任务规划;但机器人的动作仍然是预设好的,因此只能完成特定任务;底层技能通用性和泛用性较差,只能输出高级指令。
2022年12月,谷歌推出了动作控制的端到端模型RT-1(Robotics Transformer 1);RT-1模型,将任务通过Saycan拆分成具体的任务,然后使用RT-1去执行;本质上是模仿学习,无法超越数据集的遥操作,严格意义上不是“大模型”;
2023年3月6日,谷歌推出多模态视觉语言具身大模型(VLM)PaLM-E;该模型让机器人能够接收持续的多模态的输入,并具有一定的推理能力,具备5620亿的参数模型,但本质为大语言模型,对于动作的完成和指导较弱;
2023 年7月28日,谷歌推出全球首个控制机器人视觉-语言-动作(VLA)大模型RT-2 (Robotics Transformer2),可以从网络和机器人数据中学习,并将这些知识转化为机器人控制的通用指令。除了泛化能力之外,RT-2还具备推理(Reasoning)、符号理解(Symbol understanding)和人类识别(Human recognition能力。
2023年10月,谷歌推出RT-X,具身智能大数据集Open X加持的RT-2与RT-1(分别为 RT-1-X 和 RT-2-X),创造了新的具身智能大数据集OpenX,并用此数据集训练前述的机器人模型RT-1和RT-2得到新的模型RT-1-X与RT-2-X;
2024年1月,谷歌研究成果三连发数据收集的AutoRT系统、提高决策深度的SARA-RT 和提高泛化能力的RT-Trajectory 模型。
2024年3月,谷歌推出RT-H;它能通过将复杂任务分解成简单的语言指令,再将这些指令转化为机器人行动,来提高任务执行的准确性和学习效率。
... ... ...
本文仅展示极少部分,接下来,小编将详细盘点具身智能大模型领域,全球科技巨头/大厂(谷歌、英伟达、微软、OpenAI、华为、阿里、腾讯、字节等)现阶段产品进展、全球初创公司(PI、Skild AI、Covariant、有鹿机器人、X Square等)介绍及产品进展、人形机机器人本体厂家与科技巨头/大厂合作现状。
... ... ...
本文内容仅展示一部分,更多详细解读,扫码加入星球,查看完整版文章:[原创]具身智能大模型赛道:科技巨头技术进展、初创公司盘点,第一款“机器人通用大脑”花落谁家(文字5W+),并深度了解“具身智能&人形机器人”赛道
近期精选文章:
1、黄仁勋:人形机器人在内,仅有三种机器人有望实现大规模生产!马斯克:YES!!
5、马斯克:相较于软件算法,本体结构设计才是人形机器人规模量产关键!!
9、ToB、ToC or ToG,全球人形机器人产品优选落地场景梳理!
11、人形机器人构型之争:五指灵巧手 or 夹爪,双足 or 轮式