具身智能商业空间、落地场景、发展瓶颈在哪里?
文丨路永丽
编辑丨刘 欢
优必选首席品牌官谭旻;
银河通用合伙人、大模型负责人张直政;
灵宝CASBOT联合创始人兼COO张淼;
亿欧总裁王彬。
本次论坛由亿欧总裁王彬主持,与会嘉宾围绕具身智能,共同探讨了这一领域的商业空间、落地场景、发展瓶颈及下一代产品等问题,以下是本次论坛的核心观点:
1、2030年将是具身智能、大模型发展的关键拐点。
2. 具身智能在工业领域的落地最为紧迫。
3. 初创企业场景选择要与公司技术优势相匹配,展示差异化特色。
4. 中国人形机器人产业最大挑战是投资,行业核心突破点在智能(大脑)。
5.机器人对于真实世界的理解是现在整个行业的最大的瓶颈。
6. 人形机器人更重要的是类人的能力,发展大模型驱动的大脑和小脑,形成一个分级的控制系统,是具身智能眼下的瓶颈。
7. 机器人的最终目标并非成为通用人工智能,AGI的重要性在于提升技术泛化性,使机器人能够成为值得信赖的专家级工具。
8. 让产品去选择最合适的场景,客户、合作伙伴去选择最合适的产品。
以下是速记整理(有删减):
谭旻:人工智能领域的技术突破引发了行业对通用人工智能何时到来的广泛讨论。实际上,具身智能、大模型等最热门行业的拐点,就取决于此。
对于时间的判断,尽管有乐观者认为这一时刻可能即将到来,但行业普遍预测2030年左右可能是AGI时代的真正起点。
我们认为人形机器人一定是迈向通用人工智能的关键载体,外国研究机构认为到2030年,人形机器人市场大概是1500亿美元左右,也就是万亿市场的机会。
因为人形机器人是继计算机、智能手机、新能源汽车之后的下一代颠覆性产品,所以这一数字我觉得还是保守估计。
除了万亿级别市场机会,它还会带动中国上下游几千家企业的产业集群。深圳市在2019年成立了人工智能产业协会,目前已经发展成为全球最大的产业联盟之一,人工智能是能够带动最多上下游的新兴产业。
王彬:现在我们认为工业人形机器人应用,能够看到相对量产化机会,消费可能稍远。想问一下银河通用张总,您更看重工业领域的应用、还是消费领域应用?
张直政:我们认为工业领域的需求最为紧迫,因为从社会需求角度来出发,相较于消费市场,工业更需要我们投入具身智能以实现产业应用。
当下我们制造业面临着人口老龄化、人力成本及生产成本上升的多重挑战,工业自动化的推进对于维护制造业竞争优势及保障产业链的稳定性至关重要。这一方面具身智能的发展显得尤为关键,它能够突破传统机器人在自动化应用上的局限。
传统机器人所带来的自动化是通过重复播放预定动作实现的,依赖结构化场景,需要预定动作,不够泛化。
这个时候要求我们在机器人基础上,给机器人加上大脑小脑,通过大脑小脑协同控制我们能够把产业应用带到下一个阶段,具身智能有望显著提升工业生产的灵活性和效率。
王彬:确实,在我看来人形机器人的泛化能力很重要,一定要解决很多非结构化场景的问题。这个问题,张淼总您怎么看?
张淼:当下各行各业对人形机器人的需求旺盛且多样化,作为初创公司,在有限资源下选择什么样的场景落地,可能是每个企业都需要思考一件事情。
我们在商业化场景选择上有两点核心逻辑:一是具身智能在泛化性边界的突破;二是相较于同行,我们差异化的特色、优势。
我们不是所有制造赛道都去切入,我们选择3C柔性装配这样的细分的场景,因为它其实就会比较好的能够体现出,我们在具身智能加上灵巧手、灵巧操作层面区别于以往机器人公司最明显的差异化部分。
王彬:不是说先挑重活干,先挑细活干,谢谢灵宝的分享。第二个问题,现在的瓶颈,大家说心灵手巧,那么灵魂和肉体你认为优先级是哪个?短期内灵巧更难实现还是心灵更难实现?
谭旻:行业毫无疑问最核心突破点还是在智能,也就是大脑,机器人目前为止还没有自我意识,没到灵魂层面。
但从中国人形机器人产业来讲,我认为最大瓶颈还是投资。
中国今年整个人形机器人行业的融资额,其实也不过是百亿人民币左右,与美国存在差距,这限制了行业发展。特斯拉做了数十亿美元的融资,其中相当一部分用于买卡,这给行业设置非常高的门槛,从算力层面就会决定机器人大脑的训练水平。
当然大家不要以为特斯拉投资数十亿美元去买卡就解决了问题,机器人对于真实世界的理解是现在整个行业最大的瓶颈。
通俗一点,大家都想突破通用人工智能,这就是现在行业最核心的瓶颈,也是挑战。整个人形机器人行业,如何通过在真实世界的应用来采集数据,加强理解,从而真正能够达到人的智力水平,这是最为关键的。
除了现有的语音大模型之外,我们认为人工智能还要在未来2-3年,实现技术突破,让人形机器人实现具身智能,真正理解或者达到人类的水平。
王彬:格局打开。对人形机器人要求太高,直接上来就要通用,可以分步来。张总您认为呢?现在核心瓶颈是什么?是心灵还是手巧?
张直政:我觉得具身智能的技术难点,壁垒和投入切入点都是聚焦在智能上。因为没有智能,机器人就是一堆废铁。
所谓的人形机器人我觉得更重要是类人的能力,针对不同的场景,有自适应的形态,但是有人工作和思考的效率和能力,这样的话才能推动我们具身从一个演示到一个产品,从一个任务自动化到流程自动化,能够真正接管一些人不愿意做,能够更好地看到这些场景。
所以从这个角度来讲,我认为发展大模型驱动的大脑和小脑,形成一个分级的控制系统,是具身智能眼下的瓶颈,也是当务之急。
这个事情上我也是赞同刚刚谭旻总的说法,咱们在国内要发挥整个产业链的优势,通过与硬件上下游企业的合作,共同发展生态优势,以实现本体设计和制造与大脑小脑的更好适配。
机器人的最终目标并非成为通用人工智能(AGI),而是像人类一样成为特定领域的专家,这样的专业化能降低学习成本并提高效率。AGI的重要性在于提升技术泛化性,使机器人能够成为值得信赖的专家级工具,这是银河通用研发的核心方向。
王彬:这是非常好的观点,同样问题我想听听张淼总的分享。
张淼:我们觉得产品更重要,更多时候需要站在客户和行业合作伙伴角度上去思考这个问题。
我们觉得重要性取决于具体的场景的需求,在某些情况下,传统机械臂或轮式移动可能更合适。场景需求决定技术选择,当然也要考虑到成本花多少钱的问题,就综合考量得到最优的结果,让产品去选择最合适的场景,也让我们客户、合作伙伴选择最合适的产品。
王彬:谢谢张淼总的回答,您的回答让我们感觉你们公司定制性很强。提到产品问最后一个问题,能否透露一下公司下一代产品是什么,以及还在孕育当中的产品是什么? 先请张淼总回答。
张淼:我们会持续迭代我们双足人形机器人的产品,同时我们也在打磨灵巧手、灵巧操作相关技术,新一代灵巧手的产品在内测阶段,预计2025年会面向我们的工业制造的场景,给大家公开发布展示一下这些能力。
王彬:感谢。张直政总,大模型方面能不能介绍一下你们的技术储备。
张直政:我们一直以来坚持一个战略,在硬件基础上生产足够多样性的数据,只有当数据的量和多样性达到一定程度,我们才能让硬件真的有实际干活的技能。我们生产数百亿的数据,我们验证任何一款灵巧手要做到泛化抓取,至少需要10亿条数据轨迹来达到95%以上的成功率。
接下来一年,公司将继续专注于数据生产和模型训练,以提升机器人硬件的能力;
与此同时我们会进一步拓展我们大模型的能力,包括端到端大模型的能力,同时要结合大脑模型和小脑模型,研究系统层面如何高效地协同,如何更好地控制硬件,让硬件工作和环境面向场景和环境交互,达到更高的效率更低的成本,这是我们明年最重要的事情。
王彬:好的,有请谭旻总讲讲优必选的下一步发展。
谭旻:优必选有三个方面可以和大家分享。从技术储备角度,在专利布局上面,截至今年6月,优必选在全球的专利布局超过2450项,其中人形机器人有效专利全球第一,在国际竞争领域这是很重要的护城河。
研发投入上,优必选接近两千名员工,研发人员占比50%左右,公司在过去连续三年中,每年将50%的左右营收投入研发,这种投入并非短期行为,而是过去12年来一贯的战略布局。
在产业布局上,优必选在三个产业领域进行了长期商业化布局,工业制造、商业服务以及家庭陪伴。在技术专利方面,公司针对这三大商业场景进行了深入的应用布局。特别是在工业场景,我们会分三个时间节点来去做未来的部署。
首先,我们已完成第一个阶段工作,成功将人形机器人应用于新能源汽车制造的实训场景,目前已经与东风柳汽、吉利汽车、一汽-大众青岛分公司、奥迪一汽、比亚迪、北汽新能源等车厂合作,实现了单一场景的突破,并获得了车厂的认可。
目前已经提前进入到第二个时间节点,从2025-2027年,我们将从单一场景拓展到3-5个场景。人形机器人在核心基础应用领域,可能在更多工位上实现实训突破,这将显著推进人形机器人的量产进程。
第三时间节点是2028-2033年,人形机器人的应用将拓展到较为复杂的任务场景,具备超过10种技能,推出多任务通用型工业人形机器人及解决方案。
此外,在全球领域,优必选也在逐步推进落地应用,比如沙特新未来城通过全球招标采购了优必选人形机器人Walker X。明年2月,我们将在沙特LEAP展上,展示人形机器人的创新产品,大家也可以期待一下优必选在上面发布什么样的产品。
家庭陪伴方面,优必选会先做陪伴再做服务,明年会发布首款仿真人形机器人,以及搭载了大模型的桌面型人形机器人悟空二代。
王彬:谢谢谭旻总。非常感谢四位嘉宾的分享,我们今天的分享到此结束,再次感谢大家。