对话智元姜青松:手和脑是人形机器人的两大发展方向

科技   2024-09-05 18:08   北京  

作者 | 任婧瑄
编辑 | 杨锦

运营编辑 | 王一晴

“走路大家最后都会走,会有多大差异?但是手是不是足够精巧?脑是否足够聪明?这才是人形机器人发展的两大方向。展馆里面看谁讲手、谁讲脑的,投资人就会比较喜欢了。”

在2024世界机器人大会期间,智元机器人合伙人兼营销服副总裁姜青松预判了人形机器人行业的发展路线与当前的投资趋势。

作为一家成立于2023年的明星公司,智元机器人被誉为具身智能“新四小龙”之一。

从华为离职后,有着90后“天才少年”和B站百万粉丝网红创始人称号的“稚晖君”彭志辉,搭档上海交大教授闫维新,正式在上海成立智元机器人。

截至目前,智元机器人已完成天使轮、A轮、A1轮、A1+轮、A2轮、A3轮、A4轮等多轮融资,投前估值已达70亿元,这其中不仅有高瓴、经纬、红杉中国等头部机构,还有比亚迪、上汽创投、百度风投等产业资本的身影。明年初智元机器人或启动B轮融资。

智元机器人重点押注的场景在工厂,这也是特斯拉的人形机器人擎天柱最初的应用场景。姜青松称,目前工厂里最耗人的地方就是柔性物质的装配。因此,机器人的手要越做越精巧、大小脑要越做越聪明,才能像人一样胜任更多、更精密的任务。

今年,智元机器人携交互服务机器人远征A2、柔性智造机器人远征A2-W,以及智元X-Lab孵化的首个全栈开源机器人灵犀X1等创新产品亮相了世界机器人大会。

前不久的年度新品发布会上,智元宣布了一系列开源计划,包括将于9月底开源的智能机器人高性能通信框架AimRT,9月份陆续全栈开源、由X-Lab孵化的灵犀X1,以及将在今年四季度开源、基于AIDEA的百万条真机、千万条仿真数据集。

开源计划背后的布局与愿景如何?人形机器人如火如荼,智元的壁垒在哪里?在2024世界机器人大会期间,姜青松与硅谷AI见闻等媒体聊了聊智元对于具身智能技术发展趋势的展望和产品部署。

开源,让学生也造得起机器人

姜青松告诉AI见闻,开源能够最大限度地促进整个产业链的发展,但机器人行业还是比较新,如何实施开源仍是各企业还在积极探索的问题。智元最关注的是,如何通过开源让技术真正为用户所用。

目前,数据少、成本高是具身智能的关键痛点。为了帮助新入局人形机器人的玩家打破数据壁垒,智元将在今年第四季度重磅开源业界首个百万条真机、千万条仿真数据的具身数据集——具身智能数据系统AIDEA。

在数据积累方面,智元靠自有机器人占据上风,显著降低了数据获取的成本。姜青松向搜狐科技透露,当下智元将真机数据共享,就是为了让大家都能快速掌握人形机器人的技术,并了解机器人是如何运用数据的。

这次智元带到世界机器人大会展出的还有全栈开源机器人——灵犀X1,他们的愿景是希望能通过开源来努力降低造机器人的成本,把全套核心零部件的价格打下来,实现“人形机器人人人造”的生态布局。

“比如某些学生或者科技达人想做机器人,如果都按照六、七十万一套去买,肯定承受不起。”姜青松说。“零部件价格又很便宜,我们又开源了所有(灵犀X1本体的)图纸、软件框架还有运控算法。相当于机器人就慢慢进入到学生的手里,大家都可以玩!”

手把手教机器人干活

近两年,机器人行业陡然升温,行业内的玩家和产品明显层出不穷。针对现有的具身智能市场格局,姜青松表示,机器人公司越来越多,是因为本体的门槛越来越低。但真正能为客户创造价值的人形机器人技术关键还是在大脑技术的发展。

机器人分为本体、小脑和大脑。像智元这样押注工业场景赛道,软件、硬件、大脑、小脑还有云系统全栈技术布局的玩家并不多。

在通用大模型方面,智元正携手科大讯飞实现机器人的语音交互功能、任务编排和对物理世界的认知能力。姜青松指出,通用大模型需要靠整个业界来共同发展,真正让智元产生核心壁垒的是由场景数据驱动的动作大模型。

“因为通用大模型它的数据来自于互联网,但是动作大模型它来自于实际的场景。”姜青松解释道,工业场景的痛点就在于采集数据非常难,必须反复训练机器人并让它真正去服务工厂才能有真实数据产出。

“现在就是说我手把手的教机器人怎么去干活,这个教的过程产生的数据就是最有价值的数据。”姜青松说。

在姜青松看来,工业场景进入难度高,但市场空间很大,接下来还有柔性产品、危险作业,如烟花炮竹和化工等场景需要让机器人去做。

新发布的远征 A2-W就是一款柔性智造机器人,它的两条手臂既能独立操作,也能协同工作。在2024机器人大会上,智元的工程师佩戴了VR采集装置,向观众展示了远征A2-W进行抓取作业时的数据采集过程。

在工业场景中,要实现具有足够泛化能力的产品,首先需要通过遥感遥测技术将工人从危险的操作区域释放出来,然后为他们配备展台工程师所佩戴的VR眼镜和动力辅助服来操控机器人。随着工人操作次数的增加,累积的数据越来越多,机器人将逐渐具备自我泛化的能力。

与特斯拉相同,智元也选择了数据驱动路线。姜青松向搜狐科技透露,智元已经在上海建成一个大型数据训练厂,接下来会进入真机数据量产的阶段,预计到10月底,训练厂规模将达到100台左右,也就是说会有100多个工人手把手教机器人干活。

今年,智元也通过一些突破证明了这个方向的可行性,比如零部件的上下料等场景。此前,机械臂必须位置固定、大小固定才能操作,但智元当下已经可以做到泛化。

“就是任意零件、任意物体、任意位置(机器人)都能识别、都能快速地进行操作。”姜青松说。

机器人未来一定是形态多样的
会创造出新工种

“明年我们就想尝试做装配,其实装配是最耗人的。”

姜青松表示,机器人进工厂能够将枯燥耗人、重复性大的岗位释放出来。在提升生产效率的同时,也会有新工种产生,比如数据采集师、训练师、校准师、调研师等,能让年轻人去做更有技术含量的工作。

姜青松指出,如果需要机器人去巡检、爬楼,那么双足是非常好的形态,但其限制在于耗电续航。

在最新发布的五款机器人中,两款轮式人形机器人——灵犀X1-W和远征A2-W,是拥有平面地形的大车间工厂较为需要的。轮式上半身仿人有灵巧手能够执行双臂协同,再加上大脑技术的加持,中间态能够基本解决工厂的泛化场景问题。

目前,智元的重点放在通用人形机器人方面,不仅可以将产品用在工业,还可以用在商业、物流行业以及未来的消费者行业。

谈及机器人的最终形态,姜青松强调,目前具身智能在 G2 和 G3 之间,正在慢慢向 G4 到 G5 迈进,机器人形态的进化也会以作业能力为基础。具身智能 G1 到 G5 的技术路线分别对应基础自动化、通用原子技能、端到端操作技能、端到端操作大模型以及最终的AGI,类似于自动驾驶领域的 L1 到 L5 的分级。

机器人以后行业发展一定是形态多样,甚至以后会有三头六臂,只是他的脑真正发达了,而且作业能力加强了,所以说这就是发展的方向。”姜青松说。


搜狐科技
搜狐科技聚焦前沿科学与科技产业报道,深度跟踪基础科学、人工智能、互联网、通信等领域重大事件,洞察科技趋势与商业逻辑。
 最新文章