邮箱|pro@pingwest.com
在全球机器人和人工智能技术快速迭代的今天,中国机器人产业正经历着前所未有的发展机遇。本次硅星人首届AI创造者大会(ACC 2024)邀请到了深耕人形机器人领域12年的优必选科技首席品牌官谭旻,专注机器人核心算法和芯片开发的地瓜机器人CEO王丛,新晋人形机器人领域的明星企业加速进化商业化负责人李超逸,将AI与机器人深度结合的清博元宇宙研究室执行主任柳春阳,以及深谙产业发展的英诺天使基金合伙人王晟。五位嘉宾围绕产业链协同、人形机器人发展方向、AI与机器人融合等热点话题展开讨论,为我们呈现了一场富有洞见的对话。
以下为对谈实录:
AI机器人如何在产业链上实现协同共赢?
王晟:大家好!很荣幸能够主持今天这场重要的圆桌会议。在今天六个环节中,关于机器人具身智能只有这一个圆桌讨论。在座各位都是业内举足轻重的嘉宾。首先,我想请教谭旻总,作为拥有12年历史的优必选科技,也是人形机器人领域首个上市公司,从最初到现在,您感受到产业链有哪些变化?相比过去,哪些方面更加成熟?目前还有哪些环节需要自主研发?产业链的优势和不足分别是什么?
谭旻:大家好,我是优必选的谭旻。在近13年的发展历程中,我们经历了三个阶段。第一阶段是完全没有产业链的时期。在公司成立之前,我们就开始在深圳龙岗工厂研发核心零部件如舵机,因为当时国内还没有相关产业链。第二阶段是在突破核心零部件后,开始研发机器人整体模型。一个机器人包含3000-5000个零件,我们从小型桌面机器人做起,逐步发展到全尺寸人形机器人。从小功率到大功率,从简单到复杂,我们的产品不断迭代升级,如悟空机器人、天工机器人和Walker等。目前,我们已经看到产业链发生了翻天覆地的变化,不仅体现在硬件创新上,还包括软件开发以及软硬件的融合。可以说,中国机器人产业已经进入了百家争鸣的新阶段。
王晟:我还有一个问题想追问一下谭总。因为你们是从做舵机开始的,过去产业链很多地方都是你自己做的,未来像优必选这样的龙头企业,它是什么心态呢?是更开放拥抱产业链,还是要搞自己的一套体系?你怎么看未来产业链的结构?
谭旻:在产业未成熟之前,我们一直保持着两条腿走路的心态。一方面,我们必须自主掌握核心技术,因为如果不够了解,就无法与产业链进行有效协同。这就是为什么优必选在整个专利布局上,无论是软件、硬件还是操作系统等方面,都有专门的团队在做研发。例如,我们在机器视觉、语音交互、机器人步态算法、核心零部件,包括从舵机到灵巧手,再到整机结构设计和机器人操作系统等领域,都设有专门的研发团队。同时,我们也会开放与整个产业链合作,比如目前与天工的合作。天工作为国家具身智能的重要平台,优必选将加入其中。我们会以开放的心态,与包括天工在内的各个产业链环节展开合作。
王晟:谢谢谭总,相信在场的创业者都很关注这一点。接下来,我们请教两家较新的机器人公司。一个是加速进化,这家公司去年秋天才成立,专注人形机器人研发,一年内就完成了5轮融资,是人形机器人领域的新锐力量。另一个是清博元宇宙,除了元宇宙业务,还涉足AI领域,他们开发的是超写实的仿真型人形机器人。请问两位,在这段不长的创业历程中,你们对产业链有所依赖,能否分享一下你们眼中中国机器人产业链的优势在哪里?有哪些意想不到的困难?请谈谈你们在产业链协同方面的经验和教训。
李超逸:我来分享一下我们这一年的经历。作为一家初创公司,我们对产业链的思考比较简单:如果市面上有成熟的零部件,我们优先选择现成的;如果没有,就只能自主研发。举个例子说明这一年的重大变化:当我们刚进入这个行业开始研发人形机器人时,发现机器人一体化关节成本很高,大扭矩大功率的一般要一万元左右。但随着时间推移,越来越多百元级的关节出现,大功率的也降到一两千元。随着行业发展和客户增多,整个产业链在快速发展,成本也在迅速下降。同时,我们也看到中国在这个领域具有巨大优势。比如说最基础的机加工,这在国内各行业都已相当成熟。相比之下,在中东或北美,要想快速实现人形机器人的制造是非常困难的。从3D打印样品,到验证、生产、做原型、做产品,整个周期比国内长很多。我们很幸运能在国内这个相对成熟的供应链环境中发展。不过,机器人行业整体还处于起步阶段,无论是零部件还是标准都尚未完全建立。因此,各个机器人企业都需要不断调整,投入大量成本做适配和改进,确保最终能为客户提供完整、优质的产品。这是我们下一步共同努力的方向。
柳春阳:大家好,我是清博智能的柳春阳。我们的机器人团队始于2021年元宇宙元年年末的规划。虽然在机器人领域起步较晚,但我们在人工智能和大数据领域已有十多年的工作和创业经验。清博智能成立于2014年,今年正好是第十周年。我们一直专注于自然语言处理方向,这也是人工智能领域的重要组成部分,并在这个赛道上获得了诸多人工智能大数据领域的前沿奖项。
在元宇宙兴起后,我们提出"三声合一"的理念。元宇宙不仅包含虚拟人,随着其发展,由于它是虚实融合的世界,每个人都可能拥有自己的机器人。人类、数字人和机器人可以在数字世界和现实世界中实现多维互动。数字人在虚拟世界帮我们完成分享和交流,机器人则可以在现实世界中照顾老人小孩,取递快递,完成各种实际工作。
虽然我们较晚进入机器人行业,但时机把握得很好。这两三年正是人工智能和机器人赛道高速发展的黄金期,产业链已经有了雄厚的基础。我们的机器人创始团队中,除了沈阳教授外,另一位创始人在通用有十多年机械手和机械臂的工作经验。在开发人形机器人时,我们发现产业链已相当完善,所需的控制器和传感器都很成熟。我们只需按自己的设想,打造具有特色的机器人产品。
相比优必选谭总,我们是后来者。我们没有选择开发传统的钢铁型机器人,而是结合我们在新闻传播和清华人工智能学院的背景特点,选择了开发高仿真机器人。在今年的世界人工智能大会和世界机器人大会上,我们的产品给人留下了深刻印象。在八大展品中,我们的机器人最像真人,而且是美女形象,具有很高的辨识度。在机器人大会现场的100多家参展企业中,能做到这一点的仅有1%,我们是其中之一。
结合近年来大模型的快速发展,我们将机器人与大模型结合,更好地满足前台接待、智能顾问、智能客服等需求,还能进行舞蹈表演。机器人领域发展迅速,如波士顿动力经过十年发展,今年基于大数据和大模型重新训练他们的机器人。我们比他们早了两年开始利用AI和大模型训练机器人。现在可以在数字孪生场景中进行测试,不必局限于实地测试。我们的机器人酷似真人,可用于智能座舱驾驶、刷脸支付等场景。非常感谢这个时代,让我们虽然起步较晚,但把握住了机遇。谢谢!
王晟:听了柳总的介绍,感觉产业链已经相当成熟。谈到机器人产业链,人们往往关注硬件方面,如关节、减速器、控制器等。但在今天,随着大模型和AI的发展,芯片、算力和AI平台变得越来越重要。接下来,我想请教地瓜机器人的王丛总两个问题:一是请您介绍一下你们具体在做什么?二是您认为你们现在做的这些工作,包括机器人的算力芯片、计算平台等,在未来机器人产业中将发挥什么样的价值和作用?
王丛:我先介绍一下我们地瓜机器人。我们是在座唯一不直接制造机器人的机器人公司。我们专注于机器人大脑的芯片核心算法,以及相关的数据整合Pipeline工具链。虽然不一定比在座各位起步更早,但我们已经为上百家机器人公司提供芯片服务。
在这个过程中,我们发现整个机器人行业面临很多问题。无论是大公司还是小公司,要开发一款不是demo级而是真正可用、具有产品化价值的机器人,仍然是一件非常困难的事。demo很容易做,但真正量产化却很难。在这个过程中,往往需要多次推倒重来。我们发现许多工作并没有得到很好的解决,也没有合适的工具,基本上都是各自为政,或者是修改开源项目来凑合使用。
我们一直期望未来世界能像科幻电影一样,拥有各种各样的机器人。但要实现这一目标,必须经过大量尝试。我们在思考如何加快这个过程。就像互联网的爆发一样,除了需求和流量之外,更重要的是开发互联网产品相对容易。小团队也能开发出不错的APP,这是因为基础设施已经完备。如果我们期望各种类型的机器人都能出现,就必须先完善相关的基础设施。我们在思考如何加速这个时代的到来,所以更多地投入到各类工具的开发中。只要能真正帮助到大家的,我们都愿意尝试。我们天生就与所有人都是朋友,可以在各个方面开展合作。
王晟:我是不是可以这样理解,因为你们原来都是地平线的团队,之前就与各个合作伙伴建立了生态合作关系,所以地瓜机器人希望能够扩大这种生态,与各类机器人企业合作?我也补充一下,作为一家早期投资机构,我们很荣幸投资了加速进化的第一轮。我们认为现今的产业链与过去有很大不同。过去产业链主要集中在硬件方面,算法相对简单,而现在的产业链涉及大量AI和智能化。我们过去也投资了很多机器人项目,比如云深处的天使轮。在这一波机器人浪潮中,我们投资了做人形机器人的加速进化和松延动力,投资了做大脑的牵牛科技,还投资了两家做小脑的清华项目企业:自变量机器人X Square 和动易。在产业链上,我们也投资了像灵足这样做关节的企业。如今机器人产业链变得更加丰富,这是因为大家对机器人的能力要求提高了,促使每个环节都更加优秀、精细、高质量和智能。我认为未来产业链会越来越细分,而每个环节都会更加规模化。关于机器人产业链的讨论就到这里。
为什么人形设计在机器人行业备受青睐?
王晟:接下来讨论一个较有争议的话题:人形机器人。去年人形机器人非常热门,优必选上市又掀起了一波热潮。在我们的明星机器人公司中,有三家都在做人形机器人,但各自的方向不太一样。待会请谭总介绍一下各自在人形机器人方面的定位。我有一个问题,在投资和产业界争论很大的是:为什么一定要做人形机器人?为什么不能是四足、轮式或履带底盘的?人形机器人又该在哪个产业落地?这真的能落地吗?还是只是在讲故事?我想请王丛总作为第三方来补充,因为你们的视角可能与正在做人形机器人的公司不同。包括在你们平台上有多少比例的合作伙伴在做人形机器人?做人形和其他形态的合作伙伴,它们的业务发展状况是否相同?是人形机器人更容易落地还是四足机器人更好?请王丛总对三位做人形机器人的公司做些补充。
谭旻:这是一个好问题。以前我们几乎百分之百会被问到:优必选为什么要做人形机器人?这个问题现在已经被马斯克很好地化解了。自从马斯克投入人形机器人研发,并两次修正对人形机器人的未来预估后,询问优必选为什么做人形机器人的声音骤减了99%。我们看到在两年时间内,中国的人形机器人企业从屈指可数发展到现在有些数不清的程度。
说到为什么选择人形,有两个主要原因:首先,人是物以类聚的,如果要找一个能够替代我们完成所有工作的对象,一定是人形的,或是在人形基础上的延伸。这是百万年进化的结果。机器人是为服务人类而存在的,我们不会为了机器人而改变世界的所有规则和参数。如果要找到更好地辅助和赋能人类的方式,人形是最基本的选择。其次,现在我们看到的只是机器人形态,未来很快会出现真正的仿生人。除了大家关注的关节和整体结构外,仿生材料很快会成为人形机器人产业链中的重要一环,这是从机器人向仿生人迈进的第二阶段,最终可能发展到真假难辨的程度。这是产业迭代的重要方向。此外,我们需要在这个世界上找到另一个"我",无论是在VR虚拟世界中的我,还是能够进行情感互动甚至产生协同效应的存在,不一定都是人形的。其他观点在各种峰会上大家都听过很多,就不再赘述了。
王晟:简单总结一下:第一,人是天选之子;第二,马斯克解决了大多数疑问;第三,人需要和类人的存在进行协同互动。接下来请加速进化分享一下。
李超逸:谭总刚才提出了一个主流观点,这个社会确实是人类为自己打造的世界。我想分享一个我认为更本质的观点:人形机器人之所以有机会走进各行各业千家万户,关键在于我们考虑什么样的机器人最终能够进入应用场景时,要看机器人到底解决了什么问题。具体哪种形态能够解决相应的问题,才是我们最终关注的重点。从这个角度来看,确实很多场景不一定需要人形机器人,未来会出现各式各样的机器人。但在大量场景中,没有必要再去设计一个独立的机器人,这时候什么样的机器人最适合呢?答案是人形机器人。这有点类似几十年前我们讨论是否需要通用计算机或智能手机的情况。当我们有了人形机器人这样的平台,有了大量AI开发者时,就有机会催生出不一样的能力,只有这样的生态才最终有机会实现这一点。
加速进化的目标是什么?我们希望能够切实解决问题。比如现在面向开发者,提供足够开发者友好的硬件产品和软件平台;未来在工业场景、To B、To C领域,具体解决家务、照顾老人和陪伴小孩等实际问题,这就是我们的目标。
王晟:恭喜加速进化虽然成立仅一年,但已经销售出去数量可观的机器人。
柳春阳:关于为什么做人形机器人,我与谭总和李总的观点是一致的。这个世界本身是人类创造的,未来无论是AI还是机器人,都是为了更好地辅助人类完成工作。我们不可能为了AI重构物理世界和规则。我们的工作模式和场景都是为人类服务的,都是满足人类生活需要的。机器人如果更像人,就能更好地融入现有的生活方式、工作方式和场景中,这也解释了为什么机械手、机械臂最终会进化成人形机器人。第二,我们之所以选择人形机器人,是因为我们的创始人是清华新闻传播学的教授,我们要做一个有特点、有创新的机器人,能做新闻发言人。我们不仅要做冰冷的机器人,还需要机器人有情感和温度,所以我们做了高仿真的仿生机器人。在这个赛道上,企业不多,我们也算是头部企业了。
王晟:谢谢柳总,我们听听王丛总对人形机器人的看法。
王丛:作为第三方,我当然希望大家都好,因为大家好我就好。这个问题从具身智能刚火起来的两年前就在讨论。到现在这个阶段,我觉得不用太关注是否是人形。我呼吁大家更关注一些具体问题:到底能解决哪些问题,需要多少次训练才能操控,场景如何泛化等。这些才是当前最阻碍智能化到来的问题,无论是人形还是非人形。我们更应该思考如何突破这些障碍,甚至携手合作解决这些更重要的问题。
王晟:这是我们下一部分要讨论的。关于人形这部分,我想补充一点。以前我们总问"为什么是人形",最近我在问"为什么不是人形"。说不选择人形,其实是因为不相信它能变得很便宜,认为它比其他形态都要贵;不相信它能变得很有能力,觉得它不如汽车或四足机器人安全,担心摔倒或伤人。但现在似乎这些问题很快就能解决,如果它既便宜又安全,为什么不选择人形呢?这是我们思维角度的变化。关于马斯克,2017年他在发布会上说很快就能实现全自动驾驶,但等了一年又一年。虽然我们长期看好人形机器人,但在时间预期上要谨慎。现场有人直接问机器人是否遥操,机器人诚实回答是的,所以大家要保持耐心。
AI赋能下,机器人将如何实现具身智能?
王晟:接下来讨论第三部分:AI。大家都认为AI对未来的具身智能极其重要,包括李飞飞讲的空间智能。我想请在座各位分享两个问题:第一,你们目前与AI的结合程度如何?第二,长期来看如何看待AI的发展?我们经历了包括PID 、MPC、WEC这些阶段,最近看到大家都在做强化学习。但上周朱军老师团队的刘松明博士发明的产品影响很大,我也与团队交流过,他们在线上做了分享。我们拜访了其他机器人企业,有些已经研发这个模型近一年,展现了很强的涌现能力,许多未经训练的动作和场景,机器人都能自发完成。我想听听各位专家对机器人AI最终形态的看法。是需要大家都结合在一起,还是会形成一个强大的端到端解决方案?
谭旻:AI一直是制约整个产业链发展的重要挑战。从我们最早期商业化小型机器人开始,就发现必须要软硬件结合,仅有软件是不够的。关于当前的大模型,我们可以负责任地说,它并没有想象中那么厉害。当大模型真正结合到硬件时,短板就会显现。
衡量智能化至少要从两个维度来看。从软件维度看,无论是思考推理还是仿人、仿生,都有一个范式的参考标准。在美国硅谷实验室的EQ测试中,AI的能力已经达到120到140之间的智商水平,这确实很惊人。但这并不意味着真正的智能,真正的智能是要能在真实环境下解决问题,这就是为什么软硬件结合如此重要。所有颠覆性技术最终都要与硬件结合,这就是为什么我们在讨论通用人工智能时,一定要通过具身智能来实现。如果没有真正的硬件,软件是无法实现真正的智能的。
王丛:关于您提到的学术成果,我们内部也都在研究,包括多任务、跨视角、跨本体刚性结构等各个方面,效果都不错。至于是否涌现,我们并不在意这个词,我们更关注其泛化性到底有多好,比如之前需要视觉校准几千张图片,现在是否只需要几百张。我们关注的是能为产业带来多少实际价值。至于是端到端还是其他方式,我们认为要循序渐进。基于我们在自动驾驶领域的经验,任何复杂系统都是一个复杂工程,它一定是各种工程的集合体,历史上所有的工程都是如此。地瓜就是这种风格,不拘泥于任何单一学术方向,而是整合所有有用的技术。
王晟:我很想了解你们是如何规划产品阵列的?
王丛:我们相信机器人会有各种形态。对每种形态来说,不可能用单一芯片来支持,一定会有不同性能等级。我们一方面在成熟的消费领域有大量出货,如扫地、割草、陪伴机器人等,每家都在使用;同时在高阶领域,虽然相对不太成熟,我们既有像杰森这样的产品,也有cloud平台,从数据生成到验证的平台,我们也会把核心算法组件植入其中。
谭旻:在与大量AI开发者沟通的过程中,我们遇到了做世界模型的、主张完全端到端的,还有专注于各行各业应用的开发者。我们的判断是,无论哪类开发者,最终都需要一个能够屏蔽底层复杂度的好用平台,让大家能在此基础上开发应用。类比大模型的发展,有做基础模型的,也有做专业领域模型的。对于机器人,我们判断早期可能也会出现各个领域的专门能力,长期来看,这些能力会越来越多地泛化,甚至可能融合。但即使这个过程很长,它仍然是一个分布式系统,而不是完全集中的状态。在这个过程中,仍然需要为各行各业的开发者提供足够好的平台,推动整个行业发展。
柳春阳:在大模型和机器人的结合方面,我们可能与大多数机器人公司不同。90%以上的机器人公司是先有机器人,后逐步加入AI,或者早期的AI仅基于视觉和深度学习来进行控制。而我们是先有AI,后做的机器人,所以我们离不开大模型。我们的机器人主要在工业场景中与人打交道,如果没有大语言模型,就无法与王总和谭总进行沟通交流,也无法进行情感交互,所以我们与大模型是相辅相成的,天生就是依赖关系。
王晟:刚才各位嘉宾都提到,这个行业有很多参与者,产业链高度协同。从投资人角度来看,我特别喜欢这个行业。你会发现大模型向头部集中,越来越收敛,最后中国和美国就剩下一两家玩家。但机器人这个行业特别好,而且比汽车行业还好。我们投资的文远知行前两天刚上市,我觉得它比汽车行业更有前景。未来汽车制造商会收敛到几家,但在机器人领域,有多少种场景、构型和AI应用,人类未来就会有多少种机器人,这是一个特别好的产业。非常高兴能和几位有见地的嘉宾交流分享。谢谢大家!
骆轶航:感谢各位!关于机器人产业链,谭总提到的一点很重要:这个产业链在优必选进场时是不存在的,是随着先行者的进入才逐渐成熟的。这个产业链的成熟过程体现了先来帮后来、先到帮后到的特点,这是非常有意思的现象。王丛总提到的观点也很重要,我们不太追求所谓的涌现能力,而是追求实际效果和ROI。他从上游的角度衡量什么是好的机器人产品和公司,这是非常有价值的见解。
加速进化和清博两位嘉宾谈到了对人形机器人的看法,包括人形机器人与物理世界的关系,以及与AI结合的先后顺序,这两家都是很有特色的公司。它们都成立于ChatGPT诞生之后,我一直认为,2022年11月30日对机器人公司来说是一个重要时间节点。在此之前和之后成立的AI机器人公司,对AI的融入方式有很大的不同。
最后,王晟总提到了一个重要观点:机器人作为一种产品形态,最有可能实现多样化。无论是否像人,这个世界上有多少个门类和产业,就会有多少种机器人诞生,这与汽车等其他产品是完全不同的。