我们已经临近人工智能的“奇点”时刻,是人类历史上极为特殊的几年。人工智能技术的突飞猛进会对产业、经济和社会产生重大影响,将影响世界各国的竞争格局,也对社会治理提出新的挑战。
在此,腾讯研究院联合多家机构发起AI&Society人工智能+社会发展高端研讨会,旨在持续跟踪和探讨人工智能产业新趋势、创业投资新焦点和社会治理新挑战,引领社会共同思考人机共生时代的经济发展机遇与社会应对策略。
高端研讨会第三期主题为大湾区的AI战略转型,由腾讯研究院和腾讯青年发展委员会,联合香港科技园公司、华润科学技术研究院、青腾、团结香港基金和前海国际事务研究院联合发起,重点围绕大湾区的AI产业战略和社会发展转型这一话题,从AI推进制造业和服务业转型升级,以及AI支持社会治理与发展应对等多个维度,透过主旨演讲和圆桌讨论的形式进行。
在这场聚焦于人工智能(AI)和机器人的圆桌讨论中,我们邀请了来自学术界和工业界的五位嘉宾,共同探讨了AI如何塑造产业未来以及企业如何把握AI转型的机遇。讨论从AI技术的当前状态和未来趋势出发,涉及了AI在工业、服务业和日常生活的广泛应用,以及AI技术如何推动产业变革和企业效率的提升。
司晓 腾讯集团副总裁,腾讯研究院院长(主持人)
高文 中国工程院院士,北京大学博雅讲席教授,鹏城实验室主任
席宁 香港大学数据及系统工程系教授、机器人与自动化讲座教授及系主任、香港大学新兴技术研究所所长
刘煜宏 腾讯云副总裁、腾讯混元大模型负责人
王永锟 斯坦德机器人创始人兼CEO
司晓:我们趁热打铁,刚才两位大咖分享了大模型和机器人的一些洞察,第一个圆桌环节还有两位年轻的专家和企业家,我们一起来探讨一下。我的第一个问题还是先给高文院士。高院士,您曾经提到,全球人工智能的发展处于弱人工智能向强人工智能过渡的阶段,很多人也都在预测到底强人工智能什么时候能够到来。虽然我们可能没办法精准预判趋势,但是人工智能已然成为主导国家战略竞争力的重要支撑和推动科技革命的重要力量,这也是国家投入这么多力量在AI基础设施的重要目的,也有人把AI称为第四次工业革命的推动力。根据您的观察,人工智能作为一种新质生产力在推动产业变革方面,它和前三次,就是我们说的蒸汽机、电力、信息技术革命有什么相似或是不同的地方,接下来人工智能哪些技术的加速迭代,会对产业的发展产生重要影响?
高文:人工智能发展现阶段到底到了一个什么程度?我认为可以从两个角度来说:
第一个人工智能,特别是通用人工智能,是不是已经成熟了?我的观点是完全不成熟,大概如果以“人”来相比,现在可能还是刚刚会走路的小孩,是幼儿的这样一个状态,所以还是非常初级,非常年轻的,这是从发展阶段或者说与我们期望值的差距。
另外一个方面,从使用的角度,其实有很多东西已经可以用了,没有必要等到十全十美再去用。现在能解决生产、社会、服务里面的问题,可以先用起来,要把它逐步的开发、完善、迭代。从两个角度来说,代表我对现在人工智能的看法。
现在要说到底什么时候能怎么样,其实是很难预测的。但好的地方是,大家在做系统的迭代,发现了问题就会想办法去解决这个问题。比如说原来ChatGPT里面大家发现了幻觉问题,就需要去想,怎么样把它解决,随着这个问题的解决肯定还会冒出其他问题。按照这个迭代速度,我想大概有个二三十年,应该能走到一个比较理想的状态。
司晓:谢谢高院士,我简单概括一下。第一个通用人工智能,我们很难预测什么时候到来,但是在局部领域中的成熟度、可用度是已然达到的。我们一方面在追逐通用人工智能的探索,另外一方面也可以把可用的技术用到千行百业,同时也能产生一些数据,帮助技术再逐步完善。
第二个问题我想问席宁教授。席宁教授刚才说到机器人,提到工业机器人在实现智能化的过程中,需要解决三个关键技术问题——编程、校正和传感。相比工业机器人,仿人形机器人的出现其实并没有解决这三个问题,甚至让这三个关键问题变得更加突出了。所以您说当前的仿人形机器人不是产品,而是更像实验室里的原型试验机。前两天波士顿动力发布了他们的最新机器人Atlas的视频,不仅和之前长得不一样,而且适应能力、对现场的感知能力和随时应变的能力又有了一个比较大的提升。一个仿人形的机器人在模拟工厂的环境完成汽车零件的分拣,还被标记上了“完全自主”和“自适应”。您觉得具身智能在工业场景里的应用还有多远?或者您觉得具身智能技术最有希望在哪些场景落地或者成熟呢?
席宁:我觉得具身智能大家有一种感受,就觉得具身智能是一种新的智能,我的观点认为,真正的智能一定要具身。这个问题在20世纪80年代、90年代,前辈们对人工智能的研究基本上已经回答了这个问题。人工智能刚开始出现的时候说专家系统,说处理自然语言,计算机处理不了;也有一种观点说词汇量不够,按照现在的说法就是数据量不够,很多的词汇量进去还是处理不了。为什么?因为不Embodiment(具身),按中国传统表达,就是不能设身处地。同样一句话,我在不同的情况,不同的地方说,意思是完全不一样的。所以你要真正理解这个东西,就一定要知道你在什么地方,在什么条件下说的这个话,要对环境和说话人自身有一个测量和感知,有一个闭环和反馈,所谓的Embodiment(具身)就是这个意思。
真正达到智能一定要Embodiment,一定要具身,不具身就达不到智能。如果工业机器人和机器人真正应用和解决我们的问题,一定要智能化,智能化具身一定要做,一定要闭环。通过开环,大模型输入很多场景来产生一个程序,机器人拿这个程序做事,这种根据开环来解决问题的思路,这么多年机器人的发展证明了是不现实的。从人类的认识规律来说,这也是不现实的。我们要实践、认识,实践再认识。
仿人机器人就是给人无限的想象力。可以想想为什么现在资本市场、社会对仿人机器人有很大的兴趣?因为人类的需求:我们每个人都要有房子住,要有饭吃,这个东西有巨大的市场。每个人要有一个车,所以汽车是巨大的市场。现在要有手机,手机是巨大的市场,其他的东西,量都没有这个大。以后每个人要一个机器人,那机器人就是巨大的市场。但是机器人从现在的工厂走入家庭、走入社会,这中间有很多挑战性的问题。这些问题在我们工业机器人里还没有解决。
在工业机器人里没有解决的问题,你把它放到一个更复杂的环境中,只能使问题更复杂。像跳高,你跳一个一米五没跳过去,说一米八这个前景更好,那肯定还是有困难,所以这个东西有很多基础性的问题我们要解决。但是解决方案最先得到应用的,一定不是仿人机器人,一定是工业机器人和一些高端机器人的应用。所有的技术都是从高端应用逐渐下放到低端,然后应用到公众,技术发展规律是这样的。所以人工智能的发展给我们创造了无限的想象力和无限的机遇,同时带来了很多困难和挑战。我们要冷静应对,扎实研究,找到合理的发展路径。
司晓:感谢席教授。我想到一个例子,不知道能不能佐证您的观点,就是现在看起来无人驾驶的落地技术发展很快,包括基于大模型的端到端技术发展很快,但目前真正用起来的还是在矿区里面开矿车。第一可能开的慢,第二是类似于半开放的环境,对于可控性、速度、安全的要求,和在大马路上、熙熙攘攘的街道里穿行相比,还是要求低一点。在那里能做好,才能把机器人搬到家里。
下一个问题问王总,因为王总是做机器人的,根据您的经验,工业场景里机器人的能力已经进展到哪个阶段了,能在哪些具体的场景中使用起来了?具身智能技术发展之后,您对机器人应用于工业场景有怎样的预期?
王永锟:我们是专门做工业物流机器人的,是最早把无人驾驶技术应用在工业场景里,去做工厂里能够自主移动的这种移动机器人。这种机器人其实就具备了环境感知的能力,他要知道自己的位置在哪,环境是什么,要产生交互,如何去自己的目的地。
我在哪里?我要去哪个地方?这个地方我怎么去?我们主要解决这三个问题。现在我们讨论的机器人大家分很多,有工业,有商用的,有家用的,我们专门做工业机器人。在我读书的时候,工业机器人其实就是指的四大家族的机械臂,他们主要解决汽车工业里比较重载的、单一的、重复性、可靠性的问题。现在的工业机器人的概念会更泛一点。机械臂就相当于模仿人的手臂,然后把这个人的手臂的能力无限放大,变得很大、很长、能力很强、重复性很高。我们现在再加上移动能力之后,它不只有了人的手臂的能力,还包含了人的腿的能力。工业机器人我觉得还要包含工业视觉,应该属于在工业机器人范畴之内,加上了人的眼睛的能力。只不过是在工业领域,眼睛是眼睛,手臂是手臂,腿是腿,它是分离的。为什么是分离的?因为工业领域要求很高,它对可靠性要求很高,工业领域解决的是成本降低问题,并且要可靠性非常高,重复一万次,只能出一次问题,他把动作拆解得非常细,把问题拆解非常的简单,可能是一道乘法题变成加法题,都是这样的方式、逻辑来解决所有的工业场景的问题,主要是为了实现技术的可靠性。
现在我认为工业依然是这样的逻辑来做。为什么要流水线?为什么不用一个人把一个车就给装好了?是因为一个人很难具备这样的能力,一个机器人也很难具备这样的能力。本来一个工位就能装一台车,拉很长的一条流水线去单一地拆解这样的问题,我认为现在工业场景依然在用这样的逻辑去解决这个问题。因为我们追求的是高可靠性、追求的低成本。
具身智能发展的情况来看,国内发展的逻辑在工业机器人领域依然在可靠性和稳定性层面跟四大家族还是有一定差异,主要是核心零部件和我们的生产制造工艺、成本所限制的,这是在硬件层面。但是在其他的机器人领域,移动机器人、视觉甚至是一些所谓的变种的机器人,我认为国内是比较领先的,应用也是五花八门的比较领先。我认为具身智能跟工业机器人的场景不太一样,大家对具身智能的想象是人类生活的场景,我们做的工业机器人主要在工厂里工作。具身智能人能理解,是因为你在生活,它能替代你的一部分工作,他能辅助你。其实工业性的逻辑跟具身智能的逻辑,我认为是完全不一样。工业机器人是解决低成本、高可靠性的问题,但是具身智能要解决的是如何造一个你的同伴,造一个你的助手,是这样的逻辑。
具身智能的引入对工业机器人有什么刺激呢?我们核心解决的问题就是刚才席宁教授讲的,我们之前要完成一个动作,我们是用数学的方法解决这个问题。让他来执行1万次,我解这道题,他1万次都是一个动作,而不是会变方法去进行这个动作。所以我们解决的是从语文题变成数学题。我们做工业机器人的永远都在做数学题,但是现在引入具身智能和人工智能以后,大家想这个数学题我能不能不做了?我中间放一个智能,让他自己去解,让他自己去算数学怎么去做,这可能是对我们工业领域的变化,就是把解数学这部分变成自动的,这是我目前能够看到的核心应用。解数学的过程就是编程的过程。
再一个,我们在部署任务或者在调试的时候,之前是用人工的方式、数学的方式去做,现在希望能不能用人来做这个动作?让它自己去学习,让它自己去学我们人的动作,给它放一个视频,它能够学习这个东西,大量的减少我们做数学题的工作,降低调试的过程,这个是具身智能和人工智能在工业领域短期内的应用。长期的应用,因为我觉得工业逻辑跟具身智能逻辑截然相反,我觉得两个强行牵扯在一起,其实会让大家很模糊。
司晓:您讲的逻辑我们听得非常明白,他的自适应的能力是大幅的增长。之前要告诉它每一步都是在做这个,现在可以教它,让它自己去想你的目的是什么?您能不能就着工业领域讲几个具体的例子,就是之前它只能做什么,但是现在因为有了更强的自适应能力,它可以在工厂里面多做哪些工作?
王永锟:这个问题大家都喜欢问,我之前拧这个螺丝,我能不能拧那个螺丝?他可以做到,其实是可以做到的,关键是在工业场景它不是这么用的,很少会把两个工艺结合在一块。现在有一个趋势是柔性工艺:比如装车,我既能装车灯,又能装门,这是我们需要他做的东西。我们做手机也好,做汽车也好,这些产品有一些定制化的东西,我们根据不同的配置去实现不同装配的工艺,所以我认为核心就能做到这一点,就是在同一个工位上去适配更多的可能性,更多的车型。但是在制造领域,它又很少这么做,因为它成本变高了。想要柔性,它的成本就会变高,所以大家就在柔性和成本之间不断去平衡,然后引入了一些智能。会不会我虽然能装两个车,但是它有可能会出错,它出错的成本对于工业来说是极高的,所以我认为,您刚才说的那些在民用场景或者在生活场景能够实现一些智能化的东西,在工业区应用危险性是极大,所以在工业领域它并不追求这么高的灵活性,而只是在编程上减低我们的调试空间,减少我们实施的这些空间,减少维修的空间。
至于让它具备多高的智能?像在工厂的工人,我们不希望他具备太多的灵活性,我就希望我让你这么拧,你就永远都这么拧,不要太灵活了。工业是开环的,我们唯一的闭环就是这个动作有没有执行到位?而不是说这个螺丝没拧上,我是不是再换一颗螺丝,这个目前还做不到。需不需要做到呢?可能工业领域这个进程会比较慢,因为它需要的动力不是很足。但是我认为这些技术在生活领域,具身智能是需求很旺盛的。
司晓:明白。刘煜宏总,刚好咱们从工业领域可以进一步拉近到贴近我们的生活场景里面。腾讯混元大模型已经接入了700多个业务场景,真正和千行百业,或至少和服务业、和我们的生活场景的数字化会贴得很近,包括我们也针对企业客户提供一些服务。结合您的实践和观察,大模型在哪些领域,现在已经实现了应用落地或者说潜力是怎么样的?有哪些应用场景,或者有哪些例子是您觉得印象比较深刻的?
刘煜宏:先感谢一下王总刚才讲的内容,让我觉得为以后做工业大模型提供了另外一种思路。我讲讲在互联网落地的情况,刚才讲有个数字,大概700多个腾讯内部的应用及场景都接了混元大模型。可以这么说,腾讯内部基本上做到叫AI in all,几乎所有的产品都用了混元,只有或多或少或者用得浅用得深的区别。
去年大模型就在腾讯内部发布了,就像刚才高院士提到的,不用等到很完美才用。我们去年一般用来做什么?主要用来做降本增效的场景,比如说智能客服一直都有,过去利用规则,利用专家模型类似的去做,后来用了大模型之后能够更像人去做,准确率做得更好,包括像代码,腾讯有几万个工程师写代码的,我们到目前为止有1/3的代码,都是通过AI来做续写、扩写、code review等等。
到今年以来,有更多创新性的应用。除了降本增效、提效类的,很多业务创新也在用大模型来做。我举几个例子,微信读书现在里面有很多AI的能力,比如说AI大纲,我们一般找书看,不可能看完才知道这本书适不适合我。你得看一下大概讲什么东西,我感不感兴趣,过去如果没有大模型,我们就要靠人来做。
举个我最喜欢的例子,腾讯视频里面有个剧,今年大火,叫《长相思》,可能很多人都看过。那过去我们看剧就是看剧,今年有个玩法,用大模型一边看,一边可以参与里面的内容、情节,后面我们想着用AI让大家参与,来改变剧情。今年我们的玩法是什么?一边看、一边跟里面的角色聊天。这个数字大的让我吃了一惊,用大模型来跟电视剧里面的角色聊天,一个礼拜我们把这个能力放出来,它的热度超过了2个多亿,对话的次数有2亿多次,把我们自己吓一跳,甚至把我们的服务器都搞挂了。里面有一个主角的宠物叫毛球,它就是一个鸟。比如说你们把语言放出来,它就吱吱叫,啥都不会做,但一天就有几百万对话的热度跟它聊天,所以你就很难想象,过去没有大模型能够做这些事情。
今年我们有更多腾讯内部的服务应用在业务创新方面去调用。我有个数字,我们上个月统计出来,现在在创新应用方面的调用量已经达到了51%,比提效的还多。去年80%多全是降本增效的应用,今年已经过半的业务AI应用是做创新,跟业务场景结合起来的创新,这是在腾讯内部的一些应用。
如果要总结一下,在腾讯内部,不管是社交场景、游戏的场景,还是像金融,比如说我们的微信支付,刚才讲的工业,还有公司内部测试,现在用大模型来做测试,能重复的劳动已经被极大的解放了。腾讯拥有国内最好的产品生态,从我们的角度来看,大模型可以在互联网里面任何一个应用都可以做得比较好,大模型已经具备这个能力。
司晓:感谢刘煜宏总的介绍,我觉得刚才各位专家的讲解,让我有了另外一个角度,或者说从我刚才自己的发言里面,我觉得又能往前想一步。我们之前讲用电量,后来讲用云量,现在比较机械的讲就是用Token(词元)量,实际上这个Token转化为“智力”,这个“智力”未必讲的就是人类的智能,但也代表了一种智力。刚才刘煜宏总讲了很多例子,前面很多是降本增效,后面是对于重复体力劳动的解放,比如审核,也谈不上有特别高的技术含量。有的内容像AI智能体和剧里面的角色,通过AI智能体的方式进行对话,它可能提供的是一种情绪价值。当然,人类的智力本来就是可以用来提效,也可以用来给你的同伴带来情绪价值。确实AI在通过Token调用的方式,我们学到了一个词不是All in AI,而是AI in All,已经在腾讯所有产品中或多或少在使用,它带来的可能是效率的增长,可能是玩法的一些创新,或者说是更加便捷,这是一个很有意思的分享。
接着这个话题也问一下高院士和刘煜宏总,我们在工业领域大家也都谈到了多模态。我自己作为一个使用者,你用上一个版本ChatGPT给孩子写作业,尤其是国际学校的数学作业,我们会数学但是不会英文,你把它拍下来然后让机器去解答很方便。到现在4o1,虽然它的特点能力更强,但是它变成了单模态,你怎么告诉他这个数学题就会变得特别复杂,还要用英文或者把这个图像描述出来,变得不太可能。这里面多模态的好处是显而易见的。我们刚才说到文生图、文生视频的这个技术,它显然是在以多模态相互促进,或者说原生多模态,从效率到可用度上,它的友好程度会高很多。
我想请教二位专家,大模型的多模态能力的提升,它会对哪些行业领域产生影响?以及说我们现在4o1这个版本可能是降低了效率提升了准确度,因为它有思考和复盘。但是它未来是不是也回到多模态?不然它的使用就没有那么方便。请教两位怎么看这个问题?高院士,您先来。
高文:未来是单线还是多线?未来肯定是多模态的。因为我觉得以人的智力提升过程来说,我们每天为什么都要睡觉?睡觉其实是把没用的东西都给你洗掉了,留下的要搬到长期存储里面,这样才能保证你有用的东西会不停的增长,没有用的东西给踢出去了。
司晓:生理结构方面,深度睡眠也是给大脑排毒。
高文:对。但是现在的人工智能系统没有这个能力,它没有不停的复盘,把没有用的东西剔掉,有用的东西留下。我们有用的东西留下这件事,它绝不是一条线索,绝不只是语言的,或者只是语音的、视频的,都不是,它实际上是混合在一起的。所以我们大脑记忆存储里面的结构,其实现在计算机离人的生理存储结构还是差的。所以什么时候大模型能够接近于人的大脑的存储结构,他的提升度会比较快一点。
刘煜宏:我同意说高文院士刚才讲的。未来肯定是全模态的、多模态的。刚才席教授讲到,文本和语音,视频是AI制作的。从人的物理世界里面,肯定是视觉的世界,也有声音的。你光看文字,同样一句话,同样的字,我大声一点,小声一点,我语气变一下,其实是代表不同的情感。光是LLM是没有这个信息,所以一定是全模态。包括腾讯的应用,我们举个例子,我们也在往全模态走。过去大语言、文生图、文生视频,包括3D,都是垂直单一模态,现在已经开始融合了。我们的图和视频已经在融合过程,文、语音也在融合。我们慢慢会融合成一个全模态,里面的信息就不会丢失。但目前来讲还做不到。
从技术来看,一定是单一到全模态去发展,应用层面确实现在也在做。腾讯现在多模态用的比较多的几个案例,比如说广告,广告算是腾讯一个很大块的收入,但是过去广告很多年前的全是文字。现在短视频很火,我们以前要做一个短视频或者图片的这种素材,要找人专门去拍,成本效率都很低。现在我们用文生视频、文生图的方式,就能够降低两个量级,效率很高,成本很低,也是几分钱出一张图,一下子把这个成本打下来,所以在创作里面其实已经用的比较好。
另外在游戏设计里面,大家玩过王者荣耀,里面的皮肤,我们是用AI、用文生图去辅助设计去做提效。整个多模态在腾讯的社交场景,包括视频,我们现在也在跟在腾讯视频里面做类似的事情,我们会把相关的效率提升。
从我个人来讲,这里要提到一个通用的模型,未来多模态会怎么样演进?过去有一个东西叫元宇宙,没有火起来。我觉得很大一个程度可能是因为里面的数字资产,你要做数字孪生,构建一个数字的世界,其实这个数据资产、生产成本非常高。前两年远没达到这个程度。随着整个技术的发展,如果整个数字资产生产的成本降下来,我觉得数字孪生,通用的物理世界、通用的世界模型,也许就能够得到非常好的发展。
司晓:这一点也给我们带来对未来的憧憬。大家都在讨论黑神话悟空,它可能是对山西古建筑的一个高精度的还原。甚至我在网上看到过,有的博主边打游戏边进行赛博考古,说这个书法、建筑是什么朝代的,它的还原度怎么样?然后边讲解历史知识。但是同时我们也有了一个憧憬,如果AI能够无限的去生产数字资产,形成一个日式建筑风格、文艺复兴时期风格的,可能能够使得所谓的“元宇宙”的概念能够再次火起来,现在应该说已经冷下去了。像Vision Pro确实成本很高,而且它的内容供给跟不上,这可能是它核心缺点。
我们再回到机器人的问题,再回到硬的领域。之前讨论比较多的在人工智能这个领域中,“卡脖子”的是芯片问题,而在机器人这个领域中,目前国内外的发展的水平差异是怎么样的?因为我们看到国内的一些人形机器人特别火,一方面能够看到比如说Atlas,包括特斯拉的擎天柱,每一段视频都在体现身体的快速进化,但是我们也能看到国内的机器人在人形制造这个领域,不仅是百花齐放,而且成本做得出奇的低。虽然可能还没有真正的进入到我们的家庭,但是看起来硬件更迭的速度在最近一年并不比软件弱。您怎么看我们国内外的机器人产业发展,包括国内有哪些制约因素?国内有哪些优势?您怎么看这些前景?先从席宁教授开始。
席宁:工业机器人的发展当时说有三大卡脖子的技术,驱动机、减速器和控制器。但是随着技术发展和中国产业的发展,这方面的问题在逐步解决,现在这个水平已经接近国外的水平,而且很多方面也比国外做的还要好。但是机器人的下一步智能化,比如跟人工智能化的结合,我以前说过有三个新的挑战:首先是机器人编程方法,你机器人要真正做到智能化,你要有更有效的办法告诉机器人去做什么事情。一个机器人到家里,你不可能用传统的工业机器人的编程去告诉这个机器人去做什么事情,它整个的程序是不能转移和智能化的。所以要解决这个问题是机器人走向智能化里面很重要的一部分。
第二部分,工业机器人的校正,解决机器人和环境之间的关系。我原来一个人在这干活,我买个机器人往这一放他就能干活,但是机器人的坐标跟我们环境坐标是不一样的,他没办法知道他跟环境之间的关系。至于为什么我们要具身,就是解决这个问题,要对环境进行测量,这是解决机器人跟环境之间的关系。机器人编程是解决机器人跟人之间的关系。工业机器人里的校正,是解决机器人跟环境的关系。
第三部分,机器人要跟传感器结合起来,让机器人具有多维度、高精度的感知能力,这个是很重要的,这个是所有智能化的基础,具身的基础。反馈、闭环,都是建立在测量的基础上。所以怎么有效跟传感器集成是很重要的。
对下一代工业机器人或者机器人的应用,这三个是很关键的问题。仿人机器人要真正达到我们想象的应用空间,必须把这三个问题解决了,才能真正做到这样的事情。当然这里面人工智能会起到很重要的作用,人工智能的发展跟机器人的发展永远是齐头并进的。我们现在的世界,除了有物理世界、制造系统,同时我们还有一个赛博世界,里面有数据、模型这些东西,然后我们还有人。人工智能是对数据进行处理、进行决策,然后得到一些正确的最佳决定。这些东西最终要作用到物理系统,改变物理系统、改变世界,必须得通过一些手段,机器人就是这些手段。真正的要让整个世界智能化提高效率,提高各方面的有效性,机器人和人工智能的结合,这肯定是一条必由之路。
司晓:王总,您怎么看?
王永锟:其实说机器人国内外的差距,现在国内的扫地机器人已经领先全世界了,送餐的、酒店的服务机器人也领先全世界了,然后在新兴的工业级领域的协作机械臂、移动机器人我觉得也领先全世界了。
现在落后的也就是在工业机器人这个领域。我们造一个汽车厂,用的机械臂还是优先选用四大家族。因为他们的质量和可靠性很高的。所以在高端领域(高成本、质量和可靠性要求很高的领域),我认为国内还是有一点落后。这里包含了刚才说的传感器、执行器、控制器等等这些领域,我们的细节打磨程度、工程量还没有那么多。但我觉得随着时间推移,我们中国制造的能力、硬件能力肯定会遥遥领先全世界,所以这块我是非常有信心的。
第二块,中国现在遥遥领先的核心原因是中国的人工智能和中国制造的优势,是成本、人才、工程师的优势,使得机器人的应用场景非常多。中国有大量的工厂,同时中国人的生活也是丰富多彩的,场景也很多,所以在各个场景里大家都不断地尝试用机器人技术、AI技术去解决一些问题,就会蹦出一些新的东西。
比如国外卖的比较火的泳池机器人、割草机器人其实都是中国产的比较多,它是中国出口的,这些东西就是在不断地尝试世界的各种场景,这种创新也是层出不穷的。我认为中国机器人在硬件领域、场景端是有巨大优势的,但是需要时间、空间不断去迭代。现在这个机器人长这个样子,它不断迭代,就把他的泛用性、成本、质量不断的提升,可能在中国最大的问题就是质量的提升,因为中国一直都是低成本的,限定了成本再提高质量就很难。在国外能够做出更好的产品,因为国外的品牌卖出更高的价格,可能给你很大的空间让你去迭代。中国的迭代,可能给你的空间也不是很大,通常是低质量的迭代,给的研发时间不是很多,每年能够迭代的东西很少。但是我依然认为这一块有巨大的优势,因为我是做工业机器人的,我简单说一下工业机器人的前景:我们做工业机器人的目的不是为了做机器人,是为了实现智能制造,机器人是实现智能制造的必要的组件。虽然我们公司叫斯坦德机器人,但是我的目标是从机器人公司变成一家智能制造的解决方案公司,我认为要经过四步走,大概说一下我对工业和机器人关系的理解:
第一步叫工人机械化,就是大量的机器人去替代工厂内的各种工种。现在由工人来实现的工作,未来会由机器人来实现。它可能形态不是长得像人,可能只有一个手臂一个腿,反正有各种机器人替代工人,工人机械化的进程在不断推进。
第二步叫管理软件化。因为现在制造业整个的逻辑还是人的管理思维的逻辑。我们也看到很多制造之神,丰田的管理方法,华为的管理方法,还是人的这套逻辑管理工厂。但是当执行者变成机器人之后,管理方法无外乎就是执行端和信息端,是IT和OT的结合,这个管理逻辑会变成自动化的软件管理的配套逻辑。
第三步叫工厂数字化,完成了整个从实体到数字的完整的数字技术的转移。
第四步才会衍生出来智能制造,我认为智能制造一定要基于完整的数字化。局部的数字化解决的只是局部的数学题的优化问题:这个数学题很复杂,我人不想解了,用AI来解,现在做的可能是这些东西。但是我认为真正的智能制造不是关注数学题,而是抛弃了数学题,回归到语文题:我的效率怎么能提升一点,我成本怎么能更低一点?你去帮我算,给我一个答案就可以了。
智能制造可能关注的是提问题,而不是解问题,是有一个完整的工厂数字化,这四步的进程我认为在逐步推进。机器人未来的前景是机器人+人工智能的结合,能够真正实现智能制造,能够让大家享受到定制化低成本高质量的产品。其实制造业正在解决更低成本、更高效率、更高质量的问题,AI跟机器人结合,我认为大概率是朝这个方向在前进。但是AI如果在工业里有巨大的应用,我认为经过前面几步是一个必要的前提。而现在超越前面几个前提去做的工业里的智能制造,可能是比较超前的应用,离实际落地可能还是需要一些时间和基础设施的建设。
司晓:很有启发。第一步工人失业,第二步老板也失业。决策也是靠机器来做的,全部数据化。
因为时间关系,我们再问四位嘉宾最后一个问题,就是现在 AI的潮流涌向我们的生活和工作场景,这个也不用赘述了。但是我们大大小小的企业都有一个怎么在AI时代转型的问题。这个转型可能是不光是思维的转型,也不光是借助哪些成熟工具,它可能是一个系统性的。如果你没有一个更高维的思考,还是被推着走。或者同行都用你没用,那就可能会实现AI还没取代人但是原来的竞争对手因为使用AI就把你干掉了。这不是一个恐怖故事,这是发生在现实中已然到来的时代。
所以我想问一下几位嘉宾,如果企业要实现AI转型,你来提几点建议,那是什么样的?从高院士开始。
高文:现在AI迭代发展很快情况下,大家一定要关注最前沿的技术。当然关注最前沿技术,我是说关注而不是紧跟,因为有些技术它可能已经发展了半年一年,也许就无声无息了,如果你跟得太紧,你可能就掉沟里去了。但是你要关注,你要知道最前面是什么东西,它的内部逻辑应该怎么样,你觉得差不多这个东西要快成的时候一定要关注。
席宁:我同意高院士说的,我们要关注技术的发展。另一方面要脚踏实地,根据本身企业和行业的特点,找到一个结合点,我觉得这样才是在技术飞速发展的时候可以抓住机遇。
刘煜宏:我跟很多企业也都接触讨论过相关问题。我当时给他们建议:要做AI,整个要用起来,这是一号工程。刚才徐教授讲的一定要脚踏实地,我要解决什么问题,AI应该只是个手段。我非常认可刚才王总提到的,企业要做AI不是要做AI公司。如果做的是服务,比如做咨询服务,还是做咨询服务,只不过用的AI的大模型来提升效率而已。所以这个确实是个手段,但一定是一号位工程。要从老板开始关注,同时要场景化。搞AI不是我的目的,我要解决我的场景的问题,我的业务场景,我的商业模式。
王永锟:我是做企业的,我提三个比较实际一点的建议,可能比较夸张。
第一,如果你公司有编程,有很多程序员,先裁掉一半的程序员,然后逼剩余的程序员学会使用 AI编程,现在有很多工具。
第二,如果你的公司是产品公司,有很多设计师,裁掉一半设计师,让剩余的设计师学会用AI的工具来解决。
第三,下载一个腾讯元宝。在国内,要求你的所有管理层都下载一个腾讯元宝,然后把搜索工具卸载掉,不要用搜索了,开始全部所有问题都用元宝问答来改变整个习惯。获取知识的习惯从搜索变成对话的方式。
刘煜宏:我补充一点。并不是要做裁员,而是要提升生产力,就像我们1/3的代码都是我们AI写的。释放出来30%的工作量,他可以做更多的事情,企业老板要顶住。
司晓:我们再次以热烈的掌声来感谢四位嘉宾的精彩分享,谢谢大家。
李瑞龙:《具身智能,究竟还缺什么?》
司晓:《读懂深圳2035|腾讯司晓:开启人机友好的未来城市序章》
👇 点个“在看”分享洞见