今天有两个超级端:一个是Phone,一个是PC。下一个超级端是汽车,下下一个就是机器人。7月27日,由《中国企业家》杂志社主办的2024(第二十四届)中国企业未来之星年会在上海举行,本届年会的主题是“向新求质,生成未来”。猎豹移动董事长兼CEO、猎户星空董事长傅盛现身【洞见:AIGC特别分享】环节,并发表主题为《端模合一:大模型赋能机器人的创新实践》的演讲。以下为演讲的核心要点:
1.如果再过几十年回头看这一波AI浪潮,可能和现在看牛顿和爱因斯坦一样。2.现在创业就关注两件事:第一,真正追求快速闭环;第二,做一些穿越周期的事。
3.今天在企业用大模型的时候,它回答得都很对,但没有什么用,都是常识性的回答,很难和私有的知识连接起来。如果真的要企业应用,私有数据是关键。
4.大模型和云最大的不同,云更像仓库,是不拆包的,只要租用我的仓库,我不关心你存了什么。大模型不一样,存的数据它都要看一遍,才能写报告和整理,这些数据都经过它了。所以企业就应该有自己的私有化大模型。
5.今天人形机器人很火,但是我对双足机器人在商业化上的成功不是很看好,作为科研是可以,如果落地到产线上工作,没有三五年就不可能。
6.为什么做机器人还要做大模型?大模型就是机器人的大脑,你做机器人,自己不做大脑去买别人的大脑,你的竞争力就有限了,体验也不会好。我们就是要做端模一体化,根据场景应用找一款好的模型,做自己的大模型机器人。
要做穿越周期的事
我从2010年开始创业,创立了猎豹移动,经历了三个时段:第一个时段,把金山毒霸这款工业时代的软件变成了互联网时代的软件,现在还有营收,同一期的其他软件都没有了;第二个时段,我们开始去做全球出海的业务,全球6亿月活用户,4亿来自海外,Musical.ly也是我们投的天使投资,后来卖给了字节跳动,也就是现在大家熟知的TikTok;第三个时段,2016年,我们看到了AI,并提出All in AI,当时我们认为AI可以快速改变人类。但有时候技术不是一直高歌猛进,有高潮期,也有低谷期,现在终于等来了ChatGPT。我们当时就认为AI是底层的技术变革,要做机器人就要以AI为核心,做好端模一体,才能把一款产品真正做出革命性的体验。我们的Slogan是在AGI时代成为全球领先的新质生产力工具提供商。
很多人问我卖掉Musical.ly会不会后悔,没什么后悔的,因为我们没有这个基因,字节就是做得好。如果我们自己做,肯定不如今天TikTok做得好。况且我们也收获了很高的投资回报。每个人、每个团队都有自己的能力圈,做工具就是因为我们的基因,能把工具做好就非常了不起了。
如果再过几十年回头看这一波AI浪潮,可能和现在看牛顿和爱因斯坦一样。前段时间我去拜访罗振宇,聊现在如何创业,我们一起探讨就两件事:第一,真正追求快速闭环,我是个摆摊的,哪怕出现很大的变化,也有自己的小循环;第二,做一些穿越周期的事,就像爱因斯坦1905年的四篇论文,“相对论”奠定了现在的信息技术基础。
ChatGPT不是技术的胜利,而是技术信仰的胜利
2022年底ChatGPT的出现,改变了人类社会的方方面面。最近,阿里巴巴的王坚说AI也会改变科研,为什么这次AI和2016年那一波不一样呢?因为那时候看到AI很激动,觉得计算机可以识图、认人脸,就觉得它可以做一切。今天知道识别并不是人类独有的技能,语言才是人独有的技能,尤其是逻辑推理的语言。今天看起来能够突破语义理解,是人工智能的重大突破。OpenAI之所以牛,是因为它改变了学习路线,之前的大部分路线是让计算机学规则,但是OpenAI相信只要给它足够多的语言数据,OpenAI就会像小孩一样突然有一天开口说话。在此之前,大家都没有那么相信,所以其实在GPT3.0出现之前,OpenAI在硅谷都不被看好。所以,ChatGPT不是技术的胜利,而是技术信仰的胜利。因为人工智能就像大树下的根基都是一点点长出来的,一直长到Transformer,OpenAI相信只要做好下一次预测就能产生智能。这条路线非常艰难,艰难在于并不知道它的核心原理,但必须坚信,不断地试。它最难的是每次试都要花几千万美元,再去试,试完之后再调整。这也解释了,今天的“百模大战”不是技术的难度,而是技术信仰的难度,真的敢于相信、敢于投钱,才能真的把“ChatGPT”做出来。今天有很多文章说它产生意识,说它替代人类,都不用相信,ChatGPT就是预测下一个词的计算器,不断预测下一次概念的时候就产生了智能。为什么能出现这样的智能,它的原理还属于黑盒,就是没有数学公式推导能证明会出现这样的智能。我们这个行业有一个俗语,每次训练大模型就像炼丹,开始炼的时候不知道效果怎么样,一定要最后结果出来才持续。为什么OpenAI很厉害呢?2016年我们开始做语音识别、视觉识别的时候,随着数据量的增加,以前系统的智能水平很快就上来了,但是它只能上到一定的水平,这次给了大量的数据,它一直不怎么样,突然某一个时刻,水平一下子就起来了,到了原来系统到不了的智能化水平。正是因为技术信仰,今天我们也认为OpenAI的道路也未必是唯一正确的。因为技术有意思就在于它会不断地分支,不断产生新的可能性,当OpenAI在大参数模型上一骑绝尘的时候,越来越多的小参数模型开源社区开始出现。今天也有一帮人没有那么有钱,技术没有那么强,能不能做一个平民化的模型,只要解决专门的问题就行了,今天开源阵营就是在做这件事,用更便宜的算力成本、更小的参数量在某一个领域实现更好的效果,我们都坚定走在开源阵营的道路上。
模型还是应用?
去年我和朱啸虎有一次“吵架”,做AI到底是应用重要还是模型重要?当时由于大模型出来,太震惊了,很多人都说大模型会占据99%的产业链价值,但当时我就说应用是核心。今年世界人工智能大会(WIAC),几乎每个大佬都在谈应用,大家终于意识到给一个聊天窗口,给一个用户,就可以解决他生活中的所有问题,这件事情不可能,只有结合实际的需求,足够多的应用,才能让大模型为更多用户所用。前两天苹果发布会演示iOS 18后,股价涨了近10%,涨出了一个茅台和腾讯,这是苹果历史上第一次没有发布任何的硬件产品,而是发布一个概念,就是因为把Siri的概念重新升级,它就变成了你的助理,它用GPT技术做了交互。未来Siri就是我们和手机最重要的交互窗口,苹果的展示里就有Siri说:明天你妈妈要来机场了,记得去接她。这是主动提供助理的方式,以前是很难想象的。虽然以前我们有很多智能系统,但每个智能系统都要做开发、做适配,所以它并不能实现边际成本趋近于零,这次是可以实现的。推荐大家用一下秘塔搜索,搜一下就是一份报告,把需要一个晚上时间整理的报告变成了2分钟,搜索一定是重要的革命。这两天ChatGPT推出了自己的Search GPT,搜索就是一个强应用。还有就是微软的Copilot PC,它没有用英特尔的芯片,而是高通的芯片,高通的芯片是有45TOPS的NPU(神经处理单元),它可以独立处理AI的各种运算,有可能你对电脑说今天晚上把哪些文章搜一遍,整理出哪些东西,它就帮你搞定了。以前计算机也是一个生产力工具,但必须人伴随它,以后就是把计算机一放,它就把该做的做了。
大模型落地要和企业深度打磨
现在看起来AI非常热,但好的案例几乎没有,除了大模型公司自己讲,真正在客户端,没有落实好的案例。而且今天很多人都在说,我们都在期待一个好的to C应用,好像都没有出现。尤其是我们在做企业应用,在做机器人,它有三大阻碍:第一,我们的训练数据来自互联网,但互联网实际上是人类知识系统冰山显露出的一部分,书本是批量教育的产物,真正好的知识是深入的询问。很多知识来自日常的探讨,来自会议,来自各种讨论,但是今天大模型得不到这些数据。所以,造成的问题是今天在企业用大模型的时候,它回答得都很对,但没有什么用,都是常识性的回答,很难和私有的知识连接起来。如果真的要企业应用,私有数据是关键。这次苹果发布iOS 18那么成功,因为它把手机里的各种数据打通了,邮件等等都让大模型处理。其实都不是大参数模型,它是在端上处理的2.7亿参数的模型,但数据打通之后,爆发出来的能量惊人。所以我们提供的解决方案是一定要结合企业的私有知识。第二,数据的安全性。大模型和云最大的不同,云更像仓库,是不拆包的,只要租用我的仓库,我不关心你存了什么。大模型不一样,存的数据它都要看一遍,才能写报告和整理,这些数据都经过它了。即便美国OpenAI这样的公司都经常被爆出窃取私有数据等问题,所以企业就应该有自己的私有化大模型。个人以后要用好大模型,也应该有自己的大模型。苹果iOS 18就是个人端的Copilot。第三,生成式的模型,大模型的幻觉和一本正经的胡说八道,它不可避免,但它不知道自己不知道。人说错话,马上就知道,但大语言模型不是,它一本正经地讲林黛玉拿绣花针打虎的故事,它没有反思能力。今天我们发现和大模型打通以后,客服需要95%以上的能力,但大模型只能做到70%,这是大模型目前落地时天然的缺陷。今天业界提出了Agent的方式,通过一套规则或者自我反思、规划等等,和大语言模型在一起,去完成对一个具体场景的落地。很多大模型公司觉得“找人用一下”就可以把大模型做好,不是的,我们应该基于客户的诉求,做深度评估,才能做落地部署。我认为真正要把标杆,把很多东西抽象出来,形成标准化。ChatGPT到今天发布才不到两年,产业链上还有很多不成熟,它没有很好的供应商,很多苦活只能自己干。就跟特斯拉做第一辆车,整个电路都要自己干一遍,才能做自己的产品,大模型处于很早的时代,真的要做企业案例就要和企业深度打磨。如何做好机器人,通过私有化部署的方案,不需要特别强的模型,但是做好Agent应用,再加上私有知识库在很多场景可以做到95%左右准确率,满足客户的需求。我们提出一个企业应用大模型有三个段位:青铜段位是企业发动大家结合公有数据应用;黄金段位是把私有数据做好,做出数字员工;真正的王者是企业如何运营,大模型可以给出判断。美国就有这样的公司,专门通过大模型分析,给企业提供决策经营建议。今天大家都问应用什么时候会崛起?至少要到明年,会在C端看到一些应用开始出现,比如高通的那款芯片一出来,很多大厂都会在CPU上加上一个AI模块,本地应用机会崛起。这次苹果发布iOS 18,专门说会给手机配上开发图形的API,只有这样才能出现好的AI应用,或者深度化的AI应用。最后是物理的AI,今天最火的是具身智能,就是自动驾驶、智能座舱都是这个范畴。今年我们训练了一个14B的模型(Orion-14B),我们训练这个模型的核心就是让团队先学习。第二我们就是瞄准小参数,因为以后我们的机器人上,要跑本地化的模型,并与云端相结合。
机器人是下一个大模型终端
2018年我就提出机器人公式,AI、软件、硬件和服务,为什么这些年一直不温不火呢?因为以前AI的体验做不上去。我女儿经常讽刺我说:老爸,你做了一个人工智障机器人?我告诉她,不是老爸不行,是当时的技术不行,那时候雪不够厚、坡度不够长,今天大语言模型会把这个体验一下子提升很多。美国基金说可能会出现一个新物种,GPU+大语言模型+数据+电力,我觉得机器人就是这样的新物种。为什么我们做机器人还要做大模型?大模型就是机器人的大脑,你做机器人,自己不做大脑去买别人的大脑,你的竞争力就有限了,体验也不会好。我们就是要做端模一体化,根据场景应用找一款好的模型,做自己的大模型机器人。现在我们在1.0阶段,但至少要做到3.0、4.0才有体验上革命般的进步。大家都看到过餐厅的递送、讲解机器人等等,但加入了大模型就不一样。其实,Robot来源捷克语,这个词本没有那么强的人的概念,是“劳动力、奴役”的意思,在外国人眼里自动的就是Robot,只是我们翻译为“机器人”。事实上在大模型出现之前,机器人绝大部分都是自动化机器,产线上的机械臂看上去那么精密,都是写好的规则,事实上它是没有智能的。机器人有了大模型之后才能真正理解和决策,这是很大的改变。以前大部分都是基于规则,现在是端到端。它会像人一样理解世界,并作出决策,这个决策不需要人管中间的过程,这是机器人的极大提升。我们投资的一家公司做走播机器人,在直播间说话的声音像一个小姐姐一样,都是AI生成的,评论区说带我去生蚝区看看,她就去生蚝区,告诉你:“我们的生蚝又大又新鲜,赶快来吧。”之前请小姐姐直播一个月大概卖几千块优惠券,但用走播机器人一天卖3000块钱,用小姐姐播3个小时就太累了,但是机器人一天可以12小时,如果你愿意甚至可以24小时。今天人形机器人很火,但是我对双足机器人能成功商业化不是很看好,作为科研项目是可以,如果落地到产线上工作,没有三五年就不可能。尽管马斯克认为可以,但还是很难。而双臂这件事还是有机会的,用臂做一些以前不好做的工作,所以我们在具身智能发展的是双臂。今天我们发现海外也是一个巨大的市场,今年上半年我跑了几次日本,日本真的劳动力极其稀缺,所以他们对机器人的需求非常大,我们机器人能够为服务员省时、省力,他们非常愿意买单。今天有两个超级端:一个是Phone,一个是PC。下一个超级端是汽车,下下一个就是机器人,我相信让机器人插上AI翅膀就会完全不一样。最后希望所有企业家、创业者都一起全力用好AI,插上AI的翅膀。