“不是要推出一个‘超级应用’,而是要不断地帮助更多人、更多企业打造出数百万‘超级有用’的应用。”
这是百度创始人李彦宏在昨天百度世界大会上发表的对于当前大模型技术浪潮的认知与态度。
过去两年,大模型浪潮风起云涌,百度主要在做什么?底层技术上主要有两件事:
第一是RAG(Retrieval-augmented Generation)——检索增强。百度是国内最早强调检索增强技术的公司,到今天这一技术已经成为行业共识。李彦宏认为,过去24个月大模型行业最大的变化,就是基于检索增强技术基本消除了幻觉。
第二是iRAG(image based RAG)——检索增强的文生图技术。百度在今年年初决定解决这一问题,让文生图也能消除幻觉,从而在影视作品、漫画作品、连续画本、海报制作等领域落地。
此外,李彦宏还发布了One More Thing——秒哒,一个无代码编程、多智能体协作、多工具调用的软件,实现人人都是程序员。
相比底层技术,AI应用受到更多人的关注。李彦宏认为,我们即将迎来AI应用的群星闪耀时。
李彦宏看好两大AI应用方向。第一个是智能体,这是AI应用的最主流形态,包括公司类、角色类、工具类、行业类;另一个是产业应用,涵盖了制造、能源、交通、政务、金融、汽车、教育、互联网等众多行业。
构建智能体需要调用大模型API。半年前,百度文心大模型的API日调用量是2亿。李彦宏当时认为,如果这一数字能在一年之内翻10倍,也就是从2亿涨到20亿,那么他就认为大模型这件事就做成了。今天,百度公布了最新数据:文心大模型的API日调用量超过15亿,已经非常接近20倍的目标数字。
百度的大模型战略背后体现了李彦宏怎样的思考?在百度世界大会之后,甲子光年创始人&CEO张一甲、硅星人创始人骆轶航采访了李彦宏,来解读李彦宏心中的AI应用。
1.为什么说应用来了?
张一甲:过去一年,人工智能是全行业最火的赛道和技术方向,我们每天都看到非常多的产品和技术进展,百度可以聊的事情也非常多。为什么今年百度世界大会的主题定为“应用来了”?
李彦宏:从去年起,我一直在强调,模型本身并不直接创造价值,只有当模型被用来开发各种应用,并在不同场景中找到产品市场契合点(PMF),价值才能真正实现。如果说2023年大家还在努力提升模型的能力,那么未来所谓的“可用”,就是真的有东西用,应用的“用”。
过去一年,行业普遍存在焦虑:超级应用究竟在哪里?创业者的机会何在?有人甚至认为模型技术的迭代速度已经放缓,而超级应用尚未出现,这该如何是好?因此,我们提出了“应用来了”的概念。我认为,我们可以分享我们的探索、努力、工具和找到的路径方法;同时,也可以介绍他人在我们平台上创造的有价值成果,帮助更多人找到自己的发展道路和方向。
张一甲:百度在人工智能方面是全栈式布局,从芯片到框架、模型、应用都有。但今天你主要讲了iRAG、智能体、零代码。为什么挑选这几个事情作为重点?它们之间的关系是什么?
李彦宏:我们是自上而下的视角。从应用需求出发,确定需要的模型,进而确定模型所需的框架,以及框架所需的芯片,逐步深入。例如,我们今天发布的iRAG,就是因为应用需要生成准确的图像,比如公司的logo不能变形或颜色失真,这就需要精确的多模态能力。经过近一年的努力,我们认为这项技术已经实用,因此首先介绍。
我今天上午提到的逻辑是,过去两年RAG的出现让大语言模型变得实用,有效控制了幻觉生成,使其在B端场景中得到应用。多模态技术要实用,也需要准确性和可控性,即我要求你准确,你就不能出错。有了这种能力,应用空间才能拓展。
拓展后,我们寻找应用场景。智能体分为四种类型,产业应用基于我们与公司的合作,看如何在具体业务场景中提升效率,实现实际收益。
最后,我提到的无代码多智能体协作还是一个期货,预计明年一季度试用,但我认为这是一个伟大的创新。目前,硅谷和美国都非常重视辅助代码生成,既有基础模型公司,也有创业公司投入数亿美元。他们的逻辑是,美国缺乏工程师,而工程师成本高昂,年薪可达几十万甚至上百万美元。如果能帮助工程师提升效率,比如将原本两小时的工作缩短到一小时,他们就是这种思路。但我们的想法是,能否进一步降低大模型的应用门槛,让非程序员也具备编程能力。即使是计算机专业的本科毕业生,编写两三百行代码也不成问题,但在整个人群中,这仍是少数。我们希望数亿劳动力也能具备这样的能力。
随着基础模型和智能体能力的提高,我们可以将这些能力整合,让普通人,即使是不懂代码的人,也能拥有程序员的能力。想象一下,当数亿甚至数十亿人都具备这种能力时,对创造力的激发,是辅助代码生成工具无法比拟的。那些工具只是让顶尖人才更高效,而我们希望让更多人拥有顶尖人才的能力,这意义更为重大。因此,我们将主要精力放在这个方向上。
张一甲:其实工程师、程序员群体恰恰是对大模型、人工智能最有主动性、积极性探索的群体。百度做布局的时候,好像绕过了最活跃核心的群体,直接希望下沉到普通的不会写代码的群体。为什么不是先在最活跃的程序员群体中,激活这个离果实最近的群体需求,而是做这么普惠的事情?
李彦宏:也不是直接下沉,客观的讲,我们也有代码辅助生成工具叫Comate,现在百度内部一万多工程师,大约30%的代码是大模型生成的。但是它赋能的只是现在这一小比例的群体,这个产品也对外售卖,也有不少客户用这个东西,对于提升工作效率的作用已经比较明显了。
但这是两个不同的赛道,我觉得意义更大的是另外一个赛道,这边几万行,几十万行代码才能干一件事儿;但是我这边几百行代码能干另外个事儿,但它真的能让几亿、十几亿人都可以干了,意义不太一样。
骆轶航:无代码是“只要会说话就能开发应用,不需要会编程语言”。这句话会不会多多少少造成误导,让大家觉得这个门槛真的已经降得很低了,真的已经这么容易吗?
李彦宏:这还是两个不同的track。在那些最复杂的应用场景,可能确实不仅要考虑应用,还要考虑模型的能力,还有刚才讲的模型精调,数据标注等等,确实大量大量的工作仍然在可预见的未来是需要的。但另一方面,也使得很多相对没有那么复杂的应用,在过去看来还不是那么容易的事儿,在今天看来,你不是程序员也好,花几分钟时间就能做出来了。
这一条赛道也是一个逐步发展的过程,我不希望大家有误解,明年一季度所有程序员能干的事儿你就全部能干了,不会这样一蹴而就的。但是它是非常非常有希望的赛道,我今天能够写两百行代码,一年以后可能能写两千行代码,再过三年可以写两万行代码,这个能力会逐步发展出来,那它会让更多人的创造性给激发出来。
2.基础模型两年发布一个大版本就够了
骆轶航:今天上午你的演讲没有提到这两个词:一个是AGI,一个是Scaling Law,现在不讲这两个词的AI类主题演讲和活动几乎已经不存在了。你对这两个词是不是有什么看法?是AGI太远,Scaling Law卡住了?
李彦宏:确实不是故意的。可能是它们没有跑到我心里,让我觉得说这两个东西足够重要,在百度世界大会上一定要提一提。AGI这个词,就像一千个人心目中有一千个哈姆雷特。我如果再讲百度怎么定义AGI,无非就是又增加了一种定义。即使跟别人不一样,也没有多大价值。既然主题是“应用来了”,咱就关注应用。至于说更加长期的东西,我们还是在沿着这条路在做。但把这些东西讲得更完整或者更深入,我觉得只对非常小比例的人有价值,更大比例的人只是多知道了一种AGI的定义,意义是不大的。
张一甲:今年,GPT-5没有发布,OpenAI发了GPT-4o和o1模型,看起来可能是一个分杈树上的成果,或者是微创新成果。所以,大模型基础技术的进步是不是在放缓?
李彦宏:我觉得还是取决于你从什么角度看这个问题。如果当做一个学术项目,北极星指标就是「哪一年或者哪一月能实现AGI」,可以说技术进步的速度有所放缓。但我的视角更多是从应用角度看的,大模型的技术进步到底产生了什么应用。这个角度来说,我认为技术进步的速度不仅没有放慢,而且有变快趋势。
过去幻觉现象非常普遍。现在不管用哪个AI助手,问一些相关的问题,比如,这个酒店游泳池有多长?过去在网上搜索这个答案,官网没有,携程或者某个用户评论区有这个信息,但你得找半天。现在大模型直接给你答案,这个答案能不能信呢?能信。就是因为像RAG这类技术的提升。
过去两年,我认为大模型在迈向实用的过程当中,发展出来的能力仍然在以一个比较快的速度增长,所以你能够看到我们今天看的调用量上升那么快。为什么要调用,因为它有用,它在各种具体的场景当中产生了价值。
另外一个角度来讲,反而是基础模型不能够迭代特别快。如果老在变,那做应用的人就无所适从了,该做什么我不知道,我刚做了两个月,你又升级了,把我做的冲掉了,白做了,我又得重新适应一遍新的规则之类的,我觉得可能两年一个大的版本是一个比较合适的节奏。
骆轶航:所以我们不能等模型进化到AGI的阶段再去做应用。
李彦宏:没有必要。
骆轶航:o1是另外一个深度思考的维度,这个维度本身对于做应用有没有一个更好的促进作用?
李彦宏:非常有意义。百度大概是从去年第四季度开始在朝这个方向做,我们没有把它叫做强化学习、o1什么的,我们就说智能体。智能体有什么功能呢?反思、进化、使用工具,这些能力都是今天o1努力的方向,和传统意义上大语言模型的方向确实不一样。
我刚才讲了,开发者可能已经逐步适应了怎么在大语言模型上开发应用,突然搞出来一个新的方向,又得适应一遍。其实我们也很希望大家赶紧适应这种新的思维逻辑,怎样慢思考,调用工具。但这有大家学习和适应的过程,今天虽然我们发了多智能体协作这些东西,但让一个开发者开发一个多智能体协作的应用,其实难度还是很高的,成本很高,反应速度很慢,各种各样的能力怎么调用,有一个接受的过程。我很看好,但是我们得逐步逐步得让大家学习这种新的能力,接受然后再把它利用好。
3.不做Sora,但非常看好多模态
张一甲:年初Sora发布,多模态成为了今年为数不多的炸点,有非常多的公司冒出来卷Sora,这个事情百度怎么看?百度做不做Sora?
李彦宏:我觉得Sora和多模态是两个事儿,Sora本质上是在任意场景下的视频生成能力。这件事情非常有意义,与此同时又非常难。它的本质是基本可以预测未来,可以预测到下一个10秒画面变成什么样子。无人驾驶是一个特殊场景的视频生成,我现在开到这儿了,那我下一秒怎么开,会看到什么样的景象,如果你都能解决的话,那无人驾驶不用做了,都可以靠那东西做出来。正因为是这么大的一件事儿,所以我觉得它需要很长很长时间才能够做出来,而且成本很高。
但是我们今天讲的多模态,实际上是解决另外一类型的问题。比如数字人不是纯语言模型,生成的文字要用语音表达出来,语音表达的时候口型要能对得上,手势应该做什么,我如果转头了,侧面的图像能不能跟正面保持一致等等,看起来都是一个比较简单的事情,但是你仍然需要解决。靠任意场景下生成视频的东西,不一定能把这事儿解决得很好。
我要解决刚才说的这些东西,把这些简单的多模态东西解决了,就能够有很好的应用场景。我用简单的方法,就能够做到,那我为什么不呢?先把这些事儿解决了,让这个应用能够跑起来,这是我们的思路。有一种误解,就是百度不做Sora就是百度不做多模态。我们非常非常看好多模态,我们也在多模态上有非常长期的多年投入,在真正有应用场景的地方,我们的多模态能力是非常强的。
张一甲:是不是iRAG就是百度走向多模态重要的一项基础技术?
李彦宏:是的,它是我们在开发各种各样应用过程中遇到的一个障碍,必须把障碍搬走之后,我才能再往前走。
张一甲:iRAG是一项基础技术,接下来iRAG准备怎么用?往哪个APP上用?还是以什么样的形式走向终端应用?
李彦宏:终端应用应该是大家群策群力,每个人根据自己的实际需求,在已经了解的场景怎么更好地使用它。我能够想到的,其实今天举了不少车的例子。车这个行业你们非常清楚,很依赖市场推广,他们在做市场推广的时候非常非常讲究。如果出一款新的车型,我要拍摄非常漂亮的画面,照片也好,视频也好,要花很多钱。拍一张车的图片,最少得几千块钱,上万块钱;而它要拍好多张图片,还要拍视频等等。过去要五千块钱做的事儿,现在五分钱就能做出来,如果能做出来就可以大量做。
今天的例子,车飞越长城,那个东西不可能靠拍摄的,车飞不起来。但是车飞起来的话,好看不好看?确实好看。在这种市场宣传的场景,非常有用。我既要保持车该有的东西必须得有,不变的东西不能变,但是它又能够放飞人们的想象,真正有创造力的故事情节能够出来,那肯定会更吸引人。所以,在几乎所有的创作场景,iRAG都非常有价值。
骆轶航:今天上午,你有一个非常重要的论断,就是过去两年大模型基本上消除了幻觉。幻觉有的时候是涌现的伴生品,那么消灭了幻觉,会不会杀死了进一步涌现的能力?
李彦宏:这就需要我们这些从业者不断的创新,我既要消灭幻觉,还要能够保持你的涌现能力、创造力。其实国外很多人讲,基础模型将来能够具备诺奖获得者的智力水平,那是极大的创造力迸发,这确实是努力方向。但与此同时,它的这种副作用,就是幻觉要能够控制。
张一甲:技术的角度来讲,让它减少幻觉变得非常精准,和它给我们带来很多的想象力,这两个事情本质上是矛盾的吗?
李彦宏:有一定的矛盾,但它是可以解决的。我觉得至少是可以逐步解决的。我遇到问题的话,总会想办法。我希望鼓励什么东西,我在这方面要加强,不鼓励什么东西,要用其他的手段去进行控制。
4.真正的legacy就是,我信AI
骆轶航:中国AI有两派人,理想主义者和现实主义者,理想主义者追求模型的不断进化和进展;现实主义者更重要看用到模型的能力做了多少具体的事情。您今天的演讲没有大词,没有基座模型的进展,甚至不提文心一言和文小言这几个字,更多的是应用。我想知道您是从哪个时间点开始越来越倾向于变成一个AI发展的现实主义者了?
李彦宏:其实讲模型能力,我也可以讲一个小时甚至时间更长,我也不认可自己就是纯AI现实主义者。我们没有讲的,并不表明我们没有做。事实上,百度很多的研发资源还是投在了外界看来基础的能力或者理想主义者看重的东西。我们在做,我们不断地在这方面加大投入、付出努力。我只是觉得,没有必要把这些只有极少数人才能够听得懂或者说才会appreciate的东西到处去讲。我需要到处去讲的是,更多的人,几千万人,几亿人确确实实能够用得到的东西,我希望多讲。
张一甲:今天你有一个很大的篇幅讲智能体、自由画布,现场看大家很兴奋,自由画布这个idea怎么诞生的?它是百度对于多模态应用的一种终极的想象吗?
李彦宏:其实还是基于需求。这个事情最早是因为百度有一个产品叫文库,文库最早是找现成的文档,并不是做生成的。在生成式人工智能技术出现前,文库已经出现了。但是当有了生成式AI,我们发现人们最根本的需求,不是找一个现成的文档,而是为了创作自己的内容。
我们怎样能够基于现成的文档,或者哪怕没有现成的文档,能够让他更好的创作,这条路走下去就是最早文库的重构。后来我们又发了单独的产品叫橙篇,现在又推自由画布,是一步一步基于让人们能够更加方便地创作内容,或者说也不仅仅是创作,是communicate your ideas,怎么能够把心里的想法更方便,更准确的表达出来,不管语音也好,图像、文字也好。这个过程我们怎么enable这些用户,做这些事情。
骆轶航:一般比较大的公司做创新,最大的负担是Legacy,而创业公司能够没有负担得往前跑,但自由画布恰恰是建立在百度的Legacy基础之上。所以怎么看过去的一些积累?这个事儿的帮助是什么?
李彦宏:根本原因还是到底信什么?一旦你从这个视角考虑问题的话,都很好解释了。百度信AI,不是今天才信,也不是两年前信,是十几年前就信这个东西。所以文库的改造也好,或者说非常坚决的做一些在大家看来是全新的东西,或者说没有太受legacy的束缚。更或者说,我们真正的legacy就是我信AI,一旦你把这个东西当成legacy,这些东西其实就都很好解释,我就是在做我多年前一直想做的事。
5.超级应用一定会有,只是时机未到
张一甲:去年开始,我们都不断地在畅想或者期待,能够出现一款超级应用。但是为什么今年并没有出现超级应用?
李彦宏:我认为会有,只是现在时机没有到。之所以大家觉得该出来了,但是还没出来,是因为大家很容易拿这波生成式人工智能和上一波移动互联网或者上上一波PC互联网相比。说那个都是火了几年以后,我们就已经比较明确的能够看到超级应用的出现。但其实你注意到,当生成式人工智能起来的时候,我们对外一直讲这是一场新的工业革命。
如果你看作工业革命的话,应该回去比较,当时电力革命发生的时候,这个超级应用是什么?过了多少年出来的?当时蒸汽机革命出现的时候,它的超级应用是什么?是怎么出来的?那些东西可能更具有可比性。
骆轶航:它不是长在一个设备上的一款APP或者一个软件,可能是更基础设施的东西是一个超级应用。
李彦宏:没错。
张一甲:比如电力革命,并不是说某一个爆款的产品把工业革命掀起来了,而是变成基础设施以后,电灯、电话、电视、电报,各式各样百花齐放成就了一个时代,所以你今天说,相比超级应用更重要的是“不断赋能数百万超级有用的应用”。这句话是你想到的吗?
李彦宏:应该是我最先说的。
张一甲:这一字之差,其实内涵非常大。
李彦宏:对,确实就是代表我们的理念,或者说代表我们真正关注的点。
张一甲:百度一方面自己做应用,一方面也在大力推广智能体生态,赋能非常多的用户和开发者,在百度平台上做应用。未来如果出现了真正的超级应用,最有可能是百度自己做出来的,还是开发者做出来的?百度的未来,更像是一个应用公司还是平台公司?
李彦宏:我认为更有可能是开发者做出来的。我内部也讲同样的话,我们做的应用,我们同时做十款应用或者最多一百款应用,外界可能有一万个创业公司在试各种各样不同的赛道,所以你想一万对一百,哪一个做出来的可能性更大?一定是外界做出来的可能性最大。
张一甲:概率来讲也是来自开发者。
李彦宏:对,我们主要精力还是放在做工具,做基础平台,让大家更容易的在这上面开发应用。
6.百度从来没有对标过OpenAI
骆轶航:OpenAI一方面开“开发者大会”,给开发者提供一些工具和API,一方面自己推进模型往前走,哪怕一个小的功能,也杀死一批创业公司,以至于现在唯一有超级应用影子的AI应用就是ChatGPT。所以百度自己的核心要做的事情是什么?以及它和开发者的关系上,完全不想做另一个OpenAI?
李彦宏:说实话没有想过这个问题。
张一甲:是不是百度从来没有把OpenAI当做自己的对标?
李彦宏:没有。
骆轶航:但是模型本身上会拿它当做参照。
李彦宏:对,我们还是很关注它在做什么事情,但确实没有想过,要不要成为它。
张一甲:基因角度讲,百度也从来不是OpenAI?
李彦宏:不是,不是。这并不表明,我们是一个纯粹的现实主义者,其实我觉得我们也挺理想主义的。当你的梦想是让几亿人、十几亿人都具备程序员的能力,这个又需要很多年大手笔投入的时候,这难道不是一种理想主义吗?
7.智能体与搜索结合拓展了搜索边界,而不是替代或者分流
张一甲:你把一个工具做到了千家万户,让所有人都可用,本身也是一个巨大的蓝图和理想。关于应用,之前你的对外分享提到,从Copilot到Agent,到AI worker,智能体会是AI应用的终极形态吗?还是过渡阶段?
李彦宏:这个问题应该放在时间线的坐标轴上看,拉长这个时间线的话,肯定Agent是过渡形态。但是这个过渡形态我的判断会持续比较久的时间,即使是AI worker出现以后,它跟智能体还是会长期并存的关系,有些东西可以完全自动化了,有些东西还是需要通过人和AI或者说跟虚拟人的协作来完成,还是分不同的场景。
张一甲:智能体也会存在分发和流量入口的问题,跟传统的搜索,以及现有的产品矩阵之间会不会有流量争抢、竞争的关系?
李彦宏:我们想象的分发的机制或者流量入口,比较类似于现在的百度搜索。在百度里搜相应的词,你出来就有可能是一个智能体,你跟这个智能体,就像跟一个律师在线问答一样,可以进行很多轮的互动,我们看到有好几十轮的互动,有一个用户跟AI的智能体不断地问。
骆轶航:搜索公司是不是更容易做好AI智能体和很多更好的AI应用的框架?
李彦宏:应该是。大语言模型跟搜索本身很近,我们搜索一直在处理目前语言文字的东西,这是为什么我们可以很快推出来文心一言。另一方面,你有那么多智能体的时候,还是说怎么能够跟人的需求高效的匹配起来,人有了这种需求以后,上哪儿接触到这些智能体,最高效的连接还是一个搜索。
张一甲:每个智能体有多轮的对话和具体的功能,好像很多功能点进入到了一个又一个深井里面,进入到一个更深的、实用的场景里面去,会不会对原来百度的搜索的界面进行了某种分流?
李彦宏:准确的讲,不算分流,这个更多是打开了新的可能性。传统的搜索确实属于像快消品一样,即时满足你的需求、给你答案。而智能体需要多轮交互,特别复杂的需求,需要一轮一轮的交互澄清,最后帮你解决问题,甚至需要调用工具解决。这些问题,传统搜索要么解决得不好,要么压根解决不了,这两者的结合拓展了搜索的边界,不是一个完全的替代或者分流。
骆轶航:过去搜出来的是网站,现在搜出来的是智能体。
张一甲:最终的流量还是集中在以百度搜索为核心的主阵地,而不是我们分发成很多APP,别的入口?
李彦宏:APP还是移动互联网时代的理念,一方面智能体是一个更好的,满足过去满足不了的需求,这种新的形态;另一方面,大家这么关注分发,其实还是互联网思维导致的,你想一下,今天我举的像百胜中国、智能招聘这些例子,它关注的不是分发,它自有的场景,我怎么能够更加高效、更加低成本、更加快速的做到那些事情,这样的例子是很多很多的。
张一甲:这里面会存在一些商业顾虑吗?比如由于很多智能体的存在,让我们原有的商业搜索蛋糕被稀释了,有这样的隐忧吗?
李彦宏:没有,我觉得现在根本没有必要考虑对现有商业模式的冲击,因为你一旦打开了更多的可能性给自己的用户、给自己的客户,创造了新的价值的时候,你总能找到新的商业模式。我今天展示的调用量的图,你想想如果调用收费的话,那这种涨法是可以收到很多钱的。
骆轶航:比起很多同行,文心一言并不是API降价上非常激进的玩家,是什么导致了文心大模型最近两个月调用量的陡升?
李彦宏:其实我们价格非常有竞争力的,甚至有些模型是大家可以免费调用的,相当于算力送你了。更重要的是,可以说是开发者群体的觉醒,他逐步意识到了可以用模型来做出什么应用来,这是为什么我们今天强调“应用来了”,当过去一开始曲线相对没有那么陡峭,相对那么平的原因是因为绝大多数人还不知道大模型能做什么,一旦它知道了之后,那需求其实是足够旺盛的。
骆轶航:所以这个曲线也不仅是针对百度和文心大模型的,是针对整个行业的。
李彦宏:对。
8.应用驱动就是第一性原理
张一甲:人工智能是一个大的概念,里面涉及到的技术门类和产品迭代的方向又非常多,作为百度的掌舵者,每一天面对这么多的进展,你的底层思维是什么?怎么决定做什么、不做什么?取舍过程中,有没有背后思考的第一性原理?
李彦宏:就是应用驱动。这个和美国很多公司做法很不一样,美国很多公司一直都梦想要做颠覆性的技术,要多少年之内做成什么什么样子。我更多希望尽早接触场景及接触应用,在这个过程当中大家遇到的最多的问题,就是我们优先解决的问题。
很多美国同行,他们做法是当做一个science,我有一个终极目标,就想尽各种办法解决它,我们这边当做我要解决的问题,这个问题可能用工程的方法也可能用其他的方法、用数据这些驱动,最后解决下来。但是你看现在诺贝尔奖都授给公司CEO了,为什么呢?很多非常有意义的,即使是从science的角度很有意义的事,最后是靠工程的方法解决出来。所以做工程不丢人,做工程很有可能是比科学更早发现机会、发现规律的。其实飞机也是,飞机先飞上天了,人们才开始研究,原来有一个东西叫空气动力学。
张一甲:我们谈工程落地的时候,会涉及到非常多具体的需要解决的问题。你怎么决定你的重心投入聚焦的地方?
李彦宏:任何一个企业家都应该具备的能力,你面临的机会,面临的挑战总是很多很多,总是数不清的,你就是要有能力,去粗取精,去伪存真,最后沉淀下来,排出来,自己要做的事情,并且脚踏实地的把这些问题解决掉。
张一甲:关于人工智能技术本身其实还是存在一些分歧。百度投入下一代技术研发的时候,你们是all in一个方向走,还是会形成多条线,同时在往前推?
李彦宏:这是我们内部不断讨论的问题。说实话现在没有确定的答案,或者说这个答案不断在推演,不断修正过程中,任何一个公司的资源都是有限的,你不可能什么都做,并且什么都做得很好,所以一定要有取舍,我经常说所谓战略就是取舍,我们内部不断在做这样的取舍,技术模型有很多需要发力的地方我到底做什么,不做什么?先做什么后做什么?这是每天我们都在讨论的问题,可能今天给你的答案跟三个月以后给你的答案又不一样了,但是你说是不是只做一件事情,肯定不是,我们是多条线做的。
张一甲:你怎么定义什么叫做自己想要的人工智能?那每天面对各种信息,怎么保证自己看到的是真相?
李彦宏:对,我也看到各种各样的说法,但是我还能看到很多别人看不到的东西,公司内部,我们在最前沿的模型训练过程当中,到底遇到了什么问题,到底哪不满意,我能看到很多这种别人看不到的东西。因而,我也可以根据这些我所看到的信息综合起来,最后决定什么是真相,什么是重要的,什么是我们紧急的,要解决的问题。
我刚才也讲了,对我们来说并不希望基础模型不断变,我认为大的版本,比如两年左右发一个大的版本就可以了,这中间要让开发者适应,让他明白基础模型到底有什么能力,我基于这个能力到底能够做出什么东西来,基础模型变化太快,其实对于整个生态我认为不是好事情。
张一甲:像去年那种天天经常有模型迭代进展,动不动技术栈就要变了的情况,可能并不是人工智能走进我们生活当中一个比较健康的节奏和方式?
李彦宏:它在最早期的时候有这样的现象和规律是应该的,因为刚开始出来确实太不成熟了,没法基于它做应用,如果两年、三年了,还这样,那整个生态其实是会比较乱。我们把注意力应该放在闭环怎么走完,而不是不断解锁能力。2024年大家有一点急功近利了,大家都带找所谓的“超级应用”,但是真正的应用,现在已经可能有几十万上百万的应用了,只不过不是移动互联网时代的超级应用。
张一甲:在你看来,无论是一个猛子使劲在基础能力上往前冲,还是一味期待非常酷炫的人尽皆知的超级应用,都不是一个正常的发展态势?
李彦宏:对,不是本质。你看蒸汽机的发明过程,也是经过了几十年后来出来热力学第二定律之类的,电力也是。电灯、发电厂,最后像流水线之类的,这些都是因为有了电以后,才演变出来的新的业态。
骆轶航:科学家在一个AI公司里面,应该扮演的角色是什么?是驱动、辅助,还是什么环节的角色?
李彦宏:科学家应该提供的是vision,他应该看的比工程师更远一些,你看这一轮大语言模型的爆发,其实背后的vision就是你刚才讲的Scaling Law。有人看到了,我只要加算力,我只要用更多的数据来train这个模型,就会出现智能涌现,他是先有了这样的想法,才去做这些事儿的,这些事儿从正的角度想的,之所以越来越多的教授创业或者是加入更大的公司去,是因为创业能够拿几亿美元,你在学校拿那些东西就几百万美元,全美所有的大学加起来,涌现不出一个GPT3.5。在大厂里头,几万片,甚至十万片的东西已经出现了,在这么大规模上去做,显然比别人更早的知道,未来是什么样子。这些年技术发展可以说是新的特色,不光是一种想法,刚才讲了vision,要跟资源相结合,我只有有这么多资源的时候,我才能证明这个想法到底是对的还是错的。
有些人感兴趣的是相对比较science的东西,没问题,有价值。有些人感兴趣的是,怎么在市场当中找到一个创造价值的地方,我觉得也是需要的。这个世界就应该这么多样化,大家不同的人有不同的爱好,不同人有不同的信仰,最终才是有意思的世界。
张一甲:2024年已经快到尾声了,如果展望明年,你觉得人工智能可能的下一个里程碑事件是什么?
李彦宏:我觉的在各个层面都会有一些渐进性的变化,比如说基础模型的能力会提升,更多的应用会出来,尤其像多模态相关的,无论是基础能力也好,还是应用也好,可能会被更多的人所感受到。我们讲四层架构,在芯片层面、在框架层面、在模型层面、在应用层面,这四层还都会有相应的进展,甚至我觉得进展会很快。那么有了那些东西之后,上面还能够长出来什么样的可能性,其实还是挺令人期待的。
张一甲:你最期待发生什么?比如说今天如果你打开手机,看到关于人工智能的很多新闻,你脑海当中会有一个声音说,我很期待今天发生了一个什么样的事情,证明我们的判断是对的,或者给我们这个行业再来一个非常大的动能的加持?
李彦宏:我们其实不是在做一个猜谜游戏,实际上是先有了一个vision,再去实现这个vision。如果你问我最期待的东西,我还是期待像秒哒这样的产品,它能够写越来越多的代码,能够做越来越复杂的问题,让越来越多人不懂代码的人、能力没有那么强的人,具备金字塔尖那些人的能力,我觉得这是明年,也是更长期的技术理想。
9.AI人才的流动是很正常的
骆轶航:我们聊一些轻松的议题。诺贝尔物理学奖得主Geoffrey Hinton曾经差点加入百度,Dario Amodei也在百度实习过。
李彦宏:他(Dario Amodei)是百度正式员工,JimFan在百度实习过,Andrew Ng也曾经是百度非常重要的科学家。
骆轶航:发散的说,如果这些人现在都在百度,百度是个什么样的公司?聚焦一点的话说,很少有公司像百度这样,一个中国公司在全球的AI发展人才节点,资源节点和技术节点扮演过这么重要的角色,百度未来还能不能再继续扮演这个角色?
李彦宏:其实这个事也蛮有意思的。Geoffrey Hinton最终选择加入Google,并非因为我们不愿意出更多的钱,而是他个人更倾向于留在美国。尽管他未能加入,我们依然渴望吸引真正的大咖加盟百度,因此后来我们邀请了吴恩达(Andrew Ng)。吴恩达加盟的原因相对简单:当时他在Google负责Google Brain项目,希望购买更多GPU,但Google认为成本过高。我们则表示,只要他来,GPU随便买,于是他便加入了我们。他的到来,如同Dario Amodei——原斯坦福的学生,Dario Amodei加入后推荐了Jim Fan来实习,这样的连锁效应,一代代地吸引了优秀人才。
这些人才虽然后来因为种种原因离开了百度,但这对整个行业来说是健康的人才流动。他们找到了新的起点,同时百度也培养了一批杰出的人才。外界可能会因为某个人的离开而有所报道,但如果他们留下,却鲜有报道,这并非因为他们不够优秀。实际上,百度内部有许多默默无闻却极其优秀的AI专家,只是因为他们未曾离开,外界才不得而知。
对于我们而言,一方面,许多公司的创始人和不少互联网公司的CTO都是从百度走出去的,我其实很高兴。这不仅意味着我们对社会有所贡献,也树立了百度的技术品牌形象。今天,一个应届毕业生加入百度时会思考,这些离开百度的人在这里做了什么,他们能从百度获得怎样的学习和成长机会,这对于吸引新的优秀人才是非常有益的。这些人才往往能在百度脚踏实地地工作,并创造出成果。我认为,那些尚未成名的年轻一代,才是我们最宝贵的财富。
张一甲:是不是可以理解为,在今天这样一个逐渐强调落地应用的年代里,人工智能往前发展,并不像当年那样非常依赖个别的明星大牛、科学家去驱动,而更像是实打实的扑在一线去摸索需求,去解决工程问题?
李彦宏:其实都需要,这些大牛我们需要他能够看到五年十年以后,很可能某一个方向特别有前途的。但是光看到不行,你得把它做出来,得匹配相应的GPU算力资源,得有一大帮工程师。一开始做这个东西可能要100块钱,怎么把它变成一块钱就能做出来。一开始做推理要10个小时,怎么10分钟做出来,这些问题解决了,你的vision才能变成现实。
骆轶航:百度怎么在整个全球AI格局中,更加体现它的技术前瞻力?我们曾经体现过,现在体现真的比当时难,因为我们是一家中国公司。
李彦宏:总是有解法的。中国毕竟有14亿的人口,中国本身就是一个很大的市场,中国人总体来讲对于先进技术其实是欢迎的,是愿意接受的。有了这样一个环境,我们总是可以做出很多创新的,只不过这个创新,也许不是从底层往上走,而是从最上层往下走,我认为一样可以走通的。
张一甲:在我们今天这个节目的结尾,对我们所有在关注百度世界大会和关注人工智能方向的朋友们,你有没有什么总结、寄语给大家分享?
李彦宏:其实我还是想说,人工智能很像是一次新的工业革命,这意味着它不是三五年就结束,不是一两年就出现“超级应用”的过程,它更像是三五十年对于整个社会的方方面面一个非常彻底的重构。在这个过程当中,我们既需要耐心,又需要大的投入,同时需要不断的传播这种火种,让越来越多的人,越来越多的组织和公司,能够理解这件事情对他们的意义,并且很好的利用这些新的技术能力,给自己的组织、自己的公司创造出来更多的价值。
骆轶航:需要长期主义、理想主义和现实主义的三结合。
李彦宏:对,三者结合。
(封面图及文中配图来源:百度)
END.