黄仁勋在联想科技大会,图源:联想
英伟达CEO黄仁勋认为,这轮机器学习创造了最大的工业革命。黄仁勋描述了未来AI的两大重要方向:智能体AI和实体AI。智能体AI是信息领域的机器人,而实体AI则是物理世界的机器人。他提出了未来会有数以百万计的“小Jensen玩偶”(Toy Jensens),AI智能体,能够协助企业和个人完成各类任务。
联想集团董事长兼CEO杨元庆很早就提出了AI PC战略,并在联想笔记本电脑上植入了AI智能体AI Now,根据IDC的数据预测,到明年,AI PC就将占据市场的一半份额。到2030年,这一比例将达到100%。杨元庆在会后采访中提到:“AI PC是今天的主导者未必是明天的主导者,更不用说个人智能体变化就更大。可能今天的操作系统就会被颠覆掉,像Windows拿着鼠标在点icon去打开,打小叉叉去关闭,那些东西都已经不符合操作的习惯了。将来的操作系统、模型会整合,会有新的主导者出现。”
联想集团董事长兼CEO 杨元庆,图源:联想
另外,Meta创始人兼CEO马克·扎克伯格在远程连线中再次强调了开源打法以及Meta最近发布的开源多模态模型。他提到联想搭载在个人PC上的AI智能体AI Now正是基于Meta的模型创建的:“这也是我们开源 Llama 的一个重要原因,像联想这样的公司可以对大型语言模型进行微调,优化其在特定使用场景中的表现。” 他也更新了最近Meta的最新进展,比如发布的开源多模态模型 Llama 3.2,以及发布的110亿和900亿参数的模型,以及更小的、专为在设备上运行而优化的10亿和30亿参数的模型。
大会的另一大看点是英特尔与AMD这两个纠缠了几十年的芯片届的宿敌,史无前例地宣布合作,组建X86生态系统咨询小组,确保互操作性和接口一致性,并为开发者提供标准的架构工具与指令集。
基辛格在活动上亮出了他与杨元庆年轻时候的照片,X86架构是英特尔与联想几十年合作的基石,并且认为他们面前将迎来X86架构最重要的创新时期之一。基辛格生动地说道:“为此,Lisa(苏姿丰)和我达成了一致,我们真的认为现在是最佳时机,无论是Lisa还是我,还有什么比联想的舞台更适合宣布这件事呢?”
基辛格展示他和杨元庆年轻时候的照片,图源:联想
苏姿丰也提到合作的基础正是人工智能带来的时代转折点:“最令人惊叹的是,我们依然处于非常非常早期的阶段,但我们所看到的是创新的速度比以往任何时候都快。坦率地说,我们可能在过去两年所取得的进展,比前十年加起来还要多。”
联想科技大会“AI观察团”,图源:联想
在这次大会活动前特别设立的直播间里,硅谷101创始人泓君主持了一场与硅星人&品玩的创始人骆轶航以及热AI Next的主理人陈庆春关于当下人工智能如何落地的讨论,一起组成了“AI观察团”,聊了聊活动上热议的AI智能体与联想这次重点强调的无处不在的混合式AI。
但我们总结出一句话:AI agent不是你,但它可以代替你,帮助你自动解决和处理问题。
陈庆春:对,在联想就叫做你的“个人智能体”,你的个人的双胞胎。
骆轶航:最近有一个特别有意思的趋势,硅谷许多原本声称解决垂直领域问题的AI公司,现在都在搞AI陪伴。但这种AI陪伴并不是简单的逗趣聊天或情感互动,而是具有知识和情绪,帮助你处理每个问题。比如,一些公司专注于降低客户流失率、提升客服体验,或是针对保险、教育等行业的AI平台,甚至包括会议管理的AI平台,这些应用都开始出现了。
AI智能体和深度场景的结合是一个明显的趋势。比如,像友邦这样的公司,是否会把客户数据提供给ChatGPT等AI模型?这带来了很多值得思考的问题。未来,销售经理可能会管理多台没有屏幕的一体机,每台设备都有一个智能助理,帮助他处理复杂的销售管理工作,满足几十到上百个客户的需求,管理情绪等复杂任务。这样的AI agent实际上是微调过的小模型分身,也就是原生的ToB或未来的ToC AI应用。
原生AI应用这个词有点像是对软件的这种说法,而agent就是这种进化逻辑的体现。agent本身是一个混合体,融合了你的个人数据、经验、偏好等等。
陈庆春:说到agent,我还是要重新回到混合式人工智能的理解上。混合式人工智能最开始是在去年这个时候元庆提出来的,目的是为了让大家知道怎么去用这个大模型。
现在我们讨论的就是如何用好大模型。经过这一年的发展,我们可以看到AI本身也获得了很大的进展,这个进展包括预训练模型的性能提升非常快,比如Llama 3.2以及国内的千问2.5,这些大模型的预训练能力都有了很大的提升。在之前的半年,我还记得骆老师您主持了一个论坛,大家讨论的是我们到底是ToB还是ToC。最终我们发现,现在大家已经达成了共识,都是要用的。那么为什么会达成共识呢?因为当时讨论的一个点是幻觉太严重了,大模型的幻觉问题很突出。但在接下来的这两三个月中,我们取得了非常大的进展,特别是在推理能力方面有了显著提升。
泓君:如何用混合式人工智能的方法来避免在精准问题上出现幻觉问题呢?比如说,如果我用一个agent来帮我订机票和酒店,它不能把我的预订搞错。
陈庆春:混合式人工智能现在不仅是公共大模型和私有大模型的混合,未来可能还会是多个agent之间的混合,也就是agent与agent之间的对话。
骆轶航:对,最早的斯坦福小镇项目就是这样做出来的。Google以及斯坦福的团队,在斯坦福小镇一起合作,愉快地生活在一起。最近,面壁智能也有类似的公司内部项目。他们通过agent之间的协作,这种方式显然会越来越普及,尤其是在一个组织内部。
陈庆春:现在的混合式人工智能,其实混合能力要更强一些。首先,它涉及公共大模型与私有大模型之间的混合调用。其次,多个agent之间的调用也至关重要。这些agent会为你进行知识分析,最终联想的这些智能体会嵌入到每个硬件中,形成一体多端的结构。
每个智能体会帮助你进行分析,并需要调用多个大模型和agent。在后台,它们会先召开会议,讨论如何满足需求。比如你提出一个需求,作为联想的AI Now,后台就开始运作,调动多个agent来共同协作。就像公司开会一样,老板提指示,其他人、秘书协调好各方事宜。关键是,这个智能秘书就像你的双胞胎,十分了解你,就像看到镜像中的你一样。
骆轶航:比如说Ray-Ban Meta眼镜,我玩得很开心,但我认为它绝对不是第一终端。至少现在不是,五年或十年之后它可能会有变化,但那时的演进形态也可能不同。AR形态可能会进一步演化,所以我觉得这款眼镜是一个实验性和过渡性的产品,虽然具备了一些AI功能,但绝对不能算作第一终端。
我认为手机和PC都有可能成为AI第一终端,这取决于使用它的人要做什么。如果这个人不创造生产力,那么手机可能是他们的第一终端。因为人们一天到晚离不开手机,刷手机的频率远高于刷电脑的频率。你很少见到家里60岁的老人刷电脑,除了炒股票。
泓君:但现在大家的很多生产力还是发生在电脑跟手机上,对不对?
骆轶航:是的,我觉得其实手机上干活是比较少的。如果是闲着没事、半工作半休息的状态下用手机干个活没问题。我也不是没有在手机上写过文章,但要处理比较复杂的事还是不行。所以我认为电脑还是这个事的变革中心。
最近我参加了华源活动,我跟嘉宾的互动环节结束之后,我就把这些资料后贴到一个Google Docs做总结,直接推给一个AI,然后邮件就能发过去,全部AI完成。你能看到鼠标和键盘自己在动。这个东西是我觉得它就是一个生产力变革。手机上是不能干这些事的,而且你还要跨平台整合这个问题,各家的产品都要用,所以我觉得这个是一个特别有意思的事。
陈庆春:现阶段AIPC肯定是AI大模型落地的第一终端。无论是从背后的逻辑、算力,还是从本地知识库需要处理的大量数据来看,你都需要一个存储设备。因此,仅从这两点来看,PC是必然的选择。而如果选择其他设备,比如刚才你的智能眼镜,可能就有无法正常工作的情况。
泓君:我们说到AI和PC结合的时候,联想在这方面做了整合了哪些AI来提升工作效率?
陈庆春:联想是一个非常开放的生态,在基础大模型的选择上非常丰富。国内的一线大模型厂商,比如千问和Kimi,都与联想有合作;在国外,像Llama这样的模型也与联想有深度合作。联想不会拒绝任何大模型的合作方式,强调的是混合式人工智能,即谁好用、谁对你有帮助,就用谁。现在大模型的特点越来越明显,比如Kimi擅长处理长文本,MiniMax则擅长语言大模型。
陈庆春:这确实非常丰富,具体看你需要什么功能。比如说你现在需要做一个PPT,可以直接调用AI来帮助你快速生成一整套PPT,这是每个打工人最大的痛点。还有像绘图,你只要通过对话的方式告诉AI,它就会帮你完成任务,就像和一个机器人对话一样,这个机器人能帮你解决很多问题。
在办公方面,因为大部分人在Windows、PC上使用微软的办公软件,如果你可以的话还可以直接调用Copilot,一键完成操作,提升办公生产力。
泓君:谈到落地,模型的三要素是算力、算法和数据。企业通常是自己拥有数据的。而算法则是训练模型的部分。我了解到联想在算力方面也有布局。庆春能否和大家解读一下联想在算力方面的布局?
陈庆春:对,联想在算力方面的布局主要体现在其 ISG 基础设施方案业务集团,这个集团是专门为整体 AI 基础设施而设立的。算力的布局实际上是分得非常细的,它并不是简单地依赖一台服务器或者一个 GPU 来完成整个 AI 的任务。算力需要有服务器、存储能力,如果没有存储能力,就无法进行大数据分析。
其次,数据网络也是非常重要的,因为一台服务器是无法承担很多工作的。就像英伟达的黄仁勋前几天提到的,Meta 用了 19 天建立了 10 万个 GPU 集群,那么这些集群之间如何连接,就非常考验数据网络的能力。联想在这方面也有很强的技术能力。
此外,还有虚拟化的能力,比如算力池。还有数据化的能力,以及非常强的可持续发展能力。也就是说,不能消耗过多的电力,过多的消耗会造成浪费。
这个大的算力架构并不仅仅是一个 GPU 的能力,而是一个非常全面的能力。只有当这些全面的能力都建立起来后,才能实现一个非常稳定和可持续发展的算力能力。
泓君:那就是既要算力,还要省电。我记得今年 Sam Altman 一直提到,未来大模型的训练不仅仅受到算力的限制,更重要的是能源的限制。大家怎么看?你们认为未来 AI 的训练和数据中心会面临能源方面的瓶颈吗?
骆轶航:长期来看,它确实会的。因此,现在替代性能源的选择越来越多。我觉得,AI 这一波发生了一个非常有意思的变化,它改变了很多公司的角色。例如,过去我们把芯片制造商称为代工厂,但现在你会发现一些比较强大的芯片制造商已经不仅仅是代工厂,而是某种意义上变成了基础设施,变得像云一样,地位提升了。
电这一点,过去哪个行业没用电?托马斯·爱迪生发明电已经150多年了,谁都在用电。但是你会发现,电作为一种基础设施,其基础性已经达到了这样的程度。以至于你必须考虑派生和可控核聚变这种投资,其实我觉得接下来可能各地都会去搞。
所以,我认为,AI 这一波作为计算革命、生产力革命的一个范式变化,它直接重组了很多东西,抬升了许多产业链中模块的地位。
泓君:因为我们之前在播客中专门聊过一期关于 AI 能耗的内容,并请教了很多电力学专家。他们有一种观点认为,过去中国和美国在电力问题上的情况是非常不一样的。美国的电力一直属于一种非常稳定且平衡的状态,稳定的表现是每年大约 0.5% 的增长率,而美国的 GDP 增长并不依赖于电力,而是依赖于服务型行业。
所以,现在美国AI数据中心当前的耗电量其数据能耗相当于一座纽约市。然而,美国的基础设施大家都知道进展非常缓慢,电力建设无法跟上未来 AI 产生的能耗增长,而且首先要保证居民的用电需求。这个问题在美国非常严重,而在中国却不是一个特别大的问题。因为中国的电力建设,包括基础设施建设,做得可以说是非常好的。
骆轶航:基础设施这东西原本不值钱。所以我们那时说互联网公司就像水电、煤一样,我们说它估值就上不去了,市值上不去了。但是,作为一种稀缺的基础设施,它就值钱了。我觉得未来可能会出现这种新的电力和可替代能源的公司,它们直接因为变得稀缺而提升价值。这可能是一个非常大的变化。
泓君:如果能节省一点点能耗,这对所有在 GPU 上进行训练的公司来说,都是一个巨大的资源节省,同时对社会也是一种巨大的资源节省。我记得刚刚庆春在跟我们分享的时候,提到联想在降低能耗方面进行了一些尝试,可以整体展开一下吗?
陈庆春:刚才两位老师提到的观点是,做一些大型集群的算力必然会耗电。过去耗电的原因有两个:一个是散热,另一个是电力消耗。
我不知道大家是否去过数据中心,那种服务器特别多的数据中心,第一个特点就是噪音特别大。这个噪音并不是来自于服务器本身,大家可能会记得,第一代电脑的声音很大,主要是因为散热风扇的噪音。同样地,当你看到一个数据中心时,最先看到的不是服务器,而是一群空调外挂机。这么多空调外挂机是因为大量的服务器和存储在一起产生的热量会很高,如果不降温就可能导致宕机。因此,需要用空调来保持数据中心的平稳运行。
所以无论是高性能计算中心还是GPU计算中心,在散热和降低能耗方面都有天然的需求。目前,关键在于哪个厂家更有能力将这部分费用降低。这可能是一个非常有竞争力的优势,现在几乎所有数据中心,无论是国内还是国外,都优先考虑节省成本。他们会关注你能为我节省多少电力成本,毕竟工业用电成本也相对较高。
泓君:今天整体的讨论中,我还是想了解AI是不是真的创造了一些社会价值,它是如何帮助人的,尤其是如何帮助一些特殊群体。大家有没有相关的案例想要分享?
陈庆春:举个例子,联想非常关心残障人士的需求,比如聋哑人只会通过手势沟通,那么他们对着PC比划手语时,PC可以识别手势并进行翻译,把手语转换成文字或语言,帮助他人理解。这种技术能够将社会中的每一个弱势群体都考虑在内。
泓君:这个案例确实非常好,特别是在硅谷,我对AI在科学领域的应用感触很深。比如说“AI for Science”这个方向,像今年诺贝尔化学奖的颁布就特别有代表性,一共三位获奖者,其中两位获奖者是来自DeepMind,他们通过AlphaFold在蛋白质结构预测方面取得了重大突破。这类AI的进展不仅推动了基础科学的突破,同时也为社会带来了巨大的益处。
陈庆春:联想之前在公益事业方面也做了很多工作,其中一个例子就是利用AI技术帮助复刻应县木塔。大家可能知道,应县木塔是中国非常重要的古建筑之一,由于年久失修,现在已经无法让游客近距离接触或登上高层去观察其细节。为了让更多人能够感受到这座古塔的原貌,联想通过AI技术对木塔进行复原。通过AR和VR的方式,人们可以在电脑上以近距离的视角来观看和了解这座古建筑的结构和细节。