【AI访谈】黄仁勋：我们不再是“造芯片”公司，而是一家构建“AI工厂”的公司

文摘 2024-11-08 17:18 广东

真正的创新不是完全推翻过去，而是在现有基础上扩展未来。

（2024.11.7）这是昨天黄仁勋的访谈，以下是我看完后总结：

在30年前，黄仁勋一手创办的英伟达还只是硅谷众多初创公司中的一个，聚焦图形处理的细分市场。可如今，它已经是市值超过3万亿美元的巨头，站在AI革命的中心，定义了一个全新的计算世界。

马尔科姆·格拉德威尔曾说，"历史往往是由那些愿意颠覆规则的人书写的。" 黄仁勋就是这样的人。他将英伟达打造成了当代技术革新中少见的“反传统”存在，而这种特质正是英伟达在高速发展的AI世界中屹立不倒的秘密。

那么，黄仁勋的秘密是什么？他解释说，计算世界发生了一场根本的变化：从原本为人类代码设计的CPU，转变为为AI代码设计的GPU。这听起来像是技术细节，实际却代表了一场根深蒂固的计算范式的革命。几乎所有传统的技术法则都被推翻了，包括摩尔定律。“摩尔定律是过去的遗产，但不再是英伟达的指南，”黄仁勋坦言道。

黄仁勋认为，今天的英伟达，走在了一个新的引爆点上。英伟达不再是“造芯片”的公司，而是一家构建“AI工厂”的公司，它制造的不仅是半导体，更是一种新型的智能商品——这种商品能够驱动科学、医疗、制造等所有行业的智能化升级。

要理解这个未来，得从英伟达的“系统思维”入手。黄仁勋解释说：“我们现在打造的‘计算单元’已经不是芯片，而是整个数据中心。”这并不是随便说说。为了让系统的效率最大化，英伟达不只是在设计硬件，还在重新设计整个数据中心的结构，将网络、内存、算法一体化。而英伟达收购Mellanox，积极整合Infiniband和NVLink，正是出于这个原因。黄仁勋说，这种“软硬件协同设计”才能实现今天英伟达的奇迹式增长。

更令人惊叹的是，黄仁勋甚至不满足于仅仅服务AI行业。他认为每一家企业，甚至每一个国家，都将成为“AI工厂”的受益者。“任何行业都不会拒绝智能化。” 在他看来，AI不再只是技术工具，而是一种像电力、互联网一样的通用商品，将会为未来的全球经济打下基础。

正如黄仁勋所说，“我们不再是造计算机，而是造工厂。” 那些能够理解这一点的企业，将不仅是用户，更是合作伙伴。他们将在黄仁勋“AI工厂”的生态系统中找到自己的角色。

黄仁勋抓住了一个引爆点，颠覆了计算的旧世界，创造了一个智能的新时代。这一转折点，不仅属于英伟达，也属于整个科技史。

以下是部分访谈内容：

主持人：距离上次和英伟达的创始人兼 CEO 黄仁勋聊天已经一年了。现在英伟达市值超过 3 万亿美元，妥妥地成为了 AI 革命的核心。今天我们来到英伟达总部，聊聊最前沿的技术、AI 模型、数据中心规模的计算，以及英伟达对未来十年的展望。

主持人：黄仁勋，英伟达已经 30 岁了，展望未来 10 年，你认为最重要的方向是什么？是继续扩大规模吗？我们从现有架构中榨取算力和内存是不是快到极限了？你最关注什么？

黄仁勋：回顾一下，我们从写代码进化到机器学习，从写软件进化到创造 AI。以前所有东西都跑在为人类代码设计的 CPU 上，现在跑在为 AI“写代码”（也就是机器学习）设计的 GPU 上。世界变了，计算方式变了，整个底层技术都变了。结果就是，我们能解决的问题规模也发生了巨变。因为只要你的软件能在单个 GPU 上并行运行，就能扩展到整个集群、甚至多个数据中心。所以我们已经准备好以前所未有的规模扩展计算、开发软件。这才只是开始，未来十年，我们希望每年都能让整体性能翻两三倍（不是单颗芯片的性能），同时成本和能耗降低两三倍。每年都这样，几年下来效果就非常惊人。所以别惊讶，我们现在性能提升的速度远超摩尔定律，我希望我们能继续保持下去。

主持人：是什么让性能提升比摩尔定律还快？摩尔定律有点像预言，说出来就实现了。

黄仁勋：有两个核心技术支柱：一个是德纳德缩放比例定律，一个是卡弗·米德的超大规模集成电路缩放比例定律。这俩都很牛，但现在已经失效了。所以我们需要新的扩展方法。显然，新方法和软硬件协同设计有关。你得根据系统架构调整算法，根据软件架构调整系统，如此反复。除非软硬件都能控制，否则没戏。但如果都能控制，就能从 FP64 到 FP32、BF16、FP8，甚至 FP4，谁知道呢？所以协同设计非常重要。第二个关键是数据中心规模。你得把网络当成计算单元，把大量工作交给网络，进行大规模压缩。这就是我们收购 Mellanox，积极整合 Infiniband 和 NVLink 的原因。

黄仁勋：看看现在的 NVLink 多强大！计算单元扩展成了一个超级处理器——GPU。现在我们有几百个 GPU 协同工作。

黄仁勋：我们面临的计算挑战很多，最激动人心的就是低延迟生成 token，因为 AI 需要“思考”，就像你说的，要进行树搜索、思维链，还要模拟、反思自己的答案，默默地生成文本，然后快速回答。要做到这些，延迟必须极低。

黄仁勋：同时，数据中心还要保证高吞吐量，因为要控制成本，提高效率，产生收益。低延迟和高吞吐量，这两个目标是矛盾的。所以我们必须发明新东西，NVLink 就是我们的解决方案。

黄仁勋：现在我们有了虚拟 GPU，它有超强的算力来处理上下文，有海量内存，还有超高带宽生成 token，所有这些同时进行。

主持人：与此同时，开发模型的人也在疯狂优化。过去 18 个月，我团队的数据显示，用 GPT-4 级别的模型处理 100 万 token 的成本下降了 240 倍。这方面也做了大量的优化和压缩。

黄仁勋：没错，在我们这层也一样。我们很重视生态系统和软件生产力。CUDA 是个坚实的基础，上面的东西可以随便改。如果基础总变，上面就盖不了楼。CUDA 让我们快速迭代。去年我们用 Lama 测试，在算法和上层应用不变的情况下，Hopper 的性能提升了 5 倍。一年 5 倍，用传统方法根本不可能，但用协同设计就做到了，还能解释各种新东西。

主持人：你的大客户怎么看待大规模训练和推理之间基础设施的互换性？

黄仁勋：现在基础设施都是模块化的。Sam 跟我说他最近淘汰了 Volta。他们有 Pascal、Ampere，各种各样的 Blackwell 配置，有风冷的，有液冷的。你的服务必须能利用所有这些。英伟达的优势是，你今天为训练建的基础设施，明天就能完美地用来做推理。我相信大部分 ChatGPT 就是在最近训练的同类系统上做推理的。所以你可以用同一套系统训练和推理。你之前的投资不会浪费，还能继续用它做推理，同时我们和整个生态系统会不断改进算法，让你的老系统性能一年提升 5 倍。这种模式永远不会变。

黄仁勋：所以大家对基础设施的理解应该是：虽然是为训练而建，但它也能完美推理。推理会有各种规模，你会从大模型蒸馏出小模型。所以你仍然会创造强大的前沿模型，用来做开创性的工作，生成合成数据，训练小模型。最终你会同时拥有大模型和小模型。小模型虽然通用性差一点，但效率很高，能出色地完成特定任务，甚至超越人类。我们会看到各种规模的模型，就像现在的软件一样。AI 让我们更容易创建新的应用，但计算的本质没变。维护软件的成本仍然很高，你希望软件写一次到处都能跑。

黄仁勋：很多人还是这么想的。你希望工程师的努力能持续产生价值。所以好的架构应该让你今天写的软件明天在新硬件上跑得更好，或者你明天写的 AI 能在现有的大量设备上运行。这种软件理念不会变。

主持人：英伟达对客户的支持规模越来越大，从单芯片到服务器、机架，再到 DGX。你怎么看这种发展？下一步是什么？英伟达是不是该做整个数据中心了？

黄仁勋：其实我们一直在做整个数据中心。开发软件，你就需要完整的计算机系统。我们不只是设计芯片，而是构建整个数据中心。不把整个数据中心搭起来，怎么知道软件能不能跑？怎么知道网络能不能正常工作？怎么知道效率是不是达标？怎么知道能不能真正大规模运行？这就是为什么有些产品的实际性能远低于 PPT 上宣传的峰值性能。计算已经不一样了。我说过，新的计算单元是数据中心。这就是我们交付的产品，也是我们构建的东西。

黄仁勋：我们搭建各种配置的数据中心：风冷 x86、液冷 Grace、以太网、Infiniband、带 NVLink 或不带 NVLink 的。我们公司现在有 5 台超级计算机，明年还会再建 5 台。认真做软件，就得自己造计算机。我们全栈自研，垂直整合，然后拆开卖。这很牛，也很复杂。这么做是为了让我们的基础设施能适配 GCP、AWS、Azure、OCI 等各种云平台。它们的控制平面、安全平面、集群规模都不一样，但我们让它们都能用英伟达的架构，让 CUDA 无处不在。我们的最终目标是，提供一个统一、模块化的计算平台，让开发者写一次代码到处都能跑，可能会有 10% 的差异，因为不同基础设施的优化方式不同，但大体一致。

黄仁勋：这是软件的精髓，我们一直坚持。这样我们的软件工程师就能“一次编写，到处运行”。因为我们知道，软件的投入最大，也最容易验证。看看硬件行业的规模，再看看其他行业的规模，1 万亿美元的硬件支撑着 100 万亿美元的其他产业，这就说明问题了。你写的软件得一直维护下去。我们从不放弃任何软件。CUDA 还在用，因为我承诺过，会一直维护下去。我们说到做到。我最近看到一篇关于 Nvidia Shield（我们的安卓电视盒子）的评测，它是最好的安卓电视盒子，7 年前发布的，现在依然是最佳选择。我们上周刚更新了软件，还有人写了新闻报道。GeForce 现在有 3 亿玩家，我们从未抛弃过任何一个。我们的架构兼容性让我们做到了这一点。否则，我们的软件团队得扩大一百倍。我们很重视这一点，最终也让 CUDA 受益。

主持人：最近一个很好的例子就是你多快就为 x.AI 搭建好了一个集群。规模和速度都非常惊人。

黄仁勋：这得多亏 Elon。他决定做这件事，选址，搞定冷却和供电，然后决定建一个 10 万 GPU 的超级集群，这是目前最大的单体集群。

黄仁勋：然后我们倒推时间，一起规划上线日期。几个月前就定好了日期。

黄仁勋：然后我们就开始准备所有组件、OEM、系统，和他们的团队一起做软件集成，做网络模拟。我们预先把一切都做成数字孪生，预先安排好供应链、网络布线。我们甚至先搭建了一个小型版本，作为参考系统。等所有东西到货，一切都准备好了，模拟测试也做完了。然后就是大规模的集成，无数人 24/7 地工作，连接所有设备。几周内，集群就上线了。

黄仁勋：这证明了 Elon 的执行力，他如何克服机械、电气等各种巨大的挑战。这么大规模的集群，这么快的速度，史无前例。除非两个团队从网络、计算、软件、训练到基础设施，从电气工程师到软件工程师，紧密配合。

主持人：从工程角度来看，最大的挑战是什么？

黄仁勋：设备的体量太大了！几吨几吨的设备，非常夸张。通常这么大的超算，从设备交付到正式投入使用，得花一两年的时间。这很正常。

黄仁勋：我们等不了那么久。几年前，我们内部启动了一个“数据中心即产品”的项目。虽然不直接卖数据中心，但我们把它当成产品来做，从规划、搭建、优化、调优到运维。目标是像打开新 iPhone 一样，一切正常工作。

黄仁勋：这像魔法一样，但我们现在能做到。你找个地方，提供电力和冷却，我们就能在 30 天内帮你搭建好数据中心。

主持人：太牛了！如果未来要建 20 万、50 万甚至 100 万 GPU 的集群，最大的瓶颈是什么？资金？能源？场地？

黄仁勋：所有的一切！你说的这些规模，没有什么是正常的。

主持人：但一切皆有可能。

黄仁勋：没错，没有物理定律的限制，但所有的事情都会很难。而且，值不值得呢？创造出我们现在理解的这种计算机，能轻松完成我们交给它的任务，拥有一定程度的通用智能，甚至接近通用智能，这本身就是一个奇迹。我知道有五六家公司在努力，OpenAI、Anthropic、x.AI，还有 Google、Meta、Microsoft。接下来的几步至关重要，谁都想第一个到达顶峰。改造智能的奖励太诱人了，值得一试。没有物理定律的限制，但一切都会很难。

主持人：一年前我们聊天时，你提到你会跟着最前沿的客户走，他们会引导你找到下一个应用方向。你还提到了科学应用，过去一年这方面变得更主流了。你现在最感兴趣的还是科学以及 AI 在科学中的应用吗？

黄仁勋：我很高兴英伟达现在有 AI 芯片设计师和 AI 软件工程师。

主持人：AI 芯片设计师效率如何？

黄仁勋：非常棒！没有他们，Hopper 就造不出来。因为他们能探索更大的设计空间，而且他们有无限的时间，他们在超算上跑。人类工程师时间太少，探索的空间有限。我们也不能同时探索不同的方向。我们的芯片太大了，不像一个芯片，更像一千个芯片拼起来的。我们得单独优化每个部分，但理想情况是所有部分一起优化，跨模块协同设计，探索更大的空间。显然 AI 能找到更好的解决方案。没有 AI 工程师，我们做不到，时间不够。

主持人：自从我们上次聊天以来，还有一件事变了，当时英伟达市值 5000 亿美元，现在超过 3 万亿美元。过去 18 个月，你增加了 2.5 万亿美元的市值，相当于每月 1000 亿美元，或者每两三天就增加一个独角兽公司的市值。很显然，你在构建的东西和你的关注点都没变。我今天在这里感受到了一种活力，就像 15 年前在 Google 感受到的那种兴奋。这段时间有什么变化吗？英伟达的运作方式、你看待世界的方式、你下的赌注的大小，有什么不同？

黄仁勋：公司不可能像股价变动那么快。很多方面我们都没怎么变。我觉得应该退一步想想，我们到底在做什么？公司和国家都应该思考这个问题，认清正在发生什么。

黄仁勋：就像我们之前说的，我们重新发明了计算。计算方式 60 年没变过了。我们把计算的边际成本降低了百万倍，以至于我们可以让计算机自己写软件。这是个巨大的转变。

黄仁勋：芯片设计也是一样。我们希望计算机能帮我们发现芯片设计的改进点，用我们自己做不到的方式优化芯片，就像在数字生物学和其他科学领域一样。

黄仁勋：所以大家开始意识到，我们重新发明了计算，但这意味着什么？我们突然创造了智能，计算发生了什么？以前的数据中心是多租户的文件存储库，现在的新数据中心不再是数据中心，它们是单租户的，不存储文件，只生成 token。这些 token 就组成了我们所说的智能，各种各样的智能，可以是机器人动作指令，可以是氨基酸序列，可以是化学链，各种各样的东西。

黄仁勋：所以我们到底在做什么？我们创造了一种新的工具、新的机器，可以称之为“AI 工厂”。它大规模地生产 AI。大家开始意识到，这可能是一个新兴产业。它生产 token、生产数字，而这些数字很有价值，很多行业都能从中受益。

黄仁勋：再退一步想想，英伟达重新发明了计算，全球 1 万亿美元的基础设施都需要更新换代，但这只是一方面。更重要的是，我们构建的这个工具不只是为了更新数据中心，而是为了生产一种新的商品——智能。这个新商品的市场规模有多大？很难说，但可能是几万亿美元。

黄仁勋：所以，我们不再是造计算机，而是造工厂。每个国家、每个公司都需要它。哪个公司或行业会说“我们不需要智能，我们已经够聪明了”？所以这是一个巨大的变革，从产业角度来看。总有一天，人们会意识到，半导体行业不只是造芯片，而是为社会构建基础设施。然后恍然大悟：原来这么重要，不只是芯片那么简单。

主持人：你怎么看“具身智能”？

黄仁勋：我很兴奋的是，我们离通用人工智能很近了，也离通用机器人很近了。token 就是 token，关键在于如何把现实世界的事物转化成 token。这很难，但如果能做到，再结合大语言模型和其他模态，如果我能生成一个 Jensen 伸手拿咖啡杯的视频，为什么不能让机器人也生成同样的 token 去拿咖啡杯呢？所以从计算的角度来看，这两个问题很相似。我们离实现通用机器人很近了，这太令人兴奋了。

黄仁勋：现在有两个现成的机器人应用场景：自动驾驶汽车（或者说数字司机）和人形机器人。有了这两样，我们就能把机器人带到现实世界，而不需要改变世界，因为世界本来就是为它们设计的。Elon 同时做这两件事，不是巧合。机器人技术有更大的应用潜力。

黄仁勋：数字领域的应用也同样 exciting。以后肯定会有各种各样的 AI 员工。我们的团队会由真人和 AI 组成，我们用同样的方式指挥他们。我通常怎么指挥员工？给他们提供背景信息，布置任务，他们会和其他团队成员合作，然后汇报工作，如此反复。这和指挥数字 AI 员工有什么区别？未来会有 AI 营销人员、AI 芯片设计师、AI 供应链专家等等。我希望英伟达的规模越来越大，不仅是员工数量，还有 AI 的规模。

主持人：如果一年后我们再来和你聊，你认为公司哪个部门的 AI 化程度最高？

黄仁勋：我希望是芯片设计部门。

主持人：也是最重要的部门。

黄仁勋：没错。因为这方面的影响最大，也是最难的问题。我和 Synopsis 的 Sasina、Cadence 的 Andrew 合作，我完全可以想象他们会出租专业的 AI 芯片设计师，这些 AI 精通特定的模块和工具。我们会在需要的时候租一大批来帮忙。在芯片设计的某个阶段，我可能会租一百万个 Synopsis 的 AI 工程师，再租一百万个 Cadence 的。这对他们来说是个很棒的商业模式，在他们的工具平台上运行各种专业的 AI 代理，还能和其他平台协作。SAP 的 Christian 和 ServiceNow 的 Bill 也会这么做。

黄仁勋：有人说 SaaS 平台会被颠覆，我恰恰相反，我认为他们坐在金矿上，会有大量针对 Salesforce、SAP 等平台的专业 AI 代理出现。Salesforce 用 Lightning，SAP 用 ABAP，每个平台都有自己的语言。我们有 CUDA 和 Omniverse 的 OpenUSD。谁会开发最棒的 OpenUSD AI 代理？当然是我们，因为没人比我们更在乎它。所以各种平台上都会出现大量的 AI 代理，它们会互相协作，解决问题。

主持人：现在各行各业都有很多人在研究 AI，你认为哪些方向被低估了？你希望更多创业者、工程师、商界人士关注哪些领域？

黄仁勋：首先，我认为大家低估了 AI 对基础科学、计算机科学、以及其他所有科学和工程领域的影响。现在随便走进哪个大学的科学系、理论数学系，都会发现 AI、机器学习正在改变那里的研究方式。所有工程师、科学家的工作方式都会被 AI 彻底改变。

黄仁勋：我见过计算机视觉的早期阶段，和多伦多大学的 Alex、Hinton、Ilya，还有斯坦福的 Yann LeCun、Andrew Ng 合作过。我看到了早期迹象，幸运地预测到，从识别猫的玩具 AlexNet 会发展成彻底改变计算机科学和计算方式的重大变革。这个预测对我们来说很幸运。我们很兴奋，也很受鼓舞，改变了我们做事的一切。但这花了 6 年时间，从 AlexNet 到超越人类的物体识别能力，只用了几年时间。

黄仁勋：现在，所有科学领域都发生了巨大的变化，没有一个例外。从量子计算到量子化学，所有领域都在用我们讨论的这些方法。他们已经研究了两三年，再过两三年，世界将彻底改变。以后所有科学和工程的突破，都离不开生成式 AI。我很确定。所以，关于 AI 是泡沫的说法，你只需要回到基本原理，看看实际发生了什么。

黄仁勋：计算方式变了，写软件的方式变了。软件是人类编码知识的方式，我们编码算法的方式变了，这会影响一切，一切都将不同。我想我们都看到了同样的东西。所有初创公司、科学家、工程师，都会被裹挟到这场变革中。

主持人：最令人兴奋的是，来自计算机科学领域的我们，现在去看机器人大会、材料科学大会、生物技术大会，都能理解他们在做什么。虽然不是每个细节都懂，但我们理解他们探索发现的方式，都是基于通用的算法。

黄仁勋：是的，有一些普遍适用的概念。

主持人：看到这些算法在各个领域都如此有效，真的很激动人心。

黄仁勋：没错。而且我自己每天都在用 AI。我现在每天都用 AI 当我的老师。学什么东西都先问 AI，为什么要自己辛苦学？直接问 ChatGPT 或 Perplexity 就好了，取决于我的问题。然后我可以根据需要深入研究。这太棒了！

黄仁勋：几乎所有我知道的事情，我都会用 AI Double check。即使是我确定知道的事实，我也会去查一下。我每天都用 AI。

关注《森林聊AI商业》公众号

了解 AI 如何塑造商业的未来

http://mp.weixin.qq.com/s?__biz=Mzg3MTA1MzE2Nw==&mid=2247490047&idx=1&sn=40cdbc7ab0291c8e23b12af8b8a331c6

森林聊AI商业

每日一起了解，AI如何改变科技世界