英伟达Q3业绩会议纪要:黄教主回应一切

文摘   2024-11-22 21:09   中国  
一、Colette Kress 发言

Q3 是又一个创纪录的季度,我们持续实现了惊人的增长。本季度收入达到 351 亿美元,环比增长 17%,同比增长 94%,远超我们 325 亿美元的预期。所有市场平台的收入均实现了强劲的环比和同比增长,这得益于 NVIDIA 加速计算和 AI 的广泛采用。

数据中心业务创下新纪录:数据中心收入达 308 亿美元,环比增长17%,同比增长 112%。NVIDIA Hopper 产品需求表现出色,H200 的销售额环比显著增加,达到了两位数的十亿美元级别,成为公司历史上产品增长最快的一次。H200 提供了高达 2 倍的推理性能提升,并将总拥有成本 (TCO) 改进约 50%。

云服务提供商(CSPs) 占据了数据中心销售收入的大约一半,同比收入翻倍增长。这些 CSP 部署了 NVIDIA H200 基础设施和高速网络,安装规模扩展到数万颗 GPU,以满足 AI 训练和推理负载的快速增长需求。目前,基于 NVIDIA H200 的云实例已由 AWS 和 Microsoft Azure 提供,Google Cloud 和 OCI 也将很快推出。

除了大型 CSP 的显著增长外,NVIDIAGPU 在区域云业务上的收入同比翻番,北美、欧洲、中东及非洲地区(EMEA)和亚太地区(APAC)都大力扩展了 NVIDIA 云实例和主权云的建设。

消费互联网领域需求旺盛,消费互联网收入同比增长超过两倍。许多公司扩展了NVIDIA Hopper 基础设施,以支持下一代 AI 模型,包括训练、多模态和代理 AI、深度学习推荐引擎,以及生成式 AI 推理和内容创作的负载需求。NVIDIA 的 Ampere 和Hopper 基础设施推动了推理收入的增长,NVIDIA 现已成为全球最大的推理平台。

庞大的安装基础和丰富的软件生态系统鼓励开发者针对 NVIDIA 平台进行优化,从而持续提升性能并降低总拥有成本 (TCO)。NVIDIA 软件算法的快速进步使 Hopper 的推理吞吐量在一年内提升了 5 倍,并将时间到首个生成单元(First Token)的速度提高了 5 倍。即将发布的 NVIDIA NIM 将进一步提升 Hopper 推理性能 2.4 倍。

Blackwell 已进入全面生产阶段,并成功完成大规模产品切换。第三季度,我们向客户交付了13,000 个 GPU 样品,包括首批 Blackwell DGX 工程样品,其中一个已提供给 OpenAI。

Blackwell 是一个全栈式、全基础设施的 AI 数据中心规模系统,支持从 X86 到 ARM 的架构,从训练到推理的 GPU,支持 InfiniBand 和以太网交换机,并覆盖液冷和风冷等多种可定制配置,能够满足多样化且快速增长的 AI 市场需求。

客户正在争相抢占市场先机。Blackwell 系统目前已交付给我们所有主要合作伙伴,他们正在调试自己的数据中心。NVIDIA 正在帮助客户将 Blackwell 系统集成到多样化的数据中心配置中。

Blackwell需求与展望:Blackwell 的需求极为强劲,我们正全力扩展供应以满足客户的巨大需求。客户正准备大规模部署 Blackwell。Oracle 宣布了全球首个 AI 云计算集群,该集群能够扩展至超过 13.1 万颗 Blackwell GPU,以帮助企业训练和部署一些最先进的下一代 AI 模型。昨日,微软宣布将成为首家在私有预览中提供基于 NVIDIA GB200 和 Quantum InfiniBand 的 Blackwell 云实例的云服务提供商(CSP)。

上周,Blackwell 在最新一轮训练基准测试中首次亮相,以 GPU 为单位的性能全面领先,性能相比 Hopper 提升了 2.2 倍。此次测试结果还表明,我们在降低计算成本方面的持续努力。相比于需要 256 个 H100 GPU 的GPT3 基准测试,运行相同任务的 Blackwell GPU 仅需 64 个,实现了 4 倍的成本降低。NVIDIABlackwell 架构与切换技术相结合,使推理性能提升高达 30 倍,在推理扩展吞吐量和响应时间方面达到了全新高度,特别适合运行新型推理应用,如 OpenAI 的 o1 模型。

平台转型推动 AI 创业浪潮。每一次新平台的出现,都会催生一批初创公司。已有数百家 AI 原生公司成功地推出了 AI 服务。除了 Google、Meta、Microsoft和 OpenAI 等行业领军企业,Anthropic、Perplexity、Mistral、AdobeFirefly、Runway、MidJourney、Lightrix、Harvey、Codium、Cursor 和 Bridge 等初创企业也取得了显著成功。同时,成千上万的 AI 原生公司正在开发新的服务。

下一波 AI 应用将来自企业 AI 和工业 AI。企业 AI 正在全面加速,NVIDIAAI Enterprise 包括 NVIDIA NeMo 和NIM 微服务,是面向代理型 AI 的操作平台。许多行业领导者正在利用 NVIDIA AI 构建 Co-Pilots 和智能代理。与 NVIDIA 合作的公司包括 Cadence、Cohesity、NetApp、Nutanix、Salesforce、SAP 和ServiceNow,这些企业正竞相加速开发此类应用,预计未来几年内将部署数十亿个代理。

NVIDIA AI Enterprise 的加速应用,咨询行业领导者如 Accenture 和 Deloitte 正在将 NVIDIA AI 引入全球企业。Accenture 推出了一个全新的业务集团,拥有30,000 名接受过 NVIDIA AI 技术培训的专业人士,以推动这一全球构建浪潮。此外,Accenture 拥有超过 77 万名员工,已在内部部署了基于 NVIDIA 的代理型 AI 应用,其中包括一个能够将营销活动中手动步骤减少25% 到 35% 的案例。

近 1,000 家公司正在使用NVIDIA NIM,其快速应用速度体现在 NVIDIA AI Enterprise 的货币化能力上。我们预计 NVIDIA AI Enterprise 的全年收入将同比增长 2 倍以上,同时业务管道持续扩展。整体来看,我们的软件、服务和支持收入已年化达到15 亿美元,预计到今年年底将超过 20 亿美元。

工业 AI 和机器人领域的加速发展,工业 AI 和机器人领域的加速由物理 AI 的突破以及理解物理世界的基础模型驱动。与企业 AI 的 NeMo 平台类似,我们构建了 NVIDIA Omniverse,供开发者用于构建、训练和运行工业 AI 与机器人应用。一些全球最大的工业制造商已开始采用 NVIDIA Omniverse,以加速业务发展、自动化工作流并实现运营效率的新高度。作为全球最大的电子制造商,富士康利用基于 NVIDIA Omniverse 构建的数字孪生和工业 AI,加速了其 Blackwell 工厂的建设,同时实现了效率的显著提升。仅在墨西哥工厂,富士康预计其年度千瓦时用电量将减少超过 330%。

中国地区收入:中国的数据中心收入因出口合规产品交付而环比增长。然而,数据中心收入占比仍远低于出口管制之前的水平。我们预计中国市场的竞争将保持激烈,同时我们将继续遵守出口管制法规,并努力服务于客户。

主权 AI :随着各国拥抱 NVIDIA 加速计算,我们的主权 AI 计划正在加速推动由 AI 驱动的新工业革命。印度,领先的 CSP(包括 Product Communications 和 Zoda Data Services)正在建设用于部署数万颗 NVIDIA GPU 的 AI 工厂。截至年底,这些部署将使 NVIDIA GPU 在印度的使用量提升近 10 倍。此外,TCS 和 Wipro 正在采用NVIDIA AI Enterprise,并对 50 万名开发者和顾问进行技能提升,以帮助客户在 NVIDIA 平台上构建和运行 AI 代理。在 日本,软银正在使用 NVIDIA DGX Blackwell 和 Quantum InfiniBand 建设该国最强大的 AI 超级计算机。同时,软银还与 NVIDIA 合作,将电信网络转变为分布式 AI 网络,利用 NVIDIA AI Aerial 和 ARAN 平台处理 5G RAN 和CUDA 上的 AI 计算。我们也正在与 T-Mobile 合作,将这一技术应用于美国市场。日本其他企业,如 NEC 和 NTT,正在采用NVIDIA AI Enterprise。此外,主要咨询公司(如安永、日本战略咨询公司等)正在帮助推动NVIDIA AI 技术在日本工业领域的应用。

网络业务收入同比增长 20%,环比增长的领域包括 InfiniBand 和以太网交换机、SmartNex 以及 BlueField DPU。尽管本季度网络收入环比略有下降,但市场需求依然强劲且持续增长,预计在第四季度会实现环比增长。CSPs 和超级计算中心 正在采用 NVIDIA InfiniBand 平台,支持新的 H200 集群。NVIDIA Spectrum-X 以太网在 AI 应用中的收入同比增长超过 3 倍,未来的业务管道也在不断扩展,多家 CSP 和消费互联网公司正在规划大规模集群部署。传统以太网并非为 AI 设计,而 NVIDIA Spectrum-X 独特地利用了此前 InfiniBand 独享的技术,使客户能够大规模扩展其 GPU 计算能力。借助 Spectrum-X,xAI 的 Colossus 100,000 Hopper 超级计算机 在运行时实现了零应用延迟劣化,并保持了 95% 的数据吞吐率,远超传统以太网的 60%。

游戏业务:游戏业务收入达 33 亿美元,环比增长 14%,同比增长 15%。本季度,游戏业务表现强劲,笔记本、主机和桌面游戏相关收入均实现环比和同比增长。受返校季销售推动,消费者继续选择 GeForce RTX GPU 和设备来满足游戏、创意和 AI 应用的需求。渠道库存状况健康,为即将到来的假日季做好了准备。我们已开始发货新的 GeForce RTX AI PC,这些设备由 ASUS 和 MSI 推出,配备高达 321 AI TOPs 的计算能力,并将于第四季度支持微软的 Copilot+ 功能。这些机器利用 RTX 光线追踪和 AI 技术,为游戏、照片和视频编辑、图像生成以及编程带来了性能提升。

值得一提的是,过去这个季度我们庆祝了 GeForce 256 的 25 周年纪念日。作为全球首款 GPU,GeForce256 不仅变革了计算图形领域,也点燃了 AI 革命。NVIDIA的 GPU 一直是我们时代最重要技术背后的驱动力之一。

专业可视化:收入达 4.86 亿美元,环比增长 7%,同比增长 17%。NVIDIARTX 工作站继续成为专业图形、设计和工程工作负载的首选解决方案。人工智能正在成为一个强大的需求驱动因素,这包括自动驾驶车辆的模拟、生成式 AI 模型在提升生产力相关场景中的原型设计,以及生成式 AI 在媒体和娱乐领域的内容创作。

汽车业务:收入创下了 4.49 亿美元的纪录,环比增长 30%,同比增长 72%。这一强劲增长受益于 NVIDIA Orin 的自动驾驶部署以及终端市场对导航车辆(NAV)的强劲需求。Cars 推出了其基于 NVIDIA Orin 和 DriveOS 的全电动 SUV。

财务摘要:GAAP 毛利率为 74.6%,非 GAAP 毛利率为75%,环比下降,主要是因为 H100 系统向数据中心内更复杂且成本更高的系统产品结构转变所致。GAAP 和非 GAAP 运营费用环比增长 9%,原因是新产品引入相关的计算、基础设施和工程开发成本的增加。在第三季度,我们通过股票回购和现金分红向股东返还了 112 亿美元。

业绩指引:预计总收入为 375 亿美元,上下浮动 2%,这一预期反映了 Hopper 架构的持续需求以及 Blackwell 产品的初步量产。虽然需求远超供应,但随着供应链透明度的增加,我们有信心超越此前对 Blackwell 几十亿美元收入的预测。关于游戏业务,尽管第三季度的销售表现强劲,但由于供应限制,预计第四季度游戏业务收入将环比下降。GAAP 和非 GAAP 毛利率预计分别为 73% 和 73.5%,上下浮动 50 个基点。Blackwell 是一个高度可定制的 AI 基础设施,配备了多种 NVIDIA 自研芯片、多任务网络选项,并支持风冷和液冷的数据中心。当前,我们的重点是满足强劲需求,提高系统可用性,并为客户提供最佳配置组合。随着 Blackwell 的量产推进,预计毛利率将调整至低 70% 的水平;当完全量产时,毛利率预计稳定在中70% 的水平。GAAP 和非 GAAP 运营费用预计分别为 48 亿美元 和 34 亿美元。我们是一家以数据中心为规模的 AI 基础设施公司,专注于构建支持硬件和软件堆栈开发的数据中心,并支持新产品的推出。我们的投资包括建设数据中心,用于开发硬件和软件堆栈,并支持新产品的推出。GAAP 和非 GAAP 的其他收入和费用预计将实现 4 亿美元的收入,不包括与非关联投资相关的收益或损失。GAAP 和非 GAAP 税率预计为 16.5%,上下浮动 1%,不包括任何一次性项目。

二、Q&A

Q: 关于大语言模型扩展的问题,您认为这种扩展是否已经停滞?此外,当前讨论的集群尚未受益于Blackwell,这是否进一步推动了对Blackwell的需求?

A: 基础模型的预训练扩展仍然有效,并在持续进行。这是一条经验法则,而非物理定律,目前的证据表明扩展仍然有效。然而,我们发现,仅依赖预训练扩展是不够的,因此开发了两种新的扩展方法:(1)后训练扩展(Post-Training Scaling):第一代后训练方法是通过人类反馈的强化学习,而现在我们已经进化到通过AI反馈的强化学习,结合各种生成数据和合成数据来提升训练效果。(2)推理时扩展(Inference Time Scaling):例如,OpenAI的ChatGPT-01和Strawberry使用了一种被称为“测试时扩展”(Test-TimeScaling)的方法。这种方法的特点是,模型思考时间越长,输出质量越高。这类似于人类在回答问题前进行思考,通过多路径规划和链式思维等技术提高答案质量。

这三种扩展方式共同推动了基础设施的需求。目前最新一代的基础模型需要100,000个Blackwell芯片,而前一代则使用了相同数量的Hopper芯片。可以看出,从预训练、后训练到推理时扩展,需求正在快速增长。

此外,随着推理需求的扩展,NVIDIA已经成为全球最大的推理平台。此前在Hopper芯片上完成的训练工作非常高效,并且Blackwell芯片在训练基础模型时也会遗留大量优质的推理基础设施,这进一步提高了推理需求和效率。

目前,我们还观察到AI原生企业数量不断增加,企业用户也开始采用智能代理型AI(Agentic AI)。这表明来自多个领域的需求在持续增长。

Q: GTC大会提出的路线图是否能按时实现?此外,关于Blackwell供应链的限制,是否存在某些特定元件供应短缺的问题?

A: 关于Blackwell的生产,目前正全速推进。本季度的Blackwell交付量将超过此前的预估,这得益于我们供应链团队与合作伙伴的紧密协作。尽管需求超出了供应能力,但这是可以预期的,因为我们正处于生成式AI革命的开端。

在供应链方面,Blackwell系统需要整合七种定制芯片,同时支持多种冷却方式(风冷或液冷)以及不同的连接技术(NVLink 8、36、72)。此外,这些系统需要与全球各大数据中心的定制架构整合,这一过程尽管复杂,但我们凭借多代经验已经驾轻就熟。

目前,戴尔、Oracle、微软和Google等云服务提供商(CSPs)正在快速部署Blackwell系统,显示出强劲的市场需求。

在供应链合作伙伴方面,包括台积电(TSMC)、Amphenol、SK Hynix、美光(Micron)等多家公司参与了生产和供应链环节。过去季度Blackwell的出货量为零,但本季度的出货量已经达到数十亿美元级别的规模,这种扩展速度非常惊人。

Q: 关于年度产品路线图的执行,您如何确保按时完成目标?

A: 我们的年度路线图计划始终如期推进,不仅能提升平台性能,还能显著降低训练和推理的成本,从而使AI更为普及。此外,当数据中心的规模固定时,单位能效(每瓦性能)越高,客户的收入也越高。我们的产品在性能和能效方面领先于市场,因此能够为客户带来最大化的收益。

我们致力于在降低成本的同时继续提高性能和能效,以帮助客户实现更高的收入,这也是我们坚持年度节奏的重要原因。未来,我们计划支持更大规模的数据中心,从目前的百兆瓦规模扩展到千兆瓦级别,以满足不断增长的需求。

Q:是否仍预计Blackwell将在明年4月超过Hopper?随着Blackwell的扩展,毛利率可能降至70%以下,那么4月是否会是毛利率压力最大的时期?

A:关于毛利率,随着Blackwell的初期扩展,由于需要支持许多不同配置和多种芯片类型,我们的毛利率确实会受到一定压力。我们在扩展初期会专注于为客户提供最佳体验,因此毛利率在这一阶段可能会在70%以下,这是正常的情况。

随着扩展的推进,我们的毛利率会逐步提升。你是正确的,我们预计在随后的季度中,毛利率会逐步增长,并希望能较快达到75%左右,这也是我们努力的目标之一。Hopper的需求在明年仍将继续,特别是在上半年。同时,我们将在下个季度出货更多Blackwell,并且未来每个季度的出货量都会超过前一个季度。

这种情况说明,我们正处于计算领域两大根本性转变的开端:从CPU编码转向基于GPU的机器学习:这一转变已经开始普及,现在几乎没有公司不使用机器学习,而机器学习也是生成式AI的基础。创建全新类型的AI系统:随着生成式AI的兴起,数据中心的角色正从传统模式转变为“AI工厂”。这些AI工厂类似于发电厂,但它们生成的不是电力,而是AI内容。像今天的AI服务一样,这些工厂会24/7全天候运行,以满足大量客户的需求。这种现代化和新行业的创建才刚刚开始,我们预计这一趋势将持续多年,推动IT行业的进一步增长和转型。

Q: NVIDIA是否可能在2025年下半年将毛利率恢复到75%左右?您认为Blackwell的初期需求会持续几个季度?是否可以预期到2026年仍能保持增长?

A:关于毛利率,我认为2025年下半年达到75%是一个合理且可实现的目标。当然,这取决于未来扩展的具体情况,但我们确实将这一目标视为努力方向之一。

关于消化期的问题,我认为在全球完成约1万亿美元数据中心的现代化之前,不会出现显著的需求放缓。全球大多数数据中心目前仍基于传统CPU架构,而这种模式已经不再适应未来的需求。如果一家公司的资本开支计划建造新的数据中心,那么他们应该专注于为机器学习和生成式AI设计,而非延续传统架构。这是因为现有的传统数据中心已经足够多。

未来几年,全球数据中心将经历现代化的过程。从IT支出的增长速度来看,每年约为20%-30%。假设到2030年,全球数据中心市场规模可能达到数万亿美元,我们必须完成从传统编码到机器学习的转型。

此外,生成式AI的出现代表了一个全新的市场。例如,OpenAI并未替代现有市场,而是创造了一个全新行业。类似iPhone的出现,它带来了完全不同的生态系统。

这种趋势正在催生越来越多的AI原生公司,例如Runway(数字艺术智能)、OpenAI(通用智能)、Harvey(法律智能)和Writer(数字营销智能)。这些新公司表明,平台的重大变革带来了新的机会,推动了整个行业向“AI工厂”的方向发展。

因此,我认为未来的增长将来自两方面:一是IT和计算的现代化;二是AI工厂的构建,形成一个全新的人工智能生产产业。

Q:请问Hopper下季度的表现如何?是否会环比下降?如果是,是否由于供应限制或中国市场的需求减弱?能否更详细说明Blackwell与Hopper在Q4的表现和趋势?

A:关于毛利率问题,我所指的“低70%”确实包括71%、72%甚至72.5%的范围,我们可能会达到这一区间的高端,甚至略高。实际结果仍需看扩展情况,包括产品良率的提升和产品组合的优化。我们希望通过后续的改进,在年内逐步提升毛利率,目标是尽快恢复到75%左右的水平。

关于Hopper的表现,我们的H200产品不仅订单量大幅增加,部署速度也非常快,是我们见过增长最快的产品之一。我们在Q4仍会继续销售Hopper,包括各种配置和适配中国市场的版本。但与此同时,客户也在为Blackwell的部署做准备,因此Q4会是Hopper和Blackwell并存的时期。是否可能在Q4看到Hopper的环比增长?确实有这种可能,但仍需观察实际情况。我们将根据市场需求和供应情况作出调整。

Q:您如何看待推理市场的发展?在未来12个月内,是否预计推理的增长速度会超过训练?此外,对推理市场的整体看法如何?

A:我们的目标是让推理在全球范围内大规模普及。只有当每家公司都在内部进行推理时,AI才算真正成功。例如,推理可以服务于企业的营销、预测、供应链、法律、工程甚至代码生成等部门。我们希望每家公司都能24/7不间断地进行推理,同时有成千上万的AI原生创业公司生成AI内容。

推理的目标是生成“token”,即无论是使用Outlook、PowerPoint、Excel还是打开PDF,每个操作都可能涉及生成大量token。一个典型的例子是谷歌推出的NotebookLM应用,我自己也频繁使用,通过导入PDF和论文,它可以快速生成相关内容,极大提升了使用体验。

此外,推理市场还涉及一个新的AI领域:物理AI。如果说大语言模型理解的是人类语言和思维过程,那么物理AI则理解物理世界的结构,能够预测未来的可能情景。这种能力对于工业AI和机器人领域非常重要。这也是我们开发Omniverse的原因,通过Omniverse,AI可以基于合成数据和物理反馈进行学习,而不仅依赖于人类反馈。

推理的增长已经开始出现,我对此非常兴奋。不过需要指出的是,推理任务本身非常复杂:推理需要在复杂任务中保持较高的准确率;为了降低成本,推理需要具备较高的吞吐能力;推理必须快速完成,以确保良好的用户体验。

此外,随着推理任务的上下文长度越来越长,模型也变得更大,具备多模态能力。推理领域的创新速度非常快,这也是NVIDIA架构能够领先市场的关键。开发者基于CUDA和NVIDIA架构的创新生态,可以快速开发新功能,同时确保这些功能在全球的NVIDIA设备上无缝部署,从数据中心到边缘设备再到机器人系统。这种广泛的部署能力和支持多方向创新的生态系统,是NVIDIA在推理市场的重要优势。

Q:请问网络业务具体发生了什么?是否有供应限制?另外,Spectrum-X业务进展如何,是否有望达到您之前提到的数十亿美元规模?

A:首先谈谈网络业务。虽然本季度环比略有下降,但年同比增长非常显著。从我们收购Mellanox开始,就致力于将网络业务与数据中心的整体架构紧密结合。网络业务在数据中心中是至关重要的一部分,且随着我们越来越多的系统采用自有网络解决方案,这一业务持续增长并表现良好。

本季度的下降只是暂时的,接下来我们预计会恢复增长。随着Blackwell及更多系统的推出,不仅现有网络产品会被广泛使用,同时新的网络技术也会融入这些大型系统中。

Q:上次财报电话会议中您提到主权AI的需求规模为低双位数十亿美元。现在情况如何?另外,游戏业务的供应限制是否与您将资源转向数据中心有关?

A:关于主权AI,这是一个非常重要的增长领域,特别是生成式AI兴起后,推动了各国构建本土化的AI模型。今天的电话会议中我们提到,许多国家正在建设基础模型,这些模型适配本国的语言和文化,并与当地企业深度合作。主权AI的增长机会不仅体现在欧洲,也包括亚太地区,这些区域正在加速建设区域性云服务或AI工厂以支持主权AI的发展。

关于游戏业务的供应问题,目前我们正在努力扩大所有产品线的供应能力。游戏产品的市场需求非常旺盛,但挑战在于能否快速满足需求。本季度可能会面临一定供应紧张的情况,但我们预计在新的一年内供应将恢复正常。

Q: Blackwell的相关评论是否意味着接下来会有更快的增长,尤其是在供应增加的情况下?上半年是否会出现某种追赶效应?此外,关于美国新一届政府和中国业务,您是否听到任何关于关税或相关政策的讨论?

A:我们只会对下一个季度作出具体指引。目前,我们专注于本季度的工作,确保能够按计划交付Blackwell芯片。我们正在与全球所有供应商无缝合作,以满足供应需求。等到下个季度时,我们会为您提供关于扩展的更多细节。无论新政府作出什么决策,我们都会全力支持,这是我们的最高优先事项。同时,我们也会尽力满足客户需求,在市场中保持竞争力。我们始终遵守相关法规,同时做到支持客户、参与市场竞争并推动业务发展。我们会在这三个方面同时努力。

Q:计算资源在预训练、强化学习和推理中如何分配?您对目前的比例以及未来增长的重点方向有何看法?

A:目前,大部分计算资源仍然集中在基础模型的预训练阶段,因为后训练(强化学习)相关的新技术刚刚进入市场。在预训练和后训练中,尽可能优化模型能够降低推理的成本,这对所有用户都非常重要。然而,无论如何优化,某些任务仍然需要即时思考、上下文推理以及反思能力。

现阶段的基础模型已经进入多模态阶段,需要处理海量的视频数据,其训练规模达到惊人的数量级。因此,我预计在可预见的未来,预训练、后训练和推理扩展将会继续并行增长。这也意味着我们需要不断提高计算性能,每次以倍数级的提升为目标,以便持续降低AI的成本,同时提高客户的收入,从而推动AI革命继续向前发展。

三、Jensen Huang总结发言

感谢大家的参与。NVIDIA业务的巨大增长源于推动全球计算应用的两个根本性趋势:

计算堆栈的重构:从基于CPU的传统编码转向基于GPU的机器学习。这是一场从传统数据中心基础设施向“软件2.0”过渡的重大转型,传统数据中心价值1万亿美元的基础设施正在被机器学习驱动的AI重新定义。

AI时代的全面到来:生成式AI不仅是一种新型软件能力,更是一个崭新的产业。它通过“AI工厂”生产数字智能,标志着一场全新的工业革命。这场革命有望创造出一个规模达数万亿美元的AI产业。

Hopper的持续需求以及Blackwell全面量产的前景令人振奋,背后有以下几个原因:基础模型的开发者数量较去年显著增加;预训练和后训练的计算规模呈指数级增长;AI原生创业公司的数量空前增加,推理服务的成功案例不断涌现;随着ChatGPT-01和OpenAI-01的引入,“测试时扩展”(Test TimeScaling)成为新的扩展规律,进一步推动计算需求。

AI正在改变每个行业、公司和国家。企业正采用智能型AI(Agentic AI)优化工作流程,未来的AI协作者将帮助员工更快、更好地完成工作。物理AI的突破正引发工业机器人领域的投资热潮,研究者利用视频数据和Omniverse生成的合成数据训练全球性的基础模型,从而推动新的训练基础设施需求。

机器人时代即将到来,各国也认识到这些AI趋势的重要性,开始加速建设国家级AI基础设施。NVIDIA凭借其专业知识、规模和提供完整技术堆栈与基础设施的能力,可以全面应对这一多万亿美元的AI和机器人市场机遇。无论是超大规模云、企业私有云、主权区域AI云、边缘设备,还是工业机器人,NVIDIA都能够满足各类需求。感谢大家的参与,我们下次再见。

新建了付费纯美股(不含在美上市中概)交流群,除美股综合群,还有加密货币群、MSTR、英伟达、特斯拉、苹果、Google、Meta、亚马逊、微软、台积电等10多个美股个股群

另建了免费的中概、港股、A股投资群,及相关个股群:美团、阿里、阅文、贝壳、快手、拼多多、滴滴、唯品会、小米、B站、腾讯、京东、理想、蔚来、小鹏等,欢迎扫码加入。



走马财经
TMT产业资深(也就是老)观察者,部分平台叫“走马投研”
 最新文章