AI很火 Nvidia Blackwell很热——Blackwell存在严重过热问题,迫使机架重新设计

文摘   2024-11-21 16:21   日本  

The Information 报道,Nvidia的下一代Blackwell 数据中心处理器在安装在高容量服务器机架中时存在严重的过热问题,迫使机架本身重新设计。这些问题导致了设计变更,意味着产品发货延迟,并引发人们担忧,包括谷歌、Meta和微软在内的最大客户是否能够按照他们的时间表部署Blackwell 服务器。消息出来后Nvidia股价下跌了 2.9%

据知情人士向The Information 透露,NvidiaBlackwell GPU 在拥有 72 个处理器的超密集服务器中会过热。每个 Backwell 处理器的功耗超过 1000 W,因此在相对较小的空间内会产生大量的热量和功耗。

据称,Nvidia正与供应商和合作伙伴密切合作,对产品进行修改和设计变更,以解决过热问题。这种重新设计并不罕见,但在这种情况下,该公司推迟了原定于本季度的预期发货日期。

这已经不是关于Blackwell的第一次谣言了。今年8 月,有消息称 Nvidia 及其制造合作伙伴台积电正在处理因处理器封装设计而导致的产量问题。但这一消息很快得到了解决,并在季度财报电话会议上被驳回。

Nvidia 11 20 日星期三股市收盘后公布财报。公司发言人表示 :Nvidia GB200 系统是有史以来最先进的计算机。将它们集成到各种数据中心环境中需要与我们的客户共同进行工程设计。我们的工程迭代符合预期。我们的一些合作伙伴,包括戴尔科技和CoreWeave,正在 SC 和社交媒体上推广新的 Nvidia GB200 NVL72 设计。”

Moor Insights & Strategies 首席分析师表示并不完全相信这些说法.“我认为现在判断这是一个普遍存在的问题还是一个配置问题还为时过早。我无法想象 Nvidia 会运送过热的部件,尤其是在已经需要大量冷却的情况下,”他说,并补充说这则新闻的时机值得怀疑。SC 24 会议正在举行,不排除Nvidia 竞争对手试图削弱该公司的可能性。

SC会议是高性能计算领域所有知名人士聚集在一起讨论谣言和商机的日子,也正是抛出这样的大谣言的日子,它会像野火一样在整个行业中传播开来,”他说。“如果它更自然,它会在展会结束后随着人们私下交谈和闲聊而传播开来。这几乎感觉像是竞争对手为了吸引更多人关注竞争平台而散布的泄密。”

英伟达(NVDA) 周三盘后公布第三季度收益超出预期,其高性能AI 芯片的强劲销售推动了其首席执行官黄仁勋所说的“人工智能时代”。作为全球市值最大的上市公司,英伟达公布每股收益(EPS) 0.81 美元,营收为 351 亿美元。分析师预计每股收益为 0.74 美元,营收为332 亿美元。英伟达还表示,预计第四季度营收为375 亿美元,上下浮动2%。这略高于华尔街预期的370 亿美元。受此消息影响,英伟达股价下跌约1%

黄仁勋在一份声明中表示:“人工智能时代正如火如荼地展开,推动着全球向Nvidia 计算的转变。随着基础模型制造商扩大预训练、后训练和推理规模,对Hopper 的需求和对全面投产的Blackwell 的期待令人难以置信。”

Nvidia 似乎也缓解了人们对其下一代Blackwell 芯片供货可能放缓的担忧,首席财务官Colette Kress 表示,AI GPU 将在本季度开始出货,并在未来一年内逐步上市。

Hopper Blackwell 系统都存在一定的供应限制,预计 2026 财年Blackwell 的需求将超过供应量,”她补充道。



YoYo酱慢谈
杂说漫谈,科技前沿信息介绍与分享。
 最新文章