11月18日消息,据外媒报道,英伟达新一代Blackwell处理器在安装到大容量服务器机架时存在过热问题,导致延迟交付。
报道称,这些问题已导致设计变更和延迟,并引发了谷歌、Meta和微软等客户对能否按时部署Blackwell服务器的担忧。
知情人士称,用于AI和HPC(高性能计算)的Blackwell GPU在内置72个处理器的服务器中使用时会过热。这些机器每个机架的功耗预计高达120千瓦。这些问题已导致英伟达多次重新评估其服务器机架的设计,因为过热会限制GPU性能,并有损坏组件的风险。报道称,客户担心这些挫折可能会延迟他们在数据中心部署新处理器的进程。
英伟达已指示其供应商对机架进行多次设计变更,以应对过热问题。该公司与其供应商和合作伙伴密切合作,对工程设计进行修改,以改善服务器散热。虽然这些调整是此类大规模技术发布的常规步骤,但这还是进一步推迟了预期的发货日期。
针对延迟和过热问题,英伟达对外媒表示,正与云供应商合作,并将设计变更描述为正常开发流程的一部分。在英伟达继续努力解决这些技术难题的同时,与云提供商和供应商的这种合作关系旨在确保最终产品达到预期的性能和可靠性。
Blackwell GPU的最终修订版在10月下旬才进入量产阶段,这意味着英伟达将从1月下旬开始出货这些处理器。
英伟达的客户,包括谷歌、Meta 和微软等科技巨头,都使用英伟达的GPU来训练他们最强大的大型语言模型。Blackwell AI GPU的延迟自然会影响英伟达客户的计划和产品。
上周五收盘,英伟达(NASDAQ:NVDA)股价下跌3.26%至141.98美元,总市值约3.48万亿美元。