新智元报道
新智元报道
【新智元导读】英伟达的圣诞大礼包曝光,最强B300、GB300算力和显存直接提高50%,模型推理训练性能史诗级提升,同时还打破了利润率下降的魔咒。
B300和GB300:绝不仅是一次小升级
FLOPS性能提升50% 功耗增加200W(GB300和B300 HGX的TDP分别达到1.4KW和1.2KW;前代则为1.2KW和1KW) 架构改进和系统级增强,例如CPU和GPU之间的动态功率分配(power sloshing)
HBM容量增加50%,从192GB提升至288GB 堆叠方案从8层HBM3E升级为12层 针脚速率保持不变,带宽仍为8TB/s
专为「推理模型」优化
更高的带宽使交互性能普遍提升了43%(H200为4.8TB/s,而H100为3.35TB/s) 更大的批处理规模,使每秒token生成量提升了3倍,进而使成本也降低了约3倍
更高交互性,实现更低思维链延迟 72个GPU分散KV Cache,支持更长思维链,提升智能水平 相比传统8 GPU服务器,具备更优批处理扩展性 支持更多样本并行搜索,提升准确性和模型性能
供应链重构
搭载在「SXM Puck」模块上的B300 BGA封装的Grace CPU 由美国初创企业Axiado提供的基板管理控制器(HMC),取代了原有的Aspeed方案
纬创在ODM领域受影响最大,Bianca主板份额显著下降 富士康工业互联网通过独家生产SXM Puck及其插座,抵消了Bianca主板业务的损失 英伟达正在寻求Puck和插座的其他供应商,但目前尚未确定新订单
Monolithic Power Systems的市场份额将因商业模式转变而下降 市场格局重塑为新供应商创造了更多的机会
带宽提升100% PCIe通道数从32增至48,支持空冷MGX B300A等创新性架构设计 原生支持SpectrumX,无需借助效率较低的Bluefield 3 DPU(此前400G产品的方案)
对超算中心的影响
GB300提供更高的FLOPS算力和更大的显存容量 客户拥有更多系统定制自主权
对英伟达利润的影响
更高的容量 堆栈层数增加带来的每GB显存溢价 封装良率下降带来的额外成本