GB200机架供应链优化，GB200延期及GB300进展

文摘 2024-12-31 07:00 上海

GB200机架供应链优化

GB200机架由于设计规格更高，包括高速互连接口和热设计功耗(TDP)等技术更复杂，生产成本更高，需要额外的时间进行优化和调整。
GB机架系列是当前CSPs的首选解决方案，其他潜在客户还包括Tier-2数据中心、从事HPC/AI应用的学术研究机构等。TrendForce预计GB200 NVL72将成为25年最广泛采用的型号，占总部署量的80%。
由于AI服务器系统组件仍在进行供应链调整，预计年底的出货量将低于行业预期，预计GB200全机架系统的高峰发货期将推迟到25年Q2和Q3之间。
随着GB200 NVL72的140kW 热设计能耗 (TDP)超出了传统空气冷却解决方案的限制，当前行业重要参与者正大力投资液冷技术的研发，同时冷却液分配单元（CDU）供应商正在通过扩大机架尺寸和开发更高效的冷板设计来提高冷却效率。

GB200延期和GB300的进展

由于机架、冷却和电源/密度的显著变化，CSPs在服务器层面上无法对GB200进行太多更改，如Meta放弃从博通和Nvidia多渠道采购NICs，转而完全依赖Nvidia。
25年Nvidia预计销售650-700万块GPU，根据生产比例和产量预期，其中Hopper约200万块，Blackwell系列 500万块，同时生产于24年底开始提速。
由于GB200的延迟，许多原计划在第三季度开始的订单转移到GB300上。GB300有望在25年3月GTC上发布，ConnectX-8 芯片推出时间预计和GB300一致。
AI服务器方面，鸿海和广达已进入GB300的研发设计阶段，鸿海仍为最大供应商，可通过扩大产能来解决GB300服务器订单需求。
拥有GB300后，CSPs能够定制主板、冷却等更多内容，但同时显著提高平台复杂性，带来了设计、验证及测试方面更多的工作。而且成本优化也是一个很大的挑战。
随着组件从Nvidia的利润堆叠中到ODMs，客户的总支付价格差异很大。Nvidia的毛利率也将发生变化，ODM的收入也会受到影响。

欢迎加入自动驾驶实战群

上下游供应链的一些挑战

上游：HBM内存供应紧张，三星由于无法通过Nvidia HBM3E认证，预计最早到25年Q1提供HBM3E，SK Hynix作为供应商可能无法满足需求。台积电CoWoS-L封装良率和电源管理芯片（PMIC）设计变更对供应商的影响等问题。
下游：GPU与主板产量速度不一致，电缆组件、液冷组件等生产进度问题。

参考资料：

https://www.trendforce.com/presscenter/news/20241217-12412.html
https://semianalysis.com/2024/12/25/nvidias-christmas-present-gb300-b300-reasoning-inference-amazon-memory-supply-chain/#semianalysis-blocks-login-to-view-content
https://semianalysis.com/2024/08/04/nvidias-blackwell-reworked-shipment/
JP Morgan相关报告

Ai fighting

全网第一且唯一分享自动驾驶实战，以代码、项目的形式讲解自动驾驶感知方向的关键技术，从算法训练到模型部署。主要致力于3D目标检测，3D目标追踪，多传感器融合，Transform，BEV，OCC，模型量化，模型部署等方向的实战。

CES2025，Nvidia主题演讲

东北大学提出4D时空激光语义分割网络4D-CS:实现nuscenes上最新SOTA

AI应用开发系列 3-掌握Prompt写作技巧，让AI提效百倍

华为/上交通联合提出 MSSIDD:多传感器去噪基准，移动摄像头去噪模型可迁移性评估的新视角！

智能座舱缘何成为自动驾驶的“宠儿”？

北航/新加坡国立大学/华中科技提出自动驾驶视觉语言模型的视觉对抗攻击！

人工智能智能体(AI Agent)发展趋势2024年总结与2025年展望

第四届全球自动驾驶峰会1月14日在北京举办

3D视觉理解GPT4Scene：通过视觉-语言模型从视频中理解3D场景

澳门大学提出TiGDistill-BEV: 通过目标内几何学习蒸馏实现多视角BEV 3D物体检测

激光雷达会被智能汽车抛弃吗？

多模态学习关键技术深度综述：多模态标记、骨干模型架构、统一任务表示、数据与评估、挑战与趋势

2024国产人形机器人一览 1

端到端自动驾驶技术研究与分析

GB200机架供应链优化，GB200延期及GB300进展

武大/中科院/悉尼科技大学/牛津大学/西交大共同提出 DriveMLLM : 自主驾驶中多模态大语言模型的空间理解基准！

汽车产业的AIGC革命：重塑未来出行

MambaDETR: 基于查询的时间建模，使用状态空间模型进行多视图 3D 对象检测 !

大模型语义分析之嵌入(Embedding)模型

南京邮电&南京理工提出URoadNet：使用双重稀疏注意力用于多尺度道路网络提取

云计算与大模型训练的结合

华中科技大学提出端到端跨视图引用式多目标跟踪方法CRTracker

怎么提升向量数据库的召回准确率

哈尔滨工业大学提出MR-GDINO: 杜绝遗忘的高效的开放世界物体检测

YoloV8改进策略：卷积篇|CGAFusion，增强模型对特征的提取能力|附代码|即插即用

DriveGPT实现Waymo最佳预测: 扩展自回归行为模型在自动驾驶中规划与预测

AI突破：单图生成3D世界，GenEx重塑具身智能探索格局！

什么是相似性搜索？大模型的底座技术

智驾与底盘争抢的车身控制，你真的了解吗？

端到端自动驾驶技术研究与分析

基于Transformer架构的扩散模型

台湾大学 & 英伟达提出 SAM4MLLM 用于指代表达式分割的增强多模态大语言模型！

智能汽车嘚啵嘚 --- 智能座舱第八稿：智能座舱数字钥匙

华中科技 & 北航 & 清华 & 上海 AI Lab 提出 BIG.LITTLE Transformer ，用于高效视觉识别！

ChatGLM: 从GLM-130B到GLM-4的系列大型语言模型

全栈量产智驾应用算法在C1200家族芯片上的部署 | 研讨会回顾

大模型推理序列并行

SimpleBEV: 改进的LiDAR-摄像头融合架构用于3D目标检测！

端到端机器人学习的空间视觉感知（北大&哈佛）

什么是具身智能？自动驾驶是具身智能吗？

大模型推理加速与KV Cache（一）：什么是KV Cache

LsSInst: 改进基于 LSS 的 BEV 感知中的几何建模与实例表示 !

想了解AI大模型？你就不得不了解一下并行运算的始末

清华大学&加州大学发布流式密集4D重建模型Driv3R: 无需全局对齐实现15倍的推理提升

Yolo11改进策略：上采样改进|CARAFE，轻量级上采样|即插即用|附改进方法+代码

汽车产业的AIGC革命：重塑未来出行

使用大模型实现一个聊天机器人思路以及困难点

单目3D 目标检测的高效特征聚合和尺度感知回归！

一文读懂多模态大模型：LLaVA系列 | 从图像到视频内容理解的进化之路

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉