HBM制裁加码下的困境与出路

科技 2024-12-10 19:20 北京

公开课预告

12月13日19:30，# 智猩猩智算集群公开课开讲！阿里云智能集团智算集群产品专家陈祎将以《大模型时代的智算GPU集群》为主题进行直播讲解，欢迎扫码报名~

近日，据供应链人士消息，三星原厂内部传出美国商务部工业与安全局（BIS）正筹备一项针对高带宽存储（HBM）的重大禁令，计划于12月6日发布，涵盖HBM2E、HBM3以及HBM3E，并定于2025年1月2日起正式生效。

01 巨头竞争日趋激烈高度依赖全球供应链

全球HBM市场高度集中，主要由SK海力士、三星以及美光三大巨头垄断。三家原厂在HBM领域的竞争日趋白热化，朝着不断提高存储容量、带宽，减小功耗和封装尺寸方向升级。

2023年市场主要HBM代际是HBM2、HBM2e和HBM3，算力卡性能提升刺激HBM产品更迭，2023年下半年伴随英伟达H100与AMD MI300的搭载，HBM3渗透率提升。

2024年伊始，SK海力士完成HBM3e开发，而美光则跳过了HBM3，直接研发HBM3e，9月，SK海力士官宣已开始量产12H HBM3e。据TrendForce数据显示，2025年HBM3e占比预计超过80%。

市场方面，SK海力士几乎将其所有HBM产能锁定在科技巨头客户身上，如英特尔、AMD等，而美国企业美光受限于政府出口管制政策，无法将其先进的HBM产品销往中国大陆，使得三星在中国市场几乎独占了HBM的供应份额。美国HBM禁令的实施，将直接切断三星向中国客户供应HBM的渠道，引发市场恐慌，加速中国客户寻找替代方案，对三星全球市场份额造成连锁反应。

02 制裁加码近忧与远虑并存

此次HBM禁令的出台，是美国政府近年来在半导体和人工智能等高科技领域对中国实施一系列遏制措施的最新举措。此前美国政府对华出口先进芯片的限制主要是针对高算力、先进工艺，现在开始限制高带宽了。

HBM技术的落后和产能不足是中国半导体行业面临的一大重要挑战。目前，中国本土的AI芯片主要使用HBM2或HBM2e，而全球市场上的主流加速卡最低配也是HBM2e。据科技博主“信息平权”称，使用过HBM2的芯片，类似谷歌TPU v3/v4、Intel Gaudi一代、AMD的MI50/60等甚至都已经停产。

如果美国禁令限制到HBM2e，对中国加速卡的影响将是巨大的。HBM2和HBM3E的带宽差距按4倍来算，最终集群的性能差距可能是16倍，因为访存带宽和卡间互联带宽是要“匹配”的，因此计算单卡差距还不够，一旦算集群互联后的性能差距，可能是显存带宽差距的“平方”（非常粗的估计），这将使得中国本土AI芯片在性能上难以与国际竞争对手匹敌。

HBM生产需同时具备DRAM生产和先进封装工艺（核心工艺包括TSV、microbumping和堆叠键合技术）的产业化能力，目前国内部分企业虽有一定的DRAM和先进封装技术基础，但掌握的DRAM工艺制程明显落后于国际水平，且在DRAM上应用TSV、micro-bumping和堆叠键合等先进封装工艺的经验有所不足。中国本土的DRAM制程技术与国际大厂相比落后约三代，目前仍以旧世代的HBM2为发展重心。

并且国内厂家在制造能力上也不成熟，仍处于发展早期阶段。HBM产能吃紧的背后，还受到2.5D先进封装、CoWoS产能不足的掣肘。如果国内无法量产快速建立起HBM产能，也将成为自研AI芯片的隐忧。

当前HBM产能吃紧下，三大原厂走合约供货的可能性偏低，尤其是被列入美国出口管制实体清单的企业，取得难度更高。若为解决眼前之忧，可以退而求其次，采购2D-DRAM颗粒，再透过TSV垂直方向钻孔、TCB热压键合的封装技术，堆栈出规格不算高的HBM装置。但考虑长远之患，产业自主可控仍是根本。

—END—

点击下方名片

即刻关注我们

算力猩

隶属于智猩猩，关注计算芯片创新，解读中国算力突破。

算力网（络），应该是什么

先进封装技术解读 | 台积电

IBM 的大规模 A100/H100 GPU 集群 Infra 建设

22页PPT详解 NVIDIA RTX™ 5880 Ada 及训推一体机【附下载】

AI数据中心：网络设计和选型标准

突破内存墙：DRAM技术演进及3D DRAM革命

SC24｜谷歌AI加速器：TPU v6e Trillium技术解析

公开课预告：大规模异构GPU集群的互联、运维与调度｜基流科技技术负责人敬阳主讲

揭秘 AWS 10p10u 最新网络架构！

AI时代的以太网：应对大规模GPU集群网络挑战

智算中心正在CDN化

博通3.5D F2F技术：定义AI XPU的未来

NVIDIA RTX™ 5880 Ada 性能解析与私有化大模型部署｜在线研讨会直播预告

AI数据中心历史、技术与关键企业

揭秘！世界第一个采用CXL 3.1交换机的AI集群

公开课预告：大模型时代的智算GPU集群｜阿里云智能集团智算集群产品专家陈祎主讲

GPU服务器支持的“卡数”由哪些因素决定？

HBM制裁加码下的困境与出路

Meta 万卡 GPU 集群稳定性剖析与最佳实践

通往万亿晶体管GPU之路

亚马逊芯片帝国背后的功臣

比GPU快20倍？d-Matrix推理性价比分析

AWS最强AI芯片，深度解读！

功能安全的图形显示解决方案与汽车制造业模拟数字孪生平台 | NVIDIA 加速汽车制造与智驾开发专场直播预告

公开课预告：OISA构建开放高性能GPU卡间互联体系｜中国移动研究院李锴主讲

NVIDIA GH200 内部架构探究

UEC 和 UAL 应该合并吗？

AI Infra峰会与大模型峰会议程全公布！2024中国生成式AI大会上海站本周举行，报名即将截止！

公开课预告：针对先进封装的2.5D/3D Chiplet协同设计仿真EDA工具探讨｜硅芯科技创始人赵毅主讲

一文看懂Infinity Fabric

大模型时代：交换机衡量指标、技术演变及性能分析

爱芯元智吴炜：多模态大模型在端侧的创新实践与挑战｜GenAICon 2024上海站演讲预告

智算中心：现状、挑战、策略与未来机遇

GenAICon 2024上海站主会场议程公布！34位学者专家全景式解构大模型与AI Infra

追赶NVIDIA，国产AI芯片需努力的5个方面

光羽芯辰创始人周强：通向个人大模型之路｜演讲预告

从UALink近期发展再看GPU Scale Up的互连方向

无问芯穹首席科学家戴国浩教授：软硬协同与多元异构，共筑大模型算力底座｜演讲预告

公开课预告：智算中心 AI Scale-Up 网络技术｜益思芯科技解决方案副总裁唐杰主讲

大规模AI计算时代的存储：挑战与优化

聊一聊算力调度

全球化布局：AI 企业如何补齐算力短板，保障GPU集群稳定性｜GMI Cloud 亚太区总裁 King.Cui演讲预告

中国系统级封装大会SiP China 2024周三开启！免费报名～

面向大规模AI计算的高性能网络架构：Enfabrica ACF-S解决方案深度解析

近30家大模型与AI Infra企业来了！年度生成式AI大会上海站公布最新嘉宾，报名进入最后阶段

高性能GPU服务器硬件拓扑及集群组网

GPU互连新标准：UALink联盟能否打破NVIDIA垄断？

高性能智算集群设计思考与实践｜阿里云智算集群产品解决方案负责人丛培岩演讲预告

全球化布局：AI 企业如何补齐算力短板，保障GPU集群稳定性？｜GMI Cloud 亚太区总裁 King.Cui演讲预告

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉