首页
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
更多
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
HBM制裁加码下的困境与出路
科技
2024-12-10 19:20
北京
公开课预告
12月13日19:30
,# 智猩猩智算集群公开课 开讲!阿里云智能集团智算集群产品专家陈祎将以
《大模型时代的智算GPU集群》
为主题进行直播讲解,欢迎扫码报名~
近日,据供应链人士消息,三星原厂内部传出美国商务部工业与安全局(BIS)正筹备一项针对高带宽存储(HBM)的重大禁令,计划于12月6日发布,涵盖HBM2E、HBM3以及HBM3E,并定于2025年1月2日起正式生效。
01
巨头竞争日趋激烈
高度依赖全球供应链
全球HBM市场高度集中,主要由SK海力士、三星以及美光三大巨头垄断。三家原厂在HBM领域的竞争日趋白热化,朝着不断提高存储容量、带宽,减小功耗和封装尺寸方向升级。
2023年市场主要HBM代际是HBM2、HBM2e和HBM3,算力卡性能提升刺激HBM产品更迭,2023年下半年伴随英伟达H100与AMD MI300的搭载,HBM3渗透率提升。
2024年伊始,SK海力士完成HBM3e开发,而美光则跳过了HBM3,直接研发HBM3e,9月,SK海力士官宣已开始量产12H HBM3e。据TrendForce数据显示,
2025年HBM3e占比预计超过80%。
市场方面,SK海力士
几乎将其所有HBM产能锁定在科技巨头客户身上,如英特尔、AMD等,而美国企业
美光
受限于政府出口管制政策,无法将其先进的HBM产品销往中国大陆,使得
三星
在中国市场几乎独占了HBM的供应份额。美国HBM禁令的实施,将直接切断三星向中国客户供应HBM的渠道,引发市场恐慌,加速中国客户寻找替代方案,对三星全球市场份额造成连锁反应。
02
制裁加码
近忧与远虑
并存
此次HBM禁令的出台,是美国政府近年来在半导体和人工智能等高科技领域对中国实施一系列遏制措施的最新举措。此前美国政府对华出口先进芯片的限制主要是针对高算力、先进工艺,现在开始限制高带宽了。
HBM技术的落后和产能不足是中国半导体行业面临的一大重要挑战。目前,中国本土的AI芯片主要使用HBM2或HBM2e,而
全球市场上的主流加速卡最低配也是HBM2e。
据科技博主“信息平权”称,使用过HBM2的芯片,类似谷歌TPU v3/v4、Intel Gaudi一代、AMD的MI50/60等甚至都已经停产。
如果美国禁令限制到HBM2e,对中国加速卡的影响将是巨大的。HBM2和HBM3E的带宽差距按4倍来算,
最终集群的性能差距可能是16倍,
因为访存带宽和卡间互联带宽是要“匹配”的,因此计算单卡差距还不够,一旦算集群互联后的性能差距,可能是显存带宽差距的“平方”(非常粗的估计),这将使得中国本土AI芯片在性能上难以与国际竞争对手匹敌。
HBM生产需同时具备DRAM生产和先进封装工艺(核心工艺包括TSV、microbumping和堆叠键合技术)的产业化能力,目前国内部分企业虽有一定的DRAM和先进封装技术基础,但掌握的DRAM工艺制程明显落后于国际水平,且在DRAM上应用TSV、micro-bumping和堆叠键合等先进封装工艺的经验有所不足。中国本土的DRAM制程技术与国际大厂相
比落后约三
代
,目前仍以旧世代的HBM2为发展重心。
并且国内厂家在
制造能力
上也不成熟,仍处于发展早期阶段。HBM产能吃紧的背后,还受到2.5D先进封装、CoWoS产能不足的掣肘。如果国内无法量产快速建立起HBM产能,也将成为自研AI芯片的隐忧。
当前HBM产能吃紧下,三大原厂走合约供货的可能性偏低,尤其是被列入美国出口管制实体清单的企业,取得难度更高。若为解决
眼前之忧
,可以退而求其次,采购2D-DRAM颗粒,再透过TSV垂直方向钻孔、TCB热压键合的封装技术,堆栈出规格不算高的HBM装置。但考虑
长远之患
,产业自主可控仍是根本。
—END—
点击下方名片
即刻关注我们
算力猩
隶属于智猩猩,关注计算芯片创新,解读中国算力突破。
最新文章
公开课预告:大规模智算网络基础架构与部署规划|新华三数据中心网络资深产品经理韦赟主讲
算力网(络),应该是什么
先进封装技术解读 | 台积电
IBM 的大规模 A100/H100 GPU 集群 Infra 建设
22页PPT详解 NVIDIA RTX™ 5880 Ada 及训推一体机【附下载】
AI数据中心:网络设计和选型标准
突破内存墙:DRAM技术演进及3D DRAM革命
SC24|谷歌AI加速器:TPU v6e Trillium技术解析
公开课预告:大规模异构GPU集群的互联、运维与调度|基流科技技术负责人敬阳主讲
揭秘 AWS 10p10u 最新网络架构!
AI时代的以太网:应对大规模GPU集群网络挑战
智算中心正在CDN化
博通3.5D F2F技术:定义AI XPU的未来
NVIDIA RTX™ 5880 Ada 性能解析与私有化大模型部署|在线研讨会直播预告
AI数据中心历史、技术与关键企业
揭秘!世界第一个采用CXL 3.1交换机的AI集群
公开课预告:大模型时代的智算GPU集群|阿里云智能集团智算集群产品专家陈祎主讲
GPU服务器支持的“卡数”由哪些因素决定?
HBM制裁加码下的困境与出路
Meta 万卡 GPU 集群稳定性剖析与最佳实践
通往万亿晶体管GPU之路
亚马逊芯片帝国背后的功臣
比GPU快20倍?d-Matrix推理性价比分析
AWS最强AI芯片,深度解读!
功能安全的图形显示解决方案与汽车制造业模拟数字孪生平台 | NVIDIA 加速汽车制造与智驾开发专场直播预告
公开课预告:OISA构建开放高性能GPU卡间互联体系|中国移动研究院李锴主讲
NVIDIA GH200 内部架构探究
UEC 和 UAL 应该合并吗?
AI Infra峰会与大模型峰会议程全公布!2024中国生成式AI大会上海站本周举行,报名即将截止!
公开课预告:针对先进封装的2.5D/3D Chiplet协同设计仿真EDA工具探讨|硅芯科技创始人赵毅主讲
一文看懂Infinity Fabric
大模型时代:交换机衡量指标、技术演变及性能分析
爱芯元智吴炜:多模态大模型在端侧的创新实践与挑战|GenAICon 2024上海站演讲预告
智算中心:现状、挑战、策略与未来机遇
GenAICon 2024上海站主会场议程公布!34位学者专家全景式解构大模型与AI Infra
追赶NVIDIA,国产AI芯片需努力的5个方面
光羽芯辰创始人周强:通向个人大模型之路|演讲预告
从UALink近期发展再看GPU Scale Up的互连方向
无问芯穹首席科学家戴国浩教授:软硬协同与多元异构,共筑大模型算力底座|演讲预告
公开课预告:智算中心 AI Scale-Up 网络技术|益思芯科技解决方案副总裁唐杰主讲
大规模AI计算时代的存储:挑战与优化
聊一聊算力调度
全球化布局:AI 企业如何补齐算力短板,保障GPU集群稳定性|GMI Cloud 亚太区总裁 King.Cui演讲预告
中国系统级封装大会SiP China 2024周三开启!免费报名~
面向大规模AI计算的高性能网络架构:Enfabrica ACF-S解决方案深度解析
近30家大模型与AI Infra企业来了!年度生成式AI大会上海站公布最新嘉宾,报名进入最后阶段
高性能GPU服务器硬件拓扑及集群组网
GPU互连新标准:UALink联盟能否打破NVIDIA垄断?
高性能智算集群设计思考与实践|阿里云智算集群产品解决方案负责人丛培岩演讲预告
全球化布局:AI 企业如何补齐算力短板,保障GPU集群稳定性?|GMI Cloud 亚太区总裁 King.Cui演讲预告
分类
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
原创标签
时事
社会
财经
军事
教育
体育
科技
汽车
科学
房产
搞笑
综艺
明星
音乐
动漫
游戏
时尚
健康
旅游
美食
生活
摄影
宠物
职场
育儿
情感
小说
曲艺
文化
历史
三农
文学
娱乐
电影
视频
图片
新闻
宗教
电视剧
纪录片
广告创意
壁纸头像
心灵鸡汤
星座命理
教育培训
艺术文化
金融财经
健康医疗
美妆时尚
餐饮美食
母婴育儿
社会新闻
工业农业
时事政治
星座占卜
幽默笑话
独立短篇
连载作品
文化历史
科技互联网
发布位置
广东
北京
山东
江苏
河南
浙江
山西
福建
河北
上海
四川
陕西
湖南
安徽
湖北
内蒙古
江西
云南
广西
甘肃
辽宁
黑龙江
贵州
新疆
重庆
吉林
天津
海南
青海
宁夏
西藏
香港
澳门
台湾
美国
加拿大
澳大利亚
日本
新加坡
英国
西班牙
新西兰
韩国
泰国
法国
德国
意大利
缅甸
菲律宾
马来西亚
越南
荷兰
柬埔寨
俄罗斯
巴西
智利
卢森堡
芬兰
瑞典
比利时
瑞士
土耳其
斐济
挪威
朝鲜
尼日利亚
阿根廷
匈牙利
爱尔兰
印度
老挝
葡萄牙
乌克兰
印度尼西亚
哈萨克斯坦
塔吉克斯坦
希腊
南非
蒙古
奥地利
肯尼亚
加纳
丹麦
津巴布韦
埃及
坦桑尼亚
捷克
阿联酋
安哥拉