首页
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
更多
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
英伟达H20,在中国被疯抢
科技
2024-12-30 17:54
北京
本文由半导体产业纵横(ID:
I
CVI
E
W
S)编译自tomshardware
英伟达通过销售
H20
,
赚了数百亿美元。
英伟达在 2023 年和 2024 年的飙升得益于人工智能领域对 GPU 的爆炸性需求,主要是在美国、中东国家和中国。
为了将AI GPU加速器卖给中国,NVIDIA接连打造了多款缩水的特供版,从早期的A800、H800到后来的H20、L20、L2。
其中,
H20是最让中国客户满意的,因为它基于新的Hopper架构,
主要做训练(L20/L2都是中国不太需要的Ada架构推理卡),销量也是节节攀升。
由于美国存在出口限制,并且英伟达无法在没有政府出口许可的情况下将其最高端的 Hopper H100、H200 和 H800 处理器出售给中国,因此它转而将其削减版的HGX H20 GPU 出售给中国实体。
然而,分析师Claus Aasholm表示,尽管削减了,但 HGX H20 的销售表现却异常出色。
Aasholm 写道:“
通过了中国禁令的降级版 H20 系统表现非常好,环比增长 50%,这是英伟达最成功的产品。
H100 业务仅环比增长 25%。”
根据 Claus Aasholm 的发现,尽管 HGX H20 GPU 的性能与成熟的 H100 相比大幅下降
,但英伟达仍通过销售该 GPU 赚取了数百亿美元
。人工智能确实是推动几乎所有类型的数据中心硬件销售的大趋势,包括英伟达的 Hopper GPU,包括 HGX H20。
世界主要经济体——美国和中国——正在竞相获得最大的人工智能能力。对于美国来说,增长或多或少是自然而然的:更多的资金和更多的硬件等于更高的能力,但这还不够。OpenAI 本身就赚了数十亿美元,但它需要更多的钱来获得更多的硬件,从而获得人工智能训练和推理能力。
尽管存在种种限制,但中国的人工智能能力(无论是硬件还是大型模型开发)仍在不断扩大。就在上周,中国人工智能公司 Deepseek 在一篇论文中透露,它已经在 2,048 个英伟达H800 GPU 集群上训练了其 6710 亿参数的 DeepSeek-V3 混合专家 (MoE) 语言模型,耗时两个月,共计 280 万个 GPU 小时。
相比之下,Meta 投入了 11 倍的计算资源(3080 万个 GPU 小时)来训练拥有 4050 亿个参数的 Llama 3,耗时 54 天,使用了 16,384 个 H100 GPU。
随着时间的推移,中国本土的 Biren Technologies 和 Moore Threads 等公司推出的加速器可能会蚕食英伟达目前在中国数据中心的近乎垄断地位。然而,这不可能一蹴而就。
英伟达年终大礼,最强AI GPU曝光
根据SemiAnalysis的最新爆料,B300 GPU对计算芯片的设计进行了优化,并采用了全新的TSMC 4NP工艺节点进行流片。
相比于B200,其性能的提升主要在以下两个方面:
1. 算力
FLOPS性能提升50%
功耗增加200W(GB300和B300 HGX的TDP分别达到1.4KW和1.2KW;前代则为1.2KW和1KW)
架构改进和系统级增强,例如CPU和GPU之间的动态功率分配(power sloshing)
2. 内存
HBM容量增加50%,从192GB提升至288GB
堆叠方案从8层HBM3E升级为12层
针脚速率保持不变,带宽仍为8TB/s
序列长度的增加,导致KV Cache也随之扩大,从而限制了关键批处理大小和延迟。
因此,显存的改进对于OpenAI o3这类大模型的训练和推理至关重要。
下图展示了英伟达H100和H200在处理1,000个输入token和19,000个输出token时的效能提升,这与OpenAI的o1和o3模型中的思维链(CoT)模式相似。
H100到H200的升级,主要在于更大、更快的显存:
更高的带宽使交互性能普遍提升了43%(H200为4.8TB/s,而H100为3.35TB/s)
更大的批处理规模,使每秒token生成量提升了3倍,进而使成本也降低了约3倍
而对运营商而言,这H100和H200之间的性能与经济差异,远远超过技术参数的数字那么简单。
首先,此前的推理模型时常因请求响应时间长而影响体验,而现在有了更快的推理速度后,用户的使用意愿和付费倾向都将显著提高。
其次,成本降低3倍的效益,可是极为可观的。仅通过中期显存升级,硬件就能实现3倍性能提升,这种突破性进展远远超过了摩尔定律、黄氏定律或任何已知的硬件进步速度。
最后,性能最顶尖、具有显著差异化优势的模型,能因此获得更高溢价。
SOTA模型的毛利率已经超过70%,而面临开源竞争的次级模型利润率仅有20%以下。推理模型可突破单一思维链限制,通过扩展搜索功能提升性能(如o1 Pro和o3),从而使模型更智能地解决问题,提高GPU收益。
SemiAnalysis 表示,英伟达计划明年推出的 B300 Tensor Core GPU 对设计进行了调整,将在台积电 4NP 定制节点上重新流片,整体来看可较 B200 GPU 提升 50% 算力。
经济日报发布博文,英伟达(Nvidia)携手台积电(TSMC)等供应链合作伙伴,为迎接新一轮 AI 热潮,同时也是为巩固其在 AI 领域的领先地位,已提前启动下一代 Rubin 平台研发工作,原定 2026 年亮相的芯片有望提前 6 个月推出。
Rubin 是继 Blackwell 之后的下一代 AI GPU 架构,原计划于 2026 年发布,最新消息称将提前至 2025 年下半年,将采用台积电 3nm 工艺和下一代 HBM4 显存,大幅提升 AI 计算性能。
消息称英伟达正与供应链合作伙伴紧密合作,共同开发基于 R100 的 AI 服务器,与此同时台积电计划扩大 CoWoS 先进封装产能,以满足 Rubin 芯片的预期需求,目标是在 2025 年第四季度将 CoWoS 月产能提升至 8 万片。
*声明:本文系原作者创作。文章内容系其个人观点,我方转载仅为分享与讨论,不代表我方赞成或认同,如有异议,请联系后台。
半导体产业纵横
多元化的半导体产业生态服务平台,立足产业视角,提供及时、专业、深度的前沿洞见、技术速递、趋势解析,链接产业资源,构建IC生态圈,赋能中国半导体产业,我们一直在路上。
最新文章
2025年AI服务器市场将持续增长,产值达2980亿美元
硅通孔的下一步发展
炸裂!CES成芯片巨头 “斗秀场”,新品巅峰对决
美国国防部将134家中企列入黑名单,腾讯、云从、商汤等回应
AI初创企业融资达970亿美元,创新高!
HDMI 2.2官宣
华勤技术,又一重磅收购!
一文读懂上海发布《关于人工智能“模塑申城”的实施方案》
AI PC成主流,但Arm PC难挑大梁
FOPLP,今年热点
博通的繁荣,英特尔的衰落
RISC-V,任重道远
万字深度:芯片自研之路
花几个亿建智算中心,八成的GPU租不出去
Micro-LED乘风破浪,新型显示技术加速产业化
美国又“拉黑”11家中国实体
大基金三期,出手1640亿元
美国芯片业走向悬崖
Chiplet,至关重要
日本半导体设备,赚翻了!
Solidigm退出消费级SSD市场,转向数据中心
国家发改委:购买手机、平板、智能手表手环将获得补贴
25亿!北京芯片大动作
加拿大,想发展MEMS
半导体ODM巨头们,有了新方向
中方决定将28家美国实体列入出口管制名单,半导体公司英特磊在列
国家大基金三期携手华芯投资,成立930亿股权投资基金
中国汽车芯片国产化率达15%,业界:不可低估竞争力
飙升43.9%,韩国2024年芯片出口创新高
回顾2024年,中国半导体行业如何洗牌?
华为孟晚舟:三折叠和红枫的突破,只是中国电子工业快速崛起的一个缩影
聚焦半导体!闻泰科技拟出让相关产品集成业务
2024 年十大半导体新闻
国内EDA公司,变更为“无实控人”
明年存储,令人忧心
效率提升10倍!美国推动下一代EUV光刻技术发展
飞腾CPU累计销量突破1000万片
英伟达H20,在中国被疯抢
荣耀完成股改与更名,将适时启动IPO
机械硬盘的未来在哪里?
Chiplet,半导体的下一个前沿?
OpenAI大地震一分为二,全力冲刺AGI!一半向钱看,一半装理想
芯片四十年:一粒沙,一个希望的世界
Micro LED规模商用化:准备好了么?
AI芯片新战役:ASIC登场,GPU失色
倪光南:中国正从开源大国迈向开源强国
欧盟批准金刚石晶圆工厂补贴,目标明年投产
“中国英伟达”闯过2024
寒武纪,走到2500亿
下一代存储器趋势:存内处理(PIM),商业化迎来新进展
分类
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
原创标签
时事
社会
财经
军事
教育
体育
科技
汽车
科学
房产
搞笑
综艺
明星
音乐
动漫
游戏
时尚
健康
旅游
美食
生活
摄影
宠物
职场
育儿
情感
小说
曲艺
文化
历史
三农
文学
娱乐
电影
视频
图片
新闻
宗教
电视剧
纪录片
广告创意
壁纸头像
心灵鸡汤
星座命理
教育培训
艺术文化
金融财经
健康医疗
美妆时尚
餐饮美食
母婴育儿
社会新闻
工业农业
时事政治
星座占卜
幽默笑话
独立短篇
连载作品
文化历史
科技互联网
发布位置
广东
北京
山东
江苏
河南
浙江
山西
福建
河北
上海
四川
陕西
湖南
安徽
湖北
内蒙古
江西
云南
广西
甘肃
辽宁
黑龙江
贵州
新疆
重庆
吉林
天津
海南
青海
宁夏
西藏
香港
澳门
台湾
美国
加拿大
澳大利亚
日本
新加坡
英国
西班牙
新西兰
韩国
泰国
法国
德国
意大利
缅甸
菲律宾
马来西亚
越南
荷兰
柬埔寨
俄罗斯
巴西
智利
卢森堡
芬兰
瑞典
比利时
瑞士
土耳其
斐济
挪威
朝鲜
尼日利亚
阿根廷
匈牙利
爱尔兰
印度
老挝
葡萄牙
乌克兰
印度尼西亚
哈萨克斯坦
塔吉克斯坦
希腊
南非
蒙古
奥地利
肯尼亚
加纳
丹麦
津巴布韦
埃及
坦桑尼亚
捷克
阿联酋
安哥拉