首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

AMD两大新GPU加速卡：八卡2.3TB内存、性能每秒7.4亿亿次

体娱 2024-10-17 20:59 中国香港

硬件世界美国旧金山现场报道：

在Advancing AI 2024大会上，AMD正式发布了新款GPU加速卡“Instinct MI325X”。

它在大获成功的MI300X基础上再进一步，主要是增强了HBM内存部分。

【硬件规格、性能篇】

MI325X配备了多达256GB HBM3E内存，相比于MI300X又增加了64GB，还是八颗，但单颗容量从24GB增至32GB。

同时，带宽从5.3TB/s来到了6TB/s，同样增加了大约13％，Infinity Fabric总线的带宽则还是896GB/s。

性能方面倒是没啥变化，还是FP16 1.3 PFlops(每秒1300万亿次)、FP8 2.6 PFlops。

很自然的，核心规格也是原封不动：5nm XCD模块搭配6nm IOD模块，3.5D封装，1530亿个晶体管，304个计算单元。

不过，AMD透露MI325X的功耗达到了1000W，相比MI320X增加了750W。

MI325X也支持八块并行组成一个平台，这就有多达2TB HBM3E、48TB/s带宽，总的性能高达FP16 10.4 PFlops(每秒1.04亿亿次)、FP8 20.8 PFlops(每秒2.08亿亿次)。

这个规模对比NVIDIA H200 HGX，分别有80％、30％、30％的优势。

对比NVIDIA H200，无论单卡还是八卡平台，不同大模型推理的性能都可以领先20-40％。

训练性能方面，单卡可领先H200 10％，八卡平台则是持平。

MI325X加速卡和平台将在四季度内投产，而合作伙伴的整机系统、基础架构解决方案，将从明年第一季度起连续推出。

【生态伙伴、软件篇】

GPU加速器这样的产品要想成功，不但要有强大的硬件规格与性能，甚至更重要的还有两点，一是生态合作，二是软件支持。

生态方面，AMD Instinct系列的“朋友圈”不断壮大，领先的OEM整机厂商、云服务厂商、AI方案厂商都选择了AMD，那些我们熟悉的行业巨头名字都在这份越来越长的名单中。

尤其是微软、OpenAI、Meta，都在部署越来越多的Instinct平台。

软件方面，AMD ROCm开发平台是一套完整的AI软件堆栈，硬件之上，运行时、编译器、开发工具、库、AI框架、AI模型与算法一应俱全。

AMD ROCm的进化速度也在加快，新特性新功能不断加入进来，不但已经支持全部重要的AI框架与模型，还在不断优化对生成式AI的支持，包括新的算法、新的库等等，对开发者也越来越友好。

ROCm开发平台的性能也在不断优化提升，最新的6.2版本对比6.0版本，不同大模型的训练性能提升了1.7-1.9倍，平均约1.8倍；推理性能更是提升了1.9-2.8倍，平均约2.4倍。

这些都是无需升级硬件，完全靠软件优化得来的，可以说是“白捡”。

同时，AMD与开发者社区一直保持着良好、深度的合作，也是最大的贡献者之一，尤其是在PyTorch机器学习库、Triton编程语言和编译器上提供了及时、全面的支持。

AMD一直坚持开放开源的原则，不但自己的诸多技术对外公开，还全力支持着开源社区，不断壮大开源的力量。

以MI300X为例，上机无需任何调试适配，就能支持超过100万个生成式AI模型，尤其是第一时间支持Llama 3.1/3.2等领先大模型的最新版本。

良好的支持当然不仅仅是能用，更是好用，比如Llama 3 405B大模型上，MIX300X的延迟相比NVIDIA H100有着1.2倍的领先。

顺带一提，AMD近期还以6.65亿美元的价格，完成了对欧洲最大的私人AI实验室Silo AI的收购，获得了全面的端到端AI解决方案、约300名AI专家，势必会大大增强AMD在欧洲的AI业务实力，分析人士认为有望超越NVIDIA。

附MI325X官方精美图赏——

同时，AMD还宣布了全新的下一代Instinct MI350系列的首款产品“Instinct MI355X”，并披露了部分规格、性能数据。

MI355X将在2025年下半年上市，也就是还有差不多一年时间。

MI350系列将首次升级为台积电3nm工艺，首次采用CDNA 4架构，首次引入FP6、FP4浮点数据类型，搭配内存还是HBM3E但是容量高达288GB。

具体功耗没有披露，但是MI325X已经最高达1000W，AMD也透露MI355X会顺应行业趋势(NVIDIA B200 1000W、GB200 1700W)，因此必然会显著超过1000W。

FP6、FP4都属于浮点数据格式，分别代表6位、4位精度，也就是只需6位、4位就能表达一个数字，相比于FP16、F8精度大大降低，但是数据处理量也大大减少，适合大模型的量化，特别是大语言模型和混合专家模型。

如果你不需要太高的精度，更想要速度，FP6、FP4就非常适合。

MI355X上的FP6、FP4浮点性能都是9.2 PFlops(每秒9200万亿次运算)，同时还将FP16、FP8性能都提升了80％，分别达到2.3 PFlops、4.6 PFlops。

NVIDIA Blackwell GPU同样引入了FP6、FP4精度，但是性能更高，分别达20 PFlops、40 PFlops。

单卡多达288GB HBM3E内存确实是无可匹敌，同时带宽高达8TB/s。

对比MI325X分别多出1/8、1/3，而相比目前已上市的MI300X都增加了足足50％。

对比竞品，Blackwell B200也只有192GB HBM3E，但带宽同样做到了8TB/s。

MI355X同样支持单平台八卡，这样就有总计2.3TB HBME内存、64TB/s带宽，性能更是高达FP16 18.5 PFlops、FP8 37 PFlops、FP6/FP4 74 PFlops。

它也将在明年下半年供货。

Instinct系列的性能进步幅度无疑是飞跃性的，一代一个新模样，跨代对比更是惊人。

MI355X对比MI300X，FP16性能达到了7.4倍之多，HBM容量也有1.5倍，所能处理的模型参数规模，也从7140亿增加到4.2万亿，足足6倍之多。

展望未来，2026年将推出再下一代的Instinct MI400系列，基于再下一代的CDNA架构(CDNA 5?)，规格和性能必将再次迈上一个大大的台阶。

http://mp.weixin.qq.com/s?__biz=MzUzNDAwNTU1Nw==&mid=2247512513&idx=2&sn=37d427fa1b7881d25797642f38dd25c2

Windows最新版系统下载和动态，电脑爱好者之家。关注加交流群

最新文章

锁屏，上新。

注定要涨价！RTX 5090/5080/5070 曝光

又砍了！上线仅 9 个月

Intel开始测试第三代显卡架构

Windows + VR 全新体验

NVIDIA放大招：功耗达5400W！

重磅！Windows 底层大改

RTX 40 光速清库存！

Windows 测试新按钮

RTX 50 系列曝光

Win11 24H2 增强安卓体验

首发 PCIe 6.0 ！

Windows 系统优化工具上新

锐龙7 9800X3D 1％低帧专项测试：超越i9-14900KS 23％之多！

2.34纳秒世界最低时延！

锐龙7 9800X3D 1％低帧专项测试：超越i9-14900KS 23％之多！

再见，正式移除！

13代酷睿又有新马甲！命名彻底乱套了

一周了酷睿Ultra 200S在这个国家一颗都没卖出去！

Windows 11 24H2 全新 Wi-Fi 体验

AMD 六大新品齐飞！

酷睿Ultra 200K评测汇总：游戏性能竟倒退最多7％！

Windows 11 24H2 全新签名和加密

新版发布 | Windows 11 24H2 26120.2200

锐龙9000X3D提前打鸡血：游戏性能飙升35％

Windows 10 正式版十月更新

Intel 新主板千万别升 Win11 24H2

Windows 11 正式版十月更新

锐龙7 9800X3D频率飙升！性能喜人暴涨22％

支持最复杂的汉字！Windows 引入全新中文字体

Intel游戏显卡发布整整2年了：市场份额跌至0！

Windows 新快捷键

AMD新一代3D缓存神U！锐龙7 9800X3D发布、上市时间定了

新版发布 | Windows 11 23H2 22635.4371

AMD五代EPYC对飙Intel六代至强：几乎无死角碾压毫不留情！

来了！Office 2024

Intel Xe3第三代显卡开始行动！酷睿Ultra 300首发

Windows 11 24H2 新版右键菜单

Windows 11 24H2 全新节能模式

AMD两大新GPU加速卡：八卡2.3TB内存、性能每秒7.4亿亿次

Windows 11 25H2 更新到期时间

AMD正式发布Zen5/5c架构五代EPYC 9005：384线程5GHz无敌！

Windows 11 24H2 全新滚动视图

锐龙 7 7800X3D 与 i7-14700K 到底怎么选？

飞速来袭！Windows 11 24H2 新增支持 Wi-Fi 7

酷睿 Ultra 200S 系列正式发布！

Windows 11 24H2 全新 HDR 体验

Intel确认：13/14代酷睿不稳定问题已完全解决！不再有新补丁

Windows 11 23H2 22635.4300

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉