128核心504MB缓存!7年了 Intel终于第一次追上AMD

文摘   2024-11-02 21:30   中国香港  

今年6月初,Intel正式发布了新一代至强6家族的第一批成员,首次采用E能效核架构的至强6700E系列(Sierra Forest),针对高密度计算场景而优化性能,最多144核心144线程。

现在,Intel带来了新一波的至强6,P性能核设计的至强6900P系列(Granite Ridge),面向高性能计算、高强度AI负载场景。

根据路线图,明年第一季度我们还将看到至强6900E(288核心288线程)、6500P、6300P以及至强6 SoC等更多产品。

至强6性能核也采用了分离式模块化设计,包括Intel 3工艺的计算模块、Intel 7工艺的输入输出模块,通过EMIB封装技术整合在一起。

计算模块又分为三种不同版本:顶级的XCC是两个计算模块,最多86核心;中间的HCC是一个计算模块,最多48核心;然后LCC是一个较小的计算模块,最多16核心。

至强6性能核,也就是至强6900P系列,拥有最多128核心256线程,终于追上了AMD EPYC的水平,后者采用Zen4c架构的Bergamo EPYC 97x4系列也是最多128核心256线程。

事实上,按照XCC、HCC的规模合计,它其实最多做到了132个物理核心,但应该是出于良品率考虑,没有全部开启。

当然,Zen4c也算是一种能效核,但是AMD下个月就会发布Zen5架构的第五代EPYC,留给Intel的时间只有这么几天……

三级缓存骤然增大到了最多504MB,平均每核心接近4MB,对比五代至强最多320MB增加了接近60%,同时也超过了AMD四代EPYC标准版的384MB,但是相比AMD 3D缓存版的768MB乃至是1152MB,还有很大差距。

内存统一支持12个通道也追平了AMD,而且频率更高达到DDR5 6400MHz,对比五代至强增加了4个通道,频率也提升了800MHz,但是单路内存总容量从4TB将至3TB。

它还首次支持新的MRDIMM(多重存取双列直插式内存模组),最高频率达8800MHz。

这种内存将两个DDR5 DIMM内存条合而为一,从而提供双倍的数据传输率(8800MHz其实就是两个4400MHz组合而来的),而且可以同时访问两个Rank。

还支持96条PCIe 5.0/CXL 2.0通道、6条QPI 2.0总线(24GT/s),继续内置AMX、DSA、IAA、QAT、DLB等加速器。

封装接口是新的LGA7529,比五代至强的LGA4677增加了足足60%的针脚。

功耗不可避免地有所增加,热设计功耗最高达500W,而上代最高只有380W,AMD EPYC目前最高也不过400W。

具体型号共有五款,分别如下:

至强6980P:128核心256线程,三级缓存504MB,基准频率2.0GHz,全核频率3.2GHz,加速频率3.9GHz,热设计功耗500W

至强6979P:120核心240线程,三级缓存504MB,基准频率2.1GHz,全核频率3.2GHz,加速频率3.9GHz,热设计功耗500W

至强6972P:96核心192线程,三级缓存480MB,基准频率2.4GHz,全核频率3.5GHz,加速频率3.9GHz,热设计功耗500W

至强6952P:96核心192线程,三级缓存480MB,基准频率2.1GHz,全核频率3.2GHz,加速频率3.9GHz,热设计功耗480W

至强6960P:72核心144线程,三级缓存432MB,基准频率2.7GHz,全核频率3.8GHz,加速频率3.9GHz,热设计功耗500W

性能方面,Intel官方的说法是,至强6900P系列AI推理性能提升最多3倍(对比竞品领先5.5倍),HPC性能提升最多2.5倍,MsQSL数据库性能提升最多2.1倍。

同时,至强6900P系列能效更高,40%典型服务器利用率时,能效比是上代的2倍。

至强6性能核针对AI负载做了全方位的针对性设计,比如最多12个内存通道,对比四代至强带宽提升最高达2.8倍,同时引入了新的MCR DIMM内存形态,带宽再次增加30-40%,从而可以从容运行对内存敏感的超大规模LLM模型。

比如内置AMX、QAT、AVX-512等加速器,配合oneAPI跨平台标准编程模型,AI推理训练负载的性能可提升多达2-3倍。

比如多达128个内核,结合AVX-512技术,可以更好地满足计算密集型AI与科学融合负载的性能,提升幅度最高达2.9倍。

而对于功耗、能效有特别要求的应用场景,至强6能效核则是完美之选,简单地说就是性能更好、功耗更低。

举例来说,144核心的至强6780E对比64核心五代至强铂金8592+,性能提升了多达18%,但是热设计功耗从350W降低到了330W。

同时,至强6能效核的功耗随负载强度呈基本线性增加,尤其是当负载率在40-60%的时候,能够节省多达280W的功耗,综合能效提升了2.4倍。

这意味着什么?

以往需要200个机架才能达成的算力性能,如今只需66个,节省了超过2/3的空间,而且在4年的使用周期内可节省8万兆瓦的能耗,相当于二氧化碳减排3.4万吨。

总之,英特尔通过“两条腿走路”的至强6性能核、能效核产品路线图,再次彰显了它对于AI的坚定承诺和深入布局:

围绕CPU处理器这一通用平台,打造结合开放、统一的软硬件平台,并针对不同应用场景和需求优化设计,满足千行百业的广泛需求。

当然,很多人说起AI,往往会首先想到GPU加速器,诚然其性能强劲,但随之而来的是无法控制的极高功耗、极高价格,一般企业难以承受,而且缺乏足够的通用性与灵活性,而这正是CPU处理器的强项,也正是英特尔坚定推进的。

至强6改变了以往的传统处理器设计理念,在AI的浪潮下快速转身,分为性能核、能效核,各取所长,针对性地满足不同AI应用负载与场景,更加凸显了CPU的灵活性。

与此同时,英特尔也并非只抱着CPU处理器不放,XPU战略的远景就是打造多硬件、一体化、开放灵活的硬件算力平台,再加上丰富、弹性的软件开发平台,以及广泛、深入的行业合作,为各行各业提供强大、丰富的解决方案,让AI真正无处不在。


Windows之家
Windows系统爱好者之家,点视频号关注看更多动态和加入系统交流群。
 最新文章