AMD的RDNA系列GPU架构在经历了令人充满信心的RDNA1和RDNA2时代后,从RDNA3开始却陷入了一个极为尴尬的境地。RDNA3的性能和价格表现都没有令人瞩目的亮点,更不幸的是,据传下一代RDNA4也一直存在问题,导致AMD的高端Navi 41和Navi 42的设计被取消,仅保留了中低端的Navi 43和Navi 44。这意味着RDNA4的最高端型号只能是类似于Radeon RX 7600这样定位的芯片,让人不仅有些怜惜。
(图片来源VideoCardZ,creper9000)
作为键盘党,我们无法确定目前AMD的RDNA4是否真的出了问题,以及具体出了什么问题,只能从入魔中窥探猜测一二。从最近泄露的RDNA4激进的胶水设计模式来看,个人猜测这可能是导致RDNA4“问题不断”的原因。值得注意的是,从RDNA3时代开始,AMD就采用了高端Navi 31和Navi 32芯片的Chiplets化设计,但中低端Navi 33芯片保持了单一芯片设计。因此Navi 43和44的可能也保留单一芯片设计没有胶水设计,所以是他们没被取消的原因。当然,这些仅仅是个人的猜测,欢迎大家理性评论和讨论。
AMD是对于芯片胶水技术(Chiplets)最为热衷的厂商之一。在CPU部分,AMD从Zen诞生之初就实行了胶水化战略,并在Zen 2时期全面采用了胶水化架构,一直沿用至最新的Zen 4。然而,尽管AMD早早就在CPU上实行了胶水化战略,但在自家的显卡部分却没有全面采用。这是因为CPU和GPU在架构上存在差异,GPU需要处理大量高度并行计算任务,导致数据传输量明显高于CPU。AMD在CPU上采用的是传统的2D MCM技术,传输密度低且功耗大,难以满足高端GPU的需求。要满足高端GPU的需求,则必须采用硅中介、2.5D封装或3D封装等技术,这对成本和封装技术都有极高的要求。
随着封装技术的进步和成本的降低,AMD在CDNA2时代引入了胶水技术。MI250X MCM胶水了两个核心,并通过Die2Die的Infinity Fabric进行连接。虽然400GB/s的互联速度看起来很高,但是相对于CDNA2本身的规模,带宽仍然难以实现真正的胶水,因为这个400GB/s只是一颗HBM2E的带宽。因此,在物理上,MI250X是两个胶水的设计,在使用上也是两个独立的GPU,只是比通过PCIe或其他总线连接的两个GPU通信更快。
最新的RDNA3架构是AMD在胶水CPU方面的另一个努力。与CDNA2不同,RDNA3的胶水设计只有一个GCD,而主要胶水部分是将显存控制器和Infinity Cache外置胶水化。通过采用高性能的扇出设计,带宽密度比CPU胶水高10倍。因此,在AMD RDNA3中,GCD和MCD的总带宽达到了5.3TB/s,远高于CDNA2的400GB/s。这是AMD的第一款物理上是胶水的,但在逻辑上是整体的GPU芯片。
然而,RDNA3胶水化的主要驱动因素是先进工艺的成本过高和SRAM/IO电路上微缩的瓶颈。AMD仍未实现计算核心部分的胶水。在RDNA3中,计算核心必须独立且完整地放在一个芯片上。
Intel的Xe HPC GPU,Ponte Vecchio (PVC),是真正实现计算核心胶水化的GPU。PVC通过大量的3D和2.5D互联技术将计算核心胶水在一起。因此,在过去的一段时间里,我一直将Intel的Ponte Vecchio称为GPU胶水的天花板。
现在,我们谈谈最新泄露的RDNA4,我们可以发现RDNA4的胶水设计也实现了类似于Intel Ponte Vecchio的计算核心胶水化。具体来说,在RDNA4里有三部分胶水,第一部分是计算核心的胶水部分,叫做Shader Engine Die (SED)。第二部分是RDNA4的灵魂所在的Base Active Interposer Die (AID) Die。AID最高可以通过3D封装技术承载3颗SED核心,并且AID和AID之间可以通过2.5D封装技术实现横向的拓展。
因此,在示意图中,这个RDNA4总共实现了3AID*3SED的设计,也就是最高可将9颗SED核心有机地胶水在一起。最后一个核心是一个MID,主要是一些多媒体单源和PCIe控制器,避免了SED重复加载这些单元的设计。
相比于Intel的Ponte Vecchio,AMD的RDNA4有一个更为高级的地方在于这个AID核心本身还有Infinity Cache和显存控制器。因此,这里AID到SED的3D封装很可能是采用了目前最领先的3D封装技术SoIC所实现的。Intel的Ponte Vecchio虽然也是采用了3D封装技术进行计算核心的互联,但受限于Intel 3D封装所用的技术限制,它的Base Die除了互联以外基本上没有其他用处,不像AMD的AID承载了很多功能。
这里多说一嘴,如果单单看AID和MID的设计,RDNA4的模式有点像Intel下一代Xeon处理器Granite Rapids的胶水设计。
综上所述,AMD的RDNA4胶水设计比我之前称之为天花板的Intel Ponte Vecchio还要强。这个胶水设计非常完美,充分地利用了高级2.5D和3D封装的潜能,算是Chiplets设计的又一个天花板。AMD只需要设计一个AID、一个SED和一个MID,就能胶水组合出非常多的高性能GPU。这个设计非常美滋滋。
最后,让我们再回到为什么RDNA4“问题不断”的话题。就像Intel的Ponte Vecchio一样,RDNA4的激进封装设计必然存在许多麻烦事。
首先,如此多的Die封装结合在一起对于良品率的要求非常高,每一个封装都必须非常精准,否则一切前功尽弃。
其次,与Intel的Ponte Vecchio不同,AMD的RDNA4底层的AID本身就有显存控制器和Infinity Cache两个发热源。再加上上面3D封装覆盖的计算核心SED,整体的散热要求非常高。这也是为什么我说RDNA4是又一个天花板,而不是新的天花板。在高性能领域,过于先进的3D封装技术并不一定是更好的技术。因为这种过于理想的3D设计非常不利于散热。
最后,虽然RDNA4一定采用了各种高级的胶水封装技术,但是SED和SED之间的互联一定比单一芯片要差。因此,必须对芯片架构和软件设计进行大刀阔斧的修改才能避免被互联卡住。否则,即使封装技术已经完美就绪,最终性能可能也难以发挥。
看到最后来杯咖啡吧,审车17块10盒拿铁
扫描二维码
关注&加群
MebiuW
点亮 ,告诉大家你也在看