2月3日消息,据Videocardz报道,AMD 的下一代AI加速器Instinct MI400 将带来两个有源转接层芯片(AID) ,每个AID芯片将包含四个加速计算芯片(XCD),也就是说将拥有最多 8 个加速计算芯片,同时还拥有独立的多媒体(Multimedia) I/O Die。
根据AMD此前公布的消息显示,其将于今年下半年推出新一代AI加速器Instinct MI353X,该加速器将使用 3nm 工艺节点构建,GPU 将采用 CDNA 4 架构。在规格方面,内存将升级到更高的容量,最高可达 288 GB HBM3e,同时支持 FP4/FP6 数据类型。
AMD 表示,CDNA 4 架构的性能比 CDNA 3 高出 35 倍,AI 计算增加了 7 倍,内存容量/带宽增加了 50%,速度比当前一代 MI300X 高出 8 TB/s,并且还配备了最新的网络效率进步。在性能方面,AMD Instinct MI355X AI GPU 将提供高达 2.3 PFLOP 的 FP16 性能,比 MI325X 高 80%,而 FP8 数据也比 MI325X 高 80%,达到 4.6 PFLOPS。新的 FP6 和 FP4 计算性能额定为 9.2 PFLOPS。
此外,AMD还将于2026年发布更新一代的Instinct MI400系列加速器。AMD声称,这些加速器将基于AMD CDNA"Next"架构,旨在提高AI训练和推理任务的性能和效率。但是,AMD并未公布更细节的信息。
不过,据外媒coelacanth-dream的报道称,AMD最新曝光的“补丁”文件显示, MI400 将配备两个有源转接层芯片(AID) ,每个AID芯片将包含四个加速计算芯片(XCD)。而MI300系列的每个AID只配备了两个XCD,因此MI400无疑是一个更大的设计。此外,AMD还推出了一种名为Multimedia I/O Die设计,据说它将多媒体引擎与AID分开,并且很可能还移动了接口处理的其他功能。
MI400 最多可能拥有两个MID,很可能每个AID拥有 一个专用的 MID tile,与前几代相比,这将在计算单元和 I/O 接口之间提供高效的通信。即使在 MI350 上,AMD 也使用 infinity 结构进行芯粒间通信。因此,这是对 MI400 加速器的重大变化,MI400 加速器针对大规模 AI 训练和推理任务,并将基于 CDNA-Next 架构,该架构可能会更名为UDNA 作为 RDNA 和 CDNA 架构统一战略的一部分。
编辑:芯智讯-浪客剑
行业交流、合作请加微信:icsmart01
芯智讯官方交流群:221807116