CXL是一种可以显著提高CPU、GPU、加速器和内存效率的新型标准化接口。
在传统的计算架构中,CPU与内存之间的数据传输往往受到带宽和延迟的限制。而CXL技术可以通过提供高速、低延时的内存访问通道,解决这一瓶颈。
CXL技术在内存领域的主要优势在于扩展性,这种技术可以允许灵活扩展现有服务器系统无法提供的内存。
随着AI时代爆发,CXL技术的优势不断凸显,从过去缓慢发展进入快车道。
CXL 3.2技术到来
2019年,芯片“老大哥”英特尔首次提出CXL技术。同年将该技术从公司内部转移到行业联盟。
英特尔联合AMD、Arm、Meta、Micron等公司成立CXL联盟。现在国内的阿里巴巴、华为等公司也加入了这一联盟。
2020年,该联盟发布CXL 2.0,这一版本比CXL 1.0显著增强了CXL技术的灵活性和扩展性。CXL 2.0引入了CXL交换机,打破了内存扩展的限制,实现了跨服务器的内存扩展和池化。
CXL 2.0在内存领域的优势,立刻吸引了韩国存储巨头三星、SK海力士布局。
三星在2021年5月推出了行业内首款CXL DRAM产品——CMM-D(CXL Memory Module DRAM),这款产品支持CXL 2.0标准,配备128GB CXL DRAM,利用PCIe 5.0接口,实现了高达35GB每秒的显著带宽。
2022年、2023年继续推出多款支持CXL 2.0标准的DRAM产品。
SK海力士也在2022年发布首款带宽扩展器CXL内存CMM-DDR5,并在同年第四季度开始出货。
2024年,三星在Memcon 2024发布了CXL内存模块-盒式(CMM-B),支持高达2TB容量与60GB/s带宽,适用于AI和大数据分析等大内存需求应用。
2022年,CXL 3.0版本出现。CXL 3.0进一步增强了交换机的级联功能,并引入了fabric能力,使得CXL技术能够支持更复杂的网络拓扑结构。此外,CXL 3.0还优化了资源利用,扩展了内存共享和池化能力。
2023年,CXL联盟加快脚步,推出CXL 3.1版本。
CXL 3.1在3.0的基础上进行了多项改进,包括增强分解系统的Fabric管理能力、优化资源利用、扩展内存共享和池化能力,以及促进加速器之间的内存共享。
同时,CXL 3.1还引入了重要的安全功能,如增强保护的可信安全协议和扩展的元数据能力等。
2024年12月,CXL联盟正式发布CXL 3.2最新版本。
从两年一版本,到一年一版本,可见随着AI的快速发展,CXL联盟也在加速迭代CXL技术。
重点是向外扩展,为AI量身设计监控和管理功能
新版CXL 3.2增加了多种监控和管理功能,包括用于内存分层的CXL热页监控单元(CHMU)、常见事件记录、PCIe管理消息传递的兼容性以及CXL在线固件激活。
CXL联盟联合主席Anil Godbole表示,这些功能都是为快速发展的AI数据中心而设计的。
CHMU使软件能够识别第二层内存中的热页并将其迁移到第一层,例如DDR DRAM,可以提高分层内存解决方案的功率和性能。
新的常见事件记录功能可以提高粒度、监控精度和复杂CXL设备配置的管理,从而提高整体系统性能和资源分配。
此外,CXL 3.2中还添加了额外功能,包括封装后修复增强功能和CXL存储设备的性能监控事件。
监控和管理功能对于横向扩展是至关重要的,因为内存是除CPU之外服务器中价值性最高的部件之一。
CXL 2.0更专注于“机架规模”,但 3.x 系列版本的重点是“行规模”和可组合结构增长,以支持分解、池化和加速器。
此前发布的CXL 3.1首次引入的可信安全协议 (TSP) 功能,并允许基于虚拟化的可信执行环境来承载机密计算工作负载。
Godbole表示,由于许多组织将工作负载放在公共云环境中,TSP 功能变得越来越重要。
CXL 3.2版中的其他TSP功能可以针对晚期病毒消息的IDE保护,并允许使用IDE进行身份验证,这提高了CXL 连接系统的安全性。
此外,还提高了HDM-DB内存设备的安全性,通过在可信计算边界内包含更多设备和事件来减少安全隐患,并降低恶意攻击的风险。
虽然强调安全性,但Godbole说,CXL联盟更新3.2的重点还是向外扩展。
随着人工智能的快速发展,CXL行业联盟面临着跟上步伐的压力。