2024 Hot Chips|Ampere Computing的AmpereOne架构

科技   科技   2024-09-10 08:15   上海  
芝能智芯出品

在Hot Chips 2024大会上,Ampere Computing介绍了其最新的AmpereOne架构,在高性能和高效能处理器领域的一大进步,这款架构下的AmpereOne A192-32X处理器拥有192个Arm核心。


Part 1

AmpereOne架构概述


AmpereOne是Ampere面向未来的服务器处理器,支持最高192个核心,并配备有8个内存通道。

预计在接下来的季度里,Ampere将发布基于5纳米工艺的12通道DDR5版本;而在2025年,计划推出使用3纳米工艺制造的256核版本。

AmpereOne架构引入了新的分支预测机制,并针对云计算环境中的整数密集型工作负载进行了优化。


● 核心设计与存储架构

AmpereOne每个计算簇包含四个Ampere定制核心,并采用5纳米制程技术。

不同于传统的大容量共享L3缓存,AmpereOne选择了更大容量的私有L2缓存(2MB/核心),旨在保护用户数据隐私。

此外,每个计算节点有64个一致性引擎,每个引擎带有1MB L3缓存,总共提供64MB L3缓存。

这种设计有助于提高缓存访问效率,同时保障数据安全和用户隔离。


AmpereOne还采用了一种创新的内存标记技术,有助于防范缓冲区溢出攻击,并通过自适应流量管理技术最小化云环境中的“噪音邻居”效应。


● 互连与I/O子系统


AmpereOne架构支持高达2.8TB/s的芯片间互连带宽,允许计算芯片之间无缝通信。

在SoC设计中,集成了计算、内存和PCIe子系统。每个内存芯片支持双DDR5通道,而PCIe I/O芯片则有32个PCIe Gen5通道。封装中集成了四个PCIe芯片,提供了总计128个PCIe Gen5通道,增强了服务器的扩展能力。


Part 2

AI推理性能和高效能
与低延迟的计算优化


在AI推理方面,AmpereOne架构展示了出色的计算能力,支持主流AI框架,并在性能上超越了竞争对手的产品。

这使得AmpereOne成为AI和机器学习应用的理想选择,特别是在需要大量并行处理和数据分析的任务中。


AmpereOne架构致力于提高效能和降低延迟,特别是在云计算环境下常见的任务中。

通过优化分支预测算法和内存管理策略,AmpereOne在数据库查询、Web服务以及大数据分析等场景中表现出色。


AmpereOne的推出增强了Arm架构在服务器市场的生态支持。相较于几年前,如今的Arm服务器解决方案在兼容性和性能上有了显著提升。

Ampere的战略目标是挑战x86架构在数据中心中的主导地位,提供更高性能、能效比以及成本效益的解决方案。



小结

AmpereOne架构的发布标志着Ampere Computing在数据中心和云计算市场上的重磅产品,凭借其在高效能、低延迟和强大扩展性方面的突出表现,AmpereOne有望在未来服务器市场中占据重要位置。

芝能智芯
在这个数字时代,芯片及其基于的软件已经成为现代社会不可或缺的一部分。深入跟踪和分析这些技术的发展趋势变得愈发重要。而位于中国的上海,被誉为中国的芯片硅谷,将有着更多的机会为我们提供深入了解半导体行业以及中国芯片产业链发展的平台。
 最新文章