Neoverse CSS N3:实现市场领先能效的最快途径

文摘   2024-09-03 20:26   上海  


区分老的架构

从云到边缘,Arm Neoverse 提供无与伦比的性能、效率、设计灵活性和 TCO 优势,正在颠覆传统基础设施芯片。

我们看到云和超大规模服务运营商正在推动更高的计算密度。随着 128+ 核心 CPU 设计上市(Microsoft Cobalt、阿里巴巴 Yitian 710、AmpereOne),在单个封装中提供了巨大的性能,下一代目标远高于 128 个核心。

随着 CPU 性能的提高,对人工智能、网络和加密加速器等专业计算的需求也在不断增长。显然需要将这些加速器封装在一起以提高性能和效率,同时允许设计模块化,以便将加速器与不同的通用计算引擎混合和匹配。

提醒一下,Neoverse 计算子系统 (CSS ) 允许在最新工艺节点上以光速开发领先的 SoC。通过在设计中使用预配置、预验证的 CSS,合作伙伴节省了 80 个工程师年的时间和机会成本,使他们能够专注于为系统增值的秘密武器。

Neoverse CSS N3是经过市场验证的Neoverse CSS N2 的后续产品,通过新的架构功能提供更高的性能和效率,以实现数据中心市场中领先的性能/套接字和性能/TCO。Neoverse CSS N3 还为边缘和网络应用带来了无与伦比的效率。CSS N3 构建在Neoverse S3 系统 IP之上 ,其中包括我们的相干网状网络CMN S3、系统内存管理单元 MMU S3 和片上网络 NOC S3。CSS N3 还包括系统管理和本地控制处理器,以及 CPU 和系统 IP 共同设计和共同开发,以实现优化的 PPA 和系统级功能支持。

Neoverse CSS N3 支持 32 个 Neoverse N3 内核, 可在低至 40W 的功率范围内实现最大性能。它具有高度可配置性,可覆盖电信、DPU、网络和云,可扩展性从 32 核到 8 核。

除了性能和效率提升之外,Neoverse CSS N3 还支持基于小芯片的设计。CSS N3支持UCIe 芯片间连接标准,并结合 Arm 的全新 AMBA CHI C2C 协议,为构建异构加速计算奠定了基础。我们设想 Arm Neoverse CSS N3 在当今的专业计算世界中蓬勃发展,基于 CSS N3 的小芯片可以通过AMBA CHI C2C连接到 IO 相干加速器,将加速器封装在一起,以提高性能和效率。这可以取代传统解决方案,其中加速器通过 PCIe 进行片外连接,从而导致更高的延迟、更高的软件复杂性和更高的功耗。

Neoverse N3 CPU:同类领先的效率

性能效率(以每瓦性能来衡量)是 CPU 评估中最重要的指标之一。5G/6G 无线基础设施要求现代计算解决方案具有更高的性能。并且功率预算保持固定。新时代的数据处理单元 (DPU) 需要更强大的 CPU 在 PCIe 设备规范的限制内运行成熟的操作系统、虚拟机、容器和其他包处理功能。超大规模企业正在部署具有更高核心数量的更密集的 CPU,同时保持在机架的冷却能力范围内。电源效率是几乎所有细分市场的主要设计决策。Neoverse N3 的设计以功效为驱动力。

Neoverse N3 CPU继承了 Neoverse N2 中已得到证明的效率 DNA。Arm 的 CPU 设计团队孜孜不倦地工作,以增强分支预测器、预取器,并优化微架构以提高效率。他们改进了电源管理并添加了更细粒度的每核 DVFS,以帮助提取更高的性能效率。这些变化使得效率比上一代提高了 20% 以上。

Neoverse N3 可以支持广泛的 SoC 设计点:从 16 核网络设计到 32 核 Telco RAN 或云 DPU 设计,再到 192 核超大规模和云 CPU。与 Neoverse N2 相比,Neoverse N3 具有一系列电压和频率选择,每核性能效率可提高 20% 至近 50%。

扩大一流的效率领先地位

与 Neoverse N2 相比,Neoverse N3 在机器学习和数据分析工作负载方面的性能提高了约 3 倍,在 SQL 数据库方面提高了 1.3 倍,在选定的压缩应用程序方面提高了 1.2 倍,在整数性能方面提高了 1.1 倍 - 面积和功耗配置与 Neoverse N2 大致相同在同一技术节点。

灵活的缓存配置

Neoverse N3 提供广泛的缓存配置,以满足不同的计算场景。许多横向扩展云数据分析和数据库应用程序受益于更靠近核心的更大缓存,因此我们为此细分市场引入 2MB L2 缓存选项。1MB L2 缓存选项为从 5G/6G 无线基础设施、企业网络、DPU 和 SmartNIC 到超大规模服务器等各种任务中的通用计算提供了良好的性能和面积权衡;而最小的 32KB L1 和 128KB 选项则适合对缓存不敏感的工作负载,但仍需要在较小的占用空间中提供受人尊敬的计算能力。

概括

Neoverse N 系列产品线通过Neoverse N3 CPU继续提供同类领先的每瓦性能。借助新的CSS N3,Arm 将 Neoverse N3 的性能和效率与 Neoverse S3 系统 IP 相结合,提供业界最可定制的计算子系统之一,与之前的 CSS 相比,每瓦性能提高了 20% 至近 50%一代。CSS N3 是一个用于云到边缘设计的平台,使我们的合作伙伴能够创建将 Arm 强大的处理器与专用组件(无论是加密、网络或 AI 加速器,还是所有这些)相结合的产品,并使自己脱颖而出。



ARM研习社
嵌入式软件、C语言、ARM、Linux、内核、驱动、操作系统
 最新文章