AMBA,内存与ARM SoC复杂性演变

文摘 2024-09-16 09:05 上海

ARM SoC性能的复杂性演变

SoC系统一般包含处理器、缓存、互连、系统控制器和外部接口（如内存和I/O），ARM SoC则从智能手机到高性能服务器，无处不在。Arm一般提供处理器和系统IP（如互连，SMMUs，GIC），第三方提供的外部接口的功能IP（如DDR内存控制器和PCIe接口）。

下图是一个大约在1990年代ARM7的SoC计算子系统。

另外一个是2023年的SoC计算子系统的框图。

在1990年代，计算子系统通常包含一个单一的Arm Core——ARM7TDMI。相比之下，到了2023年，计算子系统则复杂得多，包括多个Arm Neoverse N2 Core，以及一个系统控制处理器（SCP）和一个管理控制处理器（MCP），这些均采用Arm M类核心实现。此外，最新的SoC架构都支持多个Core，在1990年代一般只有一个Core。而且新的SoC架构中多个I/O加速器会同时连接在一个mesh中。现代计算子系统的IC设计也变得复杂，而且也难以测试验证SoC的性能是否满足需求。

现代SoC计算子系统通常包括：

一个或多个处理器核心，通常包括内存管理单元（MMU），设备可以运行操作系统（如Linux）
一个主存控制器，对动态随机存取存储器（DRAM）进行读取和写入
一个中断控制器（GIC）
一个互连(mesh)，将所有组件连接在一起
功能性组件，如实时时钟（RTC）和通用输入/输出（GPIO）
时钟和电源管理
SoC启动机制

在图1.1所示的1990年代设计中，Arm处理器处于SoC计算子系统的”核心“位置。而在2023年的架构中，互联则处于”核心“位置。Mesh作为一种庞大且复杂的IP，贯穿于整个SoC之中。互连IP不仅拥有广泛的连接，还提供了多种配置选项。越来越多的SoC都会使用定制化的互联网络，如图形处理器（GPU）、AI/ML加速器。

过去二十多年，SOC计算子系统的变化是显而易见的，Core的复杂度也显著提升。每一代新架构都引入了更长的执行流水线以提高性能，这也对系统的其他部分带来了影响。提升时钟频率变得越来越困难且功耗增加，增加Core数量成为了一种新的解决方案。增加Core数量也是为了利用如GPU和神经处理单元（NPU）这样的优化加速，可以在提高性能的同时大幅减少能耗。

在1990年代，系统性能主要取决于处理器架构、时钟速度以及与之相连的存储系统。通过增加时钟频率就可以提升性能，并且新系统的性能相对容易预测，仅需进行少量的优化与分析即可。

2023年，如图1.2所示，由于计算子系统中包含的各种加速器、多个内存控制器、多级缓存系统以及系统各方面配置能力的增强，测试系统性能变得更加复杂。每一个系统用例可能会涉及到不同的加速器负载组合，这些工作负载通过mesh在缓存系统中产生内存流量模式——这些模式中的内存副本是可以共享的——从而形成混合的内存访问。在这些流量负载下，SoC各组件的行为和性能也变得难以预测。

过去10年引入了许多架构方面的先进技术，如Arm的big.LITTLE、AMBA® CHI、分布式虚拟内存（DVM）、内存标记扩展（MTE）、内存分区与管理（MPAM）、系统级缓存、AMBA CHI Chip-to-Chip，Chiplet技术等，当这些技术叠加众多复杂IP的集成，系统性能的分析显得尤为重要，也变得愈加困难。

SoC内存层次结构：从SRAM到DDR

内存层次结构：速度/容量/成本的平衡

在计算机架构中，内存系统的性能直接决定了整个系统的响应速度和处理能力。然而，内存技术面临着一个基本的挑战：如何在速度和容量之间找到平衡点。高端应用需要快速访问小量数据，而大容量数据则更注重成本效益。

常见的内存层次结构如下图所示：

寄存器（Registers）

处理器的算术或者逻辑运算的数据，在短时间内多次使用。将这些值存储在动态随机存取存储器（DRAM）中会非常慢且效率低下，所以处理器会配备了一定数量的内部“寄存器”，这些寄存器可以直接被处理器指令访问。如ARM Core中的通用寄存器，程序程序状态寄存器。

这些寄存器一般和处理器工作在相同频率，一般在GHz量级。处理器可以在一个时钟周期内访问寄存器，但与外部DRAM相比，每比特数据的功耗也更大。其速度快，容量很小，提升容量的成本也越高。

http://mp.weixin.qq.com/s?__biz=Mzg3ODczNDg0NA==&mid=2247485736&idx=2&sn=af2b23a7e2d47ff34ea9183a7cf0aaed

验证芯发现

验证工程师的公众号，记录芯片验证的方方面面。

最新文章

Makefile变量展开的"陷阱"

SystemVerilog仿真的起点，竟然不是initial？

AMBA,内存与ARM SoC复杂性演变

SystemVerilog，验证与AOP

新增United States 2024 106篇！【超2500篇！DVCON 论文全集下载】

优化函数传参，花里胡哨的那种

UCIE中的Adapter是什么？

AMBA CXS协议长文解析，建议收藏

超2500篇！DVCON 论文全集下载

搬砖，工作，单向度的人

资本，劳动者，你也是那个单向度的人吗？

芯片公司2023年报中的技术发展趋势-澜起科技

又是一年绩效考评时，验证工程师为何总是"低人一等"？

芯片公司2023年报中的技术发展趋势-3

芯片公司2023年报中的技术发展趋势-2

芯片公司2023年报中的技术发展趋势-1

Upward reference及其应用分析

传送门

IC技术优秀文章投稿及评选活动通知

验证笔记 015：打印UVM环境结构，print_topology？No...

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉