从微架构设计看ARM发展之路

科技   2024-11-22 16:35   江苏  

导言

ARM最近过的是风生水起,嵌入式尽管遭遇RISC-V的冲击,但依然主导市场,手机端几乎垄断,PC端各个厂商都在推出ARM架构的产品,例如苹果,微软等。云端/高端计算也占据相当市场,例如阿里的一部分自研服务器,NV的计算芯片,亚马逊的芯片等等。有一种说法,ARM的服务器旗舰核基本追上了IntelAMD,而功耗却低很多。本文依据网上资料简单阐述ARM微架构从A76-X925的变化(图片来自网络)。

A76奠基之作

就技术角度而言,2018年ARM迎来了非凡的一年,推出了具备深远影响的A76核,代号ENYO,这一代的微架构不仅是移动端的开篇大作,也是服务器V/N系列的奠基之作,后续的服务器核也是源自A76改进。

A77中坚力量

在2019年ARM推出了A77微架构,这一代比较前代加入了uOp Cache升级了预测器,加入Mop Cache这一设计影响了好几代微架构的设计。

A78设计好评

2020这一代微架构市场反馈非常好,A78相比较A77微架构设计没有大的改变,核心在优化功耗。

X1第一个超大核

同样在2020年,ARM第一次推出“超大核”X系列,对Mop Cache进行很大的升级,Decode通道也从4升级到5,说明预测器和ICache的优化都很好。

A710

2021年推出的大核。

X2

2021年推出的超大核,细节上有升级,但我关注的前端没看到核心改变。

A715

2022年本代将decode升级为5路,说明前端发送指令能力水平提升。

X3

2022年推出X3,本代L0 BTB相比前代指数级增长,覆盖更大的指令范围,Decode宽度也到6路(这里说一下,我说的Decode宽度想表达的是前端能达到这个指令吞吐量,因为decode本身没有难度,你加到12,IFU送不来这么多指令是没用的,所以这里同时也在说IFU的能力,不是简单指硬件参数)

A720

X4

2023年的超大核如果向官方宣称的那样,我觉得是X系列以来有大改变的一个版本,Mop Cache被删除,Decode宽度从前代6增到10,确保Mop Cache删除仍然能保持良好的性能以及功耗,同时说明前端发送指令的能力已经处在全球处理器设计的第一线。

A725

X925

2024年发布超大核X925,ARM觉得本代改变很大,觉得X5这个名字配不上这代了,直接改名字。L2直接到3MB,decode保持10路,可能相比前代优化了吞吐量,具体没有研究手册。

总结

从A76开始,ARM大概2年左右微架构会有一次比较大的升级,每年都会有一定的进步,并且设计越来越成熟,现在的ARM就微架构与设计能力而言(服务器/移动端),在全球都是排在前列,如果从A76开始算起,ARM从一个相对落后的状态到和领先厂商并驾齐驱大概花了6年。


温馨提示:

因最近微信公众平台推送规则改变,很多读者反馈没有及时看到更新的文章。根据最新规则,建议多点击“推荐阅读、分享、收藏”等,成为常读用户。


推荐阅读:


请点下【在看】给小编加鸡腿



21ic电子网
即时传播电子科技信息,汇聚业界精英精彩视点。
 最新文章