IAR 编译优化等级详解

汽车 2024-07-11 08:33 广东

1.编译时优化器何时介入

2.编译优化等级汇总

3.优化项解读

3.1 代码移动

3.2 函数内联

3.3 循环交换

3.4 循环展开

3.5 公用表达式消除

3.6 链接阶段的优化

4 小结

大家好，这里是快乐的肌肉。

最近在迁移工程到IAR编译器上，发现编译优化等级变成了Low\Medium\High等，这与之前GCC优化等级-O1\2\3等有什么不同呢？

因此简单总结一下。

1.编译时优化器何时介入

首先回顾一下编译原理，编译器首先通过解析器把C代码生成中间代码，紧接着将中间代码通过代码生成器生成汇编代码，然后由汇编器Assmber将汇编代码转换成目标机器码，最后通过链接器Linker将所有的目标机器码链接成elf格式等的可执行二进制代码文件，如下图：

而所谓的优化也就是在每个过程中例如中间代码生成、汇编代码生成、机器码链接等等进行size、运行速度等不同方向上的优化，如下图所示：

2.编译优化等级汇总

这里将GCC和IAR的优化等级进行汇总。

以GCC的优化等级为例，具体的优化内容主要包括：

O0：几乎不优化，目的是减少编译时间，保证代码调试顺畅；
O1：编译器优化代码大小和执行时间，但是不执行任何需要大量编译时间的优化。简单的包括分支优化、堆栈调整、常量合并等等
O2：执行大部分优化，但不会考虑时间和空间互换的优化，它在O1等级基础上增加了新的优化项，包括函数对齐、窥视孔优化等；
03：在O2基础上，新增函数克隆、循环交换等；
Os：专门为大小进行优化，该优化方式采用了O2除增加几个代码大小(如函数对齐等)的全部优化项；
Ofast：采用O3全部优化项，为运行时间做优化；
Og：提升调试体验，在保持快速编译和良好调试体验的同时提供合理的优化级别；比O0好一点

在IAR的编译优化选项里，总共提供了4个优化等级：None、Low、Medium、High；针对High等级又分为了不同子优化选项：Balanced、Size、Speed，如下图：

经测试，

None、Low只会做无用代码、冗余标签、冗余分支消除等优化，适合调试；

Medium主要优化代码逻辑、公共子表达式消除等，如下图：

High则几乎勾选了所有优化项，如下：

向量化仅在 High -> Speed有效。

经IAR Help文档总结每个等级优化项如下：

所以接下来，我们来逐步解析上述优化项具体含义。

3.优化项解读

3.1 代码移动

代码移动，移除了循环中不变表达式和公共子表达式的求值，以避免重复求值。这种优化在中等及以上优化级别执行，通常会减少代码大小和执行时间。例如代码


uint8 a=100；while(a>0){    b= x+y;    if(a % b == 0)    print(“a= %d；b=%d”,a,b);    a--；}

这种情况很明显，b=x+y，只需要在最开始计算一次就可以了，如果我们静态代码review不仔细，编译器就会帮我们把b=x+y移出循环，以减少程序计算和内存访问次数；当然这个只在Medium及以上优化等级出现。

3.2 函数内联

调Vector代码的时候，经常遇到local inline的函数调不了，有时候发现即使去掉inline修饰，仍然打不了断点，现在想可能就与这个优化等级有关。

所谓函数内联，就是编译时把已知的函数集成展开到调用者的函数体中，以消除调用的开销，但可能会增加code size。

一般来说，要看内联是否成功，需要把hex、elf等反汇编出来，如下图：

3.3 循环交换

更改循环顺序，利用循环体里的cache使用效率，同时允许进一步循环优化，例如向量运算的时候，代码如下：


for (int i = 0; i < N; i++)    for (int j = 0; j < N; j++)        for (int k = 0; k < N; k++)            c[i][j] = c[i][j] + a[i][k]*b[k][j];

开启循环交换优化后，代码优化如下：


for (int i = 0; i < N; i++)    for (int k = 0; k < N; k++)        for (int j = 0; j < N; j++)            c[i][j] = c[i][j] + a[i][k]*b[k][j];

可以看到，k和j进行了交换，为啥会做这种优化？这是因为涉及到cache的空间局部性原理，我们来看：

在原代码里数组b[k][j]的访问顺序为b[ k ][ j ] -> b[ k+1 ][ j ]...，而数据是按字节顺序存储的，这个访问顺序和存储顺序不一致，导致了空间局部性差，因此编译器在优化时将k和j进行交换，使得b[k][j]的访问顺序变成了b[k][j] -> b[k][j+1]...。

这在矢量运算里可以有效提高cache命中率和使用性能。

3.4 循环展开

循环展开意味着循环的代码体是重复的，循环的迭代次数可以在编译时确定。循环展开通过在几个迭代中平摊循环开销来减少循环开销。
这种优化对于较小的循环最为有效，在较小的循环中，循环开销可能占整个循环主体的很大一部分。

3.5 公用表达式消除

这个我最开始还没看懂是啥意思。

其实就是在编译器优化阶段，消除了程序了重复计算的一些表达式，例如代码：


y = a*b +c;z = a*b/d;

a*b属于上述两个等式共同表达式，只需要计算一次即可，变为如下：


tempVar = a*b;y = tempVar +c;z = tempVar/d;
看起来很简单，但如果是计算公式非常复杂，这个优化就比较有效果了。

同样的，这个优化选项也只在medium以上有效。

3.6 链接阶段的优化

在IAR里的Linker里同样提供了一些优化选项，如下图所示：

inline small routines：内联小函数，对小函数的调用替换为函数的本体，无法打断点的定位方向又增加一个；

Merge duplicate sections：合并相同内容的只读段，保留副本，从而将对任何重复段的所有引用重定向到保留的段。

4 小结

可以看到，在IAR里这些编译优化选项基本都是针对代码性能进行优化，其中循环展开和函数内联会增加代码大小。

所以在量产阶段到底应该用什么样的优化选项，这个需要好好琢磨一下。

从MCU的Flash容量来看，对于工程项目来说优化代码大小肯定是首先考虑的，这样可以节省硬件成本；
从软件开发角度来看，对于调用频率很高的代码段甚至是源文件可以进行单独性能优化，在IAR源文件里提供了这样的配置方式：

在一些低功耗应用，例如IBS每几分钟唤醒CPU检查汽车小电瓶有没有馈电，然后CPU重新回到深度睡眠状态。这时候IBS的功耗 = CPU深度睡眠的静态功耗 + 任务运行的动态功耗之和。一般来说，动态功耗在mA级别，因此如果对于功耗要求特别高的应用，把唤醒后要执行的任务进行性能优化，也可以减少功耗。

-end-

分享不易，恳请点个【👍】和【在看】

http://mp.weixin.qq.com/s?__biz=Mzg4NjIxODk4Mg==&mid=2247520205&idx=1&sn=6ff2ac9b167aab0c75832d64c31c8eba

汽车ECU开发

持续为您提供汽车科技、技术

最新文章

谈谈软件的任务调度策略

CAPL脚本常用语法

UDS状态位介绍

“小满”安全车控操作系统开源发布会暨共建计划说明会

破解一个”屎山“项目

《中国汽车基础软件发展报告 5.0》解读

VCU软件开发训练营

深入宝马夜视系统：红外摄像头拆解揭秘

免费参会：奔驰、长城、商汤绝影、黑芝麻智能、火山引擎邀您共探AI大模型&智能汽车

拆解奔驰车身控制模块

对功能安全职业发展的思考与建议

智能配电盒的作用及关键器件

从整车层级到零部件层级的网络管理开发

谈车规MCU的安全启动

AUTOSAR CAN网管测试用例

UDS协议TP层测试用例梳理

UDS协议测试用例梳理

倒计时2天｜中国汽车设计（国际）峰会启幕在即！

详解汽车软件集成与分支管理

VCU软件开发训练营四期预报名中

基于CAN的OTA测试用例梳理

上汽集团总设计师邵景峰确认出席2024汽车设计国际峰会

对整车研发“大跃进”的思考

VCU电控软件开发训练营

一文详解AUTOSAR DLT模块

基于AUTOSAR的一帧CAN报文的收发流程

参会攻略，倒计时5天 | 强标实施在即！上汽、吉利、长城、蔚来等邀您下周共聚AutoSec汽车安全盛宴！

从“非软件”角度看AUTOSAR CP

从定点到SOP，汽车零部件开发的关键节点解析

大咖来了 | 腾讯科技：基于强标的车辆信息安全检测实践

CanNm处于PBS状态下接收到一帧诊断报文DCM会响应吗

智能驾驶供电冗余设计详解

油门和刹车踏板解析功能

大咖来了 | 国家工业信息安全发展研究中心：汽车网络和数据安全风险分析与应对

江淮汽车动力电池热管理技术

新能源汽车行业精英汇聚，上汽选手勇夺三项冠军！

线上直播注册 | 2024 MathWorks中国汽车年会

ECU上下电过程CanSM为什么会多次设置CandTrcv和CanController模式

万字长文详解汽车软件需求开发与管理

详解整车区域控制器（ZCU)

汽车整车功能梳理

VCU电控软件开发训练营

基于高速FPGA的电力电子与电机控制的半实物仿真测试方案线上研讨会

如何提高车载以太网性能？

理想/蔚来/小鹏/路特斯/Lucid/东风/广汽/上汽/北汽/岚图/阿维塔/长城等嘉宾大揭秘 | 第四届焉知汽车年会详细议程

一文理解单片机BootLoader的前世今生

基于AUTOSAR的底层软件开发训练营

车辆ESP系统功能梳理

一文轻松搞定ETAS CP工具链基本概念与开发流程

如何设计一个车规级ECU?

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉