点击上方“Fundamental Research”关注我们
神经网络剪枝是实现基于深度神经网络的AI模型在移动端等资源有限设备上部署的重要手段。然而,不同硬件的计算能力和资源状况迥然各异,要获得对硬件最佳适配的剪枝模型,需要根据特定硬件进行设计。硬件感知神经网络剪枝是实现这一过程自动化的重要手段,但是需要同时考虑包括剪枝网络准确率与推断延时、内存等硬件性能的多个冲突目标,传统数学方法无法有效求解。本文基于多目标演化优化,提出一种硬件感知神经网络剪枝的新方法,以提供一组多样且高质量的剪枝网络供用户灵活选择,便于深度AI模型在移动端的部署与推广。
中文题目:基于多目标演化优化的硬件感知神经网络剪枝方法
英文原题:Multi-objective evolutionary optimization for hardware-aware neural network pruning
通讯作者:唐 珂,南方科技大学
第一作者:洪文静,南方科技大学
关键词:移动智能;深度神经网络剪枝;硬件感知;多目标优化;演化计算
背景介绍
随着智能技术的加速发展,实现基于深度神经网络的AI模型在移动设备、可穿戴设备、军用设备等资源有限平台上的部署已成为新一轮科技革命和产业变革的重要方向。然而,深度神经网络通常极为复杂,必需借助拥有较大存储空间和优异计算能力的硬件平台。深度神经网络剪枝是解决这一冲突的重要手段。
不同移动端的硬件条件和资源状况迥然各异,要获得对硬件最佳适配的剪枝模型,需要根据特定硬件进行设计。然而,已有的神经网络剪枝方法大多基于参数数量、每秒浮点运算次数或乘积累加运算等代理指标进行深度神经网络剪枝,而这些指标与实际硬件性能非单调。这使得这些方法所得模型必需根据硬件情况进行重新设计和手工调整,极大地阻碍了深度模型在移动端的快速部署。硬件感知的神经网络剪枝方法直接感知硬件的反馈信息进行剪枝,是实现对硬件自动适配的重要手段。然而,这一过程需要同时考虑包括剪枝网络准确率与推断延时、内存等硬件性能的多个冲突目标,不存在单一最优解,传统数学方法无法有效求解。
研究成果
唐珂教授和洪文静助理教授的联合研究提出一种基于多目标演化优化的硬件感知神经网络剪枝的新方法。作为人工智能的一部分,演化算法是一类模拟生物进化过程的启发式随机优化算法,具有对问题性质不做特别假设以及基于群体搜索的特性,是解决多目标优化问题的主流手段之一。硬件感知神经网络剪枝本质上是一个多目标优化问题,但当前鲜有基于多目标演化优化的研究,且已有的多目标演化算法在求解这一问题时仍面临以下挑战。其一,剪枝对于准确率、内存和延时等不同目标函数的影响差异极为明显,可能导致目标空间的不平衡,而已有多目标演化算法大多没有考虑这一特性,导致算法迭代中的选择压力不足;其二,深度神经网络的高度非线性使得要保持网络的准确率极为困难,而已有多目标演化算法多以随机的方式生成新的剪枝模型,使得算法生成准确率满足需求的可用剪枝模型的能力不足,导致算法的搜索效率低下。
基于上述原因,本文提出一种针对硬件感知神经网络剪枝问题的多目标演化算法,即Hardware-Aware Multi-objective evolutionary network Pruning(HAMP)。算法流程如图1所示,包含一个新的基于双空间组合的选择算子(portfolio-based selection)和一个新的代理辅助的受限逐层剪枝算子(restricted layer-wise pruning operator)。具体而言,为了克服不平衡目标空间中算法选择压力不足的问题,基于双空间组合的选择算子根据目标函数对解集支配结构的不同影响,将不平衡的目标空间转换为两个子空间,并在每个子空间中采用单独的选择策略;为了克服可用的新剪枝模型的生成效率低问题,代理辅助的受限逐层剪枝算子首先采用低精度但低复杂度的代理函数来近似和限制剪枝模型的准确率降低程度,然后借鉴经典的逐层阈值剪枝方法形成局部搜索模型。在新型边缘设备NVIDIA Jetson Nano上的实验结果表明,HAMP不仅可以自动搜索一组与目标硬件高度适配的多样化剪枝模型,而且相比于已有先进方法,可以获得准确率与硬件指标皆有竞争力的高质量剪枝模型。
图1 基于多目标演化优化的硬件感知神经网络剪枝方法
未来方向
未来,迫切需要结合更丰富的网络结构和硬件设备,更全面地研究多目标进化优化在硬件感知神经网络剪枝上的潜能,为推动移动智能的发展提供新方法和新工具。
主要作者简介
唐珂 南方科技大学计算机科学与工程系教授,IEEE Fellow、教育部“长江学者奖励计划”特岗学者。曾担任IEEE Transactions on Evolutionary Computation、Evolutionary Computation 等期刊编委或副编,主要研究方向是演化计算与机器学习。已发表论文200余篇,曾获教育部自然科学一等、二等奖,中国电子学会自然科学一等奖。
洪文静 深圳大学大数据系统计算技术国家工程实验室助理教授。主要研究方向是人工智能、演化计算、多目标优化及应用。已发表论文20余篇,主持国家自然科学基金青年科学基金、腾讯犀牛鸟专项研究、中国博士后面上基金等项目。获批深圳市高层次专业人才。
引用本文
Wenjing Hong, Guiying Li, Shengcai Liu et al., Multi‐objective evolutionary optimization for hardware‐aware neural network pruning, Fundamental Research, 4(4) (2024) 941-950.
原文链接(复制到浏览器中查看):
https://www.sciencedirect.com/science/article/pii/S2667325822003405
关于Fundamental Research
Fundamental Research是由国家自然科学基金委员会主管、主办的综合性英文学术期刊。创刊于2021年,期刊立足反映国家自然科学基金资助的优秀成果,全方位报道世界基础研究前沿重要进展和重大创新性成果,提升中国基础研究和中国科学家在国际科学界的显示度和影响力,为中外科学家打造一个高端的国际学术交流平台。内容涵盖数学物理、化学化工、生命科学、地球科学、工程与材料科学、信息科学、管理科学、健康医学、交叉科学等领域,设置Article、Review、Highlight、Perspective、Commentary等栏目。期刊已被ESCI、Scopus、DOAJ、PubMed、CAS(美国化学文摘社)、CSCD(中国科学引文数据库)、CSTPCD(中国科技论文与引文数据库)等国内外知名数据库收录。2023年影响因子5.7,位于综合性期刊Q1区。欢迎广大科研工作者关注、投稿、引用!
扫描或长按识别下方二维码关注我们
期刊主页:
www.keaipublishing.com/en/journals/fundamental-research/
文章阅读:
www.sciencedirect.com/journal/Fundamental-Research
投稿系统:
www.editorialmanager.com/fmre
查看更多本期信息,点击文末“阅读原文”,欢迎阅读、下载及引用!
喜欢本篇内容请给我们点个
在看
点击“阅读原文”了解更多