清华大学集成电路学院钱鹤、吴华强课题组提出高精度数模融合存算一体计算架构:AnDi

学术   2025-01-26 11:31   山西  

海归学者发起的公益学术平台

分享信息,整合资源

交流学术,偶尔风月

近日,清华大学集成电路学院钱鹤、吴华强教授团队在存算一体芯片领域取得研究突破,在《自然・电子》(Nature Electronics)上发表了题为 “A dual - domain compute - in - memory system for general neural network inference” 的最新成果。该研究提出了一种新型数模融合存算一体计算架构(AnDi)与硬件系统,并首次完整硬件实现了以 YOLO(You Only Look Once)为代表的复杂回归类神经网络计算,标志着模拟存算一体技术在通用神经网络计算领域迈出了关键一步(图 1)。


图 1 搭载AnDi架构的存算一体计算系统,能够进行使用浮点数数据流的通用神经网络推理。首次实现了基于ACIM的回归类YOLO目标识别任务

近年来,模拟存算一体技术(ACIM)逐渐受到业内科研人员的广泛关注。相较于传统数字电路,ACIM在神经网络计算方面具备显著的能效、算力、与集成密度的优势。然而,ACIM使用物理定律进行模拟计算,因此存在天然的计算噪声数据兼容性等问题。目前,该领域的前沿工作主要集中在利用 ACIM 进行简单的分类任务计算(如图像分类、文字识别),然而对于复杂回归类任务(如目标识别)的计算仍然存在较大挑战(图 2a)。分类任务和回归任务是神经网络的两大重要分支。二者的核心差异在于,分类任务只需计算结果的相对值大小,选择输出值最高对应的类别;而回归任务则要求计算系统输出连续、精确且动态范围大的浮点数(FP)计算结果。这对于仅能以低精度进行整数(INT)计算的ACIM技术而言,是一项重大挑战。


图 2 模拟存算一体技术当前仅适用于简单分类任务计算,而难以处理使用高精度浮点数的复杂回归类任务。AnDi计算架构融合了高能效的模拟计算,与高精度的数字计算,能够进行高精度的通用浮点数神经网络推理


基于以上背景,清华大学集成电路学院钱鹤、吴华强教授团队提出了AnDi存算一体计算架构(图 2b),系统性地解决了ACIM面临的计算噪声与浮点数兼容性问题Andi架构采用新型的双域浮点数(DDFP)数据标准,并配合共享缓存的设计,能够同时兼容模拟与数字计算核,并发挥两者高能效、高精度的互补优势。架构主要包含三个部分,分别为模拟存算一体计算核,通用数字计算核,以及DDFP处理单元。前两者负责神经网络中的矩阵乘法计算,后者负责架构中的数据流转换,解决了模拟与数字域的兼容性问题。DDFP数据结构采用INT-8格式存储特征图数据,并为每个特征图配备一个自定义的FP-15格式的缩放系数,两者相乘即可得到对应的FP-32通用格式的特征图数据,并与外部总线进行数据交互。


基于该架构,作者还提出了神经网络特征增强技术。在深度神经网络的计算中,ACIM的噪声会持续累积并向下传递,最终严重影响计算精度。然而,AnDi架构可以通过在网络中插入轻量级的特征增强层,并交由数字核进行计算,从而有效阻断噪声的累积,大幅提升了每层特征图的信噪比,以及最终的计算精度。另一方面,AnDi架构还具备计算资源动态调度技术,可以根据任务场景的需求,灵活调用高精度的数字计算核,或高能效的ACIM计算核,实现在精度与能效之间的动态平衡,对于无需时刻保持高精度计算的边缘端任务有着广泛的应用前景。


通过硬件实际测试(图 3),AnDi架构实现了对2D游戏赛车游戏的自动驾驶,能够根据道路的复杂情况自动选择使用高能效的ACIM核或者高精度的数字核。相比于传统的ACIM计算系统在精度和能效上均有较大提升。更重要的是,AnDi架构首次实现了基于ACIM的YOLO目标检测任务,突破了ACIM技术在处理浮点数回归类神经网络计算上的限制。通过引入特征增强技术,AnDi的计算精度已经接近软件。


图 3 AnDi架构的硬件实测结果。完成了2D赛车游戏的自动驾驶,与YOLO回归类神经网络推理


近期,该工作发表在《自然・电子》(Nature Electronics)期刊,题目为“A dual - domain compute - in - memory system for general neural network inference”。清华大学集成电路学院高滨副教授、吴华强教授是本论文的共同通讯作者,王泽博士生为第一作者。该研究得到了科技创新2030“脑科学与类脑研究”重大项目、国家自然科学基金委后摩尔新器件重大研究计划、杰出青年基金及青年学生基础研究项目、上海市科技重大专项、科学探索奖等项目,以及北京集成电路高精尖创新中心、清华-中国移动联合研究中心等机构的支持


 

论文链接:
https://www.nature.com/articles/s41928-024-01315-9


点击下方知社人才广场,查看最新学术招聘

扩展阅读

 
华东师大InfoMat综述: 应用于感存算的类视网膜器件
Npj Comput. Mater.: X射线吸收光谱—机器学习辅助理解
npj:机器学习——用于匹配X射线吸收谱的Web应用程序
“量身定制”催化剂缺陷,助力高能量密度锂硫电池 | NSR
本文系网易新闻·网易号“各有态度”特色内容
媒体转载联系授权请看下方

知社学术圈
海归学者发起的公益学术交流平台,旨在分享学术信息,整合学术资源,加强学术交流,促进学术进步
 最新文章