合成迭代方法及其在芯片散热中的潜能
文摘
2024-11-10 11:32
中国
引文信息:Chuang Zhang, Qin Lou, Hong Liang. Synthetic iterative scheme for thermal applications in hotspot systems with large temperature variance. International Journal of Heat and Mass Transfer 236 (2025) 126374. https://www.sciencedirect.com/science/article/pii/S0017931024012031https://www.researchgate.net/publication/377633502_Study_of_non_Fourier_heat_conduction_in_FinFETsGAAFETs_via_synthetic_iterative_scheme_with_large_temperature_variance,半个世纪前,数值离散求解玻尔兹曼输运方程(Boltzmann transport equation,BTE)在核物理、航天器再入大气层等国防领域发挥了巨大作用,其中以蒙特卡洛方法(Monte Carlo method,MC,不同领域叫法不一样)为代表的粒子类方法和以离散坐标法(Discrete ordinate method,DOM,不同领域叫法不一样)为代表的确定型方法是两大类主流的求解BTE方法。例如上世纪六七十年代,G. A. Bird采用MC方法成功模拟了钝体绕流稀薄气体动力学问题,做出了诸多杰出工作[Physics of Fluids, 1963, 6, 1518-1519. Annual Review of Fluid Mechanics, 1978, 10, 11-31];以美国Los Alamos国家实验室为代表的诸多核物理单位的学者采用BTE模拟中子辐射输运问题[Prog. Nucl. Energ., 2002, 40, 3 - 159]。实际工程问题的多尺度、多物理场、非线性等特征,对数值方法的收敛性、稳定性、精度、效率等提出了诸多挑战。经典的隐式DOM方法,即迭代求解稳态BTE,在弹道区域具有较高的计算效率,但是随着系统尺度增大,努森数(平均自由程与系统长度的比值)不断减小,其收敛效率会急剧下降,甚至收敛到错误解。MC在小努森数区域具有类似的问题:收敛慢、统计噪声/涨落大。为克服DOM在小努森数区域收敛慢的问题,上世纪六七十年代,Kopp、Alcouffe等核物理学者提出并发展了合成(Synthetic)加速的思想[Nucl. Sci. Eng., 1963, 17, 65-74; Nucl. Sci. Eng., 1977, 64, 344-355]。之后,诸多学者发展了一系列加速DOM收敛的策略,用于研究从弹道到扩散极限的中子多尺度辐射输运问题[Prog. Nucl. Energ., 2002, 40, 3 - 159]。合成迭代加速思想的核心,是引入宏观方程或宏观算子来对DOM或BTE做预处理。宏观迭代对BTE迭代求解过程中的平衡态分布做预估修正,BTE则给宏观方程提供宏观通量,不同尺度的方程交替迭代并互相交换信息。基于不精确牛顿迭代的原理[SIAM J. Numer. Anal. 19, 400 (1982). Numer. Math. 12, 23 (1968)],当迭代收敛时,宏观算子不影响最终收敛解,最终收敛解完全由BTE控制。合成加速思想在中子辐射、核物理领域最早取得成功,并在过去数十年不断发展,例如著名的扩散合成迭代加速方法(Diffusion synthetic acceleration method,DSA)。近些年,随着半导体工艺节点从22 nm迈向14 nm以下、7 nm以下、3 nm以下,晶体管结构设计从CMOS向FinFET、GAAFET或CFET等不断更新,先进封装技术从2D封装迈向2.5D、3D封装,每平方毫米硅晶圆上晶体管数目过亿,热流密度急剧增大,芯片散热或热点问题日益严重,对数值模拟或多尺度仿真的计算效率与精度提出了更高要求。以BTE为核心桥梁、并与微观或宏观方法相结合的多尺度仿真方法被Synopsys、IMEC、Intel等半导体行业顶级公司或科研单位采用。例如Intel团队的TCAD综述[IEEE Transactions on Electron Devices, 2021, 68,
5350-5357],介绍了40多年TCAD在模型、算法、计算规模等方面的发展,空间尺度从埃米横跨到毫米,涵盖求解薛定谔方程/DFT、非平衡格林函数NEGF、BTE、宏观漂移-扩散方程、更大尺度Compact模型等各种尺度模型的跨尺度超大规模仿真软件。这也表明数值求解声子BTE在芯片散热领域能够发挥作用。我们自2016年开始将合成synthetic思想引入声子导热领域,数值离散求解声子BTE单弛豫时间模型,实现了从弹道到扩散区域的高效收敛,在小努森数区域比经典隐式DOM加速收敛1-3个数量级,并发表了4篇论文:Phys. Rev. E, 2017, 96(6): 063311.(灰体模型、省内存技术、各向同性、小温度差假设);Int. J. Heat Mass Transfer, 2019, 130: 1366-1376.(非灰模型、省内存技术、各向同性、小温度差假设);Int. J. Heat Mass Transfer, 2021, 174: 121308.(非灰模型、各向同性、小温度差假设、更快收敛,2018年放在arxiv,arXiv:1812.06405);Int. J. Heat Mass Transfer, 2023, 217: 124715.(非灰模型、各向异性、小温度差假设、更快收敛)。文献[Int. J. Heat Mass Transfer, 2021, 174: 121308]中的加速策略与推导公式已经被上海交通大学鲍华教授团队采用,并发展成开源程序包[Journal of Physics: Condensed Matter, 2024, 36, 025901. Fundamental Research, 2024, 4, 907-915]。另外,值得一提的是,省内存技术是以牺牲计算时间为代价大幅度降低计算机内存需求,从而可以在个人笔记本电脑上实现6维BTE模拟,贫穷人做法。如果有钱,还是直接加计算节点省事高效。上述合成迭代方法求解稳态声子BTE过程中全部采用了小温度差假设,即声子平衡态分布没有采用最原始的玻色-爱因斯坦分布,而是采用比热与温度的乘积,做线性化近似处理,假设了声子比热、弛豫时间等声子物性参数不随空间温度的变化而发生变化。然而,在实际芯片等微电子设备散热过程中,整个系统温升大,有必要考虑声子弛豫时间、比热、热导率等物性参数随着空间温度T(x)的变化而变化,即考虑声子物性参数的温度依赖关系。当系统温升较大时,不同几何位置处的温度差异大,即便给定同一声子模式,弛豫时间、比热、热导率等物性参数依旧会随着空间位置变化而发生改变。这会增大数值模拟中的非线性、多尺度等特点,对算法效率与精度提出更高要求。合成迭代方法基于有限体积法框架,事实上对几何位置空间是否采用非结构/结构网格、动量空间或声子输入参数是否采用经验公式或DFT输入、是否大温度差、是否各向异性等没有太多限制,取决于数学公式推导能力、编程写代码能力、超大规模并行计算能力等。本文简要介绍一下合成迭代方法基本过程与思路,详细的数值公式推导过程、方法稳定性、收敛性、计算精度、效率等性质分析与细节对比,感兴趣的读者可以参考我们已发表的5篇文献或者上世纪核物理领域的经典文献。考虑稳态BTE,其中k代表动量空间,W是宏观量,散射项或碰撞项满足一定的守恒约束,Ψ一般代表质量或动量或能量,例如声子散射项满足能量守恒。经典隐式DOM做法如下,给定一个宏观分布,即假设第n迭代步的宏观分布已知,那么对于动量空间中的任意一点k,均可以通过宏观分布迭代出整个几何空间位置的下一迭代步的分布函数,若采用一阶迎风格式处理空间散度项,则只有一阶空间精度,在小努森数区域会有较大数值耗散,即需要更密的网格才能达到准确解。为了实现更高阶的空间精度,一般采用delta形式处理左端产生一个系数矩阵A,右端是介观残差项res。当n+1迭代步的分布函数更新以后,结合散射项守恒约束便可以计算出n+1迭代步的宏观分布如此循环迭代便是经典隐式DOM方法。该方法在弹道区域收敛很快,但是随着努森数不断减小、系统尺度不断增大,计算效率会急剧下降,甚至收敛到错误解[Prog. Nucl. Energ., 2002, 40, 3 - 159]。为了加速收敛,引入合成迭代的思想以及不精确牛顿迭代原理。考虑稳态的宏观守恒方程其中宏观通量F与宏观量W之间是一个未知的泛函(例如固体导热中热流与温度),但是宏观量与宏观通量在BTE框架下均可通过分布函数求矩得到。构造不精确牛顿迭代[Phys. Rev. E, 2017, 96(6): 063311]其中Q代表真实算子,是关于宏观量W的一个未知泛函,W*是精确解。方程(1.7)中第三步到第四步是不精确牛顿迭代的核心,即在迭代过程中引入一个近似的线性算子P。从方程(1.7)可以发现,如果迭代收敛,那么收敛解便是精确解,并且近似线性算子P不影响最终收敛精度[Phys. Rev. E,
2017, 96(6): 063311]。接着便可以构造一个衔接BTE或DOM的宏观迭代,即其中P是宏观系数矩阵,RES是宏观残差。注意:宏观残差完全由介观残差控制。方程(1.4)与(1.9)相结合便是整个合成迭代加速方法的核心框架。在固体导热中,热流与温度的关系未知,但在宏观尺度其本构关系一般满足傅里叶导热定律。因此,近似线性算子P采用扩散算子,从而在小努森数区域加速收敛。图1.随着硅材料尺寸增大,DOM(又叫Source iteration,SI)计算步数和计算时间急剧增大,但合成迭代方法基本在百步以内收敛[Int. J. Heat Mass Transfer, 2023, 217: 124715]图2. 硅材料热点体系散热,几何位置空间采用803网格离散,动量空间或声子参数由DFT计算得到,483个q点,6个声子分支,无各向同性假设。1000个CPU核并行计算,48个迭代步收敛,用时1.5小时[Int. J. Heat Mass Transfer, 2023, 217: 124715]图3. Single-fin bulk FET器件尺度器件尺度BTE模拟[Int. J. Heat Mass Transfer, 2025, 236: 126374]图4. Double-fin bulk FET器件尺度BTE模拟[Int. J. Heat Mass Transfer, 2025, 236: 126374]图5. GAAFET器件尺度BTE模拟[Int. J. Heat Mass Transfer, 2025, 236: 126374]合成迭代方法在核物理领域取得了巨大成功,在声子导热、芯片散热领域应该也能取得进步。面向实际芯片跨尺度多物理场耦合传热问题[IEEE Transactions on Electron Devices, 2021, 68, 5350-5357],当前工作在算法、模型、编程技术等各方面还有巨大的提升空间或潜能。Chuang Zhang, Qin Lou, Hong Liang. Synthetic iterative scheme for thermal applications in hotspot systems with large temperature variance. Int. J. Heat Mass Transfer, 236 (2025) 126374. https://www.sciencedirect.com/science/article/pii/S0017931024012031https://www.researchgate.net/publication/377633502_Study_of_nonFourier_heat_conduction_in_FinFETsGAAFETs_via_synthetic_iterative_scheme_with_large_temperature_variance投稿邮箱|rezhi2021@163.com