10月23日上午,2024年度上海市科学技术奖励大学会举行。上海交通大学金石、李磊、徐振礼的研究项目《粒子系统与分子动力学的随机快速算法及应用》获上海市自然科学一等奖。
多体粒子系统是微观尺度和多尺度物理领域的基本问题,在药物设计、新材料研发、天体物理、群体智能和大规模群体行为等领域具有广泛应用。由于粒子数通常都很大,经典计算机上的模拟和抽样算法往往受到严重挑战,在分布式计算上的并行效率也受到限制。动理学方程是从微观的多体粒子描述转变为介观的对概率密度分布描述的约化模型,在航天、聚变相关的等离子物理、反应堆和医学图像及放疗设计等领域有重要应用。
如何突破多体粒子系统计算瓶颈?如何设计高效的分子动力学算法助力药物设计以及新材料开发?上海交通大学自然科学研究院与数学科学学院的金石教授带领团队从随机算法的角度对粒子系统及动理学方程做了长期与系统性的研究,发展了系列随机算法,突破了原有计算瓶颈。
加速交互作用粒子系统的模拟
在实际应用问题中,粒子数通常很大,如天体物理、等离子体等问题中可以大到十亿甚至一摩尔分子数的量级。多体问题由于每个粒子需要和其它粒子相作用,需要粒子数平方的计算量,这对于经典计算机来说是无法接受的。上世纪不少著名的算法,如基于快速傅里叶变换的方法以及快速多极法等,均是为了把计算量从粒子数平方降到近似于粒子数线性的复杂度。但这些算法的通讯较为密集,并行效率较为低下。
如何设计复杂度低且并行效率好的算法呢?项目组将目光放在了随机算法的思路上。项目组受到了人工神经网络训练算法——随机梯度下降算法的启发,设计了一个针对交互作用粒子系统的随机分组近似,提出了“随机分批方法”(Random Batch Methods,RBM)。
“RBM在计算相互作用时,在每个时间步,将粒子随机分成多个小组,每个粒子只和本组粒子相互作用,这样作为随机近似从而降低计算量;结合时间上的平均效应,该方法可以在数学上被证明是正确的”团队成员李磊介绍到,“该方法是个极其简单同时又适用于任意力场的快速计算方法,它将多体问题的计算量从粒子数平方降到粒子数线性,同时具有高度并行的优势。举个例子,如果粒子数等于一千,那平方复杂度就是百万的量级,线性复杂度只是一千的量级,平方复杂度的算法将比线性复杂度的算法消耗多得多的资源”。
RBM方法被该团队推广至二阶系统、多组分问题以及量子系统,相关研究入选了《计算物理学报》设立的“JCP 研讨会系列”。
突破分子动力学的可扩展性瓶颈
分子动力学模拟中包含各种奇异的相互作用势函数,而其中的库仑力场更是长程的,奇异的相互作用对数值方法提出了严峻的挑战,而长程性更是带来了可扩展性方面的瓶颈。
针对奇异相互作用,项目团队引入了核分裂的思想,将随机分批思想用于处理光滑部分,而奇异部分具有超短程的相互作用,可以有效地处理。基于该思想,团队设计了“随机分批蒙特卡洛”抽样算法。“该方法中,移动一个粒子时,平均计算量是常数时间,所有粒子移动一遍的平均复杂度是线性的,因而是一种非常快速的计算方法。”
为了处理长程的库仑相互作用,项目团队将目光投向了传统的“埃瓦尔德求和”算法。“埃瓦尔德求和”算法本质上也采用了核分裂的思想,但是它在处理长程光滑部分的时候利用了傅里叶变换。由于傅里叶变换通讯较为密集,基于该思想的算法,如 “粒子网格埃瓦尔德(PME)”等算法并行效率低,有可扩展性瓶颈。团队将随机分批的思想用到了傅里叶空间这部分,用重要性采样近似替换傅里叶变换。这样,算法保持长时间的良好的误差精度,并展现出了超扩展性。
“沪渝人工智能研究院开发的软件‘微著’就是基于这系列算法的”,团队成员徐振礼说到,“并且我们的算法已经用于上海交大全固态电池项目研究中,精准锁定锂离子电导率衰减的核心问题。”
发展动理学方程的随机不确定性量化算法与理论
动理学方程是多体粒子系统介观描述的偏微分方程模型,可以通过复杂度约化或平均场极限得到。项目团队在国际上率先开展带有随机不确定性和多尺度的动理学方程的研究。“我们对多尺度和随机不确定性的非线性动理学方程构造了多尺度随机渐近保持伽辽金方法,并将广泛用于速度空间的亚强制性理论推广到随机空间,其中亚强制性理论是赛德里克·维拉尼(C. Villani) 获得菲尔兹奖工作的重要部分。”团队成员金石介绍到,“我们建立了解在随机空间的正则性和敏感性理论,及长时间误差估计。通常的数值分析得到的误差是随时间指数增长的,而该分析获得的误差是随时间指数递减的!”
团队这部分内容是金石在2018年国际数学家大会45分钟邀请报告的主要内容。
未来,团队将继续致力于高效随机算法的开发,并尝试结合新的计算机构架构造新型随机算法,助力药物研发、材料设计、电池设计等。
文:转载自文汇报