GPUMD&NEP:携手DeepModeling,打造AI时代国产高效分子动力学模拟与机器学习势函数软件

文摘   2024-06-21 18:21   芬兰  


基于原子间相互作用与统计物理的分子动力学(Molecular Dynamics,简称MD)模拟在众多自然科学,特别是材料科学中扮演着日益重要的角色。当前最具影响力的开源MD模拟软件是由美国Sandia国家实验室的Steve Plimpton教授主导开发的LAMMPS程序。与此同时,由渤海大学多尺度模拟研究所樊哲勇教授主导开发的GPUMD程序,经过十余年的积累,正逐步在学术界和工业应用中崭露头角。特别地,在GPUMD中实现的神经演化势(Neuroevolution Potential,简称 NEP)框架为MD模拟提供了准确且高效的原子间相互作用模型。GPUMD团队已开发出用于实现元素周期表大模型的框架,并发布了开箱即用、无需微调的适用于16元金属及其任意合金的UNEP-v1势函数模型。基于该模型,开发者仅用8块A100就实现了亿原子级的多晶MoTaVW高熵合金的塑性变形模拟。


在当前人工智能和大数据时代背景下,GPUMD&NEP加入DeepModeling开源软件社区(https://github.com/deepmodeling/GPUMD),将为我国材料基因工程和AI4S社区提供高效的MD模拟和机器学习势函数软件,共同促进多尺度模拟领域程序的合作研发。


GPUMD程序开发历史


GPUMD程序的开发起始于樊教授在厦门大学做博士后期间(2010-2012)练习CUDA编程的小项目。在随后的几年(2012-2017)间,樊教授进一步扩展程序,并于2017年发布了第一个版本。GPUMD程序开源后,吸引了更多开发人员加入,目前已有数十名活跃的开发者参与其中。2021年,樊教授在GPUMD中实现了基于神经网络和演化算法的NEP机器学习势函数框架。最近几年,NEP经历了多次升级,从NEP1(2021 年初)、NEP2(2021 年末)、NEP3(2022年)一路发展到NEP4(2023 年)。目前,GPUMD&NEP的开发已趋成熟,并获得学术界广泛认可和使用。


GPUMD程序主要特色


GPUMD程序在MD模拟软件领域颇具特色:


• 该程序完全在GPU(显卡)上实现,充分利用GPU资源,计算性能通常高于LAMMPS。


• 除基本的CUDA开发环境外,GPUMD不依赖任何第三方程序包,使得程序的安装如同编译一个Hello World 程序一样简单。GPUMD也同时支持Windows与Linux平台。


• GPUMD程序的输入输出文件极其简洁,对用户特别是初学者极为友好。


• GPUMD不仅支持NEP机器学习势的训练,也支持基于NEP 的MD模拟,实现了势函数的构造与应用的无缝衔接。


• GPUMD中精心优化的NEP机器学习势具有极高的计算效率,仅用两块RTX 4090消费级显卡即可实现上千万原子体系的高效模拟。


GPUMD程序高级功能


GPUMD已发展为一款较为完善的通用型MD程序,支持多种 MD系综(NVE、NVT、NPT、NPH)以及众多物理量的计算。此外,GPUMD还拥有许多独特的高级功能。


• GPUMD中的NEP模型可与ZBL短程排斥势无缝衔接,提高了NEP模型的稳定性及对短程相互作用的描述,进而应用于辐照损伤模拟。


• GPUMD中实现了高效的D3色散修正势,可与NEP结合,获得对van der Waals力的准确描述。


• GPUMD中实现了张量NEP模型,可高效地预测电偶极矩与电极化张量,并计算红外与拉曼光谱。


• GPUMD中实现了高效的MCMD (hybrid Monte Carlo and MD) 模拟,其中MC部分的耗时几乎可忽略不计。


• GPUMD中实现了一系列计算自由能的热力学积分方法。


• GPUMD中实现了高效的PIMD(path-integral MD)以及相关的RPMD(ring-polymer MD)模拟。


• GPUMD中实现了正确的原子热流表达式(LAMMPS中的表达式仅对部分势函数正确),并拥有完善的热输运模拟功能,能方便地计算在频率空间分解的热输运系数。


GPUMD程序应用情况


GPUMD程序已被全球多个国家的数千用户使用,并吸引了数十位研究人员参与开发。其应用领域包括但不限于传热传质、力学性质、结构相变、辐照损伤、光谱、催化等。相关成果发表在 Nature、Nature Communications、J. Am. Chem. Soc、ACS Nano、Phys.Rev. Lett、J. Mech. Phys. Solids、J. Chem. Theory Comput.、Phys. Rev. B、J. Chem.Phys. 等一流学术期刊上。在2022年和2023年,使用GPUMD发表的文章分别有18篇与40篇。2024年至今,使用GPUMD发表的文章已接近40篇。总体来说,GPUMD的使用量呈现出指数函数增长趋势。


GPUMD程序生态环境


GPUMD开发团队为GPUMD打造了良好的生态环境,具体如下:


• GPUMD程序有完善的用户手册(https://gpumd.org/),程序包中有大量精心制作的例子与教程。


• 樊老师所著《分子动力学模拟》一书即将出版,深入探讨了MD模拟的基础知识与GPUMD程序所涉及的理论与算法。


• GPUMD&NEP有活跃的QQ讨论群:887975816。


•GPUMD&NEP有活跃的微信公众号:“GPUMD与 NEP” (“zheyongfan_gpumd”)。


• GPUMD&NEP拥有多款支持对其预处理和后处理的Python生态环境包:

    - calorine: https://gitlab.com/materials-modeling/calorine

    - dynasor: https://dynasor.materialsmodeling.org/

    - pynep: https://github.com/bigd4/PyNEP

    - GPUMD-Wizard: https://github.com/Jonsnow-willow/GPUMD-Wizard

    - gpyumd: https://github.com/AlexGabourie/gpyumd


• 第一届GPUMD&NEP研讨会与培训课程将于2024年7月14-17日,在渤海大学举办。


GPUMD程序开发计划


GPUMD开发迅猛,短短数年内就从2017年的v1.0版本发展到了目前v3.9.4版本。GPUMD程序以在Github仓库提交Pull Request (PR) 的形式进行开发,目前累积完成的PR已高达400余条。用户和开发者可在该仓库的Issues板块提出问题和要求,也可在Discussions板块讨论程序的使用问题。GPUMD开发团队计划于2025年推出v4.0版本,使之成为一个更为完善的通用型MD程序。届时,我们将邀请所有对GPUMD开发有实质性贡献的科研人员共同撰写发布GPUMD-v4.0的论文。


我们欢迎感兴趣的研究者和课题组积极参与GPUMD&NEP的开发,共同打造一款能够比肩甚至超越LAMMPS的MD模拟软件。


在MD模拟方面,我们将:


• 实现诸多增强采样功能(张锦途、樊哲勇等)

• 完善自由能计算功能(潘书宁、樊哲勇等)

• 完善MCMD模拟功能(Paul Erhart、樊哲勇等)


在并行计算的软硬件方面,我们将:


• 实现对国产DCU的支持(董海宽、陈卫、樊哲勇等)

• 实现对AMD显卡的支持(王勇、樊哲勇等)

• 使用MPI实现跨节点GPU并行(王勇、樊哲勇等)


在势函数方面,我们将与北京科技大学宿彦京教授和钱萍教授的课题组以及其他众多科研人员深度合作,构建一系列开箱即用的NEP大模型。近期的规划如下:


• 构建16元金属及其任意合金的通用UNEP-v1模型(宋可可,赵瑞、柳佳晖、陈顺达、宿彦京、樊哲勇等),该模型已随GPUMD-v3.9.4发布。

• 在UNEP-v1的基础上开发20元金属及其任意合金的通用UNEP-v2模型并探索其在工业领域的实际应用(柳佳晖、宋可可、陈顺达、樊哲勇、宿彦京等),预计2024年底发布。

• 在UNEP-v2的基础上开发45元金属 + 非金属及其任意化合物的通用UNEP-v3模型(宋可可、柳佳晖、陈顺达、樊哲勇、宿彦京等),预计2025年发布。

• 基于Materials Project数据库训练整个元素周期表的NEP基础大模型(梁挺、陈顺达、樊哲勇等),预计2024年底发布。

• 固态电池大模型(徐克,樊哲勇等),预计2025年发布。

• 与水和水合物相关的大模型(徐克、樊哲勇等)预计2025年发布。

• 基于Open Catalyst Project数据库训练用于催化计算的 NEP 大模型(王彦周,樊哲勇等),预计2025年发布。

• 有机物和高分子的NEP大模型(唐本瑞,樊哲勇等),预计2025年发布。


结语


GPUMD&NEP作为国产分子动力学模拟和机器学习势软件的新兴力量,将继续在人工智能和大数据时代下为材料基因工程和AI4S社区提供创新工具。我们鼓励广大研究者和开发者积极参与,共同推动GPUMD&NEP的未来发展,并携手致力于多尺度模拟领域程序的合作研发与广泛应用。


GPUMD与NEP
演化策略的神经网络机器学习势NEP与GPU分子动力学GPUMD模拟