南开大学发布计算催化大原子模型(CLAM)与局域微调算法

学术   2024-08-23 10:00   山东  

题目Catalytic Large Atomic Model (CLAM): A Machine-Learning-Based Interatomic Potential Universal Model

引用Wu Z, Zhou L, Hou P, Liu Y, Guo T, Liu J-C. Catalytic Large Atomic Model (CLAM): A Machine-Learning-Based Interatomic Potential Universal Model. ChemRxiv. 2024; doi:10.26434/chemrxiv-2024-2xzct 

链接:https://chemrxiv.org/engage/chemrxiv/article-details/66c56756a4e53c48760ee61c

开源项目

https://github.com/lalaheihaihei/catalyticLAM

核心问题

1,什么是催化大原子模型(CLAM)?

催化大原子模型是能够覆盖全元素周期表的机器学习嵌入原子势machine-learning-based interatomic potential(MLIP),也称为神经网络势函数,或机器学习力场(MLFF)。

2,催化大原子模型能做什么?

可以计算DFT能算的所有体系,并且不依赖于任何前预设参数。通俗讲,催化大原子模型直接可以当做DFT用来算能量(E)、受力(F)。用于与能量、力、频率相关的计算任务,比如:结构优化、MD、过渡态搜索、频率计算、全局搜索、势能面扫描等。

3,催化大原子模型擅长/不擅长什么?

擅长做大体系的长时间计算模拟,并保持与DFT一致的计算精度。

擅长做多势能面交叉或激发态的问题。难以处理长程相互作用,难以处理电子转移长程问题。不能计算电子结构(如:电荷密度,态密度)问题。

4,催化大原子模型是不是噱头?是不是没什么用?

催化大原子模型绝不是噱头,他有着极其好的通用性,即使不在预训练集里的体系都可以结合“局域微调算法”进行计算,实现与DFT一致的精度,并且将计算速度提升数倍甚至数十倍

本文核心贡献

1. 提出局域微调算法(local fine-tuning algorithm),基于大原子模型快速做结构优化、过渡态搜索、催化反应网络构建。并且使得计算精度保持与DFT一致。

2. 构建一套计算参数一致的基于VASP的数据集,包含金属、合金、氧化物、团簇、沸石、2D 材料和小分子的综合数据集。并以此为基础构建一套了适用于多相催化体系的计算大原子模型(CLAM)。

详细内容

数据集构建:文章构建了一个包含多种催化材料和反应的综合数据集,数据集涵盖了金属、合金、氧化物、团簇、沸石、二维材料和小分子等多种催化体系。为了确保数据的一致性和广泛性,使用了与OC22数据集相同的计算参数,并采用了一系列筛选和补充算法以创建一个更平衡和具有代表性的数据集。

图1. (a) 数据集构建的流程图。(b) 金属和合金初始超胞结构示例。(c) 用于在slab模型上进行吸附的吸附物。(d-g)结构实例。

图2. 2024Q2计算完成的训练集结构数量和元素种类分布。

训练:基于DPA1和GemNet-OC图神经网络方法进行训练。DPA1模型采用了从OC22和CLAM数据集中生成的样本进行多任务训练。GemNet-OC模型则通过对预训练的OC20+OC22模型进行微调,进一步提升了预测的精度。

图3. (a) DPA1模型的训练策略:使用OC22数据集的一部分以及CLAM金属与QM9分子数据集进行训练。(b) GemNet-OC模型的训练策略:使用预训练的OC20+OC22的模型基础上,通过CLAM金属与QM9分子数据集进行微调。

1,DPA1和GenNet-OC的训练误差


图4、GemNet-OC微调和DPA1训练的机器学习势函数(MLIPs)模型与DFT在测试数据集上的比较。

局域微调加速算法:为了提高结构优化和过渡态搜索的效率,文章提出了一种局域微调算法。通过引入少量新的DFT数据来对模型进行微调,可以显著提高在特定路径上的势能面(PES)预测精度,从而加速结构优化和过渡态搜索。

示意图1、局域微调算法示意图。用极少量数据在PES上的局部微调,利用MLIP的外推能力做优化,迅速找到目标极小值/过渡态。

图5、局域微调算法进行结构优化和过渡态搜索的流程图(Inference-Labeling-Finetuning循环)

图6、局域微调优化在域外(OOD)体系中的应用示例,以八氢-N-乙基咔唑在(a, b) Pd(111)表面和(c, d) Pd13团簇上的吸附为例。

图7、在Cu(111)结构上,使用GemNet-OC、比较了单纯用GemNet-OC-S2EFS-OC20+OC22模型和CLAM模型计算的36种吸附物的能量平均绝对误差(MAE),以及经过0次、1次、2次和3次局域微调(每次微调包含5步DFT优化)后的能量误差结果。

图8、NH₃分解反应的过渡态搜索过程及不同大原子模型多次微调计算结果的对比。

反应网络构建:文章开发了一种基于CLAM模型和局域微调算法的快速反应网络构建方法,用于在复杂反应网络中评估动力学特性。该方法包含化学空间生成、局域微调优化、限制性优化、过渡态评估和微观动力学评估五个关键步骤,能够加速反应机理的探索和催化剂的设计。

图9、(a)反应网络构建的示意图:描述了使用CLAM预训练模型和局域微调算法进行反应网络构建的步骤。(b) CHOH*在Cu(111)表面上C-O、C-H和H-O键解离过程中的能量变化:通过限制性优化策略搜索末态,展示了不同解离路径的能量变化。(c) 展示了在Cu(111)表面上C-O、C-H和H-O键解离过程中形成的末态结构。

引用

Wu Z, Zhou L, Hou P, Liu Y, Guo T, Liu J-C. Catalytic Large Atomic Model (CLAM): A Machine-Learning-Based Interatomic Potential Universal Model. ChemRxiv. 2024; doi:10.26434/chemrxiv-2024-2xzct 

理论计算科学
致力于理论计算化学与材料科研学术内容知识的分享。
 最新文章