南开大学发布计算催化大原子模型（CLAM）与局域微调算法

学术 2024-08-23 10:00 山东

题目：Catalytic Large Atomic Model (CLAM): A Machine-Learning-Based Interatomic Potential Universal Model

引用：Wu Z, Zhou L, Hou P, Liu Y, Guo T, Liu J-C. Catalytic Large Atomic Model (CLAM): A Machine-Learning-Based Interatomic Potential Universal Model. ChemRxiv. 2024; doi:10.26434/chemrxiv-2024-2xzct

链接：https://chemrxiv.org/engage/chemrxiv/article-details/66c56756a4e53c48760ee61c

开源项目：

https://github.com/lalaheihaihei/catalyticLAM

核心问题：

1，什么是催化大原子模型（CLAM）？

催化大原子模型是能够覆盖全元素周期表的机器学习嵌入原子势machine-learning-based interatomic potential（MLIP），也称为神经网络势函数，或机器学习力场（MLFF）。

2，催化大原子模型能做什么？

可以计算DFT能算的所有体系，并且不依赖于任何前提预设参数。通俗讲，催化大原子模型直接可以当做DFT用来算能量（E）、受力（F）。用于与能量、力、频率相关的计算任务，比如：结构优化、MD、过渡态搜索、频率计算、全局搜索、势能面扫描等。

3，催化大原子模型擅长/不擅长什么？

擅长做大体系的长时间计算模拟，并保持与DFT一致的计算精度。

不擅长做多势能面交叉或激发态的问题。难以处理长程相互作用，难以处理电子转移长程问题。不能计算电子结构（如：电荷密度，态密度）问题。

4，催化大原子模型是不是噱头？是不是没什么用？

催化大原子模型绝不是噱头，他有着极其好的通用性，即使不在预训练集里的体系都可以结合“局域微调算法”进行计算，实现与DFT一致的精度，并且将计算速度提升数倍甚至数十倍。

本文核心贡献：

1. 提出局域微调算法（local fine-tuning algorithm），基于大原子模型快速做结构优化、过渡态搜索、催化反应网络构建。并且使得计算精度保持与DFT一致。

2. 构建一套计算参数一致的基于VASP的数据集，包含金属、合金、氧化物、团簇、沸石、2D 材料和小分子的综合数据集。并以此为基础构建一套了适用于多相催化体系的计算大原子模型（CLAM）。

详细内容：

数据集构建：文章构建了一个包含多种催化材料和反应的综合数据集，数据集涵盖了金属、合金、氧化物、团簇、沸石、二维材料和小分子等多种催化体系。为了确保数据的一致性和广泛性，使用了与OC22数据集相同的计算参数，并采用了一系列筛选和补充算法以创建一个更平衡和具有代表性的数据集。

图1. (a) 数据集构建的流程图。(b) 金属和合金初始超胞结构示例。(c) 用于在slab模型上进行吸附的吸附物。（d-g）结构实例。

图2. 2024Q2计算完成的训练集结构数量和元素种类分布。

训练：基于DPA1和GemNet-OC图神经网络方法进行训练。DPA1模型采用了从OC22和CLAM数据集中生成的样本进行多任务训练。GemNet-OC模型则通过对预训练的OC20+OC22模型进行微调，进一步提升了预测的精度。

图3. (a) DPA1模型的训练策略：使用OC22数据集的一部分以及CLAM金属与QM9分子数据集进行训练。(b) GemNet-OC模型的训练策略：使用预训练的OC20+OC22的模型基础上，通过CLAM金属与QM9分子数据集进行微调。

表1，DPA1和GenNet-OC的训练误差

图4、GemNet-OC微调和DPA1训练的机器学习势函数（MLIPs）模型与DFT在测试数据集上的比较。

局域微调加速算法：为了提高结构优化和过渡态搜索的效率，文章提出了一种局域微调算法。通过引入少量新的DFT数据来对模型进行微调，可以显著提高在特定路径上的势能面（PES）预测精度，从而加速结构优化和过渡态搜索。

示意图1、局域微调算法示意图。用极少量数据在PES上的局部微调，利用MLIP的外推能力做优化，迅速找到目标极小值/过渡态。

图5、局域微调算法进行结构优化和过渡态搜索的流程图（Inference-Labeling-Finetuning循环）。

图6、局域微调优化在域外（OOD）体系中的应用示例，以八氢-N-乙基咔唑在(a, b) Pd(111)表面和(c, d) Pd13团簇上的吸附为例。

图7、在Cu(111)结构上，使用GemNet-OC、比较了单纯用GemNet-OC-S2EFS-OC20+OC22模型和CLAM模型计算的36种吸附物的能量平均绝对误差（MAE），以及经过0次、1次、2次和3次局域微调（每次微调包含5步DFT优化）后的能量误差结果。

图8、NH₃分解反应的过渡态搜索过程及不同大原子模型多次微调计算结果的对比。

反应网络构建：文章开发了一种基于CLAM模型和局域微调算法的快速反应网络构建方法，用于在复杂反应网络中评估动力学特性。该方法包含化学空间生成、局域微调优化、限制性优化、过渡态评估和微观动力学评估五个关键步骤，能够加速反应机理的探索和催化剂的设计。

图9、（a）反应网络构建的示意图：描述了使用CLAM预训练模型和局域微调算法进行反应网络构建的步骤。(b) CHOH*在Cu(111)表面上C-O、C-H和H-O键解离过程中的能量变化：通过限制性优化策略搜索末态，展示了不同解离路径的能量变化。(c) 展示了在Cu(111)表面上C-O、C-H和H-O键解离过程中形成的末态结构。

引用：

Wu Z, Zhou L, Hou P, Liu Y, Guo T, Liu J-C. Catalytic Large Atomic Model (CLAM): A Machine-Learning-Based Interatomic Potential Universal Model. ChemRxiv. 2024; doi:10.26434/chemrxiv-2024-2xzct

理论计算科学

致力于理论计算化学与材料科研学术内容知识的分享。

最新文章

罗毅/江俊最新JACS，电场调控-机器学习光谱

Nat.Commun. 16种元素合金势函数

最新JACS，多相催化生成式预训练 Transformer (CatGPT)

最新JACS，CP2K气液界面MetaDynamics

最近纯计算JACS，CO2RR耦合电子转移

4代Intel高主频超算低至4分

计算催化，Science

最新JACS，高温动态单原子化，计算部分解读

最新JACS，固液界面

神经网络势函数天梯，eqV2再次登顶

A100 80GB配置来了

2000万构象分子计算数据库

肖海最新JACS-瞬时活性位点

肖海2023JACS回顾-恒电势CO2吸附反转

JACS单原子CO2RR

程俊最新Chem. Sci.限域催化剂的熵效应

今日纯计算Nature正刊详细解读，骆军委/John Robertson/魏苏淮/邓惠雄

欧鹏飞最新计算Matter，高熵合金机器学习

最近JACS，AIMD水界面

胡培君最新综述，神经网络势+动态催化

最新NC，机器学习Hessian矩阵

王海丰最新JACS Au，晶格N参与NRR

段文晖/徐勇两篇NC，等变神经网络泛函

1.1亿个结构DFT计算，Meta AI推出OMat24，驱动材料发现开源化

最新纯计算JACS，又是单原子合金

最新纯计算Angew，M-N-C的双面位点

最近Nat. Catal.肖海/徐冰君计算部分解读，显+隐混合溶剂模型

最近纯计算PNAS，电催化Fe-N-C

南开刘锦程课题组招收2025级计算方向博士研究生

最近纯计算JACS，石墨炔单原子

刘智攀最新JACS，C2化学

李剑锋/潘锋/郑世胜最新JACS，界面水

潘锋/李舜宁/郑世胜最新ACS Catal. C-C偶联

巩金龙/赵志坚最新NC，可解释机器学习双原子

最新动态催化计算综述

最新纯计算JACS，大数据分析C-C偶联

5代Intel 8581C服务器配置，在售最快配置

纯计算JACS Au，单原子合金

纯计算JACS Au，动态催化

如何判断服务器/超算CPU型号的速度

林森纯计算最新Angew-氢溢流

4代Intel超算，速度翻倍，价格不变

南开大学发布计算催化大原子模型（CLAM）与局域微调算法

庚子超算新上4代Intel高频多核节点

今日DeePMD再上大子刊-纯计算神经网络势

计算Nature正刊，2024计算ORR经典文章

计算最新JACS，电催化NRR

化学会34届学术年会-计算催化相关分会报告

【课题组】深圳理工大学海归讲席教授丁峰

丁峰最新小NC - DeePMD + 碳管生长

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉