快多个数量级，清华更高精度、更泛化的深度学习电子结构计算方法登Nature子刊

学术 2024-10-10 11:52 北京

将 ScienceAI 设为星标

第一时间掌握

新鲜的 AI for Science 资讯

编辑 | KX

两年前，清华大学物理系徐勇、段文晖研究组开发出高效精确的第一性原理电子结构深度学习方法 DeePH，可极大加速电子结构计算。

近日，该团队开发了一种准确而有效的实空间重构方法（real-space reconstruction），将 DeepH 方法从原先仅支持原子基组推广至适用于平面波基组，使得 DeepH 方法可与所有密度泛函理论（DFT）程序兼容。而且，该重构方法比传统的基于投影的方法快几个数量级。

这给深度学习电子结构计算方法带来了更高的精度和更好的泛化能力，并打通了其利用电子结构大数据作深度学习的通道。

相关研究以「Generalizing deep learning electronic structure calculation to the plane-wave basis」为题，于 10 月 3 日发布在《Nature Computational Science》上。

论文链接：https://www.nature.com/articles/s43588-024-00701-9

DeepH 成功与局限性

近年来，从头计算与 AI 相结合取得了显著进展。这大大扩展了理论和计算材料研究的范围，达到了前所未有的精度和效率。

深度学习方法 DeepH 取得了巨大的成功，在比传统 DFT 方法快多个数量级的速度下仍能保持亚毫电子伏的精度。

然而，此类方法只支持局域原子轨道 (AO) 基组下的 DFT 程序，而完全不兼容使用平面波 (PW)基组的 DFT 程序。事实上，平面波基组相对原子轨道基组有其独特的优势，如容易收敛、精度高、应用更广泛等，因此将 DeepH 方法推广至平面波基组对深度学习电子结构计算的未来发展具有重要的意义。

比传统方法快几个数量级

为了解决以上问题，清华研究团队提出了一种基于 PW DFT 结果的实空间重构方法来重构 AO 哈密顿量。该方法比直接投影 PW 哈密顿量或波函数的传统方法快几个数量级。

此外，研究表明，使用该方法生成的 AO 哈密顿量不仅可以很好地再现 PW 电子结构，而且非常容易被神经网络模型学习。因此，解决了 PW 基下的深度学习 DFT 哈密顿量的关键问题。新方法的高精度和高效性有利于构建更通用、更准确的深度学习电子结构计算方法，这不仅使它们能够为更广泛的科学界所使用，而且极大地提高了它们在一般应用中的适用性。

图 1：PW 基下的深度学习 DFT 哈密顿量的思想及其在旋转双层石墨烯中的应用。（来源：论文）

将 PW 汉密尔顿量转换为 AO 基组的三种方法

该方法的实际工作流程为：一组小型非扭曲结构的 PW DFT 结果用于在 AO 基下重构汉密尔顿量。然后可以推广在这些重构汉密尔顿量上训练的神经网络来预测大型扭曲结构的汉密尔顿量。

PW 汉密尔顿量和 AO 汉密尔顿量实际上是在不同基组下表达的相同物理量。原则上，一旦有了 PW 汉密尔顿量，就可以通过改变基组来获得相应的 AO 汉密尔顿量，然后当前的 AO 汉密尔顿量神经网络可以灵活地学习该 AO 汉密尔顿量。

在此，研究人员简要讨论了将 PW 汉密尔顿量转换为 AO 基组的三种方法。

投影（projectio）方法被广泛用于弥合 PW 和 AO 之间的差距。其最初是为了评估 AO 基组的质量而开发的，投影方法可以修改为直接将哈密顿量从 PW 基转换为 AO 基：

这里，PW 基在 Born–von Kármán (BvK) 超晶胞中被归一化：，其中，k 是第一布里渊区中的波矢，G 是倒格矢，N 是形成 BvK 超晶胞的原始晶胞数，Ω 是原始晶胞的体积。AO 基函数 |ϕiα〉以原子 i 为中心。可能有多个基函数（标记为 n）共享相同的角动量量子数 l 和磁量子数 m。指标 α 是 n、l、m 的缩写。

方程 (1) 被称为 Hk(G, G′) 投影法。

如果得到了 PW 哈密顿量的特征值 εnk 和波函数 |ψnk〉，则方程 (1) 可以进一步写成：

方程 (2) 被称为 ψnk(G) 投影法。

虽然方程 (1) 和 (2) 是将 PW 哈密顿量转换为 AO 基的直接方法，但它们的计算效率较低。此外，它们都相对于系统中的原子数量以立方比例缩放，这限制了它们的应用范围。

事实上，可以利用实空间中的局部性来大大加快计算速度。原子单位下的实空间中的哈密顿量为：

其中，各个项分别对应于动能、Hartree 势、交换关联势以及伪势的局部和非局部部分。本研究仅考虑交换和关联的半局部函数。方括号中的三个项称为总有效局部势：，它在单位晶胞上是周期性的。一旦有了 H(r, r′)，就可以直接在实空间中计算 AO 哈密顿量，如下所示：

该方法称为实空间重构方法。

尽管它们在理论上是等效的，并且在收敛时会产生相同的结果，但所提出的实空间重构方法比前两种基于投影的方法效率高得多。

两个研究案例

应用于扭曲双层石墨烯

深度学习 DFT 汉密尔顿量方法最显著的能力是神经网络模型可以在小结构上进行训练，并推广到预测更大结构的汉密尔顿量。

在双层石墨烯的研究中，训练集由 300 个 4 × 4 双层石墨烯超晶胞组成，这些超晶胞具有不同的堆叠和每个原子位置的随机扰动。研究人员在根据 PW DFT 结果重建的 AO 汉密尔顿量训练神经网络模型后，可以使用该模型系统地研究具有任意扭曲角度的莫尔扭曲超结构。

首先，在训练集的一个结构上对重建的哈密顿量进行基准测试，将其能带结构与使用 PW 计算的能带结构绘制在一起。如图 1c 所示，两个能带结构非常吻合。

在训练神经网络模型后，用它来研究众所周知的「魔角」扭曲双层石墨烯，θ = 1.08°，莫尔超晶胞中有 11,164 个原子。有了深度学习 DFT 哈密顿量方法，计算成本可以大大降低。如图 1d 所示，与 PW DFT 基准相比，在重建的 AO 哈密顿量上训练的神经网络能够给出非常准确的预测，误差仅为几毫电子伏。

此外，当使用从 PW DFT 输出重建的 AO 汉密尔顿量训练神经网络时，预测的能带结构（图 1d 中的 PW-NN）与 Lucignano 等人的 PW DFT 结果相比，与使用 AO DFT 计算的汉密尔顿量（图 1d 中的 AO-NN）训练神经网络的情况相比，具有更好的一致性。

这表明与 PW DFT 接口的深度学习汉密尔顿量确实可以给出更高精度的结果。这种高精度与 PW 方法的灵活性和广泛适用性相结合，将大大增强深度学习从头计算的能力，并将对未来的研究大有裨益。

应用于双层 MoS2

接下来，在双层 MoS2 系统研究中比较了三种方法。首先，研究人员在由六个原子组成的 AB 堆叠双层晶胞上测试了重构方法，从重构的 AO 哈密顿量获得的能带结构与 PW DFT 结果非常吻合。然后，绘制了三种不同方法给出的能带结构，它们几乎相同，只是 ψnk(G) 投影方法给出的能带结构与其他两种方法略有不同，因为在方程 (2) 时仅使用了有限数量的能带。

图 2：应用 PW 基下的深度学习 DFT 哈密顿量研究扭曲双层 MoS2。（来源：论文）

然后，进一步比较了三种方法的计算时间。正如预期的那样，两种基于投影的方法显示出大致的立方缩放。它们甚至比完全自洽场计算更耗时。相反，由于 AO 基的局部性，实空间重建方法实现了线性缩放，并且可以比投影方法快几个数量级。

研究人员表示：「我们工作的一个直接影响是，使深度学习电子结构方法适用于那些已经熟悉 PW 方法但在 AO DFT 方面经验较少的人。另一个有前途的未来应用是，建立通用的深度学习模型，可以处理不同类型的材料并准确预测它们的电子结构。」

人工智能 × [ 生物神经科学数学物理化学材料 ]

「ScienceAI」关注人工智能与其他前沿技术及基础科学的交叉研究与融合发展。

欢迎关注标星，并点击右下角点赞和在看。

点击阅读原文，加入专业从业者社区，以获得更多交流合作机会及服务。

http://mp.weixin.qq.com/s?__biz=MzI3MjM3ODk0NQ==&mid=2247503201&idx=1&sn=2a493a39a998cd7c8c645d48c2b23c3b

ScienceAI

机器之心旗下媒体，关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展。

最新文章

普林斯顿王梦迪团队提出蛋白水印方法，助力AI蛋白生成的版权保护与安全

贝佐斯、OpenAI领投，给机器人装AI「大脑」的Physical Intelligence获4亿美元融资

精准预测RNA可变剪接，浙大多模态深度学习模型SpTransformer登Nature子刊

创新能力超越AI Scientist，上海AI Lab「AI 科研团队」VirSci来了

类GPT化学语言模型，9秒生成100种化合物，微软AI药物设计平台登Nature子刊

登Nature，AI设计DNA开关，MIT团队实现精确的细胞控制

分类准确率达99%，山大团队提出基于对比学习的基因数据分类方法

准确、高效、物理有效，中科大、北大提出「两段式」分子对接统一框架DeltaDock

丹麦首台AI超级计算机，NVIDIA技术加持，服务于量子计算、清洁能源、生物技术等领域

TMI2024 | 阿大、同济等提出TraCoCo，用于3D医学图像半监督分割

科学实验室走向全自动化，机器人融合AI，加速科学发现，Science子刊观点

不懂AI、不会编码？如何轻松拿捏AlphaFold准确预测蛋白结构

Nature 子刊，化学语言模型自动设计多靶点配体

AI 驱动化学空间探索，大语言模型精准导航，直达目标分子

AI搞科研？西湖大学发布「AI科学家」Nova，效果比SOTA竞品提升2.5倍

成功率提升15%，浙大、碳硅智慧用LLM进行多属性分子优化，登Nature子刊

1.1亿个结构DFT计算，Meta推出OMat24，AI驱动材料发现开源化

Nature子刊，北大陈语谦团队提出多模态单细胞数据整合和插补的深度学习方法

速度提高1000万倍，AI快速准确预测等离子体加热，助力核聚变研究

从结构准确预测蛋白质功能，东北大学「CNN+GCN」统一框架，优于现有方法

仅8B参数，可与GPT-4媲美，上交大团队构建多语言医学大模型

准确预测蛋白质功能，中山大学基于几何图学习的酶工程新方法

几秒完成化学反应，每天筛选上万反应，浙大、之江全自动高通量AI「机器人」

中国科学院核聚变最新进展，AI 加速等离子体参数预测

Nature子刊，香港浸大、英伟达团队多模态深度语言模型，用于复杂的宏基因组研究

AI 驱动的「科学搜索引擎」如何加速你的课题进度

水和算法有何相似？用物理学来理解大语言模型

化学空间导航仪：流生成式AI引导分子属性控制

AI发现超16万种新RNA病毒？阿里云、中山大学合作研究登Cell

化学诺奖为何颁给「AI+生物」，凭什么Baker独占一半？

快多个数量级，清华更高精度、更泛化的深度学习电子结构计算方法登Nature子刊

Nature子刊，基于量子实验数据进行机器学习，用于解决量子多体问题

AI再夺诺奖！2024诺贝尔化学奖授予蛋白质计算领域三位科学家

诺奖颁给交叉学科，对「AI for Science」意味着什么？

从预测风暴到设计分子，微软的 AI 基础模型如何加速科学发现

精准预测流产风险，上海交大等开发可解释AI算法，为早期预防带来希望

中国科学院团队发布GeneCompass：解析基因调控密码，打造干湿融合新范式

如何用生成式 AI 定义我们的未来？看看微软怎么说

更简单、更清晰，解析核酸、蛋白、细胞等结构，AI实现快速分子模式挖掘

Science 发文，高通量蛋白质组学和人工智能的革命

中国科大、科大讯飞团队开发ChemEval：化学大模型多层次多维度能力评估的新基准

灵巧的机器人，DeepMind推出两个基于AI的机器手系统和未知场景「生成式AI」应对策略

同时生成蛋白序列和结构，David Baker团队序列空间扩散新模型登Nature子刊

新「AI科学家」？MIT整合多智能体，实现材料科学研究自动化

OpenAI o1 在医学领域的初步研究，我们离 AI 医生更近了吗？

机器学习辅助催化剂设计，天大团队开发通用且可解释的描述符

中国科学院物理学家利用机器学习揭示原子核壳演化

Nature子刊，川大团队机器学习结合MD，预测蛋白质变构，助力药物研发

23亿参数，Transformer架构，NASA、IBM发布「天气+气候」通用AI模型Prithvi WxC

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉