DRUGAI
今天为大家介绍的是来自Yong Xu团队的一篇论文。杂化密度泛函计算对于精确描述电子结构至关重要,但由于计算成本巨大,其广泛应用受到了限制。作者开发了一种名为DeepH-hybrid的深度等变神经网络方法,用于学习杂化泛函哈密顿量与材料结构的关系。该方法避免了耗时的自洽场迭代,使得大规模材料的杂化泛函精度研究成为可能。广泛的实验表明,该方法具有良好的可靠性、有效的迁移性和高效性。作为一个重要的应用,DeepH-hybrid被用于研究大超晶胞的莫尔扭曲材料,首次探讨了精确交换对魔角扭曲双层石墨烯中平带的影响。此项工作将深度学习电子结构方法推广到了传统密度泛函理论之外,推动了基于深度学习的从头计算方法的发展。
密度泛函理论(DFT)的一个里程碑式发展是杂化泛函(hybrid functionals)的发明,最初作为局域密度近似或广义梯度近似(LDA/GGA)的一个修正提出,后来在广义Kohn-Sham框架中得到了更为严格的表述。相比传统的密度泛函,杂化泛函为解决DFT中的“带隙问题”(band-gap problem)提供了一条可行的路径,因此在可靠的材料预测中必不可少,尤其在计算研究光电学、自旋电子学、拓扑电子学等领域中非常有用。然而,杂化泛函在大规模材料模拟中的实际应用受到限制,因为其计算成本远高于局域和半局域DFT方法。为了降低计算负担并促进线性标度的杂化泛函计算,研究者们投入了大量精力改进数值算法。这虽然减少了计算开销,但并未从根本上改变从头计算的整体格局。
深度学习方法为从头材料模拟带来了革命性的突破。例如,使用人工神经网络来表示DFT哈密顿量,使得具有从头精度的电子结构计算变得高效,其计算成本与经验紧结合计算(empirical tight-binding calculations)相当。所谓的深度学习DFT哈密顿量(DeepH)方法已在大规模材料模拟中展示了强大的能力,适用于非磁性和磁性系统。然而,该方法最初是在Kohn-Sham(KS)框架内设计的。在这个框架中,深度学习问题由于交换-相关势的局域性而得到简化。相比之下,杂化泛函通常在广义Kohn-Sham(gKS)方案下进行,产生非局域交换势。鉴于深度学习方法依赖于局域性的特点,是否可以将相同的策略应用于gKS方案仍是一个重要的未解问题。
在这项工作中,作者发现杂化泛函的gKS-DFT哈密顿量可以通过类似于传统DFT的神经网络来表示,这得益于局域基上近视原则的保持。作者应用了深度E(3)-等变神经网络来将 建模为材料结构的函数(图1a),由此可以预测材料的电子结构和物理性质,而无需使用从头计算的代码。通过系统的数值实验测试,该方法展示了良好的性能,并进一步应用于研究莫尔扭曲超结构,如魔角扭曲双层石墨烯,展示了在大规模电子结构计算中达到杂化泛函精度的能力。此项工作为精确高效的材料模拟铺平了道路,也为发展超越DFT的深度学习电子结构方法开启了新的大门。
模型部分
图 1
这项工作中,作者基于数值原子轨道(numerical atomic orbital,NAO)基组,使用E(3)-等变深度学习DFT哈密顿量(DeepH-E3)方法来模拟从材料结构R到相应的杂化泛函DFT哈密顿量 DFT的映射(图1a)。每个材料结构都与一个图相关联,图中的每个顶点表示一个原子,顶点之间的边连接在一定截止范围内的原子。与顶点和边关联的特征向量通过神经网络迭代更新,最终的边特征用于构建输出的跃迁矩阵。更新顶点或边时只使用其邻域内的信息,从而利用近视性原理来预测哈密顿量。此外,由于哈密顿量在不同坐标系之间协变转换,构建明确处理哈密顿量协变性质的神经网络是最自然且有优势的。为实现这一点,神经网络的所有输入、输出和内部向量都根据O(3)群的不可约表示在坐标旋转和反演下转换。将局部性和对称性的要求作为先验知识纳入,极大提升了DeepH-E3的性能,使其达到了亚meV的精度并具有出色的泛化能力。
通过使用等变神经网络(ENN),DeepH-E3方法中的映射对三维空间中的欧几里得群(E(3)群)是等变的,该群由平移、旋转和空间反演组成,从而保持了基本对称性。为了在神经网络中实现等变性,DeepH-E3使用角量子数 lll 来标记每个网络特征。当输入结构发生空间旋转时,所有特征都会进行转换。DFT哈密顿量块 可以通过将具有相同p的轨道分组,划分为子块。结果子块是等变张量。根据Wigner-Eckart定理,等变张量与等变向量可以关联起来,哈密顿量子块被视为具有表示l1⊗l2的等变张量并相应构建。
DeepH-E3从l=0(标量)特征开始,通过嵌入原子序数和原子对之间的距离来初始化。原子对的相对方向也作为l=1, 2...的输入特征,通过对强制应用球谐函数来实现。对于空间反演的等变性,特征向量还根据它们的反演奇偶性标记为偶数(e)或奇数(o)。所有中间的ENN操作都被设计为保留特征的奇偶性。在所有训练中,神经网络由三个消息传递块组成,每个中间层有64×0e + 32×1o + 16×2e + 8×3o + 8×4e等变层。例如,64×0e代表64个偶数等变向量,对应l=0;32×1o代表32个奇数等变向量,对应l=1。原子配置信息被嵌入到64维等变向量中,作为初始的顶点和边特征。训练神经网络模型时选择哈密顿量矩阵元素的均方误差作为损失函数。数据集随机分为训练集、验证集和测试集,比例为6:2:2。
案例研究
图 2
为了展示DeepH-hybrid的能力,作者对多种材料系统进行了示例研究,包括石墨烯和MoS2的单层和双层。图2展示了DeepH-hybrid在研究单层石墨烯及相关系统中的表现。神经网络模型使用包含随机扰动石墨烯超晶胞结构的数据集进行训练,该模型将被推广用于研究新的石墨烯超晶胞结构以及碳纳米管(CNTs)。对于训练集、验证集和测试集,gKS-DFT哈密顿量矩阵元素的平均绝对误差(MAE)分别为0.207、0.208和0.208 meV。该MAE甚至比使用Perdew–Burke–Ernzerhof(PBE)交换-相关泛函进行的DeepH研究中的MAE(0.40 meV)还要小。测试集由100个扰动的石墨烯超晶胞组成,按MAE排序,图2a展示了对应于最佳、中位数和最差MAE的能带结构。所有能带结构都与基准计算高度一致,展示了DeepH-hybrid的高准确性。
此外,作者还使用训练好的神经网络模型研究了在训练集中未见过的弯曲几何结构的CNT,以测试该方法的泛化能力(见图2b)。如图2c所示,对于(49, 0) CNT,DeepH-hybrid和DFT-hybrid(即使用HSE杂化泛函的基准计算)在能带结构研究中取得了良好的一致性。杂化泛函相较于LDA/GGA的一个主要改进是对带隙的更好描述,这与光学性质密切相关。作者进一步使用文献59中开发的方法,分别使用从DFT-hybrid和DeepH-hybrid获得的gKS-DFT哈密顿量计算了电极化率。图2d展示了电极化率实部和虚部随光频率ω的变化。DeepH-hybrid的计算结果与DFT-hybrid的基准数据高度一致。所有这些都证明了作者的神经网络方法的可靠性。
接下来,作者将开发的方法应用于研究扭曲双层石墨烯(TBG)材料系统,TBG属于近年来备受关注的莫尔扭曲材料的一类。在TBG系统中,已经发现了多种有趣的关联相位,例如关联绝缘体、铁磁性和超导性。特别是理论上提出,扭转角 θ≈1.08°的TBG在费米能级附近具有超平带结构,因此被称为“魔角TBG”。使用广义梯度近似(GGA)中的PBE交换-相关泛函进行的DFT计算已经重现了魔角TBG的平带结构。然而,由于魔角TBG的莫尔单元包含11,164个原子,DFT-PBE研究本质上极具挑战性。理论上,更先进的杂化泛函方法可能会改进对电子结构的描述,但其计算成本远高于DFT-PBE。杂化泛函在描述中是否能保持平带特征是一个基本重要的问题,但由于计算挑战,此前未曾研究过。
图 3
DeepH-hybrid能够克服计算挑战,具体策略如下(图3a):首先使用包含非扭曲双层石墨烯小尺寸超晶胞的数据集训练神经网络,然后将训练好的神经网络模型应用于研究不同扭转角度的TBG,包括那些具有大尺寸莫尔结构的超晶胞。通过双层石墨烯数据集训练得到的DeepH-hybrid模型,其gKS-DFT哈密顿量矩阵元素的平均绝对误差(MAE)在训练集、验证集和测试集中分别为0.146、0.147和0.147 meV。如此低的MAE确保了能带结构预测的准确性,这已经通过对代表性测试结构的研究得到了验证。
作者进一步检查了DeepH-hybrid在计算不同扭转角度的TBG时的可靠性,重点研究了具有较小莫尔单元的系统,以便进行基准计算。图3b–d展示了(2, 1)TBG(扭转角度 θ≈21.79°,每个单元包含28个原子)、(3, 2) TBG(扭转角度 θ≈13.17°,每个单元包含76个原子)和(17, 16) TBG(扭转角度 θ≈2.00°,每个单元包含3,268个原子)的能带结构对比。需要注意的是,作者通过DFT-hybrid使用低标度算法在高计算成本下计算了最终TBG系统的基准数据。值得一提的是,(17, 16) TBG的DeepH-hybrid与低标度DFT-hybrid哈密顿量的MAE为0.179 meV,这与训练损失相当,展示了DeepH-hybrid对超大规模系统的泛化能力。在所有案例研究中,DeepH-hybrid预测的能带结构与通过DFT-hybrid计算得到的基准结果高度一致。
图3e对比了DFT-hybrid和DeepH-hybrid计算哈密顿量的CPU时间随系统规模(即每个超晶胞的原子数量)的变化。DFT-hybrid计算使用了ABACUS软件包中的线性标度算法。相比之下,DeepH-hybrid仍能将计算成本减少多个数量级,并且其计算时间大致随系统规模线性增长,展示了神经网络方法的高效性。更全面的时间成本分析(包括数据集准备和神经网络优化时间)。
得益于DeepH-hybrid的高精度和高效率,能够预测魔角TBG的杂化泛函电子结构(图3f)。图3g和图3h展示了参考文献63中结构松弛后的魔角TBG的PBE和HSE能带结构。PBE和HSE哈密顿量在费米面附近均有四个平带。与PBE能带结构相比,HSE能带结构的平带带宽从4.1 meV增加到了41.1 meV。此外,作者应用微扰理论计算了HSE和PBE哈密顿量的费米速度,分别得出=36.2和0.9m/s。根据计算结果,精确交换的引入显著削弱了魔角TBG平带的平坦性,可能对魔角TBG的平带物理产生定性的影响。
图 4
关于杂化泛函解决“带隙问题”的能力,作者进一步对单层和双层H-MoS2进行了示例研究(图4a、4b)。H-MoS2是过渡金属二硫化物的代表材料,这类材料因其新兴的物理现象而备受关注。预计HSE计算可以在电子带隙方面提供更高的精度,因此,这些计算能够为预测光学性质以及其他准粒子计算提供更坚实的基础。类似于石墨烯,作者构建了包含单层和双层H-MoS2的数据集,用于训练DeepH-hybrid模型。对于单层MoS2,预测的杂化泛函哈密顿量的最终MAE在训练集、验证集和测试集中分别为0.259、0.259和0.258 meV。DeepH-hybrid预测的代表性测试数据的能带结构汇总在补充图2中,与DFT-hybrid的能带结构匹配良好。对于双层MoS2,预测的杂化泛函哈密顿量的MAE在训练集、验证集和测试集中分别为0.266、0.266和0.265 meV,代表性测试数据的能带结构汇总在补充图3中。DFT-hybrid和DeepH-hybrid测试结构带隙的对比结果汇总在补充图4中。图4展示了DeepH-hybrid在MoS2案例研究中的稳健性。两个模型在测试集上的带隙平均误差为15.1和16.0 meV,比PBE和HSE泛函之间的带隙差异小了一个数量级。
图4c–f考察了从非扭曲双层MoS2到扭曲结构的泛化能力。DeepH-hybrid预测的(2, 1)和(3, 2)扭曲双层MoS2的能带结构及电极化率与DFT-hybrid的结果高度一致。DeepH-hybrid的高效性使其能够应用于莫尔扭曲MoS2超晶胞结构。图4g展示了一系列(n, n-1)扭曲双层MoS2的带隙。在所测试的扭曲角度中,带隙变化最大达到70 meV。在具有大莫尔单元的扭曲MoS2中可以观察到平带。图4h汇总了最上层占据带的带宽及其在Γ点的有效质量。这些材料的能带结构由DeepH-hybrid预测,汇总在补充图5中。图4i展示了一个具有平价带的代表性能带结构。
编译|黄海涛
审稿|王梓旭
参考资料
Tang, Z., Li, H., Lin, P., Gong, X., Jin, G., He, L., ... & Xu, Y. (2024). A deep equivariant neural network approach for efficient hybrid density functional calculations. Nature Communications, 15(1), 8815.