DeepRelax源码链接:https://github.com/Shen-Group/DeepRelax
研究背景:解决大规模晶体结构弛豫的挑战:
在计算分子科学和材料科学领域,确定材料的平衡结构是后续性能计算的基础。然而,随着数百万新晶体和超大扭曲结构的发现,传统的计算方法(如从头计算或基于机器学习的迭代方法)面临巨大的挑战。现有方法需要通过繁重的迭代过程来优化结构,这使得这些方法在处理大规模晶体结构时表现出较差的可扩展性和较高的计算成本。
晶体结构弛豫通常是通过优化算法进行的,这包括密度泛函理论(DFT)等方法,它通过求解薛定谔方程来确定电子密度分布,并根据总能量的变化指导原子位置的调整。虽然这种方法在小规模系统中取得了成功,但当面对包含复杂化学反应表面、掺杂半导体界面或具有缺陷的大规模结构时,传统方法的计算负担显著增加。近年来,高通量的DFT计算与先进的机器学习算法加速了新材料的发现,但传统的迭代优化过程仍然制约着这些技术的应用。
主要研究成果:DeepRelax模型的提出与应用:
为了解决这些挑战,该研究团队提出了名为“DeepRelax”的新型深度生成模型。与传统的迭代优化方法不同,DeepRelax能够通过学习平衡结构的分布,直接从未弛豫的结构预测出弛豫后的晶体结构,而无需迭代。DeepRelax具备极高的计算效率,每个结构的弛豫过程可在毫秒级别完成,并且支持并行处理,大大提升了该模型在大规模虚拟筛选中的应用潜力。
DeepRelax的核心技术包括基于周期性边界条件的等变图神经网络(PaEGNN),该网络能够精确处理晶体中的周期性边界条件,直接预测弛豫结构中的原子间距离、初始与弛豫结构之间的位移,以及弛豫后的晶格参数。同时,DeepRelax还集成了不确定性量化功能,能够对每个预测结果的置信度进行评估。这使得该模型不仅高效,而且可靠,适用于材料发现中的大规模计算工作流。
研究团队通过对五个不同的数据集进行验证,展示了DeepRelax的准确性和高效性。这些数据集包括氧化物、Materials Project数据库、二维材料、范德华晶体以及包含点缺陷的晶体。DeepRelax在所有数据集中均表现出极高的可靠性,预测结果与DFT计算得到的结构高度一致。此外,DeepRelax的速度是当前主流的迭代机器学习模型(如M3GNet)的100倍以上,这为新材料的快速发现提供了强有力的工具。
值得注意的是,DeepRelax并非旨在完全替代DFT方法,而是作为预弛豫工具,使得预测结构非常接近DFT弛豫后的配置,进而显著减少DFT的后续优化步骤,特别是在复杂结构的弛豫过程中。
技术细节与应用场景:
DeepRelax模型的架构基于深度生成模型,结合了PaEGNN网络和欧几里得距离几何(EDG)求解器,能够快速确定满足预测弛豫量的结构。与现有的迭代优化模型相比,DeepRelax不仅在精度上有所提升,还通过并行处理能力解决了大规模计算任务中的可扩展性问题。
研究团队对多个不同类型的晶体材料进行了测试,包括三元氧化物、二维材料、范德华晶体以及带有点缺陷的结构。每个测试都验证了DeepRelax的有效性和普适性。尤其是在材料发现领域,DeepRelax可以在毫秒级别快速筛选大量未弛豫的晶体结构,这对高通量虚拟筛选至关重要。
在研究中,DeepRelax不仅显示出高效性,还展示了卓越的可扩展性。在计算规模上,研究人员估算使用DeepRelax对220万种新材料进行结构弛豫仅需大约4天,而现有的迭代方法则需要约400天。这种大幅的效率提升使得DeepRelax成为处理大规模材料数据库的理想选择。