研究背景:
晶体结构预测(Crystal Structure Prediction, CSP)在材料科学中扮演着关键角色,它可以帮助科学家从化学组成出发,探索材料的晶体结构,并预测其稳定性和物理性能。然而,传统的CSP方法,如USPEX、CALYPSO等,通常依赖进化算法进行晶体结构的探索和优化,这些方法虽然可以有效预测材料的稳定性,但在面临大尺度相空间的情况下会遭遇计算开销高、效率低等问题。
为了解决这些问题,近年来,生成模型逐渐成为材料生成和探索的热门方法。生成对抗网络(Generative Adversarial Network, GAN)等生成模型通过编码材料复杂的高维化学空间,将其简化为低维连续向量空间,并利用潜在空间中的知识生成新的数据。这种生成方式不仅能够有效捕捉材料的结构特征,还能通过优化潜在空间来提高生成结构的多样性。然而,生成晶体结构的过程中,GAN面临着"模式坍塌"的问题,导致生成的结构缺乏多样性和创新性。
主要研究结果:
本研究提出了一种新型的基于生成对抗网络的晶体结构预测模型,称为GAN-DDLSF(Generative Adversarial Network with Data-Driven Latent Space Fusion)。该模型结合了数据驱动的潜在空间融合(Data-Driven Latent Space Fusion, DDLSF)策略,通过将真实数据的统计特性与标准高斯分布相融合,优化了GAN的潜在空间,有效缓解了传统GAN中常见的“模式坍塌”问题。
GAN-DDLSF模型通过数据驱动的潜在空间融合策略,利用主成分分析(PCA)提取真实晶体结构的关键特征,并与GAN生成器的高斯噪声输入相结合,构建改进的潜在空间表示。这种融合方式不仅保留了真实晶体结构的主要变化特征,同时引入适度的随机性,从而生成既多样又符合物理规律的晶体结构。
在晶体结构的生成过程中,GAN-DDLSF模型通过连续的晶格参数和分数原子坐标表示,避免了传统方法中因对称性反演约束而带来的局限性,使得生成的结构在几何形态和化学成分上更接近真实晶体。
研究团队以氮化镓(GaN)为示例,采用GAN-DDLSF模型生成了9321种二元晶体结构,其中16.59%的结构达到稳定状态,24.21%的结构被评估为亚稳态。通过高通量的第一性原理计算对这些结构进行了验证,证明模型具有较高的生成精度和效率。