通讯作者:岑剡,张浩
通讯单位:复旦大学
内容简介
通过机器学习加速新型晶体材料的发现对于推动从清洁能源到信息处理等各种技术的发展至关重要。用于预测材料特性的机器学习模型需要嵌入原子信息,而传统方法在提高预测精度方面效果有限。在本文中,作者提出了一种称为通用原子嵌入 (UAE) 的原子嵌入策略,因为它们作为原子指纹具有广泛的适用性,并基于提出的 CrystalTransformer 模型生成了 UAE 张量。通过在广泛使用的材料数据库上进行实验,基于 CrystalTransformer 的 UAE (ct-UAE) 被证明能够准确捕捉复杂的原子特征,当基于 Materials Project 数据库以形成能为目标时,CGCNN 上的预测精度提高了 14%,ALIGNN 上的预测精度提高了 18%。作者还证明了 ct-UAE 在各种数据库之间的良好可移植性。基于多任务 ct-UAE 的聚类分析,可以对元素周期表中的元素进行分类,并合理关联原子特征和目标晶体特性。在应用 ct-UAE 预测杂化钙钛矿数据库中的形成能后,实现了准确度的提升,MEGNET 的准确度提升了 34%,CGCNN 的准确度提升了 16%,展现了它们作为原子指纹解决数据稀缺挑战的潜力。Nat. Commun. 2025, 16, 1210
DOI:10.1038/s41467-025-56481-x
链接:https://doi.org/10.1038/s41467-025-56481-xData:https://doi.org/10.5281/zenodo.14557908
Code:https://github.com/fduabinitio/ct-UAE