DRUGAI
功能材料的设计对于推动能源存储、催化和碳捕获等领域的技术进步至关重要。生成模型通过在给定目标属性约束的情况下直接生成新型材料,为材料设计提供了一种全新的范式。然而,现有方法在提出稳定晶体方面成功率较低,或者只能满足有限的属性约束。在此,微软研究院提出了MatterGen,一种能够跨周期表生成稳定且多样化无机材料的模型,并可以进一步通过微调,针对广泛的属性约束定向生成材料。与以往的生成模型相比,MatterGen生成的结构在新颖性和稳定性方面的可能性提升了两倍以上,并且在接近局部能量最低点的程度上提高了超过10倍。经过微调后,MatterGen能够成功生成具备目标化学组成、对称性,以及机械、电子和磁性等属性的稳定新材料。作为概念验证,研究人员合成了其中一种生成的结构,并测量其属性值与目标值的偏差在20%以内。我们相信,MatterGen在生成材料质量及能力广度方面的显著进步,标志着朝着构建材料设计基础生成模型迈出了重要一步。
引言
材料发现的速度对碳捕获、半导体设计和能源存储等领域的技术创新步伐有着重要影响。传统上,大多数材料是通过实验和人类直觉发现的,这限制了可测试候选材料的数量,并导致较长的迭代周期。得益于高通量筛选、开放材料数据库、基于机器学习的属性预测器和机器学习力场的发展,如今可以筛选数十万种材料以识别潜在的候选物。然而,基于筛选的方法在根本上仍受限于已知材料的数量。目前对未知晶体材料的最大探索范围仅达到 10⁶ 至 10⁷ 种材料,这仅是潜在稳定无机化合物数量的一小部分。此外,这些方法难以高效地针对目标属性寻找材料。
鉴于这些局限性,材料逆向设计引起了广泛关注。逆向设计的目标是直接生成满足目标属性约束的材料结构,例如通过生成模型、进化算法和强化学习等方法。生成模型因其能够高效探索新结构并灵活适应不同下游任务而备受期待。然而,目前的生成模型在生成符合密度泛函理论(DFT)计算的稳定材料方面表现不足,受限于有限的元素子集,或仅能优化非常有限的属性集,主要集中在形成能量上。
本研究中,研究人员提出了MatterGen,一种基于扩散的生成模型,能够跨周期表生成稳定且多样的无机材料,并支持针对广泛的下游任务进行微调以实现材料逆向设计。为实现这一点,研究人员引入了一种扩散过程,通过逐步优化原子类型、坐标和周期性晶格来生成晶体结构。此外,研究人员还设计了适配器模块,支持对目标化学组成、对称性以及磁性密度等标量属性的约束进行微调。与以往的先进生成模型相比,MatterGen 生成的稳定、独特、新颖(S.U.N.)材料的比例提升了两倍以上,并且生成的结构比此前模型更接近其基于 DFT 的局部能量最低点。
MatterGen 广泛的条件生成能力使其能够针对更广泛的问题进行材料逆向设计。经过微调后,MatterGen 在目标化学系统中生成 S.U.N. 材料的数量通常超过了替代法和随机结构搜索等传统方法,能够根据目标空间群生成高度对称的结构,并直接生成满足目标机械、电学和磁性属性约束的 S.U.N. 材料。此外,MatterGen 还能够在多个属性约束下设计材料,例如高磁性密度和低供应链风险的化学组成。
作为概念验证,研究人员合成了一种由 MatterGen 生成的材料,并测量其属性值与目标值的偏差在 20% 以内。这一结果验证了 MatterGen 的设计能力,展示了其在材料设计领域的广泛应用潜力。
一种新颖的扩散架构
MatterGen 是一种作用于材料三维几何结构的扩散模型。类似于图像扩散模型通过调整噪声图像中像素的颜色根据文本提示生成图片,MatterGen 通过调整随机结构中的原子位置、元素类型和周期性晶格来生成候选结构。该扩散架构专为材料设计而打造,能够处理周期性和三维几何等特性。
MatterGen 的基础模型在生成新颖、稳定且多样化的材料方面达到了当前最先进的性能(图 3)。该模型基于来自 Materials Project (MP) 和 Alexandria (Alex) 数据库的 608,000 个稳定材料进行训练。性能的提升既得益于架构的改进,也得益于训练数据的高质量和大规模。
MatterGen 可以通过带标签的数据集进行微调,以在任何给定条件下生成新材料。研究人员展示了基于目标的化学组成和对称性,以及电子、磁性和机械属性约束生成新材料的示例(图 2)。
超越筛选方法
一幅图表对比了 MatterGen 和传统筛选方法在生成具有大于 400 GPa 体积模量的稳定、独特且新颖结构任务中的表现。图表显示,筛选方法发现的此类结构数量在约 40 处趋于饱和,而 MatterGen 的数量随着 175 次密度泛函理论(DFT)计算的增加持续上升,超过 100。
MatterGen 相较于筛选方法的关键优势在于其能够探索未知材料的完整空间。例如,在图 4 中,研究人员展示了 MatterGen 可以持续生成更多具有高于 400 GPa 体积模量(例如难以压缩)的新候选材料,而筛选方法由于已知候选材料的枯竭而趋于饱和。
实验室验证
除了广泛的计算评估,研究人员还通过实验合成验证了 MatterGen 的能力。研究人员与中国科学院深圳先进技术研究院(SIAT)的李文杰教授团队合作,合成了一种新材料 TaCr₂O₆,其结构由 MatterGen 在设定体积模量目标值为 200 GPa 的条件下生成。合成材料的结构与 MatterGen 提出的结构一致,仅在 Ta 和 Cr 之间存在组成无序。此外,实验测得的体积模量为 169 GPa,与设计规格的 200 GPa 相比,相对误差低于 20%,从实验角度来看非常接近。如果类似结果能推广到其他领域,将对电池、燃料电池等的设计产生深远影响。
参考资料
Zeni, C., Pinsler, R., Zügner, D. et al. A generative model for inorganic materials design. Nature (2025).
https://doi.org/10.1038/s41586-025-08628-5