上海大学张统一院士团队JMI最新研究论文 | 人工智能晶体生成器:CGWGAN

文摘   2024-11-17 16:00   陕西  

题目:CGWGAN: crystal generative framework based on Wyckoff generative adversarial network

作者:Tianhao Su, Bin Cao, Shunbo Hu, Musen Li, Tong-Yi Zhang*

DOI: 10.20517/jmi.2024.24

Citation: Su, T.; Cao B.; Hu S.; Li M.; Zhang T. Y. CGWGAN: crystal generative framework based on Wyckoff generative adversarial network. J. Mater. Inf2024, 4, 20. http://dx.doi.org/10.20517/jmi.2024.24


导读


材料由晶体、准晶体和非晶体组成。发现新晶体是先进材料研究的重要一环,即具有深远的学术意义,更蕴含着无限的应用潜力。荣获2024年化学诺奖的人工智能蛋白质模型AlphaFold2可以生成2亿种蛋白质结构。同样地,人工智能晶体生成器可以生成大量的新晶体,成了快速发现晶体的利器。本文介绍了一种基于群论对称约束和对抗生成网络的创新晶体生成器——CGWGAN,它以普适性的设计,为新晶体结构的高效发现提供了一个知识驱动的人工智能解决方案。


正文


晶体,作为自然界中物质存在的一种基本形态,以其独特的原子排列结构,在物理、化学、生物学等多个学科领域中占据着举足轻重的地位。它们不仅是科学研究的焦点,也是现代技术中不可或缺的基石。然而,传统的晶体发现方法即成本高昂又周期漫长。为了应对这一挑战,本研究提出了一种基于Wyckoff生成对抗网络的晶体生成模型——CGWGAN。



图1.CGWGAN的三个核心模块。


图1展示了CGWGAN的晶体生成模型,它由三个核心模块构成:晶体模板生成、元素填充,以及代理模型 (M3GNet) 进行能量和声子计算,最终生成的结构还需经过第一原理计算的进一步验证。在晶体模板生成模块中,采用了不对称单元(𝒜)、空间群(𝒢)和晶格常数(𝒧)三元组概念。


CGWGAN在生成高质量晶体结构模板方面表现出色,这种合成模板与真实晶体之间的分布相似性可以通过分析得到验证。图2(a)通过分析原子数密度分布,我们发现生成模板与Materials Project (MP)数据库的分布具有高度的一致性。此外,图2(b)展示了潜在空间特征的t-SNE图,进一步证实了合成模板结构在CGWGAN判别器中的隐空间向量与真实晶体的分布极为接近。



图2. (a) 合成数据库与MP数据库的分布对比;(b) 判别器隐藏层中生成和真实结构向量的t-SNE降维可视化。


图3展示了7个新发现晶体的第一性原理计算出的声子谱,对应的空间群号分别为:(a)1,(b)25,(c)35,(d)71,(e)99,(f)123,(g)166。CGWGAN严格遵循对称约束,能够区分并生成在实空间中细微差别的结构,例如99号和123号空间群在XRD模拟谱分析中仅有细微区别,但从不对称单元分析则是完全不同的晶体。



图3. Ba-Ru-O体系中生成样品的稳定声子谱。


CGWGAN还展现出了发现超氧化物的能力。以图3中的结构(a)为例,图4(a)展示了BaRuO₆不可约晶格胞中的电荷密度等值面,其中包括一个Ba原子、一个Ru原子和六个O原子。图4(b)展示了相应的电子能带结构,揭示了O2-O6和O1-O5之间的O原子有明显的电子云重叠,而O3和O4没有与其他O原子进行明显的电子交换,获得了更多的有效电荷。此外,电子能带结构中费米能级附近的能带主要由O原子贡献,Ru原子的贡献较小,而Ba则处于深能级。



图4. (a) BaRuO₆不可约晶格胞内的等值面电荷密度;(b) 结构对应的能带结构。


展望


CGWGAN表现出了生成满足目标晶系和空间群的高效能力。本文使用的对抗神经网络也可以被包括变分自动编码器、扩散模型在内的一系列生成式机器学习算法所代替。未来的研究方向应更加注重科学和工程实践中对材料性能的需求,由此来设计和生成晶体,也要更加注重如何制备这些生成的新晶体。

通讯作者介绍



张统一教授,中国科学院院士,香港工程科学院院士,材料科学与固体力学专家,中国材料基因组工程、材料信息学和力学信息学的推动者,上海大学材料基因组工程研究院创院院长,中国材料学会材料基因组工程分会首任主任,香港科技大学(广州)广州市材料信息学重点实验室主任,Journal of Materials Informatics 主编,国际断裂学会副主席。他大力推动材料信息学、材料/力学GPT、材料/力学多模态大模型、AI4S(AI for science) 和 AI4M (AI for materials) 的发展。AI4S包含“硬件”和“软件”两方面。“硬件”指AI实验机器人和AI实验室;“软件”涵盖 AI算法及AI和其它计算相融合的各种算法。AI4S必须夯实“硬件”和“软件”两方面。专家知识指导下可解释性机器学习强调专家知识和数据驱动的无缝紧密结合,是夯实“硬件”和“软件”的法宝。


关于期刊


期刊主页

微信公众号


Journal of Materials Informatics(Online ISSN: 2770-372X)是聚焦材料信息学领域的国际英文学术期刊。于2021年4月由OAE Publishing Inc. 正式创刊,由中国科学院院士、香港工程科学院院士、上海大学材料基因研究院院长张统一教授担任创刊主编,由俄罗斯自然科学院外籍院士、哈尔滨工业大学(深圳)材料基因与大数据研究院院长刘兴军教授担任执行主编。期刊目前共有51位编委,包含国内外院士10名;以及64位青年编委。期刊已被ESCI, CAS, CNKI, Dimensions, ResearchGate, Lens, J-Gate收录,将在2025年6月获得首个影响因子。


期刊旨在通过紧密集成和智能化的方式将理论、实验、计算和人工智能协同结合,以推进和加速材料发现、设计和部署的步伐。期刊为研究人员提供了一个展示、发表和交流材料信息学相关研究的平台,寻求打破材料科学与工程、数据科学与工程及人工智能之间的壁垒。欢迎领域学者的来稿!


期刊主页:https://www.oaepublish.com/jmi

投稿地址:https://oaemesas.com/login?JournalId=jmi

联系编辑:editorialoffice@jmijournal.com


* 本文内容由作者提供,编辑部整理,一切以英文原版为主。

欢迎添加小编微信 

备注“姓名+单位+研究兴趣”邀请加入JMI读者群

OAE开放科学
OAE Publishing Inc.于2015年在美国洛杉矶成立,是一家多学科的开放获取出版公司,以“传播科学研究、促进科学创新”为使命。目前已出版了覆盖医学、机械、信息、生物、化学等学科的数本学术期刊,获得全球众多权威专家、机构的认同。
 最新文章