|作者:赵纪军
(华南师范大学物理学院)
本文选自《物理》2024年第7期
摘要 近年来,计算机算力的飞速提升推动了科学计算和人工智能领域的突破性进展。这两个领域深度融合,共同催生了数据驱动的变革性科学研究范式。作为人工智能技术的代表,机器学习为材料的计算设计带来了前所未有的发展机遇,当前的应用方向主要包括性质预测、合成预测、知识发现、生成式逆向设计等。文章将简要介绍该领域的研究进展,并展望未来发展方向与挑战。
关键词 机器学习,材料设计,材料合成,生成模型
长久以来,新材料的研发主要依赖试错法,这种传统的研究范式不仅耗时费力,而且成本高昂。20世纪中叶起,随着蒙特卡罗方法、分子动力学和密度泛函理论(DFT)等计算物理方法的发展及其在不同材料体系中的应用,计算材料学逐渐成型,并广泛应用于信息技术、能源、化工、生物医药、航空航天等领域,成为探索物质世界、研发新材料的重要工具。近年来,随着计算材料学和人工智能(AI)快速发展,基于机器学习的材料设计逐渐成为可能[1]。机器学习算法能够处理复杂的非线性关系,发现高维数据中的模式和规律,自动从数据中提取隐藏的关键特征,并且具备较强的泛化能力和迭代优化能力。这些优势与材料研究天然匹配,有望解决材料科学中设计空间巨大、构效关系复杂等关键共性难题。
自机器学习被应用于物质科学研究以来,该技术就被广泛用于预测晶体材料的各种性质,如形成能[4—12]、力学性质[5,9,12—15]、热学性质[12—14,16]、能隙[5,6,9,10,12,17]、超导电性[6,18,19]、磁学性质[10,20—23]等。
与预测材料性质相比,预测材料的可合成性、合成路径、合成条件更具挑战性[30—32]。多年来,计算材料学家预测了大量的新材料,然而最终能够被实验成功合成的比例并不高。
材料研究涉及大量的文献、专利和技术报告,其中包含着丰富的知识和数据。然而,这些信息往往以自然语言形式分散在各种来源中,这使得传统的信息检索和数据分析方法难以高效地整合和挖掘这些信息。作为机器学习的一个重要分支,自然语言处理(NLP)模型能够理解和处理复杂的语言结构,帮助材料科学家自动提取文献中的关键信息,包括材料的性质、合成方法、实验条件等,从而加速材料研发的进程[33—38]。
以功能为导向的材料逆向设计,始终是材料研究者们孜孜以求的目标。当前,AI算法的发展正在从传统的“决策式模型”逐步演进为更具创新性的“生成式模型”。关于生成式模型的基本概念,可以参考本刊上一期王磊、张潘老师撰写的《写给物理学家的生成模型》[39]。在近两年里,生成式语言大模型GPT-4和视频大模型Sora的卓越表现,彰显了生成式AI模型的无限潜力,进一步鼓舞了研究者探索材料科学领域的生成式模型[40—48]。
图5 面向光电应用的直接窄禁带半导体的逆向设计工作流程。流程始于在MP数据库上训练一个通用的循环神经网络(RNN),以学习SLICES的语法,之后通过使用直接窄禁带半导体数据集对通用RNN进行调整来训练一个专门的RNN。然后,利用专门的RNN生成了约1000万个SLICES字符串,这些字符串被重建成约340万个晶体结构。这些晶体结构经过筛选,以识别新的直接窄禁带半导体[43]
毫无疑问,数据驱动的机器学习技术正在为材料科学领域带来前所未有的创新活力。尽管在材料设计上已经取得了较大的进展,但仍然存在以下几方面的问题有待于深入研究。
(参考文献可上下滑动查看)
物理与人工智能专题
我对吴有训、叶企孙、萨本栋先生的点滴回忆 | 《物理》50年精选文章
国立西南联合大学物理系——抗日战争时期中国物理学界的一支奇葩(Ⅰ) | 《物理》50年精选文章
国立西南联合大学物理系——抗日战争时期中国物理学界的一支奇葩(Ⅱ) | 《物理》50年精选文章
原子核裂变的发现:历史与教训——纪念原子核裂变现象发现60周年 | 《物理》50年精选文章
回顾与展望——纪念量子论诞生100周年 | 《物理》50年精选文章
中国理论物理学家与生物学家结合的典范——回顾汤佩松和王竹溪先生对植物细胞水分关系研究的历史性贡献(上) |《物理》50年精选文章
中国理论物理学家与生物学家结合的典范——回顾汤佩松和王竹溪先生对植物细胞水分关系研究的历史性贡献(下) |《物理》50年精选文章
为了忘却的怀念——回忆晚年的叶企孙 | 《物理》50年精选文章
从分子生物学的历程看学科交叉——纪念金螺旋论文发表50周年 | 《物理》50年精选文章
美丽是可以表述的——描述花卉形态的数理方程 | 《物理》50年精选文章
一本培养了几代物理学家的经典著作 ——评《晶格动力学理论》 |《物理》50年精选文章
熵非商——the Myth of Entropy |《物理》50年精选文章
普渡琐记——从2010年诺贝尔化学奖谈起 |《物理》50年精选文章
天气预报——由经验到物理数学理论和超级计算 | 《物理》50年精选文章
纪念Bohr的《伟大的三部曲》发表100周年暨北京大学物理专业建系100周年 | 《物理》50年精选文章
凝聚态材料中的拓扑相与拓扑相变——2016年诺贝尔物理学奖解读 |《物理》50年精选文章
通用量子计算机和容错量子计算——概念、现状和展望 | 《物理》50年精选文章
谈书说人之一:《理论物理学教程》是怎样写成的?| 《物理》50年精选文章
时空奇点和黑洞 ——2020年诺贝尔物理学奖解读 |《物理》50年精选文章
凝聚态物理学的新篇章——超越朗道范式的拓扑量子物态 | 《物理》50年精选文章
对于麦克斯韦方程组,洛伦兹变换的低速极限是伽利略变换吗?| 《物理》50年精选文章