自古以来,材料科学的研究从归纳、实验发展到今天的计算模拟,现在又随着人工智能的发展,人们正在以机器学习的方法来预测或研究材料科学,以造福人类。
机器学习,通过AI的模式识别、数据挖掘、统计、视觉识别、语音识别以及自然语言处理等功能来丰富自己的知识图谱,准确的说,让机器获得新知识和技能,并服务人类。机器学习的逻辑是通过历史数据训练出模型,对新数据进行预测,提出新数据的潜在规律。
为何要机器学习,是因为材料科学的某些领域的数据量足够大,在实验的基础上,人们已经建立了数据库,大量的数据造成了归纳的难度,但大量的数据之间的关联性是潜在的,而且复杂度高。
如此高的复杂度,起源于第一性原理。第一性原理中包含量子力学、物理常数、元素周期表等,是第一级复杂度;第一性原理决定材料的化学结构,如组成、键合、尺寸等,这是第二级复杂度;而材料的化学结构又决定材料的物化特性,如力学、电学、热学、光学等特性,这是第三级复杂度;而材料的物化特性又决定材料的应用,如能源、工业等,这是第四级复杂度。从第一性原理到材料的实际应用,依次递增的复杂度,给从设计特定应用的材料带来了极大的难度。
机器学习要干的事是,破解复杂度找到第一性原理到材料应用的关联,精准预测材料的设计与应用。最常见的例子就是多元素合金的开发。基于第一性原理的计算得到n组合金的组分结构的数据库,采用已知的实验算法对合金特定的应用场景条件进行计算,进行仿真模拟,建立映射关系,构建神经网络模型,并为实际实验提供参考,这是已经工业化应用的例子,带来了巨大的收益。
建立模型是大量实验数据的重大意义。随着科技的发展,人们已经开发出了机器科学家。机器科学家拥有高度的人工智能,基本可以读取人类目前发表的实验数据,并进行高复杂度的模拟,建立非常清晰的逻辑关系、知识图谱和数据库,根据可随机调用的逻辑关系、知识图谱和数据库建立理论模型,来模拟期望的实验条件。最后,机器科学家可以自动化实验,去试错,获得实验数据。机器科学家可以建立合成、表征以及测试的自动化工作站,获取数据。新的数据再进入数据库,二次学习,再建立更完善的模型。
机械臂、机器人是机器科学家的重要模块,通过改装现有的实验仪器,包括天平(称量系统)、电化学工作站、测试仪器等,给它们进行系统化和自动化,通过机器发送代码指令就可以一体化运行。
机器科学家的最有前景之一的应用就是生命科学领域。从DNA到肽链,肽链折叠形成蛋白质,也就是从DNA代码到蛋白质的复杂度的挑战。在未来,合成高强度合金、预测未知物质的结构、开发新型催化剂、研发固态电解质、全自动化学合成、预测物质的光谱信息、预测细胞的特殊机制、预测复杂化学反应的机制以及预测负载晶体的结构等都亟待探索。