机器学习材料专题
在材料科学的浩瀚领域中,机器学习正逐步展现其作为变革性工具的学术潜力。随着材料设计空间的不断扩展,传统的研究方法在面对复杂多变的材料性质与结构时,往往显得力不从心。机器学习技术的引入,为这一困境提供了全新的解决方案,其强大的数据处理与分析能力,正引领着材料科学向更加精确、高效的研究范式转变。
在学术研究的视角下,机器学习通过深入挖掘材料数据中的隐藏规律,为材料性能的预测与优化设计提供了强有力的支持。通过构建复杂的数学模型,机器学习算法能够处理并解析大规模、高维度的数据集,揭示出材料性质与结构之间的内在联系。这一过程不仅促进了材料科学理论的深化,还为新材料的开发与应用提供了坚实的理论基础。
此外,机器学习在材料设计中的应用,更是体现了其智能化的特点。基于预设的性能指标,机器学习能够智能地生成材料设计方案,并通过迭代优化不断逼近最优解。这种智能设计的方法不仅提高了材料研发的效率和成功率,还推动了材料科学研究的创新与发展。通过减少试错成本,加速材料性能的验证与优化,机器学习为材料科学家提供了更加高效、精准的研究工具。
在学术界,机器学习在材料科学中的应用已经取得了显著的成果。从金属材料的性能优化到新能源材料的开发,从有机材料的合成设计到生物医用材料的创新应用,机器学习都展现出了其独特的优势和潜力。这些研究成果不仅推动了相关领域的学术进步,也为材料科学的未来发展奠定了坚实的基础。
综上所述,机器学习在材料科学中的应用,不仅是对传统研究方法的革新与超越,更是对材料科学学术研究的深度挖掘与拓展。随着技术的不断进步和应用的不断深入,我们有理由相信,机器学习将在材料科学领域发挥更加重要的作用,推动这一学科向更加繁荣、发展的方向迈进。
学习目标
机器学习材料目标:1.掌握Python编程基础及其在科学计算中的应用:学会利用Python进行数据处理、模型构建与可视化,熟悉NumPy、Pandas等工具。
2.理解材料与化学中的机器学习方法:掌握线性回归、逻辑回归、决策树、支持向量机等常见算法的基本原理与应用。
3.应用机器学习解决材料科学问题:通过项目实践,深入理解数据采集、特征选择、模型训练与评估等步骤,学会使用sklearn等工具库完成任务。
4.了解材料数据的特征工程与数据库应用:学习如何表示分子结构与晶体结构,并了解常见材料数据库的使用方法。
5.提升实战能力并引导深入学习:通过多样化的项目实践案例,巩固课程内容,为后续深度学习等更复杂算法的学习打下基础。
深度学习材料目标:1.理解深度学习与材料科学的结合点:掌握深度学习在材料特征工程和化学中的应用,了解当前研究的前沿方向。
2.熟练使用材料数据库与工具库:学习材料基因组的基本方法,并熟练掌握Material Project、Pymatgen、ASE等常见数据库及工具库的使用。
3.掌握常见深度学习算法的原理与应用:深入理解卷积神经网络、时序神经网络、生成模型及图神经网络的工作原理及其在材料研究中的具体应用。
4.培养实战能力:通过动手实践,包括深度学习框架Pytorch和Pytorch Lightning的使用、卷积神经网络在材料图像识别中的应用、基于Transformer的属性预测模型构建、生成对抗网络和变分自编码器在材料生成中的应用等,提升解决材料研究实际问题的能力。
机器学习分子动力学目标:本次授课内容包括快速上手量化软件、入门和理解机器学习,熟练运用LAMMPS模拟软件,精通机器学习力场模型等,并附带大量相关代码与示例脚本。本次课不仅带来生态最完善的DeePMD系列软件的详解和使用,还将带来机器学习力场领域具有超高数据效率的等变模型(NequIP/MACE/Allegro),从而显著减轻高昂的数据生产成本。此外,还有机器学习力场领域的ChatGPT产品——开箱即用、免费开源的通用大模型(MACE-OFF23,MACE-MP0,DPA等)的使用与微调技巧。
机器学习材料专题
深度学习材料专题
机器学习分子动力学专题
机器学习锂离子电池专题(五天内容详情点击名称查看)
深度学习超材料逆向设计专题(五天内容详情点击名称查看)
讲师介绍:
机器学习材料专题和深度学习材料专题主讲老师张老师来自国内“985工程”顶尖高校材料物理与化学专业,长期从事材料科学、机器学习,未来互联网与命名数据网络,量子力学等领域。在多个国际高水平期刊上发表 SCI检索论文15余篇。国家发明专利一项,他的授课方式深入浅出,能够将复杂的理论知识和计算方法讲解得清晰易懂,受到学员们的一致认可和高度评价!
机器学习分子动力学主讲老师来自国内高校陈老师授课,已发表SCI论文近20余篇,研究方向为基于机器学习的分子动力学模拟,包括 构建高效、高精度的AI分子力场模型,采用主动学习或大模型的知识蒸馏方法来获取高质量训练数据集, 开发基于C++的高性能的多GPU并行的LAMMPS的插件。熟知各种AI模型DeePMD, SchNet, DimeNet, SphereNet, DPA2和等变系列模型的Nequip, MACE, Allegro等,精通所有量子化学软件!
机器学习材料专题
材料机器学习概述与python基础
【理论内容】
1. 机器学习概述
2. 材料与化学中的常见机器学习方法
3. 应用前沿
【实操内容】
1)Python基础
1)开发环境搭建
2)变量和数据类型
3)控制流
2)Python基础(续)
1)函数
2)类和对象
3)模块
3. Python科学数据处理
1)NumPy
2)Pandas
3)绘图可视化
4)文件系统
第二天:常见机器学习方法与实践1
【理论内容】
1. 线性回归
1)线性回归的原理
2)线性回归的应用
2. 逻辑回归
1)逻辑回归的原理
2)逻辑回归的应用
3. K近邻(KNN)
1)K近邻的原理
2)K近邻的应用
4. 感知机(浅层神经网络)
1)感知机的原理
2)使用感知机进行回归
3)使用感知机进行分类
【实操内容】
1. 线性回归的实现与初步应用
2. 逻辑回归的实现与初步应用
3. K近邻的实现与初步应用
4. 感知机的实现与初步应用
【项目实操内容】
1. 机器学习对CO2催化活性的预测|机器学习入门简单案例 【文章】
1)机器学习材料与化学应用的典型步骤
a)数据采集和清洗
b)特征选择和模型选择
c)模型训练和测试
d)模型性能评估和优化
2)sklearn库介绍
a)sklearn库的基本用法
b)sklearn库的算法API
c)sklearn库的模型性能评估
第三天 常见机器学习方法与实践2
【理论内容】
1. 决策树
1)决策树的原理
2)决策树的应用
2. 集成学习
1)集成学习的原理
2)集成学习的方法和应用
3. 朴素贝叶斯
1)朴素贝叶斯的原理
2)朴素贝叶斯的应用
4. 支持向量机
1)支持向量机的原理
2)支持向量机的应用
【实操内容】
1. 决策树的实现和应用
2. 随机森林的实现和应用
3. 朴素贝叶斯的实现和应用
4. 支持向量机的实现和应用
【项目实操内容】
1. 利用集成学习预测双金属ORR催化剂活性【文章】
1)Sklearn中的集成学习算法
2)双金属ORR催化活性预测实战
a)数据集准备
b)特征筛选
c)模型训练
d)模型参数优化
2. 使用支持向量机预测高熵合金相态【文章】
1)支持向量机的可视化演示
a)绘制决策边界
b)查看不同核函数的区别
2)支持向量机预测高熵合金相态(分类)
a)数据集准备
b)数据预处理
c)特征工程
d)模型训练及预测
3)支持向量机预测生物炭材料废水处理性能(回归)
a)数据集准备
b)数据预处理
c)模型训练及预测
第四天 常见机器学习方法与实践3
【理论内容】
1. 无监督学习
1)什么是无监督学习
2)无监督学习算法-聚类
3)无监督学习算法-降维
2. 材料与化学数据的特征工程
1)分子结构表示
2)晶体结构表示
3. 数据库
1)材料数据库介绍
2)Pymatgen介绍
【实操内容】
1. 无监督学习算法的实现与应用
2. 分子结构的表示
3. 晶体结构的表示
4. 数据库实操
【项目实操内容】
1. 无监督学习在材料表征中应用【文章】
1)K-Means聚类算法
2)石墨烯样品数据集准备
3)二维电镜图像处理
4)聚类及统计
2. 利用机器学习预测高能材料分子性质【文章】
1)高能分子数据集准备
2)从SMILES生成分子坐标
3)从分子坐标计算库伦矩阵
4)测试不同分子指纹方法
5)比较不同特征化方法
6)模型性能评估
第五天 项目实践专题
【项目实操内容】
1.利用机器学习加速发现耐高温氧化的合金材料【文章】
1)合金材料数据集准备
2)数据预处理
3)特征构建和特征分析
4)多种模型训练
5)使用训练好的模型进行推理
2.决策树(可解释性机器学习)预测AB2合金的储氢性能【文章】
1)储氢合金材料数据集准备
2)决策树基本流程
3)动手建立一棵树
4)决策树剪枝
5)决策过程可视化和特征重要性分析
6)分类决策树和回归决策树的区别
3.分子渗透性分类预测
1)使用定量的1D分子描述符和不同的机器学习模型进行QSAR模型的训练和预测
2)使用定性的2D分子描述符和不同的机器学习模型进行QSAR模型的训练和预测
3)比较不同分子描述方法对QSAR模型性能的影响
4. 多层感知机预测单晶合金晶格错配度【文章】
1)PyTorch与Scikit-learn中多层感知机的区别
2)使用PyTorch构建多层感知机
3)训练PyTorch多层感知机模型预测单晶合金晶格错配度
4)PyTorch多层感知机模型参数优化
深度学习材料专题
第一天:深度学习与材料特征工程
【理论内容】
1.深度学习概述
2.材料特征工程
3. 材料与化学中的常见深度学习方法
4. 应用前沿
【实操内容】
1.Pytorch深度学习框架实操
1)认识Pytorch
2)Pytorch深度学习模型的建立范式
3)为预测任务建立Pytorch深度学习模型
2.Pytorch Lightning框架实操
1)使用Pytorch Lightning训练模型
2)设置最佳保存点和早停
第二天:材料基因组(工具库及数据库)
【理论内容】
1.材料基因组概述
2.材料基因组的基本方法
3.常见材料数据库介绍
【实操内容】
1.Material Project数据库与Pymatgen
1)Material Project数据库实操
2)Pymatgen库实操(matgenb)
2.ASE(Atomic Simulation Environment)实操
3.OQMD数据库数据获取与使用(qmpy_rester)
4.AFLOW数据库数据获取与使用(aflow)
5.材料特征工具Matminer实操
1)Matminer获取材料数据集
2)Matminer生成材料描述符
第三天 常见的深度学习算法、应用及实践1
【理论内容】
1. 卷积神经网络(CNN)
1)CNN的介绍
2)CNN的原理
3)ResNet的介绍及原理
【项目实操内容】
1.CNN入门案例、深度神经网络模型的预训练及微调
1)使用微调的预训练ResNet预测mnist数据集
2)从头开始训练ResNet预测mnist数据集
2.STEM图像生成
1)STEM图像数据读取与处理
2)使用ASE创建原子模型
3)模拟二硫化钼中硫原子的缺失
4)生成硫原子缺失的STEM仿真图像
3.卷积神经网络在合金电镜图片识别的应用【文章】
1)合金电镜数据集介绍及图像预处理
2)构建简单CNN模型进行分类
3)使用预训练模型VGG16进行分类
4)使用预训练模型DenseNet201进行分类
5)模型性能展示
4. 基于粉末X射线衍射图谱的晶体对称性识别CNN模型【文章】
1)XRD图像数据集准备
2)使用PyTorch处理数据集
3)PyTorch训练一维图像数据预测模型
4)PyTorch模型验证和测试
第四天 常见的深度学习算法、应用及实践2
【理论内容】
1. 时序神经网络
1)RNN的介绍及原理
2)LSTM的介绍及原理
3)GRU的介绍及原理
4)Transformer的介绍及原理
【项目实操内容】
1.LSTM&GRU入门案例
1)使用PyTorch实现时序预测模型
2)训练LSTM模型
3)训练GRU模型
4)模型评估
2.基于GRU/Transformer网络预测锂电池的老化轨迹【文章】
1)电池数据集准备与分析
2)原始数据分割与处理
3)训练GRU模型预测电池老化轨迹
4)训练Transformer模型预测电池老化轨迹
5)模型性能评估与预测
3. 基于Transformer对聚合物性质进行预测【文章】
1)聚合物数据集准备
2)对聚合物数据进行特征编码
3)使用预训练的Transformer
4)以K折交叉验证的方式微调Transformer模型预测聚合物性能
第五天 常见的深度学习算法、应用及实践3
【理论内容】
1.生成模型
1)生成对抗网络(GAN)的介绍及原理
2)变分自编码器(VAE)的介绍及原理
3)扩散模型(Diffusion Model)的介绍及原理
2.图神经网络
1)图神经网络(GNN)的介绍及原理
【项目实操内容】
1.基于VAE逆向生成晶体材料【文章】
1)晶体结构体素空间编码
2)使用变分自编码器进行晶体结构自动生成
3)变分自编码器的潜空间采样
2.基于Transformer架构的自回归模型生成指定空间群的晶体材料【文章】
1)基于Transformer架构的自回归模型
2)基于对称性的晶体结构表示
3)使用训练好的自回归模型进行指定空间群的晶体材料生成
3.图神经网络入门、分子图编码及预测
1)图神经网络实操
2)小分子的图表示
3)使用图神经网络对小分子进行分类预测
机器学习分子动力学专题
基于机器学习的分子动力学
第一部分(分子动力学基础)
1.理论内容
1.1科学研究的四范式:从大数据时代到AI4SCIENCE时代
1.2AI4SCIENCE时代的分子动力学模拟:从传统的经验力场方法和第一性原理方法到机器学习力场
1.3基于机器学习的分子动力学的特点,分类和工作流程,及发展趋势.
2.实操内容:
1.Linux系统与超算服务器的常规操作
2.Python(pycharm或vscode)的基本数据类型与代码调试
3.虚拟环境(Anaconda或Mamba)的使用
3.分子模拟软件介绍
3.1LAMMPS的入门与使用
3.2软件发展趋势与特点
3.3输入文件的详细解析与注意事项
3.4相关势函数的获取渠道
3.5分子模拟轨迹的后处理与分析
3.6机器学习势函数使用
4.OpenMM的入门与使用
4.1软件发展趋势与特点
4.2运行脚本与注意事项
4.3GAFF(Amber)力场的简要介绍
4.4使用sobtop软件和Python快速、自动化生成任意有机分子的力场参数文件(同时也适用GROMACS)
5.量子化学计算软件的介绍与快速上手
5.1CP2K软件的发展介绍与特点:
5.2软件发展趋势与特点
5.3运行命令与赝势文件
5.4使用MULTIWFN快速生成单点能或分子动力学模拟的输入文件
5.5输入文件的字段解释与注意事项
5.6使用Python实现自动化提交任务与任务后处理
5.7在CP2K中使用GFN1-xTB方法,适合新手的入门旋转!
6.ORCA软件的发展介绍与特点:
6.1软件发展趋势与特点
6.2使用MULTIWFN或基于模板快速生成单点能或分子动力学模拟的输入文件及注意事项
6.3使用Python实现自动化提交任务与任务后处理
6.4在ORCA中使用ωB97M-V泛函
7.XTB软件的发展介绍与特点:
7.1软件发展趋势与特点:发展迅猛!年被引用增长率高达87%;能够执行单点能,几何优化,分子模拟等功能
7.2安装与常用命令
7.3几种半经验方法的简要介绍
7.4使用Python实现自动化提交任务与任务后处理
7.5DFTB(简单介绍)
7.6执行单点能,几何优化,分子模拟等
7.7使用Python实现自动化提交任务与任务后处理
8.案例:传统力场方法与机器方法力场方法的对比
8.1使用OpenMM执行有机体系的分子模拟
8.2基于机器学习力场方法,结合LAMMPS执行合金,锂电池体系的分子模拟
8.3使用MDtraj等软件进行模拟结果的后处理分析与Python高质量科研绘图,包括:能量与力的预测曲线,径向分布函数,键长键角二面角分布,电池电压曲线等.
第二部分(机器学习力场的模型设计)
1.理论内容
1.1机器学习与深度学习的快速入门
1.1.1常见概念与分类
1.1.2机器学习的发展历史以及部分理论:通过可视化案例,理解神经网络的通用近似理论
1.1.3神经元,反向梯度下降,损失函数,过/欠拟合,残差连接等基本概念
1.1.4ANN, CNN, RNN, TRANSFORMER等深度神经网络的基本框架的介绍与特点
1.1.5相关学习资源的推荐
1.2科学领域的机器学习模型介绍
1.2.1物理约束/物理对称性
1.2.2高效描述局部环境方法的分类与特点
1.2.3基于核方法或深度神经网络方法
1.2.4基于描述符或分子图方法
1.3基于描述符的机器学习力场模型
1.3.1机器学习力场的开篇工作
1.3.2BPNN模型详解与发展
1.3.3生态最好的机器学习力场模型
1.3.4DeePMD系列工作的详解
1.3.5DeePMD的发展和几种描述符的介绍及特点
1.3.6DeePMD的压缩原理与特点
1.3.7DPGEN的工作原理
1.4基于图框架的机器学习力场模型
1.4.1图神经网络、图卷积网络和消息传递神经网络的发展与理解
1.4.2图神经网络的机器学习力场模型的经典模型
1.4.3SchNet模型的特点与代码实现
1.4.4基于三维空间建模的完备性与效率的几何系列模型:
1.4.5DimeNet,SphereNet和ComENet模型的详解与比较
1.4.6其他机器学习力场模型概述:DTNN和PhysNet等
2.实操内容
2.1DeePMD的离线安装与验证
2.2DeePMD输入文件详解:与理论课的模型框架相对应地进行超参数设定的讲解,及使用经验
2.3DeePMD的常见功能,包括训练,重启,冻结,压缩和测试
2.4DeePMD的常见问题与训练过程的分析
2.5综合使用LAMMPS和DeePMD, 执行高精度的分子动力学模拟
2.6分子模拟的数据后处理与分析
2.7DPGEN软件的介绍与工作流程
2.8DPGEN软件的输入和输出文件:param.json和machine.json文件的参数详解;跨计算分区的提交任务示例;不同量化级别方法的示例
2.9DPGEN软件的常用命令与使用经验,以及不同体系收敛的参考标准
第三部分(高级课程 —— 等变模型系列,领域热点)
1.理论内容
1.1不变系列模型的总结
1.1.1等变模型的概念,特点,分类和应用
1.1.2等变的概念
1.1.3等变模型的分类与特点
1.1.4等变模型的介绍:超高数据利用率与优秀的泛化能力
1.1.5群的简要介绍
1.1.6SO(3)群的简单入门与张量积
1.1.7欧式神经网络(E3NN)的介绍与注意事项
1.1.8高阶等变模型与传统模型,经验力场的区别
1.1.9常见误区的提醒
1.2等变机器学习力场的经典模型:
1.2.1Nat. Commun.上高被引的NequIP模型的详解和代码框架
2.实操内容
2.1DeePMD软件的进阶使用与补充讲解,包括多GPU并行训练
2.2LAMMPS以多GPU并行方式运行机器学习力场模型
2.3使用Python代码快速可视化机器学习力场模型在等变与不变设计上的区别
2.4使用多种机器学习的降维方法,结合K-Means聚类,从分子模拟轨迹中以低冗余方式提取多帧结构文件。
2.5NequIP模型的超参数介绍和使用
2.6复现Nat. Commun.文章结果,包括计算径向分布函数、键角分布等性质
2.7使用wandb进行超参数调优与训练过程中各种信息的可视化分析
第四部分
1.理论部分
1.1高效/高精度的基于ACE的等变模型
1.2ACE方法,消息传递和等变框架的集大成者:MACE模型
1.3方法的完备性,效率和系列发展
1.4MACE模型在多个领域的应用
1.5机器学习力场领域的ChatGPT模型
1.6有机分子体系的通用大模型:MACE-OFF23
1.7几乎涵盖元素周期表所有元素的材料领域的通用大模型:MACE-MP0
1.8其他大模型的简要介绍
1.9适用于大规模GPU并行框架的等变模型
1.10消息传递模型的不足
1.11NequIP团队在Nat. Commun.上的新作--Allegro模型的方法详解与比较
1.12SevenNet模型的介绍与比较
2.实操部分
2.1MACE模型和Allegro模型的超参数介绍和使用经验
2.2MACE模型与DeePMD模型的对比,包括精度,数据效率等
2.3Libtorch与LAMMPS软件的编译
2.4机器学习力场领域的ChatGPT的使用与分析
2.5快速上手MACE-OFF23和MACE-MP0模型
2.6对通用大模型进行微调与分析
2.7DPA-1和DPA-2的介绍与特点
课程部分案例图片:
课程特色及授课方式
线上授课时间和地点自由,建立专业课程群进行实时答疑解惑,理论+实操授课方式结合大量实战案例与项目演练,聚焦人工智能技术在材料科学领域的最新研究进展,课前发送全部学习资料,课程提供全程答疑解惑;
完全贴合学员需求的课程体系设计,定期更新的前沿案例,由浅入深式讲解,课后提供无限次回放视频,免费赠送二次学习,发送全部案例资料,永不解散的课程群,可以与相同领域内的老师同学互动交流问题,让求知的路上不再孤单!
增值服务
1、凡参加人员将获得本次课程学习资料及所有案例模型文件;
2、课程结束可获得本次所学专题全部回放视频;
3、课程会定期更新前沿内容,参加本次课程的学员可免费参加一次本单位后期举办的相同专题课程(任意一期)
课程时间
机器学习材料时间:
2024.10.19----2024.10.20(上午9.00-11.30下午13.30-17.00)2024.10.23----2024.10.24(晚上19.00-22.00)
2024.10.26----2024.10.27(上午9:00-11:30下午13:30-17:00)
腾讯会议 线上授课(共五天课程 提供全程视频回放)
深度学习材料时间:
2024.11.2----2024.11.3(上午9.00-11.30下午13.30-17.00)
2024.11.6----2024.11.7(晚上19.00-22.00)
2024.11.9----2024.11.10(上午9:00-11:30下午13:30-17:00)
腾讯会议 线上授课(共五天课程 提供全程视频回放)
机器学习分子动力学时间:
2024.10.19----2024.10.20(上午9.00-11.30下午13.30-17.00)2024.10.26----2024.10.27(上午9:00-11:30下午13:30-17:00)
腾讯会议 线上授课(共五天课程 提供全程视频回放)
课程费用
课程费用:
机器学习分子动力学
报名费用:每人每班课程¥5280元 (含报名费、培训费、资料费)
机器学习材料、深度学习材料、机器学习锂离子电池
报名费用:每人每班课程¥4680元 (含报名费、培训费、资料费)
重磅优惠:
早鸟价优惠:提前报名缴费学员可得300元优惠(仅限前15名)
套餐价:同时报名两个课程¥9080元
报二赠一(同时报名两个班可以免费赠送一个学习名额,赠送班任选)
年报优惠:可免费学习一年特惠:20880元(可免费学习一整年本单位举办的任意课程)
报名费用可开具正规报销发票及提供相关缴费证明、邀请函,可提前开具报销发票、文件用于报销
报名咨询方式(请扫描下方二维码)
RECRUIT
联系人|马老师
咨询电话|18514630500(微信同号)