两天三篇Nature!天才少年运用机器学习解决催化领域百年难题！“开山之作”震惊全世界！

文摘 2024-09-11 07:32 澳大利亚

长久以来，新材料的研发主要依赖试错法，这种传统的研究范式不仅耗时费力，而且成本高昂。20世纪中叶起，随着蒙特卡罗方法、分子动力学和密度泛函理论(DFT)等计算物理方法的发展及其在不同材料体系中的应用，计算材料学逐渐成型，并广泛应用于信息技术、能源、化工、生物医药、航空航天等领域，成为探索物质世界、研发新材料的重要工具。近年来，随着计算材料学和人工智能(AI)快速发展，基于机器学习的材料设计逐渐成为可能。机器学习算法能够处理复杂的非线性关系，发现高维数据中的模式和规律，自动从数据中提取隐藏的关键特征，并且具备较强的泛化能力和迭代优化能力。这些优势与材料研究天然匹配，有望解决材料科学中设计空间巨大、构效关系复杂等关键共性难题。

(1)性质预测：利用机器学习挖掘材料的结构—性质关系(即构效关系)，再结合材料数据库筛选和设计具有特定性能的新材料。

(2)合成预测：利用机器学习预测材料的合成方案、合成路径、具体的实验合成参数等。

(3)知识发现：利用自然语言模型，对文献库进行数据提取和知识挖掘以辅助材料设计。

(4)生成式逆向设计：基于生成式模型，根据对材料性能的需求，逆向设计材料的成分和结构。

由于学习平台文献、视频教程资料较少，技术不公开，对于有相应科研任务和发高质量文章的科研人员极度困扰，在这种情况下，培训学习显得尤为迫切。因此，特诚邀您参加我们线上培训课程，目前已有5000余名参会会员！我们的目标是助力学员在Nature、Science、Cell等正刊及子刊上发表高质量文章，借助新技术在更有限的经费下取得更高质量的研究成果。让我们共同冲刺顶尖刊物，共创2024年的科研巅峰！

机器学习材料专题

深度学习材料专题

机器学习分子动力学专题

2024年最火热机器学习锂离子电池专题（五天内容详情点击名称查看）

2024年最火热深度学习超材料设计专题（五天内容详情点击名称查看）

深度学习声学超材料专题（五天内容详情点击名称查看）

讲师介绍：

机器学习材料专题和深度学习材料专题主讲老师张老师来自国内“985工程”顶尖高校材料物理与化学专业，长期从事材料科学、机器学习，未来互联网与命名数据网络，量子力学等领域。在多个国际高水平期刊上发表 SCI检索论文15余篇。国家发明专利一项，他的授课方式深入浅出，能够将复杂的理论知识和计算方法讲解得清晰易懂，受到学员们的一致认可和高度评价！

机器学习分子动力学主讲老师来自国内高校陈老师授课，已发表SCI论文近20余篇，研究方向为基于机器学习的分子动力学模拟，包括构建高效、高精度的AI分子力场模型，采用主动学习或大模型的知识蒸馏方法来获取高质量训练数据集，开发基于C++的高性能的多GPU并行的LAMMPS的插件。熟知各种AI模型DeePMD, SchNet, DimeNet, SphereNet, DPA2和等变系列模型的Nequip, MACE, Allegro等，精通所有量子化学软件！

机器学习材料专题

材料机器学习概述与python基础

【理论内容】

1. 机器学习概述

2. 材料与化学中的常见机器学习方法

3. 应用前沿

【实操内容】

1)Python基础

1)开发环境搭建

2)变量和数据类型

3)控制流

2)Python基础（续）

1)函数

2)类和对象

3)模块

3. Python科学数据处理

1)NumPy

2)Pandas

3)绘图可视化

4)文件系统

第二天：常见机器学习方法与实践1

【理论内容】

1. 线性回归

1)线性回归的原理

2)线性回归的应用

2. 逻辑回归

1)逻辑回归的原理

2)逻辑回归的应用

3. K近邻（KNN）

1)K近邻的原理

2)K近邻的应用

4. 感知机（浅层神经网络）

1)感知机的原理

2)使用感知机进行回归

3)使用感知机进行分类

【实操内容】

1. 线性回归的实现与初步应用

2. 逻辑回归的实现与初步应用

3. K近邻的实现与初步应用

4. 感知机的实现与初步应用

【项目实操内容】

1. 机器学习对CO2催化活性的预测｜机器学习入门简单案例【文章】

1)机器学习材料与化学应用的典型步骤

a)数据采集和清洗

b)特征选择和模型选择

c)模型训练和测试

d)模型性能评估和优化

2)sklearn库介绍

a)sklearn库的基本用法

b)sklearn库的算法API

c)sklearn库的模型性能评估

第三天常见机器学习方法与实践2

【理论内容】

1. 决策树

1)决策树的原理

2)决策树的应用

2. 集成学习

1)集成学习的原理

2)集成学习的方法和应用

3. 朴素贝叶斯

1)朴素贝叶斯的原理

2)朴素贝叶斯的应用

4. 支持向量机

1)支持向量机的原理

2)支持向量机的应用

【实操内容】

1. 决策树的实现和应用

2. 随机森林的实现和应用

3. 朴素贝叶斯的实现和应用

4. 支持向量机的实现和应用

【项目实操内容】

1. 利用集成学习预测双金属ORR催化剂活性【文章】

1)Sklearn中的集成学习算法

2)双金属ORR催化活性预测实战

a)数据集准备

b)特征筛选

c)模型训练

d)模型参数优化

2. 使用支持向量机预测高熵合金相态【文章】

1)支持向量机的可视化演示

a)绘制决策边界

b)查看不同核函数的区别

2)支持向量机预测高熵合金相态（分类）

a)数据集准备

b)数据预处理

c)特征工程

d)模型训练及预测

3)支持向量机预测生物炭材料废水处理性能（回归）

a)数据集准备

b)数据预处理

c)模型训练及预测

第四天常见机器学习方法与实践3

【理论内容】

1. 无监督学习

1)什么是无监督学习

2)无监督学习算法-聚类

3)无监督学习算法-降维

2. 材料与化学数据的特征工程

1)分子结构表示

2)晶体结构表示

3. 数据库

1)材料数据库介绍

2)Pymatgen介绍

【实操内容】

1. 无监督学习算法的实现与应用

2. 分子结构的表示

3. 晶体结构的表示

4. 数据库实操

【项目实操内容】

1. 无监督学习在材料表征中应用【文章】

1)K-Means聚类算法

2)石墨烯样品数据集准备

3)二维电镜图像处理

4)聚类及统计

2. 利用机器学习预测高能材料分子性质【文章】

1)高能分子数据集准备

2)从SMILES生成分子坐标

3)从分子坐标计算库伦矩阵

4)测试不同分子指纹方法

5)比较不同特征化方法

6)模型性能评估

第五天项目实践专题

【项目实操内容】

1.利用机器学习加速发现耐高温氧化的合金材料【文章】

1)合金材料数据集准备

2)数据预处理

3)特征构建和特征分析

4)多种模型训练

5)使用训练好的模型进行推理

2.决策树（可解释性机器学习）预测AB2合金的储氢性能【文章】

1)储氢合金材料数据集准备

2)决策树基本流程

3)动手建立一棵树

4)决策树剪枝

5)决策过程可视化和特征重要性分析

6)分类决策树和回归决策树的区别

3.分子渗透性分类预测

1)使用定量的1D分子描述符和不同的机器学习模型进行QSAR模型的训练和预测

2)使用定性的2D分子描述符和不同的机器学习模型进行QSAR模型的训练和预测

3)比较不同分子描述方法对QSAR模型性能的影响

4. 多层感知机预测单晶合金晶格错配度【文章】

1)PyTorch与Scikit-learn中多层感知机的区别

2)使用PyTorch构建多层感知机

3)训练PyTorch多层感知机模型预测单晶合金晶格错配度

4)PyTorch多层感知机模型参数优化

深度学习材料专题

第一天：深度学习与材料特征工程

【理论内容】

1.深度学习概述

2.材料特征工程

3. 材料与化学中的常见深度学习方法

4. 应用前沿

【实操内容】

1.Pytorch深度学习框架实操

1)认识Pytorch

2)Pytorch深度学习模型的建立范式

3)为预测任务建立Pytorch深度学习模型

2.Pytorch Lightning框架实操

1)使用Pytorch Lightning训练模型

2)设置最佳保存点和早停

第二天：材料基因组（工具库及数据库）

【理论内容】

1.材料基因组概述

2.材料基因组的基本方法

3.常见材料数据库介绍

【实操内容】

1.Material Project数据库与Pymatgen

1)Material Project数据库实操

2)Pymatgen库实操（matgenb）

2.ASE（Atomic Simulation Environment）实操

3.OQMD数据库数据获取与使用（qmpy_rester）

4.AFLOW数据库数据获取与使用（aflow）

5.材料特征工具Matminer实操

1)Matminer获取材料数据集

2)Matminer生成材料描述符

第三天常见的深度学习算法、应用及实践1

【理论内容】

1. 卷积神经网络（CNN）

1)CNN的介绍

2)CNN的原理

3)ResNet的介绍及原理

【项目实操内容】

1.CNN入门案例、深度神经网络模型的预训练及微调

1)使用微调的预训练ResNet预测mnist数据集

2)从头开始训练ResNet预测mnist数据集

2.STEM图像生成

1)STEM图像数据读取与处理

2)使用ASE创建原子模型

3)模拟二硫化钼中硫原子的缺失

4)生成硫原子缺失的STEM仿真图像

3.卷积神经网络在合金电镜图片识别的应用【文章】

1)合金电镜数据集介绍及图像预处理

2)构建简单CNN模型进行分类

3)使用预训练模型VGG16进行分类

4)使用预训练模型DenseNet201进行分类

5)模型性能展示

4. 基于粉末X射线衍射图谱的晶体对称性识别CNN模型【文章】

1)XRD图像数据集准备

2)使用PyTorch处理数据集

3)PyTorch训练一维图像数据预测模型

4)PyTorch模型验证和测试

第四天常见的深度学习算法、应用及实践2

【理论内容】

1. 时序神经网络

1)RNN的介绍及原理

2)LSTM的介绍及原理

3)GRU的介绍及原理

4)Transformer的介绍及原理

【项目实操内容】

1.LSTM&GRU入门案例

1)使用PyTorch实现时序预测模型

2)训练LSTM模型

3)训练GRU模型

4)模型评估

2.基于GRU/Transformer网络预测锂电池的老化轨迹【文章】

1)电池数据集准备与分析

2)原始数据分割与处理

3)训练GRU模型预测电池老化轨迹

4)训练Transformer模型预测电池老化轨迹

5)模型性能评估与预测

3. 基于Transformer对聚合物性质进行预测【文章】

1)聚合物数据集准备

2)对聚合物数据进行特征编码

3)使用预训练的Transformer

4)以K折交叉验证的方式微调Transformer模型预测聚合物性能

第五天常见的深度学习算法、应用及实践3

【理论内容】

1.生成模型

1)生成对抗网络（GAN）的介绍及原理

2)变分自编码器（VAE）的介绍及原理

3)扩散模型（Diffusion Model）的介绍及原理

2.图神经网络

1)图神经网络（GNN）的介绍及原理

【项目实操内容】

1.基于VAE逆向生成晶体材料【文章】

1)晶体结构体素空间编码

2)使用变分自编码器进行晶体结构自动生成

3)变分自编码器的潜空间采样

2.基于Transformer架构的自回归模型生成指定空间群的晶体材料【文章】

1)基于Transformer架构的自回归模型

2)基于对称性的晶体结构表示

3)使用训练好的自回归模型进行指定空间群的晶体材料生成

3.图神经网络入门、分子图编码及预测

1)图神经网络实操

2)小分子的图表示

3)使用图神经网络对小分子进行分类预测

机器学习分子动力学专题

基于机器学习的分子动力学

第一部分（分子动力学基础）

1.理论内容

1.1科学研究的四范式：从大数据时代到AI4SCIENCE时代

1.2AI4SCIENCE时代的分子动力学模拟：从传统的经验力场方法和第一性原理方法到机器学习力场

1.3基于机器学习的分子动力学的特点，分类和工作流程，及发展趋势．

2.实操内容：

1.Linux系统与超算服务器的常规操作

2.Python(pycharm或vscode)的基本数据类型与代码调试

3.虚拟环境(Anaconda或Mamba)的使用

3.分子模拟软件介绍

3.1LAMMPS的入门与使用

3.2软件发展趋势与特点

3.3输入文件的详细解析与注意事项

3.4相关势函数的获取渠道

3.5分子模拟轨迹的后处理与分析

3.6机器学习势函数使用

4.OpenMM的入门与使用

4.1软件发展趋势与特点

4.2运行脚本与注意事项

4.3GAFF(Amber)力场的简要介绍

4.4使用sobtop软件和Python快速、自动化生成任意有机分子的力场参数文件（同时也适用GROMACS）

5.量子化学计算软件的介绍与快速上手

5.1CP2K软件的发展介绍与特点：

5.2软件发展趋势与特点

5.3运行命令与赝势文件

5.4使用MULTIWFN快速生成单点能或分子动力学模拟的输入文件

5.5输入文件的字段解释与注意事项

5.6使用Python实现自动化提交任务与任务后处理

5.7在CP2K中使用GFN1-xTB方法，适合新手的入门旋转！

6.ORCA软件的发展介绍与特点：

6.1软件发展趋势与特点

6.2使用MULTIWFN或基于模板快速生成单点能或分子动力学模拟的输入文件及注意事项

6.3使用Python实现自动化提交任务与任务后处理

6.4在ORCA中使用ωB97M-V泛函

7.XTB软件的发展介绍与特点：

7.1软件发展趋势与特点：发展迅猛！年被引用增长率高达87%；能够执行单点能，几何优化，分子模拟等功能

7.2安装与常用命令

7.3几种半经验方法的简要介绍

7.4使用Python实现自动化提交任务与任务后处理

7.5DFTB(简单介绍)

7.6执行单点能，几何优化，分子模拟等

7.7使用Python实现自动化提交任务与任务后处理

8.案例：传统力场方法与机器方法力场方法的对比

8.1使用OpenMM执行有机体系的分子模拟

8.2基于机器学习力场方法，结合LAMMPS执行合金，锂电池体系的分子模拟

8.3使用MDtraj等软件进行模拟结果的后处理分析与Python高质量科研绘图，包括：能量与力的预测曲线，径向分布函数，键长键角二面角分布，电池电压曲线等．

第二部分（机器学习力场的模型设计）

1.理论内容

1.1机器学习与深度学习的快速入门

1.1.1常见概念与分类

1.1.2机器学习的发展历史以及部分理论：通过可视化案例，理解神经网络的通用近似理论

1.1.3神经元，反向梯度下降，损失函数，过/欠拟合，残差连接等基本概念

1.1.4ANN, CNN, RNN, TRANSFORMER等深度神经网络的基本框架的介绍与特点

1.1.5相关学习资源的推荐

1.2科学领域的机器学习模型介绍

1.2.1物理约束/物理对称性

1.2.2高效描述局部环境方法的分类与特点

1.2.3基于核方法或深度神经网络方法

1.2.4基于描述符或分子图方法

1.3基于描述符的机器学习力场模型

1.3.1机器学习力场的开篇工作

1.3.2BPNN模型详解与发展

1.3.3生态最好的机器学习力场模型

1.3.4DeePMD系列工作的详解

1.3.5DeePMD的发展和几种描述符的介绍及特点

1.3.6DeePMD的压缩原理与特点

1.3.7DPGEN的工作原理

1.4基于图框架的机器学习力场模型

1.4.1图神经网络、图卷积网络和消息传递神经网络的发展与理解

1.4.2图神经网络的机器学习力场模型的经典模型

1.4.3SchNet模型的特点与代码实现

1.4.4基于三维空间建模的完备性与效率的几何系列模型:

1.4.5DimeNet,SphereNet和ComENet模型的详解与比较

1.4.6其他机器学习力场模型概述：DTNN和PhysNet等

2.实操内容

2.1DeePMD的离线安装与验证

2.2DeePMD输入文件详解:与理论课的模型框架相对应地进行超参数设定的讲解，及使用经验

2.3DeePMD的常见功能，包括训练，重启，冻结，压缩和测试

2.4DeePMD的常见问题与训练过程的分析

2.5综合使用LAMMPS和DeePMD, 执行高精度的分子动力学模拟

2.6分子模拟的数据后处理与分析

2.7DPGEN软件的介绍与工作流程

2.8DPGEN软件的输入和输出文件：param.json和machine.json文件的参数详解；跨计算分区的提交任务示例；不同量化级别方法的示例

2.9DPGEN软件的常用命令与使用经验，以及不同体系收敛的参考标准

第三部分（高级课程 —— 等变模型系列，领域热点）

1.理论内容

1.1不变系列模型的总结

1.1.1等变模型的概念，特点，分类和应用

1.1.2等变的概念

1.1.3等变模型的分类与特点

1.1.4等变模型的介绍：超高数据利用率与优秀的泛化能力

1.1.5群的简要介绍

1.1.6SO(3)群的简单入门与张量积

1.1.7欧式神经网络(E3NN)的介绍与注意事项

1.1.8高阶等变模型与传统模型，经验力场的区别

1.1.9常见误区的提醒

1.2等变机器学习力场的经典模型:

1.2.1Nat. Commun.上高被引的NequIP模型的详解和代码框架

2.实操内容

2.1DeePMD软件的进阶使用与补充讲解，包括多GPU并行训练

2.2LAMMPS以多GPU并行方式运行机器学习力场模型

2.3使用Python代码快速可视化机器学习力场模型在等变与不变设计上的区别

2.4使用多种机器学习的降维方法，结合K-Means聚类，从分子模拟轨迹中以低冗余方式提取多帧结构文件。

2.5NequIP模型的超参数介绍和使用

2.6复现Nat. Commun.文章结果，包括计算径向分布函数、键角分布等性质

2.7使用wandb进行超参数调优与训练过程中各种信息的可视化分析

第四部分

1.理论部分

1.1高效/高精度的基于ACE的等变模型

1.2ACE方法，消息传递和等变框架的集大成者：MACE模型

1.3方法的完备性，效率和系列发展

1.4MACE模型在多个领域的应用

1.5机器学习力场领域的ChatGPT模型

1.6有机分子体系的通用大模型：MACE-OFF23

1.7几乎涵盖元素周期表所有元素的材料领域的通用大模型：MACE-MP0

1.8其他大模型的简要介绍

1.9适用于大规模GPU并行框架的等变模型

1.10消息传递模型的不足

1.11NequIP团队在Nat. Commun.上的新作－－Allegro模型的方法详解与比较

1.12SevenNet模型的介绍与比较

2.实操部分

2.1MACE模型和Allegro模型的超参数介绍和使用经验

2.2MACE模型与DeePMD模型的对比，包括精度，数据效率等

2.3Libtorch与LAMMPS软件的编译

2.4机器学习力场领域的ChatGPT的使用与分析

2.5快速上手MACE-OFF23和MACE-MP0模型

2.6对通用大模型进行微调与分析

2.7DPA-1和DPA-2的介绍与特点

课程部分案例图片：

课程特色及授课方式

线上授课时间和地点自由，建立专业课程群进行实时答疑解惑，理论＋实操授课方式结合大量实战案例与项目演练，聚焦人工智能技术在材料科学领域的最新研究进展，课前发送全部学习资料，课程提供全程答疑解惑；

完全贴合学员需求的课程体系设计，定期更新的前沿案例，由浅入深式讲解，课后提供无限次回放视频，免费赠送二次学习，发送全部案例资料，永不解散的课程群，可以与相同领域内的老师同学互动交流问题，让求知的路上不再孤单！

增值服务

1、凡参加人员将获得本次课程学习资料及所有案例模型文件；

2、课程结束可获得本次所学专题全部回放视频；

3、课程会定期更新前沿内容，参加本次课程的学员可免费参加一次本单位后期举办的相同专题课程（任意一期）

课程时间

机器学习材料时间：

2024.10.19----2024.10.20（上午9.00-11.30下午13.30-17.00）2024.10.23----2024.10.24（晚上19.00-22.00）

2024.10.26----2024.10.27（上午9:00-11:30下午13:30-17:00）

腾讯会议线上授课（共五天课程提供全程视频回放）

深度学习材料时间：

2024.11.2----2024.11.3（上午9.00-11.30下午13.30-17.00）

2024.11.6----2024.11.7（晚上19.00-22.00）

2024.11.9----2024.11.10（上午9:00-11:30下午13:30-17:00）

腾讯会议线上授课（共五天课程提供全程视频回放）

机器学习分子动力学时间：

2024.10.19----2024.10.20（上午9.00-11.30下午13.30-17.00）2024.10.26----2024.10.27（上午9:00-11:30下午13:30-17:00）

腾讯会议线上授课（共四天课程提供全程视频回放）

课程费用

课程费用：

机器学习分子动力学

报名费用：每人每班￥5280元（包含会议费、资料费提供课后全程回放资料）

机器学习材料、深度学习材料、机器学习锂离子电池

报名费用：每人每班￥4680元（包含会议费、资料费提供课后全程回放资料）

重磅优惠：

早鸟价优惠：提前报名缴费学员可得300元优惠（仅限前15名）

套餐价：同时报名两个课程￥9080元

报二赠一（同时报名两个班可以免费赠送一个学习名额，赠送班任选）

年报优惠：可免费学习一年特惠：20880元（可免费学习一整年本单位举办的任意课程）

报名费用可开具正规报销发票及提供相关缴费证明、邀请函，可提前开具报销发票、文件用于报销

报名咨询方式（请扫描下方二维码）

RECRUIT

联系人｜张老师

咨询电话｜13141346157（微信同号）

http://mp.weixin.qq.com/s?__biz=MzAxNDMxMTQ3MQ==&mid=2247487912&idx=1&sn=ddc42b405cecf09af704b57b90aecdba

催化视界

催化视界（Catalysis Insight）专注于催化领域，分享基础知识，关注前沿研究动态。