Nature | 新的突破口!颠覆传统思路,中国学者连发Nature!

文摘   2024-03-12 09:11   广东  

机器学习模型展现出强大的适应能力,能够灵活地探索数据集中隐含的知识,以抽象的形式提供比基于规则的推理更为强大的问题解决方法。在分子模拟领域,机器学习力场(ML-FFs)成功弥补了第一性原理电子结构方法与传统经验力场之间的准确性和效率差距。近年来,该领域呈现出井喷式的蓬勃发展,这一趋势在Web of Science平台的检索结果中得以印证。相关工作频繁登入Nature、Science、Cell等顶尖刊物.通过端到端的ML-FFs,构建高精度的分子力场变得轻而易举,就像按下按钮一样简便.随着计算机的算力快速发展,通过ML-FFs实现第一性原理级别精度的大规模的分子模拟研究已经成为可能.

       作为新兴的跨学科领域,该领域知识面广,相关资料和学习平台相对匮乏,信息技术也不够开放,培训学习显得尤为迫切。因此,特诚邀您参加我们的线上培训课程,目前已有4000余名参会会员!我们的目标是助力学员在Nature、Science、Cell等正刊及子刊上发表高质量文章,借助新技术在更有限的经费下取得更高质量的研究成果。让我们共同冲刺顶尖刊物,共创2024年的科研巅峰!


专题一、机器学习分子动力学


基于机器学习的分子动力学

  第一部分(分子动力学基础)

  理论内容

 1. 从大数据时代到AI4SCIENCE时代

 2.传统分子动力学模拟:经验力场与第一性原理分子动力学

 3.机器学习概述 

 4.机器学习力场的特性,发展和分类

 5.机器学习力场构建的一般流程

实操内容(以含氟有机体系为案例)

 1. 使用mamba/conda配置虚拟环境,安装LAMMPS,OpenMM,DFTB,XTB,MDtraj,Obabel,ASE等软件

 2. 综合使用sobtop软件快速生成任意有机分子的GAFF力场参数文件,并使用OpenMM执行分子模拟

 3. sobtop软件的基本介绍和批量操作

 4. GAFF力场的概述

 5.OpenMM的基本使用

 6. 使用XTB或ORCA等软件得到高精度量化数据集

 6.1 XTB或ORCA的特点与使用,以及后处理

 7.  使用DFTB执行半经验方法GFN2-xTB级别的周期性AIMD

 7.1为什么是GFN2-xTB?

 7.2如何使用DFTB软件执行周期性的AIMD,及其使用技巧

 8. 综合使用机器学习势函数和LAMMPS软件执行分子动力学模拟

 8.1 LAMMPS的基本使用

 8.2 机器学习模型的加载和注意事项

 9. 使用MDtraj软件来分析经验力场,AIMD和机器学习分子模拟的RDF,MSD,以及键角和二面角的分布情况

 9.1 MDtraj软件的基本使用

 9.2 RDF,MSD,扩散系数的介绍与代码实现

 9.3 键角和二面角分布的统计与绘图实现

 第二部分(机器学习力场的发展--不变模型系列)

  理论内容

1. 机器学习力场的开篇工作:

 1.1 BPNN模型详解与发展

 2. 基于图卷积框架的SchNet模型

 2.1 图神经网络和图卷积网络的概述

 2.2 SchNet模型的特点与代码实现

 3. 基于3D空间建模完备性与效率的几何系列模型:

 3.1 消息传递神经网络框架

 3.2 DimeNet,SphereNet和ComENet模型的详解与比较

 4. 生态最好的机器学习力场模型

 4.1 DeePMD系列工作的详解

 实操内容(以合金体系为案例)

 1. 使用dpdata转化数据格式,并生成训练,验证和测试数据集

 2. DeePMD的超参数概述

 3. DeePMD的使用,包括训练,冻结,压缩和测试

 4. 综合使用LAMMPS和DeePMD模型执行高精度的分子动力学模拟

 5. 分子模拟的数据后处理与分析

第三部分(机器学习力场的发展--等变模型系列,领域热点)

  理论内容

 1. 等变的概念,特点,分类和应用

 2. 等变与不变的区别

 2.1 球谐函数与winger-D矩阵

 2.2 高阶等变的特点与应用

 3. 介绍e3nn框架的基本概念,特点和使用

 3.1 不可约概念与张量积

 3.2 e3nn如何实现非线性?

 4. 等变机器学习力场的经典模型:

 4.1 Nat. Commun.上高被引的NequIP模型的详解和代码框架

 5. 高效/高精度的基于ACE的等变模型

 5.1 ACE方法,消息传递和等变框架的集大成--MACE模型

 5.2 方法的完备性,效率和系列发展

 6. 适用于大规模GPU并行框架的等变模型

 6.1 消息传递网络在GPU并行时的弊端

 6.2 NequIP团队在Nat. Commun.的新作--Allegro模型

 6.3 方法详解与比较

 实操内容(锂电池材料为案例)

 1. NequIP模型或MACE模型的超参数介绍和使用

 2. 基于MACE模型的势函数构造与LAMMPS或ASE的集成

 3. MACE模型与DeePMD模型的对比,包括精度,数据效率等

 4. 计算RDF,MSD与扩散系数等性质,复现Nat. Commun.文章结果

 第四部分(数据收集方法)

 1. 理论部分

 2. 公开数据集

 3. 主动学习技术

 4. 采用预训练模型来微调或蒸馏

  实操部分(液态水为案例)

 1. 使用ASE在PYTHON环境下实现主动学习和代码详解

 1.1 多GPU并行或单GPU多任务形式并行,结合XTB,ASE等软件协同

 2. 使用DPGEN执行主动学习

 3. 使用预训练模型进行微调

 3.1 使用DPA2或MACE-OFF等

 3.2 预训练微调与从头训练的对比


部分案例图片

学习目标

1. 在机器学习基础上深入了解多种分子模拟案例:学员应能够理解和应用多个分子模拟案例的能力,涵盖有机体系、合金体系、锂电池、液态水等多个体系,并能够对分子模拟数据进行处理和深入分析。

2. 精通多种量子化学方法:学员应熟练掌握多种量子化学方法和软件,能够在实际问题中明智地选择适用的方法进行分析,并掌握标定后处理和分析的技能。

3. 熟练应用各类机器学习模型与技巧:理解并熟练应用多种机器学习力场模型框架,包括原理和代码构建,能够灵活比较不同框架的特点,同时掌握主动学习、模型预训练、知识蒸馏等机器学习技巧。

4. 了解最新行业动态和发展:对近两年行业内的热点工作和最新研究有清晰了解,具备在分子模拟和量子化学领域进行创新工作的能力,并能够将这些新知识有机地应用到实际工作中。



专题二、机器学习材料


第一天

理论内容

1.机器学习概述

2.材料与化学中的常见机器学习方法

3.应用前沿

实操内容 

Python基础

1.开发环境搭建

2.变量和数据类型

3.列表

4.if语句

5.字典

6.For和while循环 

实操内容 

Python基础(续)

1.函数

2.类和对象

3.模块

Python科学数据处理

1.NumPy

2.Pandas

3.Matplotlib

第二天

理论内容

1.线性回归

1.1 线性回归的原理

1.2 线性回归的应用

2.  逻辑回归

2.1原理

2.2 使用方法

3.  K近邻方法(KNN)

3.1  KNN分类原理

3.2  KNN分类应用

4. 神经网络方法的原理

4.1 神经网络原理

4.2神经网络分类

4.3神经网络回归

实操内容

1.线性回归方法的实现与初步应用(包括L1和L2正则项的使用方法)

2.逻辑回归的实现与初步应用

3.KNN方法的实现与初步应用

4.神经网络实现

项目实操

1.利用机器学习设计高体积模量高熵合金

2.训练机器学习模型预测多孔材料的催化性能

这两个实操项目同时穿插讲解如下内容

A1 机器学习材料与化学应用的典型步骤

A1.1 数据采集和清洗

A1.2 特征选择和模型选择

A1.3 模型训练和测试

A1.4 模型性能评估和优化

第三天

理论内容

1.决策树

1.1决策树的原理

1.2决策树分类

2.集成学习方法

2.1集成学习原理

2.2随机森林

2.3Bosting方法

3.朴素贝叶斯概率

3.1原理解析

3.2 模型应用

4. 支持向量机

4.1分类原理

4.2核函数

实操内容

1.决策树的实现和应用

2.随机森林的实现和应用

3.朴素贝叶斯的实现和应用

4.支持向量机的实现和应用

项目实操

1.使用实验数据训练机器学习模型预测金属有机框架材料中的气体吸附

2.通过机器学习方法筛选新型四元半导体化合物

这两个实操项目同时穿插讲解如下内容

A1 模型性能的评估方法

A1.1 交叉验证:评估估计器的性能

A1.2 分类性能评估

A1.3 回归性能评估

第四天

理论内容

1. 无监督学习

2.1 什么是无监督学习

2.2 无监督算法——聚类

2.3 无监督算法——降维

2. 材料与化学数据的特征工程

2.1分子结构表示

2.2 独热编码

3. 数据库

3.1材料数据库介绍

3.2 Pymatgen介绍

实操内容

1. 分子结构的表示与特征提取

2. 聚类、降维等无监督学习方法应用于分子特征处理

项目实操

1. 在机器学习技术的指导下加速钙钛矿材料的发现

2. 机器学习对CO2 封存的解释和预测

第五天

项目实操

1.  基于分子特征和逻辑回归预测分子性质

 2.  基于分子特征的无监督学习综合应用

项目实操

1. 通过机器学习预测 NiCoFe 氧化物催化剂的活性 

2. 利用基于成分的能源材料描述符进行机器学习模型的综合预测

学习目标

机器学习(ML)在材料研究中的应用,让学员能够掌握学习理论知识及熟悉代码实操,文章的复现,学会anacondaPythonpymatgen等软件、以及机器学习数据采集及清洗、分子结构表示及提取、模型训练和测试、性能评估及优化,KNN、线性回归方法,学会机器学习材料预测,材料分类,材料可视化,多种机器学习方法综合预测等操作技能,独自完成自己的课题研究项目


专题三、深度学习材料

第一天(pytorch深度学习框架演练)

理论内容

材料数据库(material project, OQMD, AFLOW)

深度学习入门

图神经网络

材料特征工程

实操内容:

Pytorch深度学习框架演练

Pymatgen介绍及结构文件生成

Pymatgen生成相图,构建表面

Megnet,QM9,JDFT等规模化材料数据集的读取

爬虫获取二维数据集

爬虫获取会议文献和期刊文章的数据

 第二天(数据库的数据获取及演练)

实操内容

1. AFLOW数据库的数据获取

1.1 AFLOW数据库功能练习

1.2. 爬虫获取AFLOW数据库的数据

2. OQMD数据库

2.1 OQMD数据库功能练习

2.2 OQMD数据库的数据获取

实操内容

1. material project数据库

1.1 新版material project获取材料XRD、DOS图、能带图、吸收谱等数据

1.2 Pymatgen按照属性要求获取material project材料数据

2. 材料特征工程工具matminer演练

2.1 matminer获取材料数据集

2.2 matminer生成材料描述符演练

第三天(结构数据驱动的高通量计算及案例)

实操和演示内容:

基于结构数据驱动的高通量计算:

1. pymatgen大批量结构获取

2. 基于pymatgen的计算文件生成

3. 大批量计算结果的获取与统计

实操内容:

基于数据驱动的功能材料开发案例一(晶体图神经网络实现材料属性预测):

1.用PYG搭建图神经网络(GCN、GAT)

2. 晶体图神经网络CGCNN模型代码原理

3. 利用晶体图神经网络实现材料属性预测

第四天(基于数据驱动的多个功能材料开发案例及实操)

实操内容:

基于数据驱动的功能材料开发案例二(半导体材料):

1. 背景介绍

2. 数据获取

3. 构建特征

4. 传统机器学习和深度学习处理

5. 讨论与评测

实操内容:

1. 基于数据驱动的功能材料开发案例三(钙钛矿材料分类):

1.1 数据集获取

1.2 构建材料特征

1.3 机器学习训练

1.4 特征可解释性分析

2. 基于数据驱动的功能材料开发案例四(深度学习实现钙钛矿材料性能回归)

2.1 matminer生成材料特征

2.2深度神经网络实现钙钛矿属性预测

2.3传统机器学习与图神经网络预测结果对比

培训目标

1.学习Material Project,AFLOW,OQMD三大材料数据库的数据获取方法。

2.学习卷积神经网络、循环神经网络和晶体图神经网络等深度学习方法在材料预测方面的应用。

3.学习主流材料数据库的数据获取方法;

4.深度学习方法在材料预测方面的应用。

部分案例图片


讲师简介

 主讲老师来自国内高校胡老师授课,已发表SCI论文近20余篇,研究方向为基于机器学习的分子动力学模拟,包括 构建高效、高精度的AI分子力场模型,采用主动学习或大模型的知识蒸馏方法来获取高质量训练数据集, 开发基于C++的高性能的多GPU并行的LAMMPS的插件。熟知各种AI模型DeePMD, SchNet, DimeNet, SphereNet, DPA2和等变系列模型的Nequip, MACE, Allegro等,精通所有量子化学软件!
     主讲老师来自国内高校孙老师授课,老师擅长利用量子化学方法和机器学习方法预测设计并研究新型能源材料、锂离子电池的电极材料,燃料电池催化剂以及燃料电池体系的整体设计,已在Energy & Materials,Journal of Physical Chemistry Letters, Journal Physical Chemistry C,等权威期刊上发表SCI检索论文近40余篇。老师在我们单位长期授课,参会学员累计四千余人,讲课内容和授课方式以及敬业精神受到参会学员的一致认可和高度评价!人工智能材料化学与深度学习材料更是我们单位的金牌讲师,好评如潮!


授课时间

HAPPY NEW YEAR

机器学习分子动力学

2024.4.13-2024.4.14(上午9:00-11:30 下午13:30-17:00)

2024.4.20-2024.4.21(上午9:00-11:30 下午13:30-17:00)

机器学习材料

2024.4.6(上午9:00-11:30 下午13:30-17:00)

2024.4.8-2024.4.11 (晚上19:00-22:00)

2024.4.13-2024.4.14午9:00-11:30 下午13:30-17:00)

深度学习材料

2024.4.16-2024.4.19晚上19:00-22:00

2024.4.20-2024.4.21午9:00-11:30 下午13:30-17:00)


培训费用



机器学习分子动力学

公费价:每人每个课程¥5880元 (含报名费、培训费、资料费)

自费价:每人每个课程¥5480元 (含报名费、培训费、资料费)

机器学习材料 深度学习材料

公费价:每人每个课程¥4680元 (含报名费、培训费、资料费)

自费价:每人每个课程¥4380元 (含报名费、培训费、资料费)

套餐价:同时报名两个课程¥9580元 报二赠一(含报名费、培训费、资料费)

福利:现在报名一门赠送一门往期课程回放

报名两门赠送两门往期“材料基因组专题、CP2K专题课程”回放

报名学习课程可赠送往期课程回放(可点击跳转详情链接):

   材料基因组专题        CP2K视频回放专题

优惠:提前报名缴费学员可得300元优惠(仅限前15名)

报名费用可开具正规报销发票及提供相关缴费证明、邀请函,可提前开具报销发票、文件用于报销






培训特色及福利




1、课程特色--全面的课程技术应用、原理流程、实例联系全贯穿

2、学习模式--理论知识与上机操作相结合,让零基础学员快速熟练掌握 3、课程服务答疑--主讲老师将为您实际工作中遇到的问题提供专业解答


授课方式:通过腾讯会议线上直播,理论+实操的授课模式,老师手把手带着操作,从零基础开始讲解,电子PPT和教程开课前一周提前发送给学员,所有培训使用软件都会发送给学员,有什么疑问采取开麦共享屏幕和微信群解疑,学员和老师交流、学员与学员交流,培训完毕后老师长期解疑,培训群不解散,往期培训学员对于培训质量和授课方式一致评价极高!




学员对于培训给予高度评价




报名咨询联系方式

报名咨询方式(请二维码扫描下方微信)


联系人:叶老师

               报名电话:13838281574 ( 微信同号)

               邮箱:y13838281574@163.com


引用往期参会学员的一句话: 


发现真的是脚踏实地的同时  需要偶尔仰望星空非常感谢各位对我们培训的认可!  祝愿各位心想事成!

往期培训单位

常州大学、电子科技大学、中国科学院大学、新疆工程学院、重庆医科大学、西安石油大学、北京交通大学、中国石油大学(北京)、江苏师范大学、哈尔滨理工大学、东北林业大学、暨南大学、南昌航空大学、浙江大学、青岛大学、山东科技大学、厦门大学、哈尔滨工业大学(深圳)、汕头大学、东北大学、北京航空航天大学、陆军工程大学、天津大学、南阳师范学院、香港大学、温州大学、江苏大学、燕山大学、东华理工大学、武汉工程大学、新疆大学、太原理工大学、华北电力大学、四川大学、广州大学、重庆大学、材料科学姑苏实验室、深圳大学、北京化工大学、燕山大学、西南石油大学、香港科技大学(广州)、厦门大学、东北大学、北京理工大学、南京航空航天大学、中国科学院青岛生物能源与过程研究所、香港城市大学、西安科技大学、厦门理工学院、中国科学院上海硅酸盐研究所、西湖大学中国核动力研究设计院、有研工程技术研究院有限公司、中南大学、福州大学、东风汽车集团股份有限公司乘用车公司、中国科学院金属研究所、贵州大学、上海大策资产管理有限公司、交通运输部公路科学研究所、贝卡尔特(中国)技术研发有限公司、云南大学、哈尔滨工业大学、西安电子科技大学、郑州大学、中国农业大学、滑铁卢大学、重庆理工大学、北京机科国创轻量化科学研究院、中国科学院深圳先进技术研究院、中原工学院、清华大学、中国科学院兰州化学物理研究所、University of Maryland、北京工业大学、安徽财经大学、中国科学与技术大学、商丘师范学院、宝理工程塑料贸易有限公司、中材科技股份有限公司、湖南工商大学、武汉大学、安庆师范大学、广东省科学院生态环境与土壤研究所、南昌航空大学、泉州师范学院、华中科技大学、南京大学、南京工业大学、吉林大学、深圳职业技术学院、西北工业大学、华东师范大学、山东大学、中国科学院空间应用工程与技术中心、中国科学技术大学、嘉兴学院、陕西师范大学、中国科学院上海硅酸盐研究所 、北京石油化工学院、重庆第二师范学院、武汉光钜、上海锦湖日丽塑料有限公司、首都医科大学宣武医院、沈阳工业大学、北京工商大学、中国科学院化学研究所、中创新航技术研究院(江苏)有限公司、中国科学院国家纳米科学中心、KAUSTuniversity、长春应用化学研究所、诺贝丽斯(中国)铝制品有限公司上海分公司、钢铁研究总院、万华化学集团股份有限公、四川奥林涂料工业有限公司、深圳市祥龙琪瑞科技有限公司、隆基乐叶光伏科技(西咸新区)有限公司、Imperial College London、中国航空制造技术研究院、苏州华碧微科检测技术有限公司、MIT、南开大学、防化研究院、中国科学院工程热物理研究所、广东工业大学、陆军装甲兵学院、南方科技大学、上海交通大学、国防科技大学、西安交通大学、中国科学院长春应用化学研究所、卢森堡大学、中国科学院力学研究所、东南大学等。


催化与氨氢能源
一个只分享顶刊的博主。专注分享催化领域新闻资讯,传递科研思想,促进科研交流,旨在创建属于大家的科研乐园!主要内容包括,文献赏析,资料共享。欢迎加入氨氢交流群,详情私信公众号,博主拉群。加v:Zhong_xiaoyu1122
 最新文章