随着分子生物学、结构生物学的快速发展,小分子药物发现进入基于靶点的药物设计时代。科研人员能够基于某个靶点进行高通量筛选,在计算机的辅助下进行合理优化,使得药物的研发变得清晰明了。而高通量筛选、虚拟筛选、基于结构的药物设计以及基于片段的药物设计逐渐成为小分子药物研发的常见技术,这些技术取得了很大的成功,至今仍然在不断丰富和发展中。药物研发领域也出现诸多新技术和新方法,比如人工智能(Artificial Intelligence,AI)技术、DNA编码化合物库(DNA Encoded Compound Library,DEL)技术、基因编辑技术(gene editing,GE)、靶向蛋白质降解(Targeted protein degradation,TPD)技术等, 这些新技术和新方法的出现和发展,为新药研发带来了新的技术手段,赋能药物靶点发现、化合物筛选等环节,可大大提升新药研发的效率,为降本增效提供可能。
AI用于药物发现是基于计算机辅助药物设计,然后结合化学信息、生物信息中的大量数据建立优质的机器学习模型,在靶点筛选、分子结构/化学空间分析、配体-受体相互作用模拟、药物三维定量构效关系分析等过程中指导先导化合物的发现和优化。AI的发展可以帮助提取这些大型生物医学数据集中存在的有用特征、模式和结构。在确定和验证了合适的靶点之后,下一步是寻找合适的药物或类药物分子,这些分子可以与靶点相互作用并引起所需的反应。在大数据时代,通过支配海量的大型化学数据库,协助寻找针对特定靶点的完美药物。
科研背景:
01
CADD(Computer Aided Drug Design):计算机辅助药物设计,依据生物化学、酶学、分子生物学以及遗传学等生命科学的研究成果,针对这些基础研究中所揭示的包括酶、受体、离子通道及核酸等潜在的药物设计靶点,并参考其它类源性配体或天然产物的化学结构特征,以计算机化学为基础,通过计算机的模拟、计算和预算药物与受体生物大分子之间的相互作用,考察药物与靶点的结构互补、性质互补等,设计出合理的药物分子。它是设计和优化先导化合物的方法,CADD的应用,包括基于结构的药物设计(SBDD)、基于配体的药物设计(LBDD)、高通量虚拟筛选(HTVS)等技术,突破了传统的先导物发现模式,极大地促进了先导化合物发现和优化。特别是在食品、生物、化学、医药、植物、疾病方面应用广泛!靶点的发现与确证是现代新药研发的第一步,也是新药创制过程中的瓶颈之一。CADD的应用可以加快靶点发现的速度,提高靶点发现的准确度,从而推进新药研发。
02
AIDD(AIDrug Discovery & Design):是近年来非常火热的技术应用,且已经介入到新药设计到研发的大部分环节当中,为新药发现与开发带来了极大的助力。随着医药大数据的积累和人工智能技术的发展,运用AI技术并结合大数据的精准药物设计也不断推动着创新药物的发展。在新型冠状病毒的治疗方案中,通过一系列计算机辅助药物生物计算的方法发现一大类药物分子可以有效阻止新冠病毒的侵染,为治疗新冠提供了新思路。倾向于机器对数据库信息的自我学习,可以对数据进行提取和学习,一定程度上避免了化合物设计过程中的试错路径,同时还会带来很多全新的结构,为药物发现打破常规的结构壁垒。
03
代谢组学是通过比较对照组和实验组,以寻找代谢谱差异的研究方法,近年来,代谢组学在疾病诊断,病理研究,新药开发,药物毒理学,动植物、微生物,营养学等医学与人类健康和疾病密切相关的领域有着广泛的应用,在复杂数据中,人工智能算法用于生物标志物挖掘的组合是解决问题和实施健康科学新技术的常用方法。利用机器学习作为从质谱数据中识别疾病的手段,旨在开发诊断和预后生物标志物、治疗靶点和患者管理系统。
CADD计算机辅助药物设计设计流程,让学员能够掌握包括PDB数据库、靶点蛋白、蛋白质-配体、蛋白-配体小分子、蛋白-配体结构、notepad的介绍和使用、分子对接、蛋白-配体对接、虚拟筛选、蛋白-蛋白对接、蛋白-多糖分子对接、蛋白-水合对接、Linux安装、gromacs分子动力学全程实操、溶剂化分子动力学模拟
AIDD人工智能药物发现与设计课程让学员了解药物发现的前沿背景,学习人工智能领域的各类常见算法,熟悉工具包的安装与使用,掌握一定的算法编程能力,能够运用计算机方法研究药物相关问题。通过大量的案例讲解和实践操作,具备一定的AIDD模型构建和数据分析能力。
机器学习代谢组学适于对深度学习、代谢组学等多组学分析感兴趣的学员。课程通过基础入门+应用案例实操演练的方式,从初学及应用研究的角度出发,带大家实战演练多种深度学习模型(深度神经网络DNN、卷积神经网络CNN、循环神经网络RNN、可变自动编码器VAE、图卷积神经网络GCN)通过对这些深度学习在组学中的应用案例进行深度讲解和实操,让学员能够掌握深度学习分析高维基因组学、转录组学、蛋白组学等多组学数据流程,系统学习深度学习及基因组学理论知识及熟悉软件代码实操,熟练掌握这些前沿的分析工具的使用以及研究创新深度学习算法解决生物学及临床疾病问题与需求。助力学员发表Nature、Science、Cell等正刊及子刊杂志!(在生信分析的新技术加持下,用更少的经费,发更高质量的文章)
授课专家
CADD主讲老师来自国内顶尖药物研究所,老师主要擅长药物虚拟筛选、计算机辅助药物设计、、分子对接、分子动力学等方面的研究、知名金牌授课老师、学员好评率达99.9%!
AIDD授课老师曹老师,有多年年的计算机算法研究和程序设计经验。研究方向涉及计算机辅助药物设计、机器学习、深度学习、分子毒性预测、图神经网络生化反应。。一作身份发表SCI论文数篇,包括,Journal of Biomedical Informatics, International Journal of Molecular Sciences等知名期刊。
01
CADD计算机辅助药物设计课表内容
第一天上午
背景与理论知识以及工具准备
1.PDB数据库的介绍和使用
1.1数据库简介
1.2靶点蛋白的结构查询与选取
1.3靶点蛋白的结构序列下载
1.4靶点蛋白的下载与预处理
1.5批量下载蛋白晶体结构
2.Pymol的介绍与使用
2.1软件基本操作及基本知识介绍
2.2蛋白质-配体相互作用图解
2.3蛋白-配体小分子表面图、静电势表示
2.4蛋白-配体结构叠加与比对
2.5绘制相互作用力
3.notepad的介绍和使用
3.1 优势及主要功能介绍
3.2 界面和基本操作介绍
3.3插件安装使用
下午
一般的蛋白
-配体分子对接讲解
1.对接的相关理论介绍
1.1分子对接的概念及基本原理
1.2分子对接的基本方法
1.3分子对接的常用软件
1.4分子对接的一般流程
2.常规的蛋白-配体对接
2.1收集受体与配体分子
2.2复合体预构象的处理
2.3准备受体、配体分子
2.4蛋白-配体对接
2.5对接结果的分析
以新冠病毒蛋白主蛋白酶靶点及相关抑制剂为例
第二天
虚拟筛选
1.小分子数据库的介绍与下载
2.相关程序的介绍
2.1 openbabel的介绍和使用
2.2 chemdraw的介绍与使用
3.虚拟筛选的前处理
4.虚拟筛选的流程及实战演示
案例:筛选新冠病毒主蛋白酶抑制剂
5.结果分析与作图
6.药物ADME预测
6.1ADME概念介绍
6.2预测相关网站及软件介绍
6.3预测结果的分析
第三天
拓展对接的使用方法
1.蛋白-蛋白对接
1.1蛋白-蛋白对接的应用场景
1.2相关程序的介绍
1.3目标蛋白的收集以及预处理
1.4使用算例进行运算
1.5关键残基的预设
1.6结果的获取与文件类型
1.7结果的分析
以目前火热的靶点
PD-1/PD-L1等为例。
2.涉及金属酶蛋白的对接
2.1 金属酶蛋白-配体的背景介绍
2.2蛋白与配体分子的收集与预处理
2.3金属离子的处理
2.4金属辅酶蛋白-配体的对接
2.5结果分析
以人类法尼基转移酶及其抑制剂为例
3.蛋白-多糖分子对接
4.1蛋白-多糖相互作用
4.2对接处理的要点
4.3蛋白-多糖分子对接的流程
4.4蛋白-多糖分子对接
4.5相关结果分析
以
α-糖苷转移酶和多糖分子对接为例
5.核酸-小分子对接
5.1核酸-小分子的应用现状
5.2相关的程序介绍
5.3核酸-小分子的结合种类
5.4核酸-小分子对接
5.5相关结果的分析
以人端粒
g -四链和配体分子对接为例。
操作流程介绍及实战演示
第四天
拓展对接的使用方法
1.柔性对接
1.1柔性对接的使用场景介绍
1.2柔性对接的优势
1.3蛋白-配体的柔性对接
重点:柔性残基的设置方法
1.4相关结果的分析
以周期蛋白依赖性激酶
2(CDK2)与配体1CK为例
2.共价对接
2.1两种共价对接方法的介绍
2.1.1柔性侧链法
2.1.2两点吸引子法
2.2蛋白和配体的收集以及预处理
2.3共价药物分子与靶蛋白的共价对接
2.4结果的对比
以目前火热的新冠共价药物为例。
3.蛋白-水合对接
3.1水合作用在蛋白-配体相互作用中的意义及方法介绍
3.2蛋白和配体的收集以及预处理
3.3对接相关参数的准备
重点:水分子的加入和处理
3.4蛋白-水分子-配体对接
3.5结果分析
以乙酰胆碱结合蛋白
(AChBP)与尼古丁复合物为例
第五天
分子动力学模拟(linux与gromacs使用安装)
1. linux系统的介绍和简单使用
1.1 linux常用命令行
1.2 linux上的常用程序安装
1.3 体验:如何在linux上进行虚拟筛选
2.分子动力学的理论介绍
2.1分子动力学模拟的原理
2.2分子动力学模拟的方法及相关程序
2.3相关力场的介绍
3.gromacs使用及介绍
重点:主要命令及参数的介绍
4.origin介绍及使用
第六天
溶剂化分子动力学模拟的执行
1.一般的溶剂化蛋白的处理流程
2.蛋白晶体的准备
3.结构的能量最小化
4.对体系的预平衡
5.无限制的分子动力学模拟
6.分子动力学结果展示与解读
以水中的溶菌酶为例
第七天
蛋白-配体分子动力学模拟的执行
1.蛋白-配体在分子动力学模拟的处理流程
2.蛋白晶体的准备
3.蛋白-配体模拟初始构象的准备
4.配体分子力场拓扑文件的准备
4.1 高斯的简要介绍
4.2 ambertool的简要介绍
4.3生成小分子的力场参数文件
5.对复合物体系温度和压力分别限制的预平衡
6.无限制的分子动力学模拟
7.分子动力学结果展示与解读
8.轨迹后处理及分析
以新冠病毒蛋白主蛋白酶靶点及相关抑制剂为例
下方为部分案例图:
02
AIDD人工智能药物设计与发现课程内容
(第一天)
人工智能药物发现(AIDD)简介
机器学习和深度学习在药物发现领域的应用
工具的介绍与安装
1.人工智能药物发现(AIDD)简介2.机器学习和深度学习在药物发现领域的应用
机器学习
机器学习与药物发现
2.1 机器学习
(第三天)
图神经网络与药物发现
3.1 图神经网络
3.4 经典论文讲解:DeepTox: Toxicity Prediction using Deep Learning
(第四天)
自然语言处理与药物发现
4.1 自然语言处理
4.4 经典论文解读:Extraction of organic chemistry grammar from unsupervised learning of chemical reactions
(第五天)
生化代谢路径设计与药物发现
5.5 经典论文讲解:Predicting Organic Reaction Outcomes with Weisfeiler-Lehman Network
赠送视频:深度学习AiphaFold2蛋白质结构预测实例讲解
(以下内容为赠送的视频教程)
蛋白质结构与功能的概述。
蛋白质的组成
蛋白质的结构
蛋白质的功能
常见蛋白质结构预测的网站及方法。
常用蛋白质结构预测的相关网站及软件
常用网站及软件的使用方法及说明
机器学习在蛋白质结构预测的应用。
蛋白质结构与小分子药物库获取
机器学习加速预测小分子药物
AlphaFold2机器学习模型对蛋白结构预测
实战蛋白结构预测目前最好的人工智能模型AlphaFold2。
AlphaFold2模型的获取及安装
AlphaFold2相关数据的获取
AlphaFold2模型的实战操作
03
机器学习代谢组学课程内容
第一天
A1 代谢物及代谢组学的发展与应用
(1) 代谢生理功能;
(2) 代谢疾病;
(3) 非靶向与靶向代谢组学;
(4) 空间代谢组学与质谱成像(MSI);
(5) 代谢流与机制研究;
(6) 代谢组学与药物和生物标志物。
A2 代谢组学实验流程简介
A3 色谱、质谱硬件原理
(1) 色谱分析原理;
(2) 色谱的气相、液相和固相;
(3) 色谱仪和色谱柱的选择;
(4) 质谱分析原理及动画演示;
(5) 正、负离子电离模式;
(6) 色谱质谱联用技术;
(7) LC-MS 的液相系统
A4 代谢通路及代谢数据库
(1) 几种经典代谢通路简介;
(2) 能量代谢通路;
(3) 三大常见代谢物库:HMDB、METLIN 和 KEGG;
(4) 代谢组学原始数据库:Metabolomics Workbench 和Metabolights.
第二天
(3) 样本及代谢物的运输与保存问题;
B2 LC-MS 数据质控与搜库
(1) LC-MS 实验过程中 QC 样本的设置方法;
(2) LC-MS 上机过程的数据质控监测和分析;
(3) XCMS 软件数据转换与提峰;
B3 R 软件基础
(1) R 和 Rstudio 的安装;
(2) Rstudio 的界面配置;
(3) R 的基本数据结构和语法;
(4) 下载与加载包;
(5) 函数调用和 debug;
B4 ggplot2
(1) 安装并使用 ggplot2
(2) ggplot2 的画图哲学;
(3) ggplot2 的配色系统;
(4) ggplot2 画组合图和火山图;
第三天
机器学习
C1 无监督式机器学习在代谢组学数据处理中的应用
(1) 大数据处理中的降维;
(2) PCA 分析作图;
(3) 三种常见的聚类分析:K-means、层次分析与 SOM
(4) 热图和 hcluster 图的 R 语言实现;
C2 一组代谢组学数据的降维与聚类分析的 R 演练
(1) 数据解析;
(2) 演练与操作;
C3 有监督式机器学习在代谢组学数据处理中的应用
(1) 数据用 PCA 降维处理后仍然无法找到差异怎么办?
(2) PLS-DA 找出最可能影响差异的代谢物;
(3) VIP score 和 coef 的意义及选择;
(4) 分类算法:支持向量机,随机森林
C4 一组代谢组学数据的分类算法实现的 R 演练
(1) 数据解读;
(2) 演练与操作;
第四天
D1 代谢组学数据清洗与 R 语言进阶
(1) 代谢组学中的 t、fold-change 和响应值;
(2) 数据清洗流程;
(3) R 语言 tidyverse
(4) R 语言正则表达式;
(5) 代谢组学数据过滤;
(6) 代谢组学数据 Scaling 原理与 R 实现;
(7) 代谢组学数据的 Normalization;
(8) 代谢组学数据清洗演练;
D2 在线代谢组分析网页 Metaboanalyst 操作
(1) 用 R 将数据清洗成网页需要的格式;
(2) 独立组、配对组和多组的数据格式问题;
(3) Metaboanalyst 的 pipeline 和注意事项;
(4) Metaboanalyst 的结果查看和导出;
(5) Metaboanalyst 的数据编辑;
(6) 全流程演练与操作
第五天
E1 机器学习与代谢组学顶刊解读(2-3 篇);
(1) Nature Communication 一篇代谢组学小鼠脑组织样本 database 类型的文献;
(2) Cell 一篇代谢组学患者血液样本的机器学习与疾病判断的文献;
(3) 1-2 篇代谢组学与转录组学和蛋白组学结合的文献。
E2 文献数据分析部分复现(1 篇)
(一)文献深度解;
(2)实操:从原始数据下载到图片复现;
(3) 学员实操。
下方为部分案例图:
三、授课时间
CADD计算机辅助药物设计专题培训班
2023.6.17 -----2023.6.18 全天授课(上午09.00-11.30 下午13.30-17.00)
2023.6.19-----2023.6.21晚上授课(晚上19.00-22.00)
2023.6.25全天授课(上午09.00-11.30 下午13.30-17.00)
2023.6.26 -----2023.6.30晚上授课 (晚上19.00-22.00)
AIDD人工智能药物发现与设计专题培训班
2023.6.24 -----2023.6.25 全天授课(上午09.00-11.30 下午13.30-17.00)
2023.6.27---2023.6.28晚上授课(晚上19.00-22.00)
2023.7.1 -----2023.7.2全天授课(上午09.00-11.30 下午13.30-17.00)
机器学习与代谢组学培训时间
2023.06.17----2023.06.18全天授课(上午 09.00-11.30 下午 13.30-17.00)
2023.06.19----2023.06.20晚上授课 (晚上 19.00-22.00)
2023.06.25 全天授课(上午 09.00-11.30 下午 13.30-17.00)
2023.06.27----2023.06.28晚上授课 (晚上 19.00-22.00)
(腾讯会议直播上课 提供录像回放 录像永久观看)
四、报名费用
CADD计算机辅助药物设计与AIDD人工智能药物发现与设计课程价格:
公费价:每人每班¥5880元 (含报名费、培训费、资料费)
自费价:每人每班¥5480元 (含报名费、培训费、资料费)
机器学习与代谢组学课程价格:
公费价:每人每班¥4680元 (含报名费、培训费、资料费)
自费价:每人每班¥4480元 (含报名费、培训费、资料费)
优惠政策
优惠一:两班同报:9880 三班同报:13880 四班同报:17880
优惠二:提前报名缴费学员+转发到朋友圈或者到学术交流群可享受每人300元优惠(仅限15名)
优惠三:报名两班免费赠送一个学习名额(赠送班任选)
优惠四:报名五个培训班免费赠送三个学习名额(赠送班任选)
报名费用可开具正规报销发票及提供相关缴费证明、邀请函,可提前开具报销发票、文件用于报销
证书:参加培训并通过考试的学员,可以申请获得工业和信息化部工业文化发展中心颁发的“工业强国建设素质素养提升尚工行动”岗位能力适应评测证书。该证书可在中心官网查询,可作为能力评价,考核和任职的重要依据。评测证书查询网址:www.miit-icdc.org(自愿申请,须另行缴纳考试费500元/人)
五、培训福利
报名缴费成功赠送报名班型全套预习视频
课后学习完毕提供全程录像视频回放,针对与培训课程内容 进行长期答疑,微信解疑群永不解散,
参加本次课程的学员可免费再参加一次本单位后期组织的相同的 专题培训班(任意一期都可以)
六、授课方式
通过腾讯会议线上直播,理论+实操的授课模式,老师手把手带着操作,从零基础开始讲解,1600余页电子PPT和教程+预习视频开课前一周提前发送给学员,所有培训使用软件都会发送给学员,有什么疑问采取开麦共享屏幕和微信群解疑,学员和老师交流、学员与学员交流,培训完毕后老师长期解疑,培训群不解散,往期培训学员对于培训质量和授课方式一致评价极高
往期培训群部分好评截图:
往期参会单位
国外院系高校;有来自麻省理工大学、University of Bristol (布里斯托大学)、加州伯克利大学、Osaka University(大版大学)、乔治梅森大学、加州理工大学、曼彻斯特大学 、莱斯大学、波士顿大学、德州 农工大学、德雷克大学、美国联合大学、普林斯顿大学、斯坦福大学、Imperial College London、 KAUSTuniversity、理海大学、TheUniversityofQueensland、澳大利亚昆士兰大学、耶鲁大学、牛 津大学、剑桥大学、匹兹堡大学、悉尼大学、多伦多大学、西雅图华盛顿大学、伦敦大学、杜克大学、东 京大学、哥伦比亚大学、康奈尔大学、纽约大学、西北大学、布朗大学、华盛顿大学
国内院系高校;有来自中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所)、中山大 学、北京大学第一医院、中国医学科学院北京协和医院、西北民族大学、西南大学、山东大学、加州伯克 利大学、启元实验室、中国人民解放军总医院第一医学中心、河南师范大学、南京工业大学、南方科技大 学、南京大学、中国医学科学院基础医学研究所、青海省农林科学院、天津中医药大学第一附属医院、山东大学、黑龙江八一农垦大学、南昌大学第二附属医院、台州市中心医院(台州学院附属医院)、宁波大 学附属人民医院、新疆农业大学、北京林业大学、广西医科大学、湖南文理学院、滨州医学院、滨州医学 院烟台附属医院、华南师范大学、中国环境科学研究院、云南师范大学、昆明理工大学、湖北医药学院、 苏州大学、福州大学、南方医院、南昌大学第二附属医院、深圳市中医院、湖南文理学院、河南科技学 院、福建省立医院、中南大学湘雅医院、深圳市中医院、省立同德医院、内蒙古科技大学包头师范学院、 乌鲁木齐市疾病预防控制中心、中国林业科学研究院林业研究所、中国农业科学院兰州畜牧与兽药研究 所、鲁东大学、河北工程大学、南方医科大学珠江医院、首都医科大学附属北京妇产医院、重庆医科大学 附属第二医院、北京普利智诚生物技术有限公司、复旦大学上海医学院、陕西中医药大学附属医院、中国 医学科学院血液病医院(中国医学科学院血液学研究所)、滨州康达欣医疗器械有限公司、深圳北京大学 香港科技大学医学中心、天津市肿瘤医院、陆军特色医学中心、空军军医大学第一附属医院、江南大学、 中国科学院深圳先进技术研究院、中国科学院上海营养与健康研究所、北京阅众时刻文化传媒有限公司、 北京慧康健怡医疗器械有限公司、杭州奥明基因科技有限公司、亦欣生物科技无锡有限公司、广州市肖悦 生物科技有限公司、张家口泽涵生物科技有限公司、平安科技。感谢对我们培训的认可!还有许多因为时 间冲突无法参加。这次我们诚挚邀请您来参加!
联系人:陈老师
报名电话:18339237911(微信同号)
qq:529201149
引用往期参会学员的一句话: