10月9日,欧洲中部时间11时45分(北京时间17时45分),瑞典皇家科学院决定将2024年诺贝尔化学奖的一半授予大卫·贝克(David Baker),以表彰他在“计算蛋白质设计”方面的贡献,并将另一半授予戴密斯·哈萨比斯(Demis Hassabis)和约翰·M·詹伯(John M. Jumper),以表彰他们在“蛋白质结构预测”方面的贡献。
在预测类药物相互作用方面,AlphaFold 3 实现了前所未有的准确度,包括蛋白质与配体的结合以及抗体与其靶蛋白的结合。在 PoseBusters 的基准测试中,AlphaFold 3 的准确率比现有最佳传统方法高出 50%,而且无需任何结构信息输入,成为首个超越传统物理预测工具的人工智能系统。这种预测抗体与蛋白质结合的能力,对于理解人类免疫反应的各个方面以及新抗体的设计至关重要。
蛋白质是生命的基石。从构建我们的身体组织,到调节新陈代谢,再到抵抗疾病,蛋白质无处不在。然而,自然界中的蛋白质并不总能满足我们的需求。传统的蛋白质工程方法往往依赖于试错和经验,耗时耗力且效率低下。而AI的出现,为我们打开了一扇新的大门。通过机器学习和深度学习算法,AI能够快速分析海量的蛋白质数据,预测蛋白质结构,甚至从头设计全新的蛋白质。这不仅大大提高了效率
重磅!DeepMind又放大招!
AlphaFold 在蛋白质预测领域一骑绝尘,AlphaFold 3 更是突破限制,实现了所有生命分子的预测,其发布时便有声音称,AlphaFold 3 的结构化预测与生成将加速AI驱动药物设计的发展。
如今,DeepMind 又放大招——发布用于新型蛋白质设计的 AlphaProteo
AlphaProteo是首个专为设计新型高强度蛋白质结合物的AI系统,它可以生成多种目标蛋白的结合物。该系统显著提升了成功率,甚至比现有方法强3至300倍。尤其是针对与癌症和糖尿病并发症相关的VEGF-A蛋白,AlphaProteo是首个设计成功结合物的AI工具。此外,它还能有效结合多种与感染、癌症、炎症和自身免疫疾病相关的蛋白质,例如BHRF1、SARS-CoV-2尖刺蛋白、IL-7Rɑ、PD-L1、TrkA和IL-17A等
AlphaProteo 成功设计了 7 个靶标的蛋白结合剂。包括两种病毒蛋白,BHRF1 和 SARS-CoV-2 刺突蛋白受体结合域 SC2RBD;以及 5 种参与癌症、炎症和自身免疫性疾病的蛋白,SC2RBD、IL-7Rɑ、PD-L1、TrkA、IL-17A 和 VEGF-A。实现了更高的实验成功率和比现有最佳方法高 3 到 300 倍的结合亲和力
对于 BHRF1 ,在 Google DeepMind Wet Lab 中进行测试时,88% 的候选分子成功结合。根据测试的靶标,AlphaProteo 结合剂的结合力平均比现有最佳设计方法强 10 倍;对于另一个靶标 TrkA,该团队设计的结合剂甚至比经过多轮实验优化的针对该靶标的最佳先前设计的结合剂更强!
国内主要从事AI蛋白质设计的高校
北京大学、国际机器学习研究中心、清华大学
中国科学院计算技术研究所、中国人民大学、上海交通大学
复旦大学、上海科技大学、中国科学院上海药物研究所
中国科学院分子细胞科学卓越创新中心
浙江大学、西湖大学、浙江工业大学、
深圳先进技术研究院、清华大学深圳国际研究生院
南方科技大学、中国科学技术大学
厦门大学、山东大学、中国科学院天津工业生物技术研究所
作为2024年最值得期待的技术!
AI蛋白质设计资料与学习途径少之又少,特培训学习迫在眉睫!郑州清瑞信息科技有限公司联合清华大学、北京大学、西湖大学、浙江大学、中国科技技术大学、天津大学、协和药物研究所已经举办培训四十余期,参会学员达5000余人!学员好评极高!其中不乏有发表Nature、Cell、Science等国际顶刊!
主讲老师在国内顶尖课题组中从事人工智能蛋白质设计研究,目前的主要研究方向是蛋白质设计机器学习算法开发与应用,在蛋白质工程和生物相关算法开发有丰富的实战经验。已在Nature communications、ACS Catalysis等国际知名期刊和ICML等机器学习会议上发表论文数十篇
学员评价
AI蛋白质设计课表
*涉及使用代码/计算工具的操作
一、蛋白质相关的深度学习简介
1.基础概念
1.1.机器学习简介:从手写数字识别到大语言模型
1.2.蛋白质结构预测与设计回顾
1.3.Linux简介
1.4.代码环境:VS code和Jupyter notebook*
1.5.Python关键概念介绍*
2.常用的分析/可视化蛋白质及相关分子的方法
2.1.常用数据库与同源序列搜索和MSA构建
2.2.使用pymol和Mol*可视化蛋白质结构*
2.3.使用biopython与biotite分析生物序列与结构数据*
2.4.使用fpocket与point-site分析蛋白质结构口袋*
3.深度学习蛋白质设计与传统蛋白质设计之间的差异
3.1.深度学习的本质
3.2.传统方法:全原子能量函数Rosetta与统计势
3.3.深度学习:几何深度学习
3.4.深度学习与传统的物理方法的互补性
3.5.深度学习蛋白质设计的优越性
4.蛋白质语言模型
4.1.语言模型:从RNN到Transformers
4.2.理解蛋白质语言
4.3.生成式蛋白质语言模型
4.4.结构模型与语言模型的比较分析
5.基于深度学习的蛋白质功能与性质预测
5.1.蛋白质功能分类预测*
5.2.信号肽、跨膜区、亚细胞定位预测
5.3.蛋白质同源结构搜索
5.4.酶活性位点预测
二、深度学习与蛋白质结构预测
1.传统蛋白质(复合物)结构预测
1.1.使用modeller、swiss-model进行同源建模
1.2.基于分子动力学的从头建模
1.3.分子对接加入非蛋白质部分,AutoDock Vina实际操作*
2.现代深度学习用于蛋白质结构预测
2.1.RaptorX:从计算机视觉到蛋白质结构
2.2.AlphaFold2
2.3.AlphaFold3:生成式结构预测
2.4.ESMFold:语言模型与结构预测的融合
3.AlphaFold2 原理回顾
3.1.从共进化到结构
3.2.注意力机制
3.3.EvoFormer
3.4.Structural Module
4.AlphaFold3 介绍
4.1.扩散模型
4.2.训练数据
4.3.AlphaFold3 的成绩与不足
5.AlphaFold2/3 实际操作与结果分析
5.1.AlphaFold2实操*
5.2.AlphaFold2分析*
5.3.AlphaFold server使用*
5.4.本地版的AlphaFold3*
5.5.AlphaFold3分析*
6.ESMFold
6.1.从语言模型到结构预测
6.2.什么时候使用ESMFold,什么时候使用AlphaFold
6.3.ESMFold使用*
三、固定主链蛋白质序列设计
1.传统的蛋白质序列设计
1.1.基于全原子力场*
1.2.基于统计势
2.融入结构知识的语言模型设计蛋白质序列
2.1.ESM-IF原理介绍
2.2.ESM-IF的应用*
3.基于CNN的序列设计
3.1.CNN原理简介
3.2.DenseCPD设计方法
3.3.有侧链构象的设计方法
4.基于GNN设计序列
4.1.ProteinMPNN 的成功经验分析
4.2.ProteinMPNN 的广泛应用
4.3.ProteinMPNN 实际操作*
5.其他的序列设计模型
5.1.ABACUS-R 简介与实际操作*
5.2.CarbonDesign 从结构预测来到序列设计去*
5.3.CARBonAra 环境感知的序列设计*
6.固定主链序列设计在功能蛋白设计中的应用
6.1.新骨架蛋白质表达量优化(Science文章复现)*
6.2.抗体亲和力优化(Science文章复现)*
6.3.结合进化信息的酶性质全方位优化(JACS文章复现)*
四、深度学习蛋白质结构设计
1.传统思路回顾
1.1.结构域拼接
1.2.SCUBA:无侧链的蛋白质力场
2.基于蛋白质表面几何深度学习的binder设计
2.1.masif原理简介
2.2.masif用于识别蛋白表面的PPI热点
2.3.masif设计binder
3.基于扩散模型的蛋白质骨架设计模型
3.1.FrameDiff:基于IPA的主链生成*
3.2.Chroma:等变图神经网络结构设计
3.3.RFDiffusion:基于RosettaFold
3.4.RFDiffusion-All-Atom:基于RosettaFold-All-Atom
4.序列-结构共设计
4.1.trDesign
4.2.AlphaFold Hallucination
4.3.Rfjoint
4.4.Protein Generator
5.结合蛋白从头设计Nature Communication文章流程*
5.1.功能表位的选取
5.2.带限制条件的骨架生成
5.3.迭代优化
6.荧光素酶结构从头设计
6.1.Theozyme理论解释
6.2.骨架生成策略
6.3.活性位点设计与活性进化
五、面向功能的蛋白质序列设计
1.语言的深度学习建模方法
1.1.Transformer
1.2.BERT: Bidirectional Encoder Representations from Transformers
1.3.GPT: Generative Pre-trained Transformers
2.蛋白质语言模型的代表:ESM
2.1.模型框架
2.2.ESM系列工作:ESM-1/2,MSA Transformer,ESM3
2.3.ESM模型实际操作*
3.基于蛋白质语言模型的功能蛋白设计
3.1.预训练+微调的范式
3.2.条件式生成模型:Progen与ZymCTRL
3.3.Progen案例分析
3.4.上手微调ZymCTRL*
4.非自回归的序列生成模型
4.1.ProteinGAN:生成序列
4.2.DeepEvo:生成耐热酶
4.3.Prot-VAE
4.4.P450Diffusion:基于扩散模型设计功能P450*
5.功能蛋白生成后的评估指标
5.1.天然序列相似性评估*
5.2.多样性评估*
5.3.结构合理性评估*
六、基于深度学习的蛋白质挖掘与改造应用
1.酶学性质预测
1.1.DLKcat与GotEnzyme数据库介绍
1.2.UniKP:利用预训练模型挖掘、改造Kcat*
1.3.CLEAN:基于对比学习的EC号预测挖掘稀有脱卤酶*
2.蛋白质热稳定性改造
2.1.MutCompute介绍
2.2.利用MutCompute改造PETase(Nature)*
2.3.ThermoMPNN介绍与使用*
2.4.Pythia介绍与使用*
3.机器学习辅助定向进化/蛋白质工程
3.1.零样本突变效应预测原理
3.2.零样本改造基因编辑酶*
3.3.Low-N策略用于蛋白质工程
3.4.预训练模型的Evo-tuning*
3.5.ECNet介绍
3.6.蛋白质相互作用中的突变效应预测
4.针对自己的实验数据,训练自己的神经网络*
4.1.神经网络训练框架
4.2.数据收集、整理
4.3.特征提取方式
4.4.预训练模型的选取
4.5.模型训练、测试
4.6.新突变的预测
5.深度学习辅助的新酶挖掘*
5.1.基因编辑脱氨酶挖掘(Cell工作复现)
5.2.耐热塑料水解酶挖掘(Nature Communications
5.3.使用FoldSeek进行基于结构的挖掘
通过课程学习您将得到
基于深度学习的通用型蛋白设计模型近几年来发展迅速,本课程围绕蛋白设计基础与前沿工作展开讲述,从蛋白结构的预测与优化到蛋白的从头设计进行深度教学,本课程从零基础开始讲解,对基础知识进行详细讲解,并且会结合前沿文献讲解相关技术的应用。帮助学员们, 通过本次培训学员将了解蛋白质设计的底层逻辑与基本规则,并掌握蛋白质设计中的常见蛋白质设计算法的实际操作,具备基的蛋白质设计算法开发的基础能力及前沿视野。
AIDD人工智能药物发现与设计
课程目标
Science Technology
AIDD人工智能药物发现与设计:是人工智能和机器学习技术使制药领域实现了现代化。目前机器学习和深度学习算法已被应用于多肽合成、虚拟筛选、毒性预测、药物监测和释放、药效团建模、定量构效关系、药物重定位、多药理和生理活性等药物发现过程。可以很好的将传统的面向化学的药物发现与人工智能药物设计相结合。此外,世界各地的系统生物学和化学科学家与计算科学家合作,开发现代ML算法和原理,大大的可以促进药物的发现和开发。
AIDD授课老师老师,有十余年的计算机算法研究和程序设计经验。研究方向涉及生物信息学,深度学习,药物靶标识别,药物不良反应等。参与了国自然基金2项,主持了省厅级科研项目3项。一作身份发表SCI论文数篇,包括BMC Bioinformatics, Journal of Biomedical Informatics, International Journal of Molecular Sciences等知名期刊。
AIDD人工智能药物发现与设计课程:让学员了解药物发现的前沿背景,学习人工智能领域的各类常见算法,熟悉工具包的安装与使用,掌握一定的算法编程能力,能够运用计算机方法研究药物相关问题。通过大量的案例讲解和实践操作,具备一定的AIDD模型构建和数据分析能力。
AIDD人工智能药物发现与设计课表内容
计算机辅助药物设计视频回放课
课程目标
Science Technology
CADD计算机辅助药物设计:依据生物化学、酶学、分子生物学以及遗传学等生命科学的研究成果,以计算机化学为基础,通过计算机的模拟、计算和预算药物与受体生物大分子之间的相互作用,考察药物与靶点的结构互补、性质互补等,设计出合理的药物分子。它是设计和优化先导化合物的方法,特别是在食品、生物、化学、医药、植物、疾病方面应泛!靶点的发现与确证是现代新药研发的第一步,也是新药创制过程中的瓶颈之一。
计算机辅助药物设计主讲老师来自国内高校北京协和医院药物研究所,老师主要擅长深度学习、机器学习、药物虚拟筛选、计算机辅助药物设计、人工智能药物发现、分子对接、分子动力学等方面的研究,有十余年的研究经验。
计算机辅助药物设计主要包含:PDB数据库、靶点蛋白、蛋白质-配体、蛋白-配体小分子、蛋白-配体结构、分子对接、蛋白-配体对接、虚拟筛选、蛋白-蛋白对接、蛋白-多糖分子对接、蛋白-水合对接、分子动力学等
计算机辅助药物设计课表内容
授课时间安排
AI蛋白质设计授课时间
2024.11.01-----2024.11.03(晚上19:00-22:00)
2024.11.08-----2024.11.10(晚上19:00-22:00)
2024.11.15-----2024.11.16(晚上19:00-22:00)
2024.11.22-----2024.11.24(晚上19:00-22:00)
共计12晚的课 通过腾讯会议直播 线上实操 提供全部录播
AIDD人工智能药物发现与设计授课时间
2024.11.02-----2024.11.03(09:00-11:30--13:30-17:00)
2024.11.09-----2024.11.10(09:00-11:30--13:30-17:00)
2024.11.16(09:00-11:30--13:30-17:00)
共计5天的课 通过腾讯会议直播 线上实操 提供全部录播
计算机辅助药物设计视频回放课授课时间
共计全7天的视频课 提供全部录播+代码资料+PPT软件+进群解疑
培训费用及福利
课程报名费用:
AI蛋白质设计直播课:
公费价:每人每班¥6880元 (含报名费、培训费、资料费、提供课后全程回放资料)
自费价:每人每班¥6480元 (含报名费、培训费、资料费、提供课后全程回放资料)
AIDD药物发现与设计直播课
公费价:每人每班¥5880元 (含报名费、培训费、资料费、)
自费价:每人每班¥5580元 (含报名费、培训费、资料费、)
计算机辅助药物设计回放课:
公费价:每人每班¥4980元 (含报名费、培训费、资料费、提供全程回放资料,代码,PPT,进群解疑)
自费价:每人每班¥4580元 (含报名费、培训费、资料费、提供全程回放资料,代码,PPT,进群解疑)
重磅优惠:
报二送一(同时报名两个班免费赠送一个学习名额赠送班任选)
优惠1:
两班同报:10880元 (原价18640)
三班同报:14880元 (原价23620)
特惠一:24880元 (可免费学习一整年本单位举办的任意课程)
特惠二:28880元(可免费学习两整年本单位举办的任意课程)
优惠2:提前报名缴费可享受300元优惠(仅限十五名)
报名学习课程可赠送往期课程回放(报多少赠多少)
(可点击跳转详情链接):
1、课程特色--全面的课程技术应用、原理流程、实例联系全贯穿
2、学习模式--理论知识与上机操作相结合,让零基础学员快速熟练掌握
3、课程服务答疑--主讲老师将为您实际工作中遇到的问题提供专业解答
授课方式:通过腾讯会议线上直播,理论+实操的授课模式,老师手把手带着操作,从零基础开始讲解,电子PPT和教程开课前一周提前发送给学员,所有培训使用软件都会发送给学员,有什么疑问采取开麦共享屏幕和微信群解疑,学员和老师交流、学员与学员交流,培训完毕后老师长期解疑,培训群不解散,往期培训学员对于培训质量和授课方式一致评价极高!
腾讯会议实时直播解答|手把手带着操作
引用本次参会学员的一句话: