引言
本次给大家分享的是来自麻省理工学院(MIT)的Regina Barzilay教授和Tommi Jaakkola教授课题组的工作。该研究以「DiffDock: Diffusion Steps, Twists, and Turns for Molecular Docking」为题,于 2022 年发布在 arXiv 。
研究背景
蛋白质的生物学功能可以通过与其结合的小分子配体(如药物)来调节。预测小分子配体化合物与受体蛋白质的结合构象预测对于药物设计至关重要。传统的分子对接方法基于检索和打分函数(score function),首先是搜索配体和受体可能的结合模式(位置、配体在口袋内的取向、配体构象),候选集可能非常大(百万级),然后对候选结合复合物打分。近期把分子对接看作回归问题来处理的深度学习方案逐渐增多,虽然减少了运行时间,但尚未显着提高准确性。
研究简介
该研究团队创新性的将分子对接(molecular docking)视为一个生成建模问题,并采用了时下在图像生成等领域相当热门的生成扩散模型,开发了 DiffDock。模型概览如图1所示,该模型以单独的配体和蛋白质作为输入文件。随机采样的初始对接位姿在平移、旋转和扭转自由度上反向扩散去噪。被采样的对接位姿按告高置信度模型,产生一系列预测和置信度评分,并按照评分排序,获得最终预测。
研究结果
DiffDock 在 PDBBind 上获得了 38% 的 TOP1 成功率(RMSD<2Å),显著优于传统对接方法(SMINA,QuickVina-W,GLIDE和GNINA,成功率约23%)和最先进的深度学习方法(EquiBind和TANKBind,成功率约20%)。与此同时,速度也有3-12倍提升。对于柔性折叠的复合物结构,此前各种方法最大仅达到10.4%的对接成功率,而DiffDock仍达到了21.7%的成功率水平。
DiffDock特点
基于扩散模型:DiffDock 采用扩散模型来生成配体的位置、方向和构象,这是一种新颖的方法,有别于传统的基于评分函数的对接方法。
全局搜索:无需预先定义对接区域,DiffDock 能够进行全面的全局搜索,探索更多可能的结合模式。
端到端学习:DiffDock 能够直接从蛋白质和配体的原子坐标学习,无需人工特征工程。
考虑水分子:将水分子纳入对接过程,提高了预测的准确性和真实性。
高效性能:在多个基准测试中,DiffDock 展现出优于传统方法的性能,特别是在预测复杂蛋白质 - 配体相互作用方面。
快速预测:DiffDock 能够在短时间内生成多个可能的对接构象,为药物设计和筛选提供了高效工具。
模型测试
合肥科晶生物已将DiffDock顺利本地化,可以在 GPU 加速下,计算速度远超传统对接软件,大大提高了分子对接的效率。输入受体蛋白(PDB ID 1AC8)和配体化合物(PubChem SID 26702362),通过与冷冻电镜解析结果对比,评估DiffDock预测化合物与蛋白质之间结合位点,最佳构象的能力和速度。从输入化合物的SDF文件和蛋白质的PDB文件,到输出10个构象,用时小于1分钟。10个构象分别按照置信度高低排序,我们选择最佳构象与PDB构象对比。
冷冻电镜解析构象与DIFFDOCK预测构象之间差异较小,均方根差值(RMSD)仅为0.472。
解析构象中化合物与蛋白质的179位赖氨酸、181位组氨酸和185位丝氨酸存在氢键连接。DIFFDOCK则显示化合物与蛋白质的179位赖氨酸和185位丝氨酸存在氢键连接,精准度较高。
总结
DIFFDOCK 是一种新颖的分子对接方法,具有快速的推理时间和高选择性准确性的置信度估计。随着技术的不断进步,我们可以期待 DiffDock 在加速药物研发进程、降低研发成本等方面发挥越来越重要的作用。
福利来袭!
科晶生物论文出图
免费蛋白互作分析等您来领!
0551-64669001
扫码添加客服,即可领取!
▼