调节蛋白质功能的主要方法涉及蛋白质与小分子配体的相互作用。这些相互作用在生物过程中起着至关重要的作用,例如酶催化、信号转导和细胞内的调节机制。小分子与蛋白质上特定位点的结合可以诱导构象变化、调节活性或抑制功能。该机制是研究蛋白质功能和设计具有定制特性的小分子结合蛋白以用于治疗和工业应用的宝贵工具,包括设计酶来催化没有天然催化剂的反应,以及开发可以通过传递信号检测环境中的化合物的生物传感器,可用于环境监测、临床诊断、病原体检测、药物输送系统和食品工业中的应用。
蛋白质口袋的设计逐渐成为关键一环。
蛋白质口袋,即蛋白质中具有特定形状和化学性质的口袋结构,其能够通过特异性地结合一些小分子化合物,如同锁和钥匙的相互作用,开启或调控生物体内众多的生理过程。从酶的催化反应到信号传导,再到细胞的调节机制,这些相互作用无处不在。因此,设计能够与特定小分子紧密结合的蛋白,即高质量的蛋白质口袋,对于药物研发来说意义非凡。
但是,传统的计算方法在生成高质量的蛋白质口袋时面临诸多困难,常常需要克服蛋白质-配体相互作用的复杂性、配体和氨基酸侧链的灵活性,以及序列结构依赖性等。
近日,一种全新的深度生成模型 PocketGen 的出现,为解决这些难题带来了新的解决方案。该模型由来自中国科学技术大学、哈佛医学院等机构的研究人员共同开发,研究成果发表在 Nature Machine Intelligence 期刊上,通过将人工智能与生物医学相融合,为蛋白质口袋的设计提供了全新的思路和方法。
PocketGen 可以生成具有优异结合亲和力和结构有效性的高保真蛋白质口袋。它的运行速度比基于物理的方法快十倍,成功率达到 95%,成功率定义为生成的口袋中结合亲和力高于参考口袋的百分比。此外,它的氨基酸回收率超过 64%。
PocketGen 模型的最核心的创新之处在于其独特的架构设计。它采用了一种协同设计方案,能够根据给定的配体分子和蛋白质支架(除口袋区域外的部分),同时预测蛋白质口袋的序列和结构。
图|PocketGen 模型独特的架构设计
PocketGen 模型主要由两个关键模块构成,即双层图转换器(bilevel graph transformer)和序列优化模块。
双层图转换器是 PocketGen 的“结构探测器”。它可以将蛋白质-配体复合物建模为块的几何图,以此来捕捉原子、残基和配体等不同层面的相互作用。在这个过程中,其独特的双层注意力机制,犹如一双敏锐的眼睛,既能关注原子级别的细微相互作用,又能把握残基/配体层面的宏观关系,从而全面理解蛋白质口袋内的复杂环境。在生成蛋白质口袋结构时,它可以直接更新口袋区域所有原子的坐标,而不是分别处理骨架和侧链,这种方式大大提高了结构预测的准确性和效率。
而序列优化模块则十分巧妙地将蛋白质语言模型(pLMs)融入其中。通过在 pLMs 中植入轻量级结构适配器,实现了序列与结构特征之间的交叉注意,从而确保生成的序列与结构相互匹配、协调一致。
为了验证 PocketGen 模型的卓越性能,研究团队在两个广泛使用的数据集——CrossDocked 和 Binding MOAD 上进行了严格的测试。研究人员采用了一系列全面的评估指标,包括亲和力、结构有效性以及氨基酸回收率(AAR)等。
与其他六种先进的方法相比,PocketGen 模型展现出了显著的优势。在生成高质量蛋白质口袋方面,它的表现尤为突出。例如,CrossDocked 数据集上,PocketGen 生成的蛋白质口袋在结构有效性上超过了其他方法,其设计能力比部分方法高出 2% - 3%,Vina 分数也比最强的基线方法 RFAA 高出 0.199。在氨基酸回收率方面,PocketGen 平均达到了 63.40%,远高于其他方法,在生成效率上,PocketGen 更是脱颖而出。传统的基于物理的方法(如 PocketOpt)和模板匹配方法(如 DEPACT)生成 100 个蛋白口袋可能需要超过1000 秒,而先进的蛋白骨架生成模型 RFdiffusion 和 RFAA 由于其扩散架构的计算复杂性,也需要较长时间(分别为 1633.5 秒和 2210.1 秒)。相比之下,PocketGen 仅需 44.2 秒即可完成同样的任务,速度提升了数十倍,大大提高了蛋白口袋生成的效率,为大规模的生化实验提供了可能。
图|PocketGen 模型在与其他模型对比中,表现出明显优势
不仅如此,PocketGen 模型还为后续研究开辟了新的方向。例如,它可以进一步拓展到设计蛋白质的更大区域,而不仅仅局限于口袋区域。研究人员也可以通过引入更多的生化先验知识、子口袋和交互模板,进一步提高 PocketGen 模型的泛化能力等。
此外,研究人员还展示了 PocketGen 在先前研究的基础上重新设计针对特定靶配体的抗体、酶和生物传感器口袋的能力。
抗体:皮质醇 (HCY) 是一种主要的压力激素,可提高血液中的葡萄糖水平,并可作为压力和其他疾病的生物标志物。研究人员重新设计了皮质醇特异性抗体 ( PDB ID 8cby )的口袋,以潜在地帮助开发免疫测定。
酶:阿哌沙班 (APX) 是一种口服抗凝剂,于 2012 年获得 FDA 批准,用于治疗非瓣膜性房颤患者,以降低中风和血栓风险。阿哌沙班靶向 Xa 因子 (fXa) ( PDB ID 2p16 ),这是一种凝血过程中的关键酶,可将凝血酶原转化为凝血酶,从而形成血栓。因此,重新设计 fXa 的口袋可能具有治疗意义。
生物传感器:芬太尼 (7V7) 已成为一种被广泛滥用的药物,导致阿片类药物危机。芬太尼结合蛋白(生物传感器)的计算设计可以促进毒素的检测和中和。例如,Baker 等人开发了一种用于检测植物中芬太尼的生物传感器( PDB ID 5tzo )。
PocketGen 能够建立有利的蛋白质-配体相互作用,从而为这些药物配体生成高亲和力口袋。对于 PocketGen,生成的口袋中亲和力高于参考值的百分比分别为 11%、40% 和 45%。相比之下,排名第二的最佳方法 RFAA 在相同情况下仅达到 0%、10% 和 18%。
总而言之,目前阶段 PocketGen 模型能生成如此具有高亲和力和结构有效性的蛋白口袋,对于药物研发具有重要意义,相信未来在 PocketGen 模型的帮助下,我们有望开发出更高效、更具特异性的药物,为疾病治疗带来新的希望。
参考文献:
1.Zhang, Z., Shen, W.X., Liu, Q. et al. Efficient generation of protein pockets with PocketGen.. Nat Mach Intell (2024). https://doi.org/10.1038/s42256-024-00920-9