Binder 结构和序列的联合设计
BindCraft
2024年10月1日,Sergey Ovchinnikov 和 Bruno E. Correia发表了一篇, 题为BindCraft: one-shot design of functional protein binders的论文。
介绍了 BindCraft 这一创新的自动化流程,它利用 AlphaFold2 深度学习模型的权重,无需高通量筛选或实验优化即可设计出功能性蛋白质结合剂 Binder,解决了传统方法耗时且效率低下的问题,并显著提高了设计成功率在10-100%,为治疗、诊断和生物技术领域带来了突破。
关键词
蛋白设计|联合设计|AF2|Binder
背景
蛋白质-蛋白质相互作用(PPI)是生物过程中的核心过程,但设计能够调节这些相互作用的蛋白质结合剂一直充满挑战。
传统实验方法,如:免疫接种和抗体库筛选既耗时又费力。基于传统物理的方法,如Rosetta,虽然在早期 Binder 设计中起到了关键作用,但成功率低(<0.1%)和需要大量设计采样的问题。并且在对接目标蛋白结构时,可能因表面不匹配而无法有效靶向某些表位。
随着计算蛋白设计的进步,尤其是深度学习模型AlphaFold2的应用,现在能够更精确地预测蛋白质结构,从而设计出新的蛋白质结合剂。
BindCraft正是基于AF2的技术,它是一个开源的自动化设计流程,能利用AF2来高效设计出功能性结合Binder,无需进行大规模的实验筛选,大大简化了设计过程,并提高了成功率。这项工作代表着计算设计领域的一大进步,为治疗、诊断和生物技术开辟了新的可能性。
编者也推荐感兴趣的读者事先学习相关的几篇文章:
原理
BindCraft 的 Binder 设计流程(图1a),可以分为以下几个主要步骤:
输入目标蛋白结构 生成 Binder 骨架和序列 序列优化 过滤
1. 输入目标蛋白结构
用户输入目标蛋白的PDB格式结构,BindCraft将使用这个结构来指导后续的结合剂设计。这一步是整个流程的基础,因为目标蛋白的结构决定了可能的结合位点和结合剂设计的出发点。
2. 生成 Binder 骨架和序列
模型:AF2-Multimer
初始化:BindCraft首先随机生成一个结合剂序列,并将其与目标蛋白结构一起输给AF2-Multimer模型。
结构预测和损失计算:AF2模型预测结合剂的结构,并计算设计损失,这个损失包括多个项,如pLDDT、ipTM等,用于评估 Binder 与目标蛋白的匹配程度。
反向传播和优化:利用计算出的损失函数,通过反向传播更新 Binder 序列,以优化 Binder 的结构和序列(下图)。
3. 序列优化
模型:solMPNN 界面保持:在这一步中,结合剂与目标蛋白的结合界面保持不变。 序列优化:使用 solMPNN 对 Binder 的核心和非表面序列进行优化,以提高结合剂的稳定性和可溶性。
4. 过滤
模型:AF2单体模型 复查:优化后的 Binder 再次使用AF2单体模型进行预测。 评分:结合 AF2 的置信度评分和 Rosetta 物理评分对设计进行过滤,选择最有可能成功的 Binder 序列。
这里过滤的标准考虑的相当全面,也十分专业。编者看了下仓库,这里的筛选标准包括以下指标:
1. MPNN_score
2. MPNN_seq_recovery
3. pLDDT
4. pTM
5. i_pTM
6. pAE
7. i_pAE
8. i_pLDDT
9. ss_pLDDT
10. Unrelaxed_Clashes
11. Relaxed_Clashes
12. Binder_Energy_Score
13. Surface_Hydrophobicity
14. ShapeComplementarity
15. PackStat
16. dG
17. dSASA
18. dG/dSASA
19. Interface_SASA_%
20. Interface_Hydrophobicity
21. n_InterfaceResidues
22. n_InterfaceHbonds
23. InterfaceHbondsPercentage
24. n_InterfaceUnsatHbonds
25. InterfaceUnsatHbondsPercentage
26. Interface_Helix%
27. Interface_BetaSheet%
28. Interface_Loop%
29. Binder_Helix%
30. Binder_BetaSheet%
31. Binder_Loop%
32. InterfaceAAs
33. HotspotRMSD
34. Target_RMSD
35. Binder_pLDDT
36. Binder_pTM
37. Binder_pAE
38. Binder_RMSD
经过上述步骤后,BindCraft 将输出一系列高质量的结合剂设计,这些设计可以直接用于实验验证,如SPR实验或晶体学分析。
结果
BindCraft 设计流程针对的数十个目前蛋白设计了Binder小蛋白。这些靶点包括细胞表面受体、过敏原、从头设计的蛋白质、多域核酸酶等,它们在治疗和科研中具有重要的意义和价值。
对于每个靶蛋白,图1b提供了以下信息:
蓝色框:表示成功设计的数量与实验测试总数的比例。 黄色框:显示最高亲和力结合剂的Kd值(无需进一步实验优化)。 橙色框:表示因拟合不佳而需重新测定的预估计的Kd值。
靶点 | 成功数量 | 最高Kd值 | 预估Kd值 |
---|---|---|---|
PD-1 | 13/53 | < 1 nM | |
PD-L1 | 7/9 | 615 nM | |
IFNAR2 | 3/9 | 260 nM | - |
CD45 | 4/16 | 15 nM | - |
SpCas9 | 6/6 | 267 nM | |
DerF7 | 4/10 | 12.8 nM | - |
DerF21 | 4/7 | 793 nM | |
BetV1 | 2/7 | 120 nM | - |
BBF-14 | 6/11 | 20.9 nM | - |
SAS-6 | 3/9 | 5.7 μM | - |
从上表可看出 BindCraft 在针对多样化靶点和具有挑战性的蛋白质靶点,设计出高亲和力Binder结合剂方面的效率和潜力。证明了 BindCraft 在计算 Binder 设计领域的先进性,以及其在生物技术和治疗应用中的潜在价值。
文献代码
[1] Pacesa, Martin, et al. "BindCraft: one-shot design of functional protein binders." bioRxiv (2024): 2024-09.
[2] https://github.com/martinpacesa/BindCraft
往期合集
干货文章|线上报告|蛋白设计|综述|Binder|Co-design|Benchmark|AF3|David Baker|ESM|MaSIF|结构预测|语言模型|骨架生成|逆向折叠|抗体设计|多肽设计|酶设计|稳定性|药物设计
关注我们
死磕自己,愉悦大家
专注于AI蛋白相关的论文解读&学术速运