BindCraft|一站式设计高亲和力Binder

文摘   2024-10-23 21:30   广东  

Binder 结构和序列的联合设计

BindCraft

2024年10月1日,Sergey OvchinnikovBruno E. Correia发表了一篇, 题为BindCraft: one-shot design of functional protein binders的论文。

介绍了 BindCraft 这一创新的自动化流程,它利用 AlphaFold2 深度学习模型的权重,无需高通量筛选或实验优化即可设计出功能性蛋白质结合剂 Binder,解决了传统方法耗时且效率低下的问题,并显著提高了设计成功率在10-100%,为治疗、诊断和生物技术领域带来了突破。

关键词

蛋白设计|联合设计|AF2|Binder

背景

蛋白质-蛋白质相互作用(PPI)是生物过程中的核心过程,但设计能够调节这些相互作用的蛋白质结合剂一直充满挑战。

传统实验方法,如:免疫接种和抗体库筛选既耗时又费力。基于传统物理的方法,如Rosetta,虽然在早期 Binder 设计中起到了关键作用,但成功率低(<0.1%)和需要大量设计采样的问题。并且在对接目标蛋白结构时,可能因表面不匹配而无法有效靶向某些表位

随着计算蛋白设计的进步,尤其是深度学习模型AlphaFold2的应用,现在能够更精确地预测蛋白质结构,从而设计出新的蛋白质结合剂。

BindCraft正是基于AF2的技术,它是一个开源的自动化设计流程,能利用AF2来高效设计出功能性结合Binder,无需进行大规模的实验筛选,大大简化了设计过程,并提高了成功率。这项工作代表着计算设计领域的一大进步,为治疗、诊断和生物技术开辟了新的可能性。

编者也推荐感兴趣的读者事先学习相关的几篇文章:

原理

BindCraft 的 Binder 设计流程(图1a),可以分为以下几个主要步骤:

  • 输入目标蛋白结构
  • 生成 Binder 骨架和序列
  • 序列优化
  • 过滤

1. 输入目标蛋白结构

用户输入目标蛋白的PDB格式结构,BindCraft将使用这个结构来指导后续的结合剂设计。这一步是整个流程的基础,因为目标蛋白的结构决定了可能的结合位点和结合剂设计的出发点。


2. 生成 Binder 骨架和序列

  • 模型:AF2-Multimer

  • 初始化:BindCraft首先随机生成一个结合剂序列,并将其与目标蛋白结构一起输给AF2-Multimer模型。

  • 结构预测和损失计算:AF2模型预测结合剂的结构,并计算设计损失,这个损失包括多个项,如pLDDT、ipTM等,用于评估 Binder 与目标蛋白的匹配程度。

  • 反向传播和优化:利用计算出的损失函数,通过反向传播更新 Binder 序列,以优化 Binder 的结构和序列(下图)。

Binder 结构和序列的联合设计

3. 序列优化

  • 模型:solMPNN
  • 界面保持:在这一步中,结合剂与目标蛋白的结合界面保持不变。
  • 序列优化:使用 solMPNN 对 Binder 的核心和非表面序列进行优化,以提高结合剂的稳定性和可溶性。
BindCraft 的序列优化部分

4. 过滤

  • 模型:AF2单体模型
  • 复查:优化后的 Binder 再次使用AF2单体模型进行预测。
  • 评分:结合 AF2 的置信度评分和 Rosetta 物理评分对设计进行过滤,选择最有可能成功的 Binder 序列。
BindCraft 的筛选步骤

这里过滤的标准考虑的相当全面,也十分专业。编者看了下仓库,这里的筛选标准包括以下指标:

1. MPNN_score
2. MPNN_seq_recovery
3. pLDDT
4. pTM
5. i_pTM
6. pAE
7. i_pAE
8. i_pLDDT
9. ss_pLDDT
10. Unrelaxed_Clashes
11. Relaxed_Clashes
12. Binder_Energy_Score
13. Surface_Hydrophobicity
14. ShapeComplementarity
15. PackStat
16. dG
17. dSASA
18. dG/dSASA
19. Interface_SASA_%
20. Interface_Hydrophobicity
21. n_InterfaceResidues
22. n_InterfaceHbonds
23. InterfaceHbondsPercentage
24. n_InterfaceUnsatHbonds
25. InterfaceUnsatHbondsPercentage
26. Interface_Helix%
27. Interface_BetaSheet%
28. Interface_Loop%
29. Binder_Helix%
30. Binder_BetaSheet%
31. Binder_Loop%
32. InterfaceAAs
33. HotspotRMSD
34. Target_RMSD
35. Binder_pLDDT
36. Binder_pTM
37. Binder_pAE
38. Binder_RMSD

经过上述步骤后,BindCraft 将输出一系列高质量的结合剂设计,这些设计可以直接用于实验验证,如SPR实验或晶体学分析。

结果

BindCraft 设计流程针对的数十个目前蛋白设计了Binder小蛋白。这些靶点包括细胞表面受体、过敏原、从头设计的蛋白质、多域核酸酶等,它们在治疗和科研中具有重要的意义和价值。

对于每个靶蛋白,图1b提供了以下信息:

  • 蓝色框:表示成功设计的数量与实验测试总数的比例。
  • 黄色框:显示最高亲和力结合剂的Kd值(无需进一步实验优化)。
  • 橙色框:表示因拟合不佳而需重新测定的预估计的Kd值。
图|BindCraft 针对各靶点设计Binder的实验成功率和最优Kd值
靶点成功数量最高Kd值预估Kd值
PD-113/53
< 1 nM
PD-L17/9
615 nM
IFNAR23/9260 nM-
CD454/1615 nM-
SpCas96/6
267 nM
DerF74/1012.8 nM-
DerF214/7
793 nM
BetV12/7120 nM-
BBF-146/1120.9 nM-
SAS-63/95.7 μM-

上表可看出 BindCraft 在针对多样化靶点和具有挑战性的蛋白质靶点,设计出高亲和力Binder结合剂方面的效率和潜力。证明了 BindCraft 在计算 Binder 设计领域的先进性,以及其在生物技术和治疗应用中的潜在价值。

文献代码

[1] Pacesa, Martin, et al. "BindCraft: one-shot design of functional protein binders." bioRxiv (2024): 2024-09.

[2] https://github.com/martinpacesa/BindCraft

往期合集

干货文章线上报告蛋白设计综述BinderCo-designBenchmarkAF3David BakerESMMaSIF结构预测语言模型骨架生成逆向折叠抗体设计多肽设计酶设计稳定性药物设计

关注我们

死磕自己,愉悦大家

专注于AI蛋白相关的论文解读&学术速运

历史文章

  1. AlphaFold3 图解

  2. AlphaFold3 万字长文解读

  3. AlphaFold3 预测蛋白突变亲和力变化?

  4. 一文看懂 Binder 设计

  5. 蛋白结构和序列的共同设计

  6. 深度学习如何助力抗体设计

  7. 蛋白计算海内外课题组汇总

  8. Meta AI 蛋白语言模型ESM系列

  9. COMPSS 酶蛋白从头设计的筛选方法

  10. 简述酶的定向进化

  11. Cell 综述:从头蛋白设计之结构到功能

  12. CSH 综述文章:结构预测与蛋白设计

  13. CSH 综述文章:蛋白质序列的生成模型

  14. Nat. Biotech. 蛋白设计专刊

  15. Nat. Biotech. 深度学习与功能蛋白设计

  16. Nat. Biotech. 功能蛋白从头设计的星火

  17. ProteinBench 蛋白设计最全的Benchmark

  18. ProteinGym 蛋白突变最好的Benchmark

  19. DiG 预测蛋白构象分布

  20. MaSIF 基于表面指纹的蛋白从头设计

  21. SaProt 结构感知的蛋白质语言模型

  22. InstructPLM 语言模型与逆向折叠的结合

  23. CRISPR-GPT 基因编辑的大模型智能体

AI4Protein
读书破万卷juǎn,专注于AI蛋白相关的学术搬运。
 最新文章