David Baker|设计含β-strand的Binder

文摘   2024-12-04 22:11   广东  

设计含β-strand的Binder

本篇是长文《再看Binder设计》的一部分,一鱼多吃。设计含β-strand的Binder,拎出来单独再发一篇。

2. 正文

如果读者观察仔细,不难发现,目前的各种Binder设计方案都偏好于设计α-helix的Binder骨架,其中又以稳定的3-helix偏多。归纳如下:

  • 曹龙兴2022年Nature,13个靶点,全是α-helix
  • RFdiffusion, 5个靶点,全是α-helix
  • BindCraft, 10个靶点,1个靶点的Binder含有β-strand
  • MaSIF, 4个靶点,1个靶点的Binder含有β-strand
  • AlphaProteo, 8个靶点,3个靶点的Binder含有β-strand



1. Knowledge Gap

为什么设计β-strand的结合Binder十分困难?

RFdiffusion在生成与目标蛋白表面区域形状互补的骨架方面表现出色[1]。也就是说,RFdiffusion在能生成合理几何特征的Binder骨架

靶蛋白表面极性区域常存在暴露的氢键供体和受体,设计Binder必须精确定位与靶点的受体和供体相补充,以补偿与水失去的相互作用,但RFdiffusion这类算法并不总是实现氢键供体和受体的详细互补性[1]。也就是说,目前的Binder设计方案在化学特征上做的不是很好




2. 科学问题

本文[1]要解决的科学问题就β-strand的Binder设计。 许多疾病相关的靶蛋白具有β-sheets和未配对且暴露的β-strands,David Baker通过引入β-strand的condition,改进RFdiffusion,使其能设计的Binder能够互补β-sheet扭曲、弯曲、凸起等其他不规则特征

上面这一段似乎也是在几何特征上改进,还是没解决文章[1]自己定义的Knowledge Gap,哈哈哈!也许还得靠后面出来的全原子Binder骨架设计模型发力!

注意⚠️:β-sheet是指多个(≥2)β-strand组成起来的二级结构,所以本论文基本用的都是单词β-strand。




3. Conditional RFdiffusion

下图1a是β-strand界面条件信息的展示**。这部分展示了如何向RFdiffusion模型提供Condition条件信息,以便生成与靶蛋白边缘(edge β-strand,青色)配对的β-strand结合Binder。

Binder的Condition条件信息,包括期望的Binder残基二级结构和N×N块邻接矩阵(SS/ADJ,N是Binder的长度,绿色),该矩阵指定了二级结构块之间的期望邻接性。

Ineraction,条件信息,即:设计长度为L的β-strand(黄色)与靶蛋白的长度为T的edge β-strand(青色)结合。用算法将以上条件信息映射到张量tensor,RFdiffusion会调节靶蛋白-Binder的结合界面。将L个连续的Binder残基,分配给与靶点蛋白的edge β-strand结合。长度N的Binder其余部分(绿色)则没有提供条件信息,于是没有二级结构限制、相互作用限制。这里有点绕,归纳如下:

  • 整个靶蛋白,其中有一小段为edge β-strand,青色
  • 相互作用关键区域,Target edge β-strand(青色) ↔ Binder β-strand(黄色)
  • Binder β-strand长度为L,L < N,是unmasked
  • 整个Binder的长度为N,需提供二级结构SS和邻接矩阵ADJ信息

下图1b是RFdiffusion去噪轨迹示意图。上半部分是一般的RFdiffusion去去噪轨迹(top)。下半部分是提供β-strand界面条件信息的情况下,RFdiffusion去噪轨迹(bottom)。这表明条件信息对RFdiffusion的引导至关重要。



下图1c是对比β-strand SS/ADJ 与 仅使用热点hostpots(BFF4)条件下的Binder设计成功率。干实验成功率定义1为Rosetta < 30,干实验成功率定义2为AlphaFold2模型 iPAE < 10。可见,β-strand SS/ADJ条件下显著优与仅使用热点的RFdiffusion。



下图1d结构聚类表明生成的Binder确实含有β-strand,也表明β-strand界面条件可以引导RFdiffusion探索更广泛的蛋白结构空间,从而设计出结构更多样化的Binder。红色圆圈⭕️也说明β-strand condition有更高的in-silico成功率。1/2/3个α-helix的Binder明显减少,含有不少于1个β-strand的Binder数量明显增多。




4. 实验结果

该论文图2对很多个靶点的设计β-strand Binder进行了湿实验验证,测试不同温度的CD曲线,拟合出二级结构的比例去估计Tm(下图2b)。测试不同浓度下的SPR响应值,拟合出蛋白-Binder的亲和力Kd(下图2c,亲和力范围从0.528-164 nM不等。

该论文图3还测试Binder与各靶点之间的特异性,特异性指针对靶点A设计的Binder A,只能结合靶点A,与靶点B/C/D不结合。

该论文图4还解析了一个靶点-Binder的复合物晶体结构,验证了计算设计和实验的一致性。

注⚠️:本文的conditional版本的RFdiffusion代码暂时还未开源。

参考文献

[1]. Sappington, Isaac, et al. "Improved protein binder design using beta-pairing targeted RFdiffusion." bioRxiv (2024): 2024-10.

AI4Protein 2024 大事件

感谢读者的投票,帮助我们了解AI4Protein领域的2024!

本投票结果,将在2024年的最后一天推送在公众号文章。

进群交流

进群请认真填写问卷!

广告勿扰,广告勿扰!

往期合集

干货文章线上报告蛋白设计综述BinderCo-designBenchmarkAF3David BakerESMMaSIF结构预测语言模型骨架生成逆向折叠抗体设计多肽设计酶设计稳定性药物设计

关注我们

死磕自己,愉悦大家

专注于AI蛋白相关的论文解读&学术速运

AI4Protein
读书破万卷juǎn,专注于AI蛋白相关的学术搬运。
 最新文章