设计含β-strand的Binder
本篇是长文《再看Binder设计》的一部分,一鱼多吃。设计含β-strand的Binder,拎出来单独再发一篇。
2. 正文
如果读者观察仔细,不难发现,目前的各种Binder设计方案都偏好于设计α-helix的Binder骨架,其中又以稳定的3-helix偏多。归纳如下:
曹龙兴2022年Nature,13个靶点,全是α-helix RFdiffusion, 5个靶点,全是α-helix BindCraft, 10个靶点,1个靶点的Binder含有β-strand MaSIF, 4个靶点,1个靶点的Binder含有β-strand AlphaProteo, 8个靶点,3个靶点的Binder含有β-strand
1. Knowledge Gap
为什么设计β-strand的结合Binder十分困难?
RFdiffusion在生成与目标蛋白表面区域形状互补的骨架方面表现出色[1]。也就是说,RFdiffusion在能生成合理几何特征的Binder骨架。
靶蛋白表面极性区域常存在暴露的氢键供体和受体,设计Binder必须精确定位与靶点的受体和供体相补充,以补偿与水失去的相互作用,但RFdiffusion这类算法并不总是实现氢键供体和受体的详细互补性[1]。也就是说,目前的Binder设计方案在化学特征上做的不是很好。
2. 科学问题
本文[1]要解决的科学问题就β-strand的Binder设计。 许多疾病相关的靶蛋白具有β-sheets和未配对且暴露的β-strands,David Baker通过引入β-strand的condition,改进RFdiffusion,使其能设计的Binder能够互补β-sheet扭曲、弯曲、凸起等其他不规则特征。
上面这一段似乎也是在几何特征上改进,还是没解决文章[1]自己定义的Knowledge Gap,哈哈哈!也许还得靠后面出来的全原子Binder骨架设计模型发力!
注意⚠️:β-sheet是指多个(≥2)β-strand组成起来的二级结构,所以本论文基本用的都是单词β-strand。
3. Conditional RFdiffusion
下图1a
是β-strand界面条件信息的展示**。这部分展示了如何向RFdiffusion模型提供Condition条件信息,以便生成与靶蛋白边缘(edge β-strand,青色)配对的β-strand结合Binder。
Binder的Condition条件信息,包括期望的Binder残基二级结构和N×N块邻接矩阵(SS/ADJ,N是Binder的长度,绿色),该矩阵指定了二级结构块之间的期望邻接性。
Ineraction,条件信息,即:设计长度为L的β-strand(黄色)与靶蛋白的长度为T的edge β-strand(青色)结合。用算法将以上条件信息映射到张量tensor,RFdiffusion会调节靶蛋白-Binder的结合界面。将L个连续的Binder残基,分配给与靶点蛋白的edge β-strand结合。长度N的Binder其余部分(绿色)则没有提供条件信息,于是没有二级结构限制、相互作用限制。这里有点绕,归纳如下:
整个靶蛋白,其中有一小段为edge β-strand,青色 相互作用关键区域,Target edge β-strand(青色) ↔ Binder β-strand(黄色) Binder β-strand长度为L,L < N,是unmasked 整个Binder的长度为N,需提供二级结构SS和邻接矩阵ADJ信息
下图1b
是RFdiffusion去噪轨迹示意图。上半部分是一般的RFdiffusion去去噪轨迹(top)。下半部分是提供β-strand界面条件信息的情况下,RFdiffusion去噪轨迹(bottom)。这表明条件信息对RFdiffusion的引导至关重要。
下图1c
是对比β-strand SS/ADJ 与 仅使用热点hostpots(BFF4)条件下的Binder设计成功率。干实验成功率定义1为Rosetta < 30,干实验成功率定义2为AlphaFold2模型 iPAE < 10。可见,β-strand SS/ADJ条件下显著优与仅使用热点的RFdiffusion。
下图1d
结构聚类表明生成的Binder确实含有β-strand,也表明β-strand界面条件可以引导RFdiffusion探索更广泛的蛋白结构空间,从而设计出结构更多样化的Binder。红色圆圈⭕️也说明β-strand condition有更高的in-silico成功率。1/2/3个α-helix的Binder明显减少,含有不少于1个β-strand的Binder数量明显增多。
4. 实验结果
该论文图2
对很多个靶点的设计β-strand Binder进行了湿实验验证,测试不同温度的CD曲线,拟合出二级结构的比例去估计Tm(下图2b
)。测试不同浓度下的SPR响应值,拟合出蛋白-Binder的亲和力Kd(下图2c
,亲和力范围从0.528-164 nM不等。
该论文图3
还测试Binder与各靶点之间的特异性,特异性指针对靶点A设计的Binder A,只能结合靶点A,与靶点B/C/D不结合。
该论文图4
还解析了一个靶点-Binder的复合物晶体结构,验证了计算设计和实验的一致性。
注⚠️:本文的conditional版本的RFdiffusion代码暂时还未开源。
参考文献
[1]. Sappington, Isaac, et al. "Improved protein binder design using beta-pairing targeted RFdiffusion." bioRxiv (2024): 2024-10.
AI4Protein 2024 大事件
感谢读者的投票,帮助我们了解AI4Protein领域的2024!
本投票结果,将在2024年的最后一天推送在公众号文章。
进群交流
进群请认真填写问卷!
广告勿扰,广告勿扰!
往期合集
干货文章|线上报告|蛋白设计|综述|Binder|Co-design|Benchmark|AF3|David Baker|ESM|MaSIF|结构预测|语言模型|骨架生成|逆向折叠|抗体设计|多肽设计|酶设计|稳定性|药物设计
关注我们
死磕自己,愉悦大家
专注于AI蛋白相关的论文解读&学术速运