再看Binder设计

文摘   2024-12-01 15:42   广东  

再看Binder设计


虽然编者之前也介绍过Binder设计的一些文章,譬如:

但最近读了些文献,发现Binder设计其实远远不止于此,看到了更广阔的一些东西。于是再梳理归纳一篇Binder的长文,Please Enjoy。

目录

1. 背景介绍
2. 相关工作
2.1 David Baker,设计含β-strand的Binder [1]
2.2 David Baker,RFpeptides设计环肽 [2]
2.4 David Baker,蛋白IDR区域序列的特异性靶向 [3]
2.4 David Baker,扩散设计IDP蛋白Binder [4]
2.5 最新Nature,IDR的PPI是否有手性约束?[5]
2.6 David Baker,pMHC的Binder设计 [6]

3. Binder与CAR-T
3.1 什么是CAR-T
3.2 David Baker,Nature文章 [7]
3.3 谢琦曹龙兴的NBE文章 [8]
3.4 Andrea Schmidts的文章 [9]

4. PPI数据库AlphaSeq [10]
5. 讨论总结

1. 背景介绍

《一文看懂Binder设计》的文章中,已经介绍梳理了Binder设计的背景、模版设计、骨架设计、序列设计、筛选指标方法等。

《AlphaProteo|从头设计高亲和力Binder蛋白》一文中,对AlphaProteo模型的生成器、过滤器、联合设计、是否为全原子设计、靶点选择、实验结果等方面进行了猜测和讨论。

《Binder设计大赛的结果》启示我们,不能盲目相信结构预测的置信度指标;设计工具、设计方案也可以多种多样,关键看怎么用好。

《BindCraft|一站式设计高亲和力Binder》一文中,大师Sergey通过幻觉不断迭代优化Binder的Backbone,再结合solMPNN优化序列,整体pipeline也算是结构+序列的联合设计。之前EvoPro这类方案只是不断迭代设计序列BindCraft表明不断迭代优化BackBone也很重要。另外,BindCraft给出了迄今为止最全面的Binder筛选指标

大师Sergey的《RSO》也能进行Binder设计,论文中也有案例。RSO的优势在于对Hallucination考虑relax的序列,相对于RFdiffusion能设计出更合理的BackBone。


虽然虽然有如此多前人的优秀工作,Binder设计其实还有一些局限性、或一些有价值的应用场景未涉及,比如:

  • RFdiffusion偏好生成α-helix的骨架,怎么生成含β-sheet的Binder?
  • 针对IDR的靶点,如何设计Binder?是否有手性约束?
  • 如何设计环肽的蛋白结合剂?
  • Binder如何应用到CAR-T治疗中去?
  • 缺乏PPI数据库,如何解决?

读者如果仔细看了上面的目录,这些问题,大概心中就有了答案。 也可以跟随编者,按照目录在下文中一点点展开,探索上述问题的答案。

2. 相关工作

2.1. 设计含β-strand的Binder

如果读者观察仔细,不难发现,目前的各种Binder设计方案都偏好于设计α-helix的Binder骨架,其中又以稳定的3-helix偏多。归纳如下:

  • 曹龙兴2022年Nature,13个靶点,全是α-helix
  • RFdiffusion, 5个靶点,全是α-helix
  • BindCraft, 10个靶点,1个靶点的Binder含有β-strand
  • MaSIF, 4个靶点,1个靶点的Binder含有β-strand
  • AlphaProteo, 8个靶点,3个靶点的Binder含有β-strand

2.1.1 Knowledge Gap

为什么设计β-strand的结合Binder十分困难?

RFdiffusion在生成与目标蛋白表面区域形状互补的骨架方面表现出色[1]。也就是说,RFdiffusion在能生成合理几何特征的Binder骨架

靶蛋白表面极性区域常存在暴露的氢键供体和受体,设计Binder必须精确定位与靶点的受体和供体相补充,以补偿与水失去的相互作用,但RFdiffusion这类算法并不总是实现氢键供体和受体的详细互补性[1]。也就是说,目前的Binder设计方案在化学特征上做的不是很好


2.1.2 科学问题

本文[1]要解决的科学问题就β-strand的Binder设计。 许多疾病相关的靶蛋白具有β-sheets和未配对且暴露的β-strands,David Baker通过引入β-strand的condition,改进RFdiffusion,使其能设计的Binder能够互补β-sheet扭曲、弯曲、凸起等其他不规则特征

上面这一段似乎也是在几何特征上改进,还是没解决文章[1]自己定义的Knowledge Gap,哈哈哈!也许还得靠后面出来的全原子Binder骨架设计模型发力!

注意⚠️:β-sheet是指多个(≥2)β-strand组成起来的二级结构,所以本论文基本用的都是单词β-strand。


2.1.3 Conditional RFdiffusion

下图1a是β-strand界面条件信息的展示。这部分展示了如何向RFdiffusion模型提供Condition条件信息,以便生成与靶蛋白边缘(edge β-strand,青色)配对的β-strand结合Binder。

Binder的Condition条件信息,包括期望的Binder残基二级结构和N×N块邻接矩阵(SS/ADJ,N是Binder的长度,绿色),该矩阵指定了二级结构块之间的期望邻接性。

Ineraction,条件信息,即:设计长度为L的β-strand(黄色)与靶蛋白的长度为T的edge β-strand(青色)结合。用算法将以上条件信息映射到张量tensor,RFdiffusion会调节靶蛋白-Binder的结合界面。将L个连续的Binder残基,分配给与靶点蛋白的edge β-strand结合。长度N的Binder其余部分(绿色)则没有提供条件信息,于是没有二级结构限制、相互作用限制。这里有点绕,归纳如下:

  • 整个靶蛋白,其中有一小段为edge β-strand,青色
  • 相互作用关键区域,Target edge β-strand(青色)Binder β-strand(黄色)
  • Binder β-strand长度为L,L < N,是unmasked
  • 整个Binder的长度为N,需提供二级结构SS和邻接矩阵ADJ信息

下图1b是RFdiffusion去噪轨迹示意图。上半部分是一般的RFdiffusion去去噪轨迹(top)。下半部分是提供β-strand界面条件信息的情况下,RFdiffusion去噪轨迹(bottom)。这表明条件信息对RFdiffusion的引导至关重要。


下图1c是对比β-strand SS/ADJ 与 仅使用热点hostpots(BFF4)条件下的Binder设计成功率。干实验成功率定义1为Rosetta < 30,干实验成功率定义2为AlphaFold2模型 iPAE < 10。可见,β-strand SS/ADJ条件下显著优与仅使用热点的RFdiffusion。


下图1d结构聚类表明生成的Binder确实含有β-strand,也表明β-strand界面条件可以引导RFdiffusion探索更广泛的蛋白结构空间,从而设计出结构更多样化的Binder。红色圆圈⭕️也说明β-strand condition有更高的in-silico成功率。1/2/3个α-helix的Binder明显减少,含有不少于1个β-strand的Binder数量明显增多。


2.1.4 实验结果

该论文图2对很多个靶点的设计β-strand Binder进行了湿实验验证,测试不同温度的CD曲线,拟合出二级结构的比例去估计Tm(下图2b)。测试不同浓度下的SPR响应值,拟合出蛋白-Binder的亲和力Kd(下图2c,亲和力范围从0.528-164 nM不等。

该论文图3还测试Binder与各靶点之间的特异性,特异性指针对靶点A设计的Binder A,只能结合靶点A,与靶点B/C/D不结合。

该论文图4还解析了一个靶点-Binder的复合物晶体结构,验证了计算设计和实验的一致性。

注⚠️:本文的conditional版本的RFdiffusion代码暂时还未开源。

2. 相关工作

2.2. 设计环肽的RFpeptides

可以看到RFpeptides [2] 的最后一个通讯是Gaurav Bhardwaj,他和David Baker一样也是华盛顿大学的,不过是在药学院不是在IPD。浏览其谷歌主页不难发现,Gaurav是多年一直深耕多肽环肽的研究(下图),今年也与David Baker合作发表了一篇关于大环分子的Science文章


华盛顿大学已将RFpeptides授权给公司Vilya(https://vilyatx.com),这是一家IPD的衍生公司。Gaurav Bhardwaj和David Baker是该公司的联合创始人、顾问和股东。


2.2.1 设计哪一种环肽?

环肽其实有很多种成环的方式(下图),包括:

  • Side chain-to-side chain
  • Head-to-tail
  • Tail-to-side chain
  • Head-to-side chain
DOI: 10.1039/d1ob00411e

RFpeptides其实是最简单的一种成环方式,Head-to-tail首尾成环,通过形成酰胺键连接在一起。


2.2.2 RFpeptides的位置编码和多样性

位置编码: 在大环肽设计中,相对位置编码是关键,它通过在肽链的一半位置切换从正编码(“向右”)到负编码(“向左”)来实现循环图1A展示了将循环对称的相对位置编码引入,使得RFdiffusion能够生成具有特定拓扑结构的大环肽。

图1A|位置编码

图1D展示了大环肽链的相对位置编码是循环的(左上角);除了图1D左上角之外,链与链之间和靶蛋白链的相对位置编码用标准的形式。


环肽的多样性图1B展示了RFpeptides能够产生多样的循环肽,包括α-螺旋、β-折叠和环/线圈二级结构。

图1B|环肽的多样性

2.2.3 RFpeptides的流程

RFpeptides的流程
  1. 骨架生成:使用位置编码改进的RFdiffusion生成大环肽骨架
  2. 序列设计:用ProteinMPNN多轮迭代设计序列,Rosetta Relax实现局部构象优化
  3. 结构预测:使用Sergey的AfCycDesign预测复合物结构
  4. 筛选指标:结构预测置信度指标iPAE、pLDDT,RMSD<2Å,Rosetta的物理界面质量指标ddG、SAP、接触面积CMS等

2.2.4 实验结果

论文图2/3/4对多个靶点进行了实验验证,包括亲和力甚至共晶结构的解析。以其中一个靶点RbtA为例,介绍其实验结果。

下图4A,是靶点和环肽复合物结构示意图,可见环肽与靶点互补性特别好,在空腔里面;紫色显示的大环被设计为与灰色显示的细菌蛋白目标结合。

下图4B是SPR不同浓度的响应曲线,拟合出来的亲和力为9.4 nM;实验揭示了分子之间具有高亲和力的相互作用。

下图4C是预测的复合物结构和XRD实验解析的晶体结构Align;以及Align之后的界面对比放大的示意图;复合物结构RMSD误差仅有1.4埃米。


论文作者之一David Juergens说:“这对于药物设计的影响确实令人兴奋,因为大环肽可以在许多方面的优点、且可定制,而正常的肽和蛋白无法做到。” [14]

RFpeptides的工作标志着利用AI解决生物学的挑战又进一步。虽然它最初作为药物设计工具进行开发,但RFpeptides也可以用来创建诊断试剂以及用于医学研究之外的其他定制肽。

注⚠️:本文的RFpeptides代码暂时还未开源。

2. 相关工作

2.3. 蛋白IDR区域序列的特异性靶向

设计能够特异性结合内在无序蛋白区域(Intrinsically Disordered Regions, IDRs)的蛋白方面存在的挑战

本文提出一种结合生物物理和深度学习的方案,通过多样化模板和RFdiffusion来针对IDRs生成结合蛋白,旨在填补上面指出的Knowledge Gap。

通过此方法,作者在39个靶蛋白上进行验证,每个靶点设计36个结合蛋白。其中34个亲和力优于100 nM,4个亲和力达到pM级别下图。表明该方法可能为IDRs识别的一种通用解决方案 [3]。

本文实验验证的亲和力靶点,以及该靶点最优亲和力,黄色是失败的

2.3.1. 设计流程

第一步:口袋生成

下图1c展示如何针对单个氨基酸或二肽构建结合口袋,类型包含单口袋E、单口袋RT、单口袋PV、双口袋PV等(全部口袋,见论文SI Table7),其中E、R、T、P、V是氨基酸的单字母类型。这些口袋能为目标肽的侧链形成相互作用或氢键等,也保证结构上兼容性互补性等。

第一步:口袋生成(pocket generation)

第二步:口袋组装

下图1d展示了口袋组装(Pocket Assembly)。通过重新组合多个口袋,使用RFdiffusion生成它们之间的界面,以生成整体刚性结构(IDR的结合蛋白骨架,灰色,下面的拓展图1A-B)。然后生成很多个结合骨架的模板,口袋以不同的顺序和几何形状排列,以实现对一般IDR序列识别的能力。

第二步:口袋组装(Pocket Assembly)
拓展图1A-B

第三步:线程

下图1a展示了线程(Threading)。将IDR目标序列穿过所有模板(上一步得到)的骨架Backbone,搜索最佳结合模式(template library search)。IDR为图1a中的多肽,IDR的结合蛋白为图1a中的灰色骨架。然后使用ProteinMPNN优化结合蛋白序列,接着AF2预测结构。如果AF2预测结果不佳,使用RFdiffusion调整设计特定的骨架和某些口袋。

第三步:线程(Threading)

第四步:细化

下图1b展示了细化(Refinement)。一是针对具有挑战性的极性或带电目标,或无法采用规则二级结构结合的靶点,通过RFdiffusion进行精确的氨基酸间相互作用的优化。二是使用RFdiffusion的部分扩散方法,对口袋、间隔和蛋白质背骨之间的“不匹配”进行高分辨率细化和扰动(下面的拓展图4)。将细化的结合蛋白骨架补充回模板库,以增加模板库的多样性和覆盖范围。

第四步:细化(Refinement)
拓展图4

2.3.2. 实验结果

该论文图4a展示了靶点的名称,以及所对应的IDR氨基酸序列。图4b/c/d展示了结构示意图,SPR实验不同浓度的响应值,以及相应的亲和力Kd值。

论文中的图4

该论文图3还解析了IDR-结合蛋白的复合物晶体结构,验证了计算设计和实验的一致性。

该论文图5还测试了功能性,以及IDR-结合蛋白之间的特异性,特异性是指针对靶点A设计的Binder A,只能结合靶点A,与靶点B/C/D不结合。

注⚠️:本文的代码暂时还未开源。

2. 相关工作

2.4. 扩散设计IDP蛋白的Binder




内在无序蛋白(Intrinsically Disordered Proteins, IDPs)和内在无序区域(Intrinsically Disordered Regions, IDRs)几乎占自然界蛋白的一半(49%)下图

无序蛋白的普遍性:人类蛋白质组中有序蛋白(ORDPs)和无序蛋白(IDPs)/无序区域(IDPRs)的频率分布

然而,设计能够特异性结合IDPs和IDRs的Binder方面,尚未有一套通用的方法论,存在巨大挑战。具体来说,这些困难包括[4]:

  1. 自身结构多变:由于IDRs自身缺乏固定的结构,构象高度多变下图

  2. 结合构象多变:IDRs在结合过程中可能会发生构象变化,目前还没有好的方案解决。

无序蛋白的多样性和灵活性:Amylin、C肽和VP48的NMR结构和通过AlphaFold预测的结构

本文通过改进RFdiffusion,比如:训练数据、训练策略、条件信息引入推理、双侧扩散(two-side diffusion)等,尝试解决以上的难题。填补了靶向IDPs/IDRs的Binder设计方面的知识空白。

原版RFdiffusion版本需要输入靶蛋白的结构,指定热点Hotspots的氨基酸,推理输出Binder蛋白的骨架。而这里,本文的RFdiffusion有3方面的改进:

  • 仅输入靶蛋白序列,推理出靶点+Binder的复合物骨架
  • 输入靶蛋白序列+靶蛋白部分二级结构,进行推理出Binder
  • 双侧扩散(two-side diffusion),原版RFdiffusion是单侧扩散

2.4.1. RFdiffusion改进

这里的RFdiffusion版本,训练数据是含有2条链的蛋白骨架(N-Ca-C),模型被训练后,在只有靶蛋白序列的情况下,就能设计出特异性结合靶蛋白的Binder。这些Binder具有细微变化的螺旋构象(下图深蓝色)。

RFdiffusion改进1:仅输入靶蛋白序列,设计出结合Binder骨架

RFdiffusion的改进版本,还允许指定区域的二级结构及其序列。当提供相同的靶蛋白序列输入,但不同的二级结构类型(α-Helix或β-strand)时,靶蛋白与Binder的最终构象可能会有所不同(下图右边)。这种方法允许研究者指定目标区域的二级结构(如α-Helix或β-strand),从而更精确地控制生成的靶蛋白与Binder复合体的构象。

RFdiffusion改进2:不同二级结构信息的引入:设计出不同的Binder

下图是双侧部分扩散的示意图。 RFdiffusion 对靶点和Binder的随机噪声安装起始父设计(下图左边Parent)进行去噪;通过初始噪声的不同噪声步的程度(top),可以控制引入的结构变化的程度(bottom)。

RFdiffusion改进3:双侧部分扩散

这种方法允许靶点和Binder同时发生构象变化。单侧部分扩散只多样化Binder的构象而保持靶点结构固定下图),而双侧部分扩散允许更广泛的构象变化,从而可能找到更适合结合的构象。

双侧部分扩散与原版RFdiffusion的对比

2.4.2. 实验结果

文章对上表的6个不同的IDP靶点设计了Binder,并进行了湿实验的验证。下文编者随机选一个实验结果进行简单扼要的阐述。


图2a-dAmylin的Binder设计:展示了针对Amylin设计的四种结合体(,,,),以及SPR实验验证的亲和力。下标αβ指代的是Binder包含的二级结构。

图2e-fCP和VP48的Binder设计:同样展示了复合物结构和SPR亲和力响应图。通过仅输入序列输入扩散设计,得到的Binder。结果说明,即使在没有特定二级结构信息的情况下,改进版的RFdiffusion也能成功设计出高亲和力的Binder。

图2g-iβ-strand的Binder设计:三个不同的靶点都设计出β-strand的Binder,亲和力分别为11 nM, 14 nM, 和97 nM。

图2|不同靶点的Binder设计,以及SPR亲和力实验验证

该论文图3还解析了靶点-Binder的复合物晶体结构,验证了计算设计和实验的一致性。

该论文图4还测试Binder与各靶点之间的特异性,特异性是指针对靶点A设计的Binder A,只能结合靶点A,与靶点B/C/D不结合。

注⚠️:本文的改进版的RFdiffusion代码暂时还未开源。

2. 相关工作

2.5. IDR的PPI是否有手性约束?

无序蛋白(IDPs)是一类在自然状态下缺乏固定三维结构的蛋白质,它们在生物体内扮演着重要的角色。尽管无序蛋白可以在复合物中保持无序状态并发挥功能,但是否受到手性约束一直是个疑问

本文的Knowledge Gap就是在于理解无序蛋白复合物(intrinsically disordered protein complexes)是否受到手性约束(chiral constraints)的影响。具体来说,就是探究无序蛋白-蛋白相互作用,是否真正独立于立体化学的限制?以及在无序到有序的连续谱上,这些相互作用对手性的敏感性如何变化 [5]。


2.5.1. 蛋白的手性

下图a展示了左旋(L-)和右旋(D-)氨基酸的基本结构。L-氨基酸和D-氨基酸是彼此的镜像,它们不能相互重叠,这种特性被称为“手性”。在自然界中,绝大多数蛋白质由L-氨基酸构成,而D-氨基酸在生物体系中较为罕见。

下图b展示了L型-蛋白质和D型-蛋白之间的镜像关系。这种镜像关系意味着,如果一个D型-蛋白要与型蛋白形成PPI结合,它们必须在结构上能够互补。这对于理解蛋白质相互作用和药物设计具有重要意义。

氨基酸的手性、蛋白的手性示意图

2.5.2. 研究体系&问题

下图c展示论文中选择的五个蛋白-蛋白体系,它们覆盖了从完全无序到有序。这些蛋白-蛋白复合物体系包括:

  • ProTα:H1(完全无序)
  • RST: ANAC046、DREB2A和ANAC01(无序到有序之间)
  • MCL1:PUMA(完全有序)
从无序到有序的5个蛋白-蛋白体系

下图d通常情况下,L型-靶蛋白与L型-Binder能够发生结合。D型-Binder不能与L型-靶蛋白结合,本文的研究问题就是,这是否在IDP上也成立?

D型-Binder能不能与L型-靶蛋白结合?

2.5.3. 实验结果

该论文图2是对完全无序的ProTα:H1,和完全有序的MCL1:PUMA体系的实验结果。

图2左边完全无序体系,证明无论是L型-还是D型-H1,对靶点ProTα的亲和力都是8μM左右。

图2右边完全有序体系,证明L型-PUMA与靶点MCL1禽类在1nM;而D型-PUMA与靶点亲和力在270μM,约等于无亲和力。

图2|完全无序的ProTα:H1,和完全有序的MCL1:PUMA体系的实验结果

该论文图3是对无序到有序之间三个蛋白-单笔体系,RST: ANAC046、DREB2A和ANAC013,的实验结果验证。

图3左边无序程度最高体系,RST:ANAC046,L型-Binder与靶点亲和力650nM,L型-Binder为10μM;亲和力倍数差异最低。

图3中间无序程度中等体系,RST:DREB2A,L型-Binder与靶点亲和力250nM,L型-Binder为18μM;亲和力倍数差异中等。

图3右边无序程度最低体系,RST:ANAC013,L型-Binder与靶点亲和力81nM,L型-Binder为41μM;亲和力倍数差异最大。

图3|无序到有序之间三个蛋白-单笔体系,RST: ANAC046、DREB2A和ANAC013,的实验结果验证

2.5.4. 研究结论

下图4e说明了L型-靶蛋白与L型、D型Binder的结合亲和力差异,通过热力学分析,主要是L型 ⇌ D型的焓变(ΔH)和熵变(TΔS)不一样导致的。

下图4f总结了五个体系的手性敏感性。(L-和D-肽结合自由能的差异,浅灰色柱子),可见随着从无序到有序,这种结合能差异越大,也跟论文图2/3的亲和力差异倍数所一致。

/|| 是相对于L-肽结合自由能的损失倍数,这同样反映了五个体系的手性敏感性,从无序到有序,手性敏感性越来越强

图4e-f|从无序到有序的5个蛋白体系,手性敏感性越来越强

2. 相关工作

2.6. pMHC的Binder设计

本文是David Baker最新的Arxiv论文 [6]。一般抗原肽会先与MHC形成二元复合物pMHC,pMHC在体内接着与TCR,形成TCR-pMHC的三元复合物。这里设计的Binder就是代替TCR的角色。

输入是pMHC复合物,RFdiffusion设计Binder骨架要求结合到peptide上,然后序列用ProteinMPNN,最后结构预测再筛选。所以,David Baker还是采用一贯的流程进行蛋白从头设计,即:Backbone (RFdiffusion) --> Sequence (proteinMPNN) --> Structure (AF2) 。

最终实验上亲和力在纳摩尔级别。这篇论文已有解读不再多赘述,编者推荐感兴趣的读者阅读《David Baker|靶向Peptide-MHCI复合物的高特异性Binder设计》

3. Binder与CAR-T

3.1. 什么是CAR-T

一般的T细胞可以看作是保安,作用是抓住并消灭坏人(如:癌细胞等)。但保安嘛能力较弱,所以需要人工改造T细胞,嵌合抗原受体的CAR-T就是一种改造。CAR-T是在T细胞膜上嵌入了蛋白(上图橙色),scFv就能更强结合癌细胞上的抗原(如:CD19,上图黄色)。

嵌入在T细胞表面的蛋白,主要目的是结合抗原,所以这个蛋白可以是scFv、Binder等,anyway只要能抓住坏东西就行,所以Binder设计也能在CAR-T治疗中大显身手


3.2. David Baker的Nature文章

这篇文章嵌入在细胞膜上的蛋白叫做,合成膜内蛋白水解受体SNIPR)。本文设计了靶向两种可溶性免疫分子TGF-β和VEGF的SNIPR [7],这两种分子通常在肿瘤环境周围高水平存在。也就是说,抗原坏人是TGF-β和VEGF

这篇论文已有优秀的解读,编者推荐感兴趣的读者阅读《David Baker团队最新Nature:合成新型受体,创建更安全的CAR-T细胞疗法》


3.3. 谢琦老师的NBE文章

scFv由单克隆抗体的轻链(VL)和重链(VH)通过Linker连接而成,因此scFv的重、轻链易发生错误聚集和折叠,结构稳定性较差,不仅影响了T细胞识别抗原细胞能力,还可引起非抗原依赖性的T细胞激活,导致T细胞的过早耗竭,极大的降低了CAR-T疗法的治疗效果 [8]。简而言之,scFv的CAR-T很弱鸡

本文针对的是胶质母细胞瘤表面的高表达的肿瘤抗原EGFR和CD276。曹龙兴老师还是利用RifDock工具设计了这两个抗原的高亲和力迷你结合蛋白Binder。然后将Binder嵌入到T细胞膜上,代替原有的scFv

这篇论文已有优秀的解读,编者推荐感兴趣的读者阅读《西湖实验室谢琦、曹龙兴团队联合开发基于从头蛋白质设计技术的CAR T疗法用于治疗胶质母细胞瘤》


3.4. Andrea Schmidts的工作

前面2篇CAR-T文章编者都没有仔细展开,是因为已有报道。这一篇是刚放出来的arxiv文章(下图),简单展开,帮助大家了解Binder设计与CAR-T技术的联合应用。

尽管从头Binder设计(DNBs)的概念已经被提出,但它们在CAR-T疗法中的具体应用和效果尚未被充分探索 [9]。

如何通过计算方法设计出能够有效识别和结合特定抗原的DNBs,以及这些DNBs在实际的细胞疗法中的表现如何,这些都是需要进一步研究的问题。

如何利用DNBs开发个性化的癌症疗法,以及这些疗法在不同患者中的适用性和效果。

本文旨在通过将Binder设计与CAR-T结合,探索以上问题的答案。




本文的Binder设计方案,是和David Baker一致的常规方案。即:

  1. RFdiffusion,得到Binder骨架
  2. ProteinMPNN,设计Binder设计
  3. AlphaFold2,预测蛋白-Binder复合物结构

这里针对的抗原是EGFR,它自身有相应的抗体scFV(H+L链)。从头设计Binder(DNBs)结合在抗原EGFR的其他表位上(下图a),然后与T细胞连接器(TCE)链接在一起。实验结果表明,Binder的CAR-T治疗效果,跟scFv的效果比较接近(下图b)。


本论文还有十分丰富的内容,编者偷个懒不再多讲述了,欢迎感兴趣的读者阅读原文。

4. 数据库AlphaSeq

初创公司A-Alpha Bio(https://www.aalphabio.com)最近的AlphaSeq数据库专注于蛋白质-蛋白质相互作用(protein-protein interaction, PPI),包含了超过7.5亿条测量结果,构成了世界上最大的PPI数据集 [10]。

Sadly,这是该公司的核心资产,目前未开源。如果这批数据能够开源,这对PPI蛋白设计、Binder设计方面做出巨大的贡献。甚至也有可能推动PPI的蛋白语言模型浮现。

编者写到这里,已经肝不动啦。欢迎对AlphaSeq数据库的同学拓展阅读《世界最大蛋白质相互作用数据集AlphaSeq横空出世》,或者阅读长文解读AlphaSeq的博客文章 [10]。

5. 讨论总结

本文首先介绍了Binder设计一些最近进展,包括:

  • 含β-strand的Binder设计 [1]
  • 环肽设计RFpeptides [2]
  • IDR/IDP的Binder设计 [3][4]
  • IDR的PPI是否有手性约束 [5]
  • pMHC的Binder设计 [6]

而且,Sadly,David Baker这些文章还未见刊,所以代码都没有开源。

然后简单介绍了Binder设计应用到CAR-T癌症治疗的几篇文章[7][8][9],最后几句话带过最大的PPI数据库AlphaSeq [10]。

参考文献

[1].β-strand Binder: Sappington, Isaac, et al. "Improved protein binder design using beta-pairing targeted RFdiffusion." bioRxiv (2024): 2024-10.

[2].RFpeptides: Rettie, Stephen, et al. "Accurate de novo design of high-affinity protein binding macrocycles using deep learning." bioRxiv (2024): 2024-11.

[3].IDR Binder: Wu, Kejia, et al. "Sequence-specific targeting of intrinsically disordered protein regions." bioRxiv (2024): 2024-07.

[4].IDP Binder: Liu, Caixuan, et al. "Diffusing protein binders to intrinsically disordered proteins." bioRxiv (2024).

[5].IDP Binder chirality: Newcombe, Estella A., et al. "Stereochemistry in the disorder–order continuum of protein interactions."Nature (2024): 1-7.

[6].pMHC Binder: Design of high specificity binders for peptide-MHC-I complexes

[7]. Piraner, Dan I., et al. "Engineered receptors for soluble cellular communication and disease sensing."Nature (2024): 1-3.

[8]. Xia, Zhen, et al. "Targeting overexpressed antigens in glioblastoma via CAR T cells with computationally designed high-affinity protein binders."Nature Biomedical Engineering (2024): 1-17.

[9]. Mergen, Markus, et al. "Engineering de novo binder CAR-T cell therapies with generative AI."bioRxiv (2024): 2024-11.

[10]. Creating the largest protein-protein interaction dataset in the world (A-Alpha Bio).https://www.owlposting.com/p/creating-the-largest-protein-protein

进群交流

进群请认真填问卷!

广告勿扰,广告勿扰

往期合集

干货文章线上报告蛋白设计综述BinderCo-designBenchmarkAF3David BakerESMMaSIF结构预测语言模型骨架生成逆向折叠抗体设计多肽设计酶设计稳定性药物设计

关注我们

死磕自己,愉悦大家

专注于AI蛋白相关的论文解读&学术速运


历史文章

  1. AlphaFold3 图解

  2. AlphaFold3 万字长文解读

  3. AlphaFold3 预测蛋白突变亲和力变化?

  4. 一文看懂 Binder 设计

  5. 蛋白结构和序列的共同设计

  6. 深度学习如何助力抗体设计

  7. 蛋白计算海内外课题组汇总

  8. Meta AI 蛋白语言模型ESM系列

  9. COMPSS 酶蛋白从头设计的筛选方法

  10. 简述酶的定向进化

  11. Cell 综述:从头蛋白设计之结构到功能

  12. CSH 综述文章:结构预测与蛋白设计

  13. CSH 综述文章:蛋白质序列的生成模型

  14. Nat. Biotech. 蛋白设计专刊

  15. Nat. Biotech. 深度学习与功能蛋白设计

  16. Nat. Biotech. 功能蛋白从头设计的星火

  17. ProteinBench 蛋白设计最全的Benchmark

  18. ProteinGym 蛋白突变最好的Benchmark

  19. DiG 预测蛋白构象分布

  20. MaSIF 基于表面指纹的蛋白从头设计

  21. SaProt 结构感知的蛋白质语言模型

  22. InstructPLM 语言模型与逆向折叠的结合

  23. CRISPR-GPT 基因编辑的大模型智能体

AI4Protein
读书破万卷juǎn,专注于AI蛋白相关的学术搬运。
 最新文章