再看Binder设计
虽然编者之前也介绍过Binder设计的一些文章,譬如:
一文看懂Binder设计 AlphaProteo|从头设计高亲和力Binder蛋白 Binder设计大赛的结果启示 BindCraft|一站式设计高亲和力Binder RSO|超越RFdiffusion的蛋白设计方法?
但最近读了些文献,发现Binder设计其实远远不止于此,看到了更广阔的一些东西。于是再梳理归纳一篇Binder的长文,Please Enjoy。
目录
1. 背景介绍1. 背景介绍
《一文看懂Binder设计》的文章中,已经介绍梳理了Binder设计的背景、模版设计、骨架设计、序列设计、筛选指标方法等。
《AlphaProteo|从头设计高亲和力Binder蛋白》一文中,对AlphaProteo模型的生成器、过滤器、联合设计、是否为全原子设计、靶点选择、实验结果等方面进行了猜测和讨论。
《Binder设计大赛的结果》启示我们,不能盲目相信结构预测的置信度指标;设计工具、设计方案也可以多种多样,关键看怎么用好。
《BindCraft|一站式设计高亲和力Binder》一文中,大师Sergey通过幻觉不断迭代优化Binder的Backbone,再结合solMPNN优化序列,整体pipeline也算是结构+序列的联合设计。之前EvoPro这类方案只是不断迭代设计序列,BindCraft表明不断迭代优化BackBone也很重要。另外,BindCraft给出了迄今为止最全面的Binder筛选指标。
大师Sergey的《RSO》也能进行Binder设计,论文中也有案例。RSO的优势在于对Hallucination考虑relax的序列,相对于RFdiffusion能设计出更合理的BackBone。
虽然虽然有如此多前人的优秀工作,Binder设计其实还有一些局限性、或一些有价值的应用场景未涉及,比如:
RFdiffusion偏好生成α-helix的骨架,怎么生成含β-sheet的Binder? 针对IDR的靶点,如何设计Binder?是否有手性约束? 如何设计环肽的蛋白结合剂? Binder如何应用到CAR-T治疗中去? 缺乏PPI数据库,如何解决?
读者如果仔细看了上面的目录,这些问题,大概心中就有了答案。 也可以跟随编者,按照目录在下文中一点点展开,探索上述问题的答案。
2. 相关工作
2.1. 设计含β-strand的Binder
如果读者观察仔细,不难发现,目前的各种Binder设计方案都偏好于设计α-helix的Binder骨架,其中又以稳定的3-helix偏多。归纳如下:
曹龙兴2022年Nature,13个靶点,全是α-helix RFdiffusion, 5个靶点,全是α-helix BindCraft, 10个靶点,1个靶点的Binder含有β-strand MaSIF, 4个靶点,1个靶点的Binder含有β-strand AlphaProteo, 8个靶点,3个靶点的Binder含有β-strand
2.1.1 Knowledge Gap
为什么设计β-strand的结合Binder十分困难?
RFdiffusion在生成与目标蛋白表面区域形状互补的骨架方面表现出色[1]。也就是说,RFdiffusion在能生成合理几何特征的Binder骨架。
靶蛋白表面极性区域常存在暴露的氢键供体和受体,设计Binder必须精确定位与靶点的受体和供体相补充,以补偿与水失去的相互作用,但RFdiffusion这类算法并不总是实现氢键供体和受体的详细互补性[1]。也就是说,目前的Binder设计方案在化学特征上做的不是很好。
2.1.2 科学问题
本文[1]要解决的科学问题就β-strand的Binder设计。 许多疾病相关的靶蛋白具有β-sheets和未配对且暴露的β-strands,David Baker通过引入β-strand的condition,改进RFdiffusion,使其能设计的Binder能够互补β-sheet扭曲、弯曲、凸起等其他不规则特征。
上面这一段似乎也是在几何特征上改进,还是没解决文章[1]自己定义的Knowledge Gap,哈哈哈!也许还得靠后面出来的全原子Binder骨架设计模型发力!
注意⚠️:β-sheet是指多个(≥2)β-strand组成起来的二级结构,所以本论文基本用的都是单词β-strand。
2.1.3 Conditional RFdiffusion
下图1a
是β-strand界面条件信息的展示。这部分展示了如何向RFdiffusion模型提供Condition条件信息,以便生成与靶蛋白边缘(edge β-strand,青色)配对的β-strand结合Binder。
Binder的Condition条件信息,包括期望的Binder残基二级结构和N×N块邻接矩阵(SS/ADJ,N是Binder的长度,绿色),该矩阵指定了二级结构块之间的期望邻接性。
Ineraction,条件信息,即:设计长度为L的β-strand(黄色)与靶蛋白的长度为T的edge β-strand(青色)结合。用算法将以上条件信息映射到张量tensor,RFdiffusion会调节靶蛋白-Binder的结合界面。将L个连续的Binder残基,分配给与靶点蛋白的edge β-strand结合。长度N的Binder其余部分(绿色)则没有提供条件信息,于是没有二级结构限制、相互作用限制。这里有点绕,归纳如下:
整个靶蛋白,其中有一小段为edge β-strand,青色 相互作用关键区域,Target edge β-strand(青色) ↔ Binder β-strand(黄色) Binder β-strand长度为L,L < N,是unmasked 整个Binder的长度为N,需提供二级结构SS和邻接矩阵ADJ信息
下图1b
是RFdiffusion去噪轨迹示意图。上半部分是一般的RFdiffusion去去噪轨迹(top)。下半部分是提供β-strand界面条件信息的情况下,RFdiffusion去噪轨迹(bottom)。这表明条件信息对RFdiffusion的引导至关重要。
下图1c
是对比β-strand SS/ADJ 与 仅使用热点hostpots(BFF4)条件下的Binder设计成功率。干实验成功率定义1为Rosetta < 30,干实验成功率定义2为AlphaFold2模型 iPAE < 10。可见,β-strand SS/ADJ条件下显著优与仅使用热点的RFdiffusion。
下图1d
结构聚类表明生成的Binder确实含有β-strand,也表明β-strand界面条件可以引导RFdiffusion探索更广泛的蛋白结构空间,从而设计出结构更多样化的Binder。红色圆圈⭕️也说明β-strand condition有更高的in-silico成功率。1/2/3个α-helix的Binder明显减少,含有不少于1个β-strand的Binder数量明显增多。
2.1.4 实验结果
该论文图2
对很多个靶点的设计β-strand Binder进行了湿实验验证,测试不同温度的CD曲线,拟合出二级结构的比例去估计Tm(下图2b
)。测试不同浓度下的SPR响应值,拟合出蛋白-Binder的亲和力Kd(下图2c
,亲和力范围从0.528-164 nM不等。
该论文图3
还测试Binder与各靶点之间的特异性,特异性指针对靶点A设计的Binder A,只能结合靶点A,与靶点B/C/D不结合。
该论文图4
还解析了一个靶点-Binder的复合物晶体结构,验证了计算设计和实验的一致性。
注⚠️:本文的conditional版本的RFdiffusion代码暂时还未开源。
2. 相关工作
2.2. 设计环肽的RFpeptides
可以看到RFpeptides [2] 的最后一个通讯是Gaurav Bhardwaj,他和David Baker一样也是华盛顿大学的,不过是在药学院不是在IPD。浏览其谷歌主页不难发现,Gaurav是多年一直深耕多肽环肽的研究(下图
),今年也与David Baker合作发表了一篇关于大环分子的Science文章。
华盛顿大学已将RFpeptides授权给公司Vilya(https://vilyatx.com
),这是一家IPD的衍生公司。Gaurav Bhardwaj和David Baker是该公司的联合创始人、顾问和股东。
2.2.1 设计哪一种环肽?
环肽其实有很多种成环的方式(下图
),包括:
Side chain-to-side chain Head-to-tail Tail-to-side chain Head-to-side chain
RFpeptides其实是最简单的一种成环方式,Head-to-tail首尾成环,通过形成酰胺键连接在一起。
2.2.2 RFpeptides的位置编码和多样性
位置编码: 在大环肽设计中,相对位置编码是关键,它通过在肽链的一半位置切换从正编码(“向右”)到负编码(“向左”)来实现循环。图1A
展示了将循环对称的相对位置编码引入,使得RFdiffusion能够生成具有特定拓扑结构的大环肽。
图1D
展示了大环肽链的相对位置编码是循环的(左上角);除了图1D
左上角之外,链与链之间和靶蛋白链的相对位置编码用标准的形式。
环肽的多样性:图1B
展示了RFpeptides能够产生多样的循环肽,包括α-螺旋、β-折叠和环/线圈二级结构。
2.2.3 RFpeptides的流程
骨架生成:使用位置编码改进的RFdiffusion生成大环肽骨架 序列设计:用ProteinMPNN多轮迭代设计序列,Rosetta Relax实现局部构象优化 结构预测:使用Sergey的AfCycDesign预测复合物结构 筛选指标:结构预测置信度指标iPAE、pLDDT,RMSD<2Å,Rosetta的物理界面质量指标ddG、SAP、接触面积CMS等
2.2.4 实验结果
论文图2/3/4
对多个靶点进行了实验验证,包括亲和力甚至共晶结构的解析。以其中一个靶点RbtA为例,介绍其实验结果。
下图4A
,是靶点和环肽复合物结构示意图,可见环肽与靶点互补性特别好,在空腔里面;紫色显示的大环被设计为与灰色显示的细菌蛋白目标结合。
下图4B
是SPR不同浓度的响应曲线,拟合出来的亲和力为9.4 nM;实验揭示了分子之间具有高亲和力的相互作用。
下图4C
是预测的复合物结构和XRD实验解析的晶体结构Align;以及Align之后的界面对比放大的示意图;复合物结构RMSD误差仅有1.4埃米。
论文作者之一David Juergens说:“这对于药物设计的影响确实令人兴奋,因为大环肽可以在许多方面的优点、且可定制,而正常的肽和蛋白无法做到。” [14]
RFpeptides的工作标志着利用AI解决生物学的挑战又进一步。虽然它最初作为药物设计工具进行开发,但RFpeptides也可以用来创建诊断试剂以及用于医学研究之外的其他定制肽。
注⚠️:本文的RFpeptides代码暂时还未开源。
2. 相关工作
2.3. 蛋白IDR区域序列的特异性靶向
设计能够特异性结合内在无序蛋白区域(Intrinsically Disordered Regions, IDRs)的蛋白方面存在的挑战。
本文提出一种结合生物物理和深度学习的方案,通过多样化模板和RFdiffusion来针对IDRs生成结合蛋白,旨在填补上面指出的Knowledge Gap。
通过此方法,作者在39个靶蛋白上进行验证,每个靶点设计36个结合蛋白。其中34个亲和力优于100 nM,4个亲和力达到pM级别下图
。表明该方法可能为IDRs识别的一种通用解决方案 [3]。
2.3.1. 设计流程
第一步:口袋生成
下图1c
展示如何针对单个氨基酸或二肽构建结合口袋,类型包含单口袋E、单口袋RT、单口袋PV、双口袋PV等(全部口袋,见论文SI Table7),其中E、R、T、P、V是氨基酸的单字母类型。这些口袋能为目标肽的侧链形成相互作用或氢键等,也保证结构上兼容性互补性等。
第二步:口袋组装
下图1d
展示了口袋组装(Pocket Assembly)。通过重新组合多个口袋,使用RFdiffusion生成它们之间的界面,以生成整体刚性结构(IDR的结合蛋白骨架,灰色,下面的拓展图1A-B
)。然后生成很多个结合骨架的模板,口袋以不同的顺序和几何形状排列,以实现对一般IDR序列识别的能力。
第三步:线程
下图1a
展示了线程(Threading)。将IDR目标序列穿过所有模板(上一步得到)的骨架Backbone,搜索最佳结合模式(template library search)。IDR为图1a
中的多肽,IDR的结合蛋白为图1a
中的灰色骨架。然后使用ProteinMPNN优化结合蛋白序列,接着AF2预测结构。如果AF2预测结果不佳,使用RFdiffusion调整设计特定的骨架和某些口袋。
第四步:细化
下图1b
展示了细化(Refinement)。一是针对具有挑战性的极性或带电目标,或无法采用规则二级结构结合的靶点,通过RFdiffusion进行精确的氨基酸间相互作用的优化。二是使用RFdiffusion的部分扩散方法,对口袋、间隔和蛋白质背骨之间的“不匹配”进行高分辨率细化和扰动(下面的拓展图4
)。将细化的结合蛋白骨架补充回模板库,以增加模板库的多样性和覆盖范围。
2.3.2. 实验结果
该论文图4a
展示了靶点的名称,以及所对应的IDR氨基酸序列。图4b/c/d
展示了结构示意图,SPR实验不同浓度的响应值,以及相应的亲和力Kd值。
该论文图3
还解析了IDR-结合蛋白的复合物晶体结构,验证了计算设计和实验的一致性。
该论文图5
还测试了功能性,以及IDR-结合蛋白之间的特异性,特异性是指针对靶点A设计的Binder A,只能结合靶点A,与靶点B/C/D不结合。
注⚠️:本文的代码暂时还未开源。
2. 相关工作
2.4. 扩散设计IDP蛋白的Binder
内在无序蛋白(Intrinsically Disordered Proteins, IDPs)和内在无序区域(Intrinsically Disordered Regions, IDRs)几乎占自然界蛋白的一半(49%)下图
。
然而,设计能够特异性结合IDPs和IDRs的Binder方面,尚未有一套通用的方法论,存在巨大挑战。具体来说,这些困难包括[4]:
自身结构多变:由于IDRs自身缺乏固定的结构,构象高度多变
下图
。结合构象多变:IDRs在结合过程中可能会发生构象变化,目前还没有好的方案解决。
本文通过改进RFdiffusion,比如:训练数据、训练策略、条件信息引入推理、双侧扩散(two-side diffusion)等,尝试解决以上的难题。填补了靶向IDPs/IDRs的Binder设计方面的知识空白。
原版RFdiffusion版本需要输入靶蛋白的结构,指定热点Hotspots的氨基酸,推理输出Binder蛋白的骨架。而这里,本文的RFdiffusion有3方面的改进:
仅输入靶蛋白序列,推理出靶点+Binder的复合物骨架 输入靶蛋白序列+靶蛋白部分二级结构,进行推理出Binder 双侧扩散(two-side diffusion),原版RFdiffusion是单侧扩散
2.4.1. RFdiffusion改进
这里的RFdiffusion版本,训练数据是含有2条链的蛋白骨架(N-Ca-C),模型被训练后,在只有靶蛋白序列的情况下,就能设计出特异性结合靶蛋白的Binder。这些Binder具有细微变化的螺旋构象(下图
深蓝色)。
RFdiffusion的改进版本,还允许指定区域的二级结构及其序列。当提供相同的靶蛋白序列输入,但不同的二级结构类型(α-Helix或β-strand)时,靶蛋白与Binder的最终构象可能会有所不同(下图
右边)。这种方法允许研究者指定目标区域的二级结构(如α-Helix或β-strand),从而更精确地控制生成的靶蛋白与Binder复合体的构象。
下图
是双侧部分扩散的示意图。 RFdiffusion 对靶点和Binder的随机噪声安装起始父设计(下图
左边Parent)进行去噪;通过初始噪声的不同噪声步的程度(top),可以控制引入的结构变化的程度(bottom)。
这种方法允许靶点和Binder同时发生构象变化。单侧部分扩散只多样化Binder的构象而保持靶点结构固定(下图
),而双侧部分扩散允许更广泛的构象变化,从而可能找到更适合结合的构象。
2.4.2. 实验结果
文章对上表
的6个不同的IDP靶点设计了Binder,并进行了湿实验的验证。下文编者随机选一个实验结果进行简单扼要的阐述。
图2a-d
是Amylin的Binder设计:展示了针对Amylin设计的四种结合体(,,,),以及SPR实验验证的亲和力。下标αβ指代的是Binder包含的二级结构。
图2e-f
是CP和VP48的Binder设计:同样展示了复合物结构和SPR亲和力响应图。通过仅输入序列输入扩散设计,得到的Binder。结果说明,即使在没有特定二级结构信息的情况下,改进版的RFdiffusion也能成功设计出高亲和力的Binder。
图2g-i
是β-strand的Binder设计:三个不同的靶点都设计出β-strand的Binder,亲和力分别为11 nM, 14 nM, 和97 nM。
该论文图3
还解析了靶点-Binder的复合物晶体结构,验证了计算设计和实验的一致性。
该论文图4
还测试Binder与各靶点之间的特异性,特异性是指针对靶点A设计的Binder A,只能结合靶点A,与靶点B/C/D不结合。
注⚠️:本文的改进版的RFdiffusion代码暂时还未开源。
2. 相关工作
2.5. IDR的PPI是否有手性约束?
无序蛋白(IDPs)是一类在自然状态下缺乏固定三维结构的蛋白质,它们在生物体内扮演着重要的角色。尽管无序蛋白可以在复合物中保持无序状态并发挥功能,但是否受到手性约束一直是个疑问。
本文的Knowledge Gap就是在于理解无序蛋白复合物(intrinsically disordered protein complexes)是否受到手性约束(chiral constraints)的影响。具体来说,就是探究无序蛋白-蛋白相互作用,是否真正独立于立体化学的限制?以及在无序到有序的连续谱上,这些相互作用对手性的敏感性如何变化 [5]。
2.5.1. 蛋白的手性
下图a
展示了左旋(L-)和右旋(D-)氨基酸的基本结构。L-氨基酸和D-氨基酸是彼此的镜像,它们不能相互重叠,这种特性被称为“手性”。在自然界中,绝大多数蛋白质由L-氨基酸构成,而D-氨基酸在生物体系中较为罕见。
下图b
展示了L型-蛋白质和D型-蛋白之间的镜像关系。这种镜像关系意味着,如果一个D型-蛋白要与型蛋白形成PPI结合,它们必须在结构上能够互补。这对于理解蛋白质相互作用和药物设计具有重要意义。
2.5.2. 研究体系&问题
下图c
展示论文中选择的五个蛋白-蛋白体系,它们覆盖了从完全无序到有序。这些蛋白-蛋白复合物体系包括:
ProTα:H1(完全无序) RST: ANAC046、DREB2A和ANAC01(无序到有序之间) MCL1:PUMA(完全有序)
下图d
通常情况下,L型-靶蛋白与L型-Binder能够发生结合。D型-Binder不能与L型-靶蛋白结合,本文的研究问题就是,这是否在IDP上也成立?
2.5.3. 实验结果
该论文图2
是对完全无序的ProTα:H1,和完全有序的MCL1:PUMA体系的实验结果。
图2左边
完全无序体系,证明无论是L型-还是D型-H1,对靶点ProTα的亲和力都是8μM左右。
图2右边
完全有序体系,证明L型-PUMA与靶点MCL1禽类在1nM;而D型-PUMA与靶点亲和力在270μM,约等于无亲和力。
该论文图3
是对无序到有序之间三个蛋白-单笔体系,RST: ANAC046、DREB2A和ANAC013,的实验结果验证。
图3左边
无序程度最高体系,RST:ANAC046,L型-Binder与靶点亲和力650nM,L型-Binder为10μM;亲和力倍数差异最低。
图3中间
无序程度中等体系,RST:DREB2A,L型-Binder与靶点亲和力250nM,L型-Binder为18μM;亲和力倍数差异中等。
图3右边
无序程度最低体系,RST:ANAC013,L型-Binder与靶点亲和力81nM,L型-Binder为41μM;亲和力倍数差异最大。
2.5.4. 研究结论
下图4e
说明了L型-靶蛋白与L型、D型Binder的结合亲和力差异,通过热力学分析,主要是L型 ⇌ D型的焓变(ΔH)和熵变(TΔS)不一样导致的。
下图4f
总结了五个体系的手性敏感性。(L-和D-肽结合自由能的差异,浅灰色柱子),可见随着从无序到有序,这种结合能差异越大,也跟论文图2/3
的亲和力差异倍数所一致。
/|| 是相对于L-肽结合自由能的损失倍数,这同样反映了五个体系的手性敏感性,从无序到有序,手性敏感性越来越强。
2. 相关工作
2.6. pMHC的Binder设计
本文是David Baker最新的Arxiv论文 [6]。一般抗原肽会先与MHC形成二元复合物pMHC,pMHC在体内接着与TCR,形成TCR-pMHC的三元复合物。这里设计的Binder就是代替TCR的角色。
输入是pMHC复合物,RFdiffusion设计Binder骨架要求结合到peptide上,然后序列用ProteinMPNN,最后结构预测再筛选。所以,David Baker还是采用一贯的流程进行蛋白从头设计,即:Backbone (RFdiffusion) --> Sequence (proteinMPNN) --> Structure (AF2) 。
最终实验上亲和力在纳摩尔级别。这篇论文已有解读不再多赘述,编者推荐感兴趣的读者阅读《David Baker|靶向Peptide-MHCI复合物的高特异性Binder设计》。
3. Binder与CAR-T
3.1. 什么是CAR-T
一般的T细胞可以看作是保安,作用是抓住并消灭坏人(如:癌细胞等)。但保安嘛能力较弱,所以需要人工改造T细胞,嵌合抗原受体的CAR-T就是一种改造。CAR-T是在T细胞膜上嵌入了蛋白(上图
橙色),scFv就能更强结合癌细胞上的抗原(如:CD19,上图
黄色)。
嵌入在T细胞表面的蛋白,主要目的是结合抗原,所以这个蛋白可以是scFv、Binder等,anyway只要能抓住坏东西就行,所以Binder设计也能在CAR-T治疗中大显身手。
3.2. David Baker的Nature文章
这篇文章嵌入在细胞膜上的蛋白叫做,合成膜内蛋白水解受体(SNIPR)。本文设计了靶向两种可溶性免疫分子TGF-β和VEGF的SNIPR [7],这两种分子通常在肿瘤环境周围高水平存在。也就是说,抗原坏人是TGF-β和VEGF。
这篇论文已有优秀的解读,编者推荐感兴趣的读者阅读《David Baker团队最新Nature:合成新型受体,创建更安全的CAR-T细胞疗法》。
3.3. 谢琦老师的NBE文章
scFv由单克隆抗体的轻链(VL)和重链(VH)通过Linker连接而成,因此scFv的重、轻链易发生错误聚集和折叠,结构稳定性较差,不仅影响了T细胞识别抗原细胞能力,还可引起非抗原依赖性的T细胞激活,导致T细胞的过早耗竭,极大的降低了CAR-T疗法的治疗效果 [8]。简而言之,scFv的CAR-T很弱鸡。
本文针对的是胶质母细胞瘤表面的高表达的肿瘤抗原EGFR和CD276。曹龙兴老师还是利用RifDock工具设计了这两个抗原的高亲和力迷你结合蛋白Binder。然后将Binder嵌入到T细胞膜上,代替原有的scFv。
这篇论文已有优秀的解读,编者推荐感兴趣的读者阅读《西湖实验室谢琦、曹龙兴团队联合开发基于从头蛋白质设计技术的CAR T疗法用于治疗胶质母细胞瘤》。
3.4. Andrea Schmidts的工作
前面2篇CAR-T文章编者都没有仔细展开,是因为已有报道。这一篇是刚放出来的arxiv文章(下图
),简单展开,帮助大家了解Binder设计与CAR-T技术的联合应用。
尽管从头Binder设计(DNBs)的概念已经被提出,但它们在CAR-T疗法中的具体应用和效果尚未被充分探索 [9]。
如何通过计算方法设计出能够有效识别和结合特定抗原的DNBs,以及这些DNBs在实际的细胞疗法中的表现如何,这些都是需要进一步研究的问题。
如何利用DNBs开发个性化的癌症疗法,以及这些疗法在不同患者中的适用性和效果。
本文旨在通过将Binder设计与CAR-T结合,探索以上问题的答案。
本文的Binder设计方案,是和David Baker一致的常规方案。即:
RFdiffusion,得到Binder骨架 ProteinMPNN,设计Binder设计 AlphaFold2,预测蛋白-Binder复合物结构
这里针对的抗原是EGFR,它自身有相应的抗体scFV(H+L链)。从头设计Binder(DNBs)结合在抗原EGFR的其他表位上(下图a
),然后与T细胞连接器(TCE)链接在一起。实验结果表明,Binder的CAR-T治疗效果,跟scFv的效果比较接近(下图b
)。
本论文还有十分丰富的内容,编者偷个懒不再多讲述了,欢迎感兴趣的读者阅读原文。
4. 数据库AlphaSeq
初创公司A-Alpha Bio(https://www.aalphabio.com
)最近的AlphaSeq数据库专注于蛋白质-蛋白质相互作用(protein-protein interaction, PPI),包含了超过7.5亿条测量结果,构成了世界上最大的PPI数据集 [10]。
Sadly,这是该公司的核心资产,目前未开源。如果这批数据能够开源,这对PPI蛋白设计、Binder设计方面做出巨大的贡献。甚至也有可能推动PPI的蛋白语言模型浮现。
编者写到这里,已经肝不动啦。欢迎对AlphaSeq数据库的同学拓展阅读《世界最大蛋白质相互作用数据集AlphaSeq横空出世》,或者阅读长文解读AlphaSeq的博客文章 [10]。
5. 讨论总结
本文首先介绍了Binder设计一些最近进展,包括:
含β-strand的Binder设计 [1] 环肽设计RFpeptides [2] IDR/IDP的Binder设计 [3][4] IDR的PPI是否有手性约束 [5] pMHC的Binder设计 [6]
而且,Sadly,David Baker这些文章还未见刊,所以代码都没有开源。
然后简单介绍了Binder设计应用到CAR-T癌症治疗的几篇文章[7][8][9],最后几句话带过最大的PPI数据库AlphaSeq [10]。
参考文献
[1].β-strand Binder: Sappington, Isaac, et al. "Improved protein binder design using beta-pairing targeted RFdiffusion." bioRxiv (2024): 2024-10.
[2].RFpeptides: Rettie, Stephen, et al. "Accurate de novo design of high-affinity protein binding macrocycles using deep learning." bioRxiv (2024): 2024-11.
[3].IDR Binder: Wu, Kejia, et al. "Sequence-specific targeting of intrinsically disordered protein regions." bioRxiv (2024): 2024-07.
[4].IDP Binder: Liu, Caixuan, et al. "Diffusing protein binders to intrinsically disordered proteins." bioRxiv (2024).
[5].IDP Binder chirality: Newcombe, Estella A., et al. "Stereochemistry in the disorder–order continuum of protein interactions."Nature (2024): 1-7.
[6].pMHC Binder: Design of high specificity binders for peptide-MHC-I complexes
[7]. Piraner, Dan I., et al. "Engineered receptors for soluble cellular communication and disease sensing."Nature (2024): 1-3.
[8]. Xia, Zhen, et al. "Targeting overexpressed antigens in glioblastoma via CAR T cells with computationally designed high-affinity protein binders."Nature Biomedical Engineering (2024): 1-17.
[9]. Mergen, Markus, et al. "Engineering de novo binder CAR-T cell therapies with generative AI."bioRxiv (2024): 2024-11.
[10]. Creating the largest protein-protein interaction dataset in the world (A-Alpha Bio).https://www.owlposting.com/p/creating-the-largest-protein-protein
进群交流
进群请认真填问卷!
广告勿扰,广告勿扰。
往期合集
干货文章|线上报告|蛋白设计|综述|Binder|Co-design|Benchmark|AF3|David Baker|ESM|MaSIF|结构预测|语言模型|骨架生成|逆向折叠|抗体设计|多肽设计|酶设计|稳定性|药物设计
关注我们
死磕自己,愉悦大家
专注于AI蛋白相关的论文解读&学术速运