Mol. Cell. Proteomics丨利用AlphaFold2与交联质谱建模柔性蛋白质结构

文摘   科学   2024-03-21 11:33   广东  
大家好,本周为大家分享一篇发表在Molecular & Cellular Proteomics上的文章,Modeling Flexible Protein Structure With AlphaFold2 and Crosslinking Mass Spectrometry[1],文章的通讯作者是德国汉堡大学结构系统生物学中心的Maya Topf教授。
许多蛋白质都可以用一种以上的结构来描述,且每种结构都有其功能意义。本文提出了一种结合AlphaFold2(AF2)和交联质谱(XL-MS)的流程图1,用于为具有多种构象的蛋白质进行结构建模。该流程包括两个主要步骤:使用 AF2 生成合集,并使用 XL-MS数据进行构象选择图2。在构象选择方面,本文开发了两个分数——monolink概率分数(MP)crosslink概率分数(XLP,这两个分数都基于蛋白质表面的残基深度(residue depth)(图3。文章在一个大型的诱饵蛋白结构数据集上对MP和XLP进行了基准测试,结果显示,本文开发的分数优于之前的分数图4、图5。然后,本文在蛋白质数据库中具有开放和封闭构象的三个蛋白质上测试了文章提出的方法:首先使用AF2生成集合,然后使用XL-MS实验数据筛选开放构象和封闭构象。在6个案例中,5AF2集合中最准确的模型,或该模型内的构象,通过使用XLP评估的crosslinks鉴定图6。在其余的情况下,只有monolinks(通过MP评分评估成功识别了谷氨酰胺结合的周质蛋白的开放构象,且这些结果通过纳入monolinks的“占用”得到了进一步提升。这为monolinks的有效性提供了一个令人信服的概念证明图7。相比之下,AF2评分只能在6个案例中的2个里识别出最准确的构象。本文的结果突出了AF2XL-MS等实验方法的互补性,且文章所开发的MPXLP评分提供了可靠的指标来评估预测模型的质量。


图1. 本文提出的流程


图2. 结合AlphaFold2XL-MS模拟柔性蛋白的构象

A)已知谷氨酰胺结合的周质蛋白(QBP)PDB中具有开放和封闭的构象,但AF2默认只预测封闭的构象。高预测对齐误差(PAE)块通常表示域之间的边界,但QBP被预测为一个单一的低PAE块,较高的PAE区域图中白色是由展开的N端造成的。

B)当化学交联剂红色的两端与蛋白质共价结合时,就会发生crosslinks,而monolinks只涉及一个附着位点。欧氏距离(ED)是交联C⍺原子之间的最短路径,而溶剂可及表面距离(SASD)是交联C⍺原子之间沿蛋白质表面的最短路径。

C)本文的灵活蛋白质建模方法包括从开放和封闭构象中以monolinks(a)crosslinks(bc)的形式获取XL-MS数据,同时使用AlphaFold2进行浅层多序列比对(≤64序列)预测模型集合。AF2模型通过它们与每个构象的XL-MS数据的匹配程度进行评分,使用实验程序中描述的monolinks概率(MP)crosslinks概率(XLP)评分。

图3.  DSS-BS3-交联赖氨酸残基的深度和C⍺-C⍺欧氏距离的经验分布
43PDB结构中,在总共4162个赖氨酸中发现了831个独特的赖氨酸残基带有一个附加的交联剂。
A)标记和未标记赖氨酸的深度分布用负幂函数拟合。
B)C⍺-C⍺距离分布用s型函数拟合。


图4.  基于crosslinkmonolink的分数可以在一定误差容忍度的情况下,在模拟基准中区分接近原生的结构

A)3DRobot数据集中,10100%crosslinkmonolink恢复范围内,crosslinkmonolink评分函数在排序精度和近原生结构选择方面的性能。总体而言,XLP在得分中表现最好,特别是在低交联回收率(≤ 30%)时。橙色星号表示XLP显著优于MNXL的回收率,黑色星号表示相反(***p < 0.001, **p < 0.01, *p < 0.05)。XLP中删除深度信息会使性能降至低于MNXL,但高于MP分数。

B)通过增加一定比例的错误交联来模拟错误发现率(FDR)会导致XLP3DRobot数据集中200个蛋白质的中位数排名准确性和中位数近原生选择方面的性能变差。蓝线描绘了FDR和交联恢复的组合,其中AUC中等程度地识别了近原生结构(AUC ≥ 0.7)。在低交联回收率下,XLP在高达10%FDR下仍然具有中等的识别能力,并且在更高的交联回收率下可以承受高达30%FDR


图5.  XLPMP得分表明在AF2生成的结构集合中接近原生性

A)C3、荧光素酶和QBP在预测AF2模型中的差异,用各自开放和封闭PDB构象的RMSD表示。每个点代表一个AF2模型。黄色箭头指向Top1-XLP/MP评分模型。在所有情况下,XLPMP要么能够选择接近原生的模型,要么在没有接近原生结构的情况下,从AF2预测集中选择RMSD较低的结构之一。对于C3QBPAF2结构位于开放和封闭构象之间的一条直线上,表明AF2系综可能代表了两个构象之间的物理相关的中间结构。

B)XLPMP分数与模型精度大致成正比关系,因此与封闭和开放构象的RMSD成反比。相应的RMSDpTM图显示用于比较。PDB构象用黄色箭头表示。在每种情况下都显示了近原生选择(AUC)和排序精度(CC)(na,表示没有发现近原生结构)。除QBP闭合构象外,XLPMP评分的AUCCC均优于AF2pTM评分。


图6.  XLP评分从C3、荧光素酶和QBPAF2系综中选择闭合构象

PDB模型作为参考,以及AF2集合中的三个代表性结构XLPMP得分最高的,最准确的(PDB结构的RMSD最低,以及pTM得分最高的模型。相应的XLP分数和目标构象的RMSD显示在每个模型旁边,每个结构下面的括号中显示了模型在精度方面的排名。在每种情况下,实验得出的crosslinks都显示出来,用Cα-Cα距离表示蓝色:<21 Å黄色:21 - 33 Å,红色>33 Å)


图7.  XLPMP评分从C3、荧光素酶和QBPAF2系综中选择开放构象

PDB模型作为参考,以及AF2集合中的三个代表性结构XLPMP得分最高的,最准确的(PDB结构的RMSD最低,以及pTM得分最高的模型。相应的XLPMP分数和目标构象的RMSD显示在每个模型旁边,每个结构下面的括号中显示了模型在精度方面的排名。在每种情况下,都显示了实验衍生的crosslinks(C3和荧光素酶monolinks(QBP)crosslinksCα-Cα距离着色蓝色:<21 Å黄色:21 - 33 Å,红色>33 Å)monolinks以残差深度着色蓝色:≤6.25 Å,红色:>6.25 Å)

综上所述,本文提出了一个用于预测蛋白质的特定构象的流程。文章发现crosslinksmonolinks都有助于发掘正确的蛋白质构象。





撰稿:聂旻涵

编辑:李惠琳

文章引用:Manalastas-Cantos K, Adoni KR, Pfeifer M, et al. Modeling Flexible Protein Structure With AlphaFold2 and Crosslinking Mass Spectrometry. Mol Cell Proteomics. Published online January 22, 2024. doi:10.1016/j.mcpro.2024.100724


李惠琳课题组网址
www.x-mol.com/groups/li_huilin




参考文献
  1. Manalastas-Cantos K, Adoni KR, Pfeifer M, et al. Modeling Flexible Protein Structure With AlphaFold2 and Crosslinking Mass Spectrometry. Mol Cell Proteomics. Published online January 22, 2024. doi:10.1016/j.mcpro.2024.100724




李惠琳课题组
推介Top-down MS原理、新技术、新方法以及相关结构质谱方法及其在翻译后修饰调控机制、蛋白-药物相互作用、 蛋白质机器结构及功能解析等领域的前沿文献与工作交流。
 最新文章