图2. 结合AlphaFold2与XL-MS模拟柔性蛋白的构象
A)已知谷氨酰胺结合的周质蛋白(QBP)在PDB中具有开放和封闭的构象,但AF2默认只预测封闭的构象。高预测对齐误差(PAE)块通常表示域之间的边界,但QBP被预测为一个单一的低PAE块,较高的PAE区域(图中白色)是由展开的N端造成的。
A)在3DRobot数据集中,10到100%的crosslink或monolink恢复范围内,crosslink和monolink评分函数在排序精度和近原生结构选择方面的性能。总体而言,XLP在得分中表现最好,特别是在低交联回收率(≤ 30%)时。橙色星号表示XLP显著优于MNXL的回收率,黑色星号表示相反(***p < 0.001, **p < 0.01, *p < 0.05)。从XLP中删除深度信息会使性能降至低于MNXL,但高于MP分数。
B)通过增加一定比例的错误交联来模拟错误发现率(FDR)会导致XLP在3DRobot数据集中200个蛋白质的中位数排名准确性和中位数近原生选择方面的性能变差。蓝线描绘了FDR和交联恢复的组合,其中AUC中等程度地识别了近原生结构(AUC ≥ 0.7)。在低交联回收率下,XLP在高达10%的FDR下仍然具有中等的识别能力,并且在更高的交联回收率下可以承受高达30%的FDR。
A)C3、荧光素酶和QBP在预测AF2模型中的差异,用各自开放和封闭PDB构象的RMSD表示。每个点代表一个AF2模型。黄色箭头指向Top1-XLP/MP评分模型。在所有情况下,XLP或MP要么能够选择接近原生的模型,要么在没有接近原生结构的情况下,从AF2预测集中选择RMSD较低的结构之一。对于C3和QBP,AF2结构位于开放和封闭构象之间的一条直线上,表明AF2系综可能代表了两个构象之间的物理相关的中间结构。
B)XLP和MP分数与模型精度大致成正比关系,因此与封闭(左)和开放(右)构象的RMSD成反比。相应的RMSD与pTM图显示用于比较。PDB构象用黄色箭头表示。在每种情况下都显示了近原生选择(AUC)和排序精度(CC)(na,表示没有发现近原生结构)。除QBP闭合构象外,XLP和MP评分的AUC和CC均优于AF2的pTM评分。
PDB模型作为参考,以及AF2集合中的三个代表性结构:XLP或MP得分最高的,最准确的(PDB结构的RMSD最低),以及pTM得分最高的模型。相应的XLP分数和目标构象的RMSD显示在每个模型旁边,每个结构下面的括号中显示了模型在精度方面的排名。在每种情况下,实验得出的crosslinks都显示出来,用Cα-Cα距离表示(蓝色:<21 Å,黄色:21 - 33 Å,红色>33 Å)。
PDB模型作为参考,以及AF2集合中的三个代表性结构:XLP或MP得分最高的,最准确的(PDB结构的RMSD最低),以及pTM得分最高的模型。相应的XLP或MP分数和目标构象的RMSD显示在每个模型旁边,每个结构下面的括号中显示了模型在精度方面的排名。在每种情况下,都显示了实验衍生的crosslinks(C3和荧光素酶)或monolinks(QBP)。crosslinks以Cα-Cα距离着色(蓝色:<21 Å,黄色:21 - 33 Å,红色>33 Å),monolinks以残差深度着色(蓝色:≤6.25 Å,红色:>6.25 Å)。
编辑:李惠琳
文章引用:Manalastas-Cantos K, Adoni KR, Pfeifer M, et al. Modeling Flexible Protein Structure With AlphaFold2 and Crosslinking Mass Spectrometry. Mol Cell Proteomics. Published online January 22, 2024. doi:10.1016/j.mcpro.2024.100724
Manalastas-Cantos K, Adoni KR, Pfeifer M, et al. Modeling Flexible Protein Structure With AlphaFold2 and Crosslinking Mass Spectrometry. Mol Cell Proteomics. Published online January 22, 2024. doi:10.1016/j.mcpro.2024.100724