文献分享:分子网络-电子碰撞激发技术增强代谢物注释

2024-03-03 10:59   湖北  
大家好,本周分享一篇发表在analytical chemistry (IF 7.4)的文章,题目为“Enhancing Metabolome Annotation by Electron Impact Excitation of Ions from Organics-Molecular Networking”。该研究的通讯作者为许国旺研究员,中国科学院大连化学物理研究所


 

●  背景介绍  ●

基于高效液相色谱-高分辨质谱(HPLC-HRMS)的非靶向代谢组学已成为不同领域不可或缺的工具,如:疾病诊断、环境科学、食品安全等。质谱技术的最新进展大大提高了代谢组学的研究能力。然而,大规模、高精度的代谢物标注仍然是代谢组学研究的瓶颈,限制了对代谢组学数据的全面理解和利用。

电子激活解离(EAD)包括一系列利用自由电子的解离技术,如电子捕获解离(ECD)、热电子捕获解离(HECD)和有机物离子的电子碰撞激发(EIEIO)。EIEIO是一种非电子俘获解离方法,专为单电荷分子设计EIEIO能利用相对较高能量的电子(>10 eV)激发分子离子的电子态,导致同质裂解,形成具有未配对电子的自由基产物。EIEIO在各种生物大分子(如肽)的详细结构注释中发挥了重要作用。由于缺乏参考的EIEIO MS/MS数据库,目前还没有针对EIEIO非靶向代谢组学数据的全球代谢组注释。在推进非靶向代谢组学分析的过程中,迫切需要充分利用EIEIO的潜力。

分子网络(MN)对非靶向代谢组学数据的可视化和注释具有独特的优势。该课题引入了结构引导分子网络策略(SGMNS)。该方法利用从代谢物结构数据库中提取的化合物的分子指纹相似性来构建分子网络。SGMNS整合了基于网络的代谢物注释和结构数据库的优势,使用几个初始种子代谢物,就能有效地注释成千上万的代谢物。该团队提出了一种新方法,将EIEIOMN结合起来,以加强代谢物标注,并将建立的方法应用于前列腺癌研究








●  分析与讨论  ●
EIEIOCID模式下代谢产物片段库的构建

EIEIO参考MS/MS数据库的缺乏给使用LC-EIEIO-MS/MS注释非靶向代谢组学数据带来了巨大挑战。研究分析了MSMLS的商业标准物质库,包括羧酸、氨基酸、生物胺、脂肪酸、脂类、类固醇等。构建了EIEIOCID模式下的代谢物片段库,其中包括ESI+ESI−电离模式下的母离子m/ztRMS/MS图谱信息。该片段库可用来注释代谢物,研究EIEIO的碎片特征以及光谱相似性与结构相似性的关联。

代谢物的EIEIO碎裂,基于电子诱导解离机制,与广泛使用的低能CID模式相比,EIEIO产生的碎片离子更丰富,与结构信息的联系更紧密。该团队以三种典型的参考代谢物(如脱氧腺苷酸、棕榈酰肉碱和瓜氨酸)为例。阐述了EIEIO的碎裂模式和特点,研究也表明EIEIO产生的碎片离子数量明显多于CID模式。


Figure 1. MS/MS spectra and potential fragmentation pathways of deoxyadenylic acid (a) and palmitoylcarnitine (b) in CID and EIEIO modes. Each spectrum is labeled with the corresponding count of fragment ions (no. of FI). The fragment ions appearing in both dissociation modes are marked in red, and the fragment ions specific to the EIEIO mode are in blue. The precursor ions were hidden in the EIEIO spectra.


结构相似性和光谱相似性的关联

普遍认为,具有相似结构或亚结构的化合物很可能拥有相似的质谱MS/MS图谱。基于这一假设,人们提出了各种分子网络方法,如GNPSSGMNSKGMN等,用于非靶向代谢物标注。针对已建立的参考MS/MS数据库,使用CIDEIEIO模式获取的MS/MS图谱探讨了Sim1(用Dice系数计算)和Sim2(用修正余弦计算)之间的相关性。ESI+ESI−电离模式分别列举了55,94552,650对代谢物。对这些代谢物对的Sim1Sim2之间的关系进行了进一步评估。在ESI+ CID中,代谢物对主要呈密集分布。沿x轴排列(图2a中的红色),而在ESI+ EIEIO中则主要集中在对角线上(图2b)。这意味着与ESI+ CID模式相比,ESI+ EIEIO模式中Sim1Sim2之间的相关性相对更强。此外,还评估了CIDEIEIOMS/MS图谱之间的相似性。在ESI+ESI−电离模式下,分别有32.54% (109/335)和11.69% (38/325)的EIEIO图谱与CID图谱的Sim2 > 0.6匹配(图2cS3c)。这说明CID参考光谱数据并不适合注释EIEIO光谱。

Figure 2. A heat map of the relationship between structural and spectral similarity in the ESI +CID (a) and EIEIO (b) modes. The density plots(gray show the distributions of structural and spectral similarity. (c) The spectral similarity of standards in ESI+redder color represents a denser distribution of metabolite pairs in heat maps.


对于4374对结构相似的代谢物,在CIDEIEIO模式下,Sim2≥0.5(即MS/MS图谱相似)的代谢物对百分比分别为22.63%990/4374)和31.28%1368/4374)(图3b,c)。在两种模式的1633个相似的MS/MS图谱对中,EIEIO模式有643个独特的代谢物对,CID模式有265个,常见的代谢物对有725个(图3c)。在这些独特的代谢物对中,保留了具有相同大类33的代谢物对。除了有机氧化合物在EIEIO模式中是唯一的之外,两种模式的大类类型相似(图3d)。此外,与CID模式(2.01%)相比,EIEIO模式中脂类和类脂分子对的比例(16.36%)要高得多。这表明EIEIO增强了Sim1Sim2之间的相关性,尤其是有机氧化合物(如糖酸及其衍生物、氨基糖、单糖和糖基化合物)和脂类及类脂分子(如类固醇及其衍生物、脂肪酰基、前烯醇脂和甘油脂)。不过,EIEIO模式中核苷、核苷酸和类似物分子对的百分比(2.57%)低于CID模式(15.44%)。


Figure 3. (a) Violin plot of spectral similarities in ESI + CID and EIEIO modes and Sim2 CID /Sim2 EIEIO Article within 3 intervals of structural similarity. (b)The percentages of structurally similar metabolite pairs with Sim2 < 0.5 and Sim2 ≥ 0.5 in ESI + CID and EIEIO modes, respectively. (c)Venn plot for all the structurally similar metabolite pairs and structurally similar metabolite pairs with Sim2 ≥ 0.5 in ESI + CID and EIEIO modes. (d)The distributions of SuperClass categories for the metabolite within the uniquely similar MS/MS spectra pairs in CID and EIEIO modes.


 EIEIO 光谱相似性网络评估

光谱相似性网络(如GNPS)已被证明是一种从非靶代谢组学数据中捕捉结构类似物的有效方法。通过利用在ESI+ EIEIOCID模式下获得的上述335条参考MS/MS图谱,建立了EIEIOCID图谱相似性网络,阈值为0.8EIEIO光谱相似性网络包含214个节点、252条边和40个子网络(图4a)CID光谱相似性网络包含99个节点、74条边和40个子网络(图4b)。结果显示,在对结构相似的代谢物进行聚类方面,EIEIO光谱相似性网络要优于CID


Figure 4.  Spectral similarity networks for EIEIO (a) and CID (b) modes. (c) The partially enlarged drawing of (a). (d) The partially enlarged detail of (b). (e) Compounds appearing simultaneously in both subnetworks.



结构相似性网络的评估

为对非靶向代谢组学数据进行深度注释,我们开发了一种结构引导的分子网络策略(SGMNS)。为了评估SGMNSEIEIO非靶向代谢组学数据的有效性,我们构建了一个结构相似性网络(17651个节点和1128.23万条边)Sim1阈值为0.4,由HMDB中按内源筛选的12954个代谢物、KEGG中的4351个代谢物、OSI/SMMS中的328个代谢物和MSMLS中的51个代谢物组成(表S7)

结果表明,在EIEIO模式下,结构相似性网络的注释覆盖率和准确率均高于CID模式。这是因为某些结构相似的代谢物在CID模式下表现出较低的MS/MS图谱相似性,导致注释无法通过结构相似性网络传播。此外,某些结构相似的代谢物在CID模式下表现出较高的MS/MS图谱相似性,导致通过结构相似性网络传播注释的错误(图S8)。该研究利用血浆样品(NIST SRM 1950)评估了结构相似性网络对EIEIO非靶代谢组学数据的注释性能,并与CID模式下的注释性能进行了比较。研究人员基于十种已知代谢物,利用结构相似性网络分别从LC-CID-HRMS/MSLC-EIEIO-HRMS/MS数据中成功注释了10492337个代谢物特征(图5b)。此外,共有858个代谢物特征同时被两种解离模式注释,其中94.87%814/858)的代谢物特征有相同的候选代谢物。结果显示,CIDEIEIO模式的注释结果可以相互补充和验证。


Figure5. (a) Annotation coverage and accuracy of CID and EIEIO modes for the spiked plasma sample by the structural similarity network. (b) The annotation results of CID and EIEIO modes from NIST SRM 1950 by the structural similarity network.


前列腺癌症样本的分析

研究收集了来自24名健康对照组(HC)27PCa患者的代谢组学数据。以前列腺癌(PCa)EIEIO/CID非靶向代谢组学分析为例进行了分析。在CIDEIEIO模式下,分别成功获得了70736876个独特代谢物特征的MS/MS图谱。生成的主成分分析(PCA)得分图显示HC组和PCa组之间存在明显的差异(图6a)。通过非参数检验发现,HC组和PCa组之间共有812个代谢物特征存在明显差异(P0.05)(图6c),其中87个代谢物是通过EIEIOCID-非靶向代谢组学数据的结构相似性网络注释。对这87个差异显著的代谢物进行通路分析,结果显示多个代谢通路(鞘脂代谢、甘油磷脂代谢和亚油酸代谢)受到了不同程度的扰动(图6d),这与之前的结果基本一致。


Figure 6.  (a) PCA score plot for QC, HC, and PCa groups. (b) The annotation results of QC samples in CID and EIEIO modes. (c) Volcano plot of the metabolite features from HC and PCa samples. (d) Pathway analysis of the 87 significantly differential metabolites. (e) Relative intensities of SM(41:1) and Plasmenylcholine in HC and PCa groups. (f) ROC curve of biomarkers for the diagnosis of PCa.





● 总结  ●

该研究利用EIEIOMN的协同优势,为大规模代谢组学注释提出了一种新方法。结果表明,EIEIO图谱中丰富的片段离子能使图谱和结构相似性之间的相关性更强。这提高了MN对非靶向代谢组学数据的注释性能。结构相似性网络作为一种独立于光谱库的大规模注释方法,有效地解决了由于EIEIO光谱数据库缺乏而导致的EIEIO非靶向代谢组学注释的难题。这种方法只需要约10个已知代谢物就可注释数千个代谢物,这为大规模代谢组学注释提供了另一种解决方案。




编辑:覃佐剑

责任编辑:魏芳

文章引用:https://doi.org/10.1021/acs.analchem.3c03443.

文章信息:Wang, X., Sun, X., Wang, F., Wei, C., Zheng, F., Zhang, X., Zhao, X., Zhao, C., Lu, X., & Xu, G. (2024). Enhancing Metabolome Annotation by Electron Impact Excitation of Ions from Organics-Molecular Networking. Analytical chemistry, 96(4), 1444–1453. https://doi.org/10.1021/acs.analchem.3c03443.

● 关于我们


中国农业科学院油料作物研究所油料品质化学与营养创新团队脂质分析实验室致力于突破脂质组分析所面临的生物基质复杂、脂质及其代谢产物种类繁多且结构复杂、定性和定量分析困难等共性关键技术瓶颈,建立高效,高通量的脂质组分析平台,并将该平台广泛应用于:(1)不同生物种质资源中脂质组成;(2)应用于食品安全与质量控制;(3)脂质的生物功能与营养学评价;(4)开发新的功能脂质。


脂质组分析平台:

扫码关注更多精彩

油料脂质分析实验室
中国农业科学院油料作物研究所脂质剖析与鉴定课题组致力于突破脂质组分析所面临的生物基质复杂、脂质及其代谢产物种类繁多且结构复杂、定性和定量分析困难等共性关键技术瓶颈,建立高效,高通量的脂质组分析平台。
 最新文章