大家好,本周分享一篇发表在analytical chemistry(IF 7.4)的文章,题目为“Leveraging Unidentified Metabolic Features for Key Pathway Discovery: Chemical Classification-driven Network Analysis in Untargeted Metabolomics”。该研究的通讯作者为许国旺研究员,中国科学院大连化学物理研究所。
● 背景介绍 ●
植物生活在不断变化的环境中,环境的变化往往对其生长和发育构成挑战和压力。植物经常会遇到不利条件,包括生物压力,如病原体感染和食草动物的攻击、以及非生物胁迫,如干旱、 盐度、 极端温度和养分缺乏等。提高植物的抗逆性对农业发展、粮食生产和环境可持续性至关重要。在植物生物学中,植物的新陈代谢必须保持灵活,以维持细胞平衡。然而,全面了解植物胁迫响应中错综复杂的代谢途径仍然是一项复杂的任务。
代谢组学是研究植物系统的一个重要工具,它可以无偏见地描述植物组织中的代谢组对不同环境的反应,即使是复杂生物混合物中低浓度的代谢物。近年来,代谢组学已被广泛应用于研究植物组织中的新陈代谢。代谢通路富集分析是代谢组学中广泛使用的一种策略,通过评估通路中差异显著代谢物的富集情况来探索改变的通路途径。它在揭示与代谢变化相关的生物学机制方面发挥着至关重要的作用。目前代谢组学的通路富集分析仍有局限性,现有通路数据库对代谢物的覆盖率仍然相对较低,这导致许多代谢物无法映射到特定通路。此外,代谢组学数据通常包含大量未识别的代谢物,也无法将这些未知化合物映射到相关代谢途径中。此外,由于数据库或注释不完整,通路富集分析很可能会产生假阳性和假阴性结果。此外,目前对关键代谢通路的研究主要集中在已知的途径,这些途径是依赖与文献报告或已有知识进行推测。这些局限性对基于非靶向代谢组学数据的深入分析和受调控通路的系统研究构成了挑战。
本研究提出了一种新方法,通过最大限度地利用非靶向代谢组学数据来揭示关键代谢途径。以食草动物诱导的玉米须反应为例,构建了化学分类驱动的分子网络(CCMN)以深入阐明未知代谢物的结构/类别,并通过基于CCMN的通路富集分析研究了食草动物胁迫反应中的重要代谢通路。
基于CCMN代谢通路核心工作流程
以食草动物诱导的玉米蚕丝代谢反应为例,介绍了该方法的整个工作流程,关键的代谢途径如图 1 所示。首先,基于 HPLC- HRMS 平台进行了非靶向代谢组学分析。然后,对代谢途径进行全局注释。
Figure 1. A workflow of key metabolic pathways revealing based on untargeted metabolomics and construction of CCMN.
其次,利用 MS2 数据对代谢特征进行了注释。最后,基于比较代谢组学数据确定了昆虫食草反应的差异代谢物。最后,经过通路预富集分析和后续的基于 CCMN 的通路富集分析,最大限度地利用已确定的差异代谢物、类注释差异特征和结构/类演绎差异特征,揭示与胁迫相关的关键通路。
基于 MS/MS 的未知代谢特征化学分类注释
为了探索非靶向代谢组学数据中固有的结构信息,研究使用 Sirus 5 进行了基于 MS/MS 的化学分类鉴定。
Figure 2. MS/MS-based chemical classification characterization of all unknown metabolites in the ESI− (A) and ESI+ (B) ionization modes,respectively.
如图2A所示,负模式下,利用 SIRIU5 实现了2580 个代谢特征的分类,该分类将天然产物(NP)分为7个途径、70个超类和 672类。其中,1665 个代谢特征个特征被归入超类(超类概率≥0.4,通路概率得分≥0.5),274 个特征被分类到特定通路。同样,ESI+ 电离模式下,2737个特征中,1985个被成功归入超类,477 个特征被归入路径中(图 2B)。
使用CCMN实现未知特征结构或者类别判断
为了获得更全面的代谢组信息,进一步利用非靶向代谢组学特征的结构信息和基于 MS/MS 的化学分类信息来推断未识别的特征。本研究中,利用注释为相同 NP 通路的代谢组学特征,专门构建了化学分类驱动的分子网络(CCMN)。然后利用 CCMN 与缺乏结构和类别信息的完全未知代谢特征建立潜在联系。如图 3 所示,CCMN 通过利用已知的结构信息和潜在的代谢反应,促进了未知代谢特征的识别和注释。通过这种方法,即使在缺乏结构和类别信息的情况下,也能获得这些未知代谢特征的初步推断。
Figure 3. Propagation annotation based on CCMN. Structural deduction for the class-annotated metabolic features (A), Structural deduction for the unknown metabolic features (B), and NP class deduction of the unknown metabolic features (C).
化学分类驱动的分子网络评估
为了评估 CCMN 的稳健性和准确性,我们使用玉米须样品对它进行了全面评估。样品中添加了 80 种不同的标准参考物,包括13种二萜类化合物、13种三萜类化合物、25 种黄酮类化合物、20 种氧脂类化合物和 9 种苯丙类化合物(C6 -C3 )。
UPLC-MS/MS 共获得了 141 条与加标标准品相关的 MS/MS 图谱。在 141 条 MS/MS 图谱预测中,11 条预测失败(Failed),20 条预测错误(FALSE),110 条预测准确(TRUE)预测准确率为 84.6%。对 CCMN 的类别注释性能也进行了全面评估。加标萜类化合物标准物质为甜叶菊和罗汉果所独有,而玉米丝中不含这两种物质。研究选择了 6 个二萜类和 4 个三萜类光谱作为种子节点,将剩余的 131 个光谱被指定为未知光谱,用于CCMN 的类别注释。在预测结果中,失败 38 次,FALSE 4 次,TRUE 89 次。预测率为 71.0%,预测准确率为 95.7%。这些结果证明了 CCMN 方法对未知代谢物分类注释的可靠性和有效性。
昆虫取食反应中的差异代谢物
为了研究食草动物胁迫对玉米须的整体影响,进行了主成分分析( PCA )。PCA得分图见图4A ( ESI - )和图S4A ( ESI + )。在野生动物(图4B和S4B)、GMO - 1 (图4C和S4C)和GMO - 2组(图4D和S4D)中,火山图显示出对昆虫取食响应的显著差异代谢特征( p < 0.05且| log2Fold Change | > 1)。如图4E所示,在ESI -离子模式下,共有844 / 1593个代谢特征显著降低/增加,713 / 1378个代谢特征显著降低/增加。
Figure 4. Differential metabolic features (ESI−)inresponse toinsect herbivory. The PCA score plot ofcorn silkbefore and after insect treatment across thethree groups (A). The volcano plots ofdifferential metabolites inresponse toinsect herbivory inthewild (B), GMO-1 (C), and GMO-2 groups (D), respectively. Venn diagrams ofsignificantly decreased (blue) and increased (yellow) differential metabolites among thethree groups (E).
通过基于 CCMN 的途径富集分析探索参与昆虫食草的关键差异途径
在这项研究中,我们旨在确定昆虫食草反应的关键代谢途径。为避免未识别的差异代谢物造成的偏差,我们使用基于结构和类注释代谢特征的超几何检验进行了通路预富集分析。代谢特征的预富集分析。代谢特征的预富集分析覆盖了95.74 % ( ESI - )和95.18 % ( ESI + )的代谢特征。通过严谨的分析,预筛选出8条显著差异通路。为了最大限度地挖掘代谢组学数据的潜力,实现对关键代谢通路更精准的筛选,构建了8条预筛选差异通路的CCMN。此外,我们利用CCMN对完全未知代谢物的结构或类别进行了注释。通过整合基于CCMN的未知功能的推论,再次进行通路富集分析,补充了245个代谢物。修改后的通路富集分析最终确定并保留了8条( p < 0.05 , FDR < 0.05)通路。苯丙素生物合成途径是唯一显著富集的途径( p < 0.05 , FDR < 0.1),这与上述基于CCMN的途径富集一致。结果表明,基于CCMN的方法通过富集更多的显著性通路,具有更低的p值和更高的富集因子,表现出了更优越的性能。
Figure 5. (A) CCMN-based pathway enrichment analysis and (B) circle plot ofdifferential metabolic features. (C) Pathway-enriched analysis based onannotated differential metabolites using MetaboAnalyst 6.0and circle plot ofannotated differential metabolites (D).
玉米须抗草食的关键胁迫相关途径
图6A(注释的代谢物结构)基于热图中昆虫处理前后的强度比,对8个关键通路中涉及的胁迫相关代谢物进行了可视化。在对昆虫取食的反应中,野生组和GMO - 1和GMO - 2组观察到了一致的反应。其中,苯丙烷( C6-C3 )途径中的大部分胁迫相关代谢物在昆虫处理后显著降低。与野生组相比,转基因组对昆虫处理表现出相对更强的反应。这种下降在GMO - 1组(减少0.22和0.10倍)和GMO - 2组(降低0.23和0.11倍)中更为明显,说明转基因组的反应更为明显。此外,脂肪酸途径中的FA 18:2 + 3O,单萜途径中的当药苷和糖基化的苯丙氨酸(苯丙氨酸- Glc )氨基酸和小肽途在野生组中分别增加了6.49,2.27和17.16倍。说明转基因株系对昆虫取食的反应增强。
Figure 6. Key stress-related pathways against herbivory incorn silk. Heatmap ofstructure-annotated stress-related metabolites (A). The regulation oftypical metabolites inherbivory-related pathways incorn silk(B). Key pathways against herbivore attack incorn silk(C).
与报道一致,十八烷类化合物作为植物激素的主要类别发挥着关键的作用,并参与调节植物中的生物和非生物胁迫信号。在玉米须中,它们在短期的昆虫攻击后被激活。此外,莽草酸和苯丙素途径,显著下调,而二萜、单萜和类固醇途径上调(图6C )。CCMN在揭示参与植物抗性的重要代谢物方面显示出巨大的潜力。
● 总结 ●
揭示非靶向代谢组学中的未知信息和提高数据利用率对于推进代谢组学研究至关重要。本研究开发了一种用于揭示关键代谢通路的新方法-化学分类驱动的分子网络(CCMN),它利用 MS/MS 图谱和代谢物相关性来探索未识别代谢特征的结构和类别信息。此外,还提出了一种基于 CCMN 的通路富集分析方法,以减少当前通路富集分析中因忽略大量未识别的差异代谢特征而产生的偏差。食草动物诱导的玉米丝代谢反应研究也证明了这种方法的有效性。8条关键通路,包括苯丙类化合物(C6 -C3 )、黄酮类化合物、十八烷类化合物、二萜类化合物、木质素、类固醇、氨基酸/小肽和单萜化合物。这些途径被认为是对食草动物胁迫的关键化学反应。此研究强调了通过 CCMN 方法有效利用未识别的代谢特征,并为复杂的生物反应过程提供了珍贵的见解。
编辑:覃佐剑
责任编辑:魏芳
文章引用:https://doi.org/10.1021/acs.analchem.3c04591.
文章信息:Zhang, X., Li, Z., Zhao, C., Chen, T., Wang, X., Sun, X., Zhao, X., Lu, X., & Xu, G. (2024). Leveraging Unidentified Metabolic Features for Key Pathway Discovery: Chemical Classification-driven Network Analysis in Untargeted Metabolomics. Analytical chemistry, 96(8), 3409–3418. https://doi.org/10.1021/acs.analchem.3c04591.
● 关于我们
中国农业科学院油料作物研究所油料品质化学与营养创新团队脂质分析实验室致力于突破脂质组分析所面临的生物基质复杂、脂质及其代谢产物种类繁多且结构复杂、定性和定量分析困难等共性关键技术瓶颈,建立高效,高通量的脂质组分析平台,并将该平台广泛应用于:(1)不同生物种质资源中脂质组成;(2)应用于食品安全与质量控制;(3)脂质的生物功能与营养学评价;(4)开发新的功能脂质。