植物代谢组学作为一门新兴的组学技术,被广泛应用到代谢途径解析、基因功能解析以及作物品种改良等领域,展现出巨大的潜力。随着质谱技术的发展及检测成本的降低,群体规模的植物代谢组学检测需求日益增加,然而,针对大样本量的代谢组学数据处理及数据挖掘的流程开发相对滞后,现有的流程大部分由各个实验室自行搭建,且要求使用者具有一定的编程经验。因此,开发一款用户友好的大规模植物代谢组学数据分析流程具有重要意义。
JIPB近日在线发表了河南大学张学斌团队题为“MetMiner: A user-friendly pipeline for large-scale plant metabolomics data analysis”的论文 (https://doi.org/10.1111/jipb.13774),介绍了一款用户友好的,专为大规模植物代谢组学数据处理及数据挖掘打造的分析流程MetMiner。
MetMiner分析流程由三部分构成:第一部分为上游数据处理,第二部分为下游数据分析,第三部分为进阶数据挖掘。整体基于R-shiny开发,具有用户友好的、交互性强的图形界面,通过数据上传、参数选择等简单步骤即可完成完整的植物代谢组学数据分析及数据挖掘工作。
上游数据处理目的在于将LC-MS原始数据经过数据清洗、标准化等过程转换为可以用于下游统计分析的干净数据。该部分调用了tidyMass framwork (Shen et al. 2022), 先进的质谱数据存储和管理方式确保了MetMiner可以从不同类型的质谱数据开始分析,同时也保证了数据分析的透明性、可追溯性以及可重复性。
下游数据分析包括了代谢物的注释、分类、基础统计分析以及富集分析,该研究针对性的开发了代谢组下游分析工具包 (MDAtoolkits)。MDAtoolkits内置了六个植物特异的MS2代谢物数据库以及三个MS1代谢物数据库,保证了植物代谢组学代谢物注释的准确性。此外,MDAtoolkits集成了多元统计分析和单元统计分析来快速鉴定差异代谢物,并基于ClassyFire数据库和KEGG数据库开发了代谢物分类富集分析和通路富集分析来帮助用户解析差异代谢物潜在的生物学功能。
对于复杂的代谢组学实验设计,标志代谢物的挖掘工作相对困难,本研究提出了迭代WGCNA的策略,通过多轮WGCNA将无法聚类的代谢物逐步排除,最终将具有相同积累规律的代谢物归类到不同的模块,构建代谢物共积累网络。通过对模块的通路富集分析、分类富集分析以及枢纽代谢物 (hub metabolite) 提取,快速锁定标志代谢物。
图1. MetMiner流程结构
图2. 图形交互展示
Shen, X., Yan, H., Wang, C., Gao, P., Johnson, C. H., and Snyder, M. P. (2022). TidyMass an object-oriented reproducible analysis framework for LC-MS data. Nat. Commun. 13: 4365.
Wang, X., Liang, S., Yang, W., Yu, K., Liang, F., Zhao, B., Zhu, X., Zhou, C., Mur, L. A. J., Roberts, J. A., et al. (2024). MetMiner: A user-friendly pipeline for large-scale plant metabolomics data analysis. J. Integr. Plant Biol. https://doi.org/10.1111/jipb.13774
#JIPB热点论文 | 植物的“金属考验”:毒性与解毒之战——植物与微量金属相互作用的挑战、机制与未来展望#
往期合集:
物种研究合集:
长按二维码
关注JIPB