JIPB | 河南大学张学斌团队开发植物代谢组学数据分析流程:MetMiner

文摘   科学   2024-09-11 10:00   北京  

植物代谢组学作为一门新兴的组学技术,被广泛应用到代谢途径解析、基因功能解析以及作物品种改良等领域,展现出巨大的潜力。随着质谱技术的发展及检测成本的降低,群体规模的植物代谢组学检测需求日益增加,然而,针对大样本量的代谢组学数据处理及数据挖掘的流程开发相对滞后,现有的流程大部分由各个实验室自行搭建,且要求使用者具有一定的编程经验。因此,开发一款用户友好的大规模植物代谢组学数据分析流程具有重要意义。

JIPB近日在线发表了河南大学张学斌团队题为“MetMiner: A user-friendly pipeline for large-scale plant metabolomics data analysis”的论文 (https://doi.org/10.1111/jipb.13774),介绍了一款用户友好的,专为大规模植物代谢组学数据处理及数据挖掘打造的分析流程MetMiner。

MetMiner分析流程由三部分构成:第一部分为上游数据处理,第二部分为下游数据分析,第三部分为进阶数据挖掘。整体基于R-shiny开发,具有用户友好的、交互性强的图形界面,通过数据上传、参数选择等简单步骤即可完成完整的植物代谢组学数据分析及数据挖掘工作。

上游数据处理目的在于将LC-MS原始数据经过数据清洗、标准化等过程转换为可以用于下游统计分析的干净数据。该部分调用了tidyMass framwork (Shen et al. 2022), 先进的质谱数据存储和管理方式确保了MetMiner可以从不同类型的质谱数据开始分析,同时也保证了数据分析的透明性、可追溯性以及可重复性。

下游数据分析包括了代谢物的注释、分类、基础统计分析以及富集分析,该研究针对性的开发了代谢组下游分析工具包 (MDAtoolkits)。MDAtoolkits内置了六个植物特异的MS2代谢物数据库以及三个MS1代谢物数据库,保证了植物代谢组学代谢物注释的准确性。此外,MDAtoolkits集成了多元统计分析和单元统计分析来快速鉴定差异代谢物,并基于ClassyFire数据库和KEGG数据库开发了代谢物分类富集分析和通路富集分析来帮助用户解析差异代谢物潜在的生物学功能。

对于复杂的代谢组学实验设计,标志代谢物的挖掘工作相对困难,本研究提出了迭代WGCNA的策略,通过多轮WGCNA将无法聚类的代谢物逐步排除,最终将具有相同积累规律的代谢物归类到不同的模块,构建代谢物共积累网络。通过对模块的通路富集分析、分类富集分析以及枢纽代谢物 (hub metabolite) 提取,快速锁定标志代谢物。

图1. MetMiner流程结构

MetMiner可以通过Shiny Server部署在高性能服务器或者计算集群,调用更多的计算资源来实现对大样本量的代谢组学数据分析。此外,MetMiner的设计理念充分考虑了流程的“易用性”和“交互性”。“Resuming analysis from the unfinished steps”功能使用户可以随时继续未完成的分析,或者选择性的针对特定步骤进行重新分析。“Interactive plot”提供了强大的图表数据交互能力,使用户直接从图片中获取相应信息。例如图2中,通过点击差异分析火山图中代表差异代谢物的点,该代谢物的统计分析结果、代谢物注释、MS2 spactra以及化学结构图会相应的显示。简化了用户对数据提取操作,提升了数据分析及信息获取的效率。

图2. 图形交互展示

最后,该研究通过MetMiner流程对206份拟南芥F-box突变体群体拟靶代谢组学数据进行了深度解析,快速锁定了标志代谢物硫代葡萄糖苷 (glucoraphanin) 和芥子酰苹果酸 (sinapoyl malate) 并且通过靶向检测验证了MAX2突变导致硫代葡萄糖苷增加,KFB20突变导致芥子酰苹果酸的增加,该结果也说明了MetMiner在群体规模代谢组学数据挖掘中的准确性和高效性。此外,经MetMiner处理的不同质谱平台产生的非靶代谢组学数据在代谢物定性及定量的方面展现出高度的一致性,这说明MetMiner在代谢物注释方面具有较高的稳健性。
河南大学省部共建作物逆境适应与改良国家重点实验室博士后王骁、已毕业硕士生梁爽、青年教师杨文奇以及青年教师禹坷为论文的共同第一作者,张学斌教授为该论文的通讯作者,青年教师张君丽为共同通讯作者。本研得到国家重点研发计划、河南省高等学校重点科研项目、国家自然科学基金、河南省博士后科研资助项目以及Biotechnology and Biological Sciences Research Council (BBSRC, UK) “A China-UK joint phenomics consortium to dissect the basis of crop stress resistance in the face of climate change”的资助。
张学斌现为河南大学生命科学学院教授,博士生导师。团队的研究主要聚焦于植物酚类化合物合成与代谢及多组学联合解析其在植物逆境适应中的分子机理。课题组长期致力于建立完善的作物多组学研究体系,组建了《河南大学多组学联合研究中心》、《河南省作物逆境多组学国际联合实验室》,目前已经建立了包括:非标记定量蛋白质组学,标记定量蛋白质组学,修饰蛋白质组学,非靶向代谢组学、拟靶向代谢组学、靶向代谢组学、激素组学、脂质组学、完整细胞壁成分鉴定体系等组学方法体系。欢迎对多组学技术感兴趣的老师、同学交流、合作。课题组常年招收博士后和硕博士研究生,欢迎对多组学尤其是代谢组学方向感兴趣的同学加入。
参考文献:

Shen, X., Yan, H., Wang, C., Gao, P., Johnson, C. H., and Snyder, M. P. (2022). TidyMass an object-oriented reproducible analysis framework for LC-MS data. Nat. Commun. 13: 4365. 

文章引用:

Wang, X., Liang, S., Yang, W., Yu, K., Liang, F., Zhao, B., Zhu, X., Zhou, C., Mur, L. A. J., Roberts, J. A., et al. (2024). MetMiner: A user-friendly pipeline for large-scale plant metabolomics data analysis. J. Integr. Plant Biol. https://doi.org/10.1111/jipb.13774

推荐阅读:

#JIPB热点论文 | 植物的“金属考验”:毒性与解毒之战——植物与微量金属相互作用的挑战、机制与未来展望#

#JIPB热点论文和高被引论文#

往期合集:

#Abiotic Stress Responses#   
#Cell and Developmental Biology#
#Functional Omics and Systems Biology# 
#Global Change Biology#
#Gene Editing#
#Molecular Physiology#   
#Metabolism and Biochemistry#
#Molecular Ecology and Evolution#
#Plant Biotic Interactions#   
#Photosynthesis and Crop Physiology#   
#Plant Reproductive Biology#   
#Plant Phylogenomics# 
#Plant Epigenetics#
#Synthetic Biology# 

物种研究合集:

#Foxtail millet# 
#Maize# 
#Soybean#
  #Wheat# 



  

JIPB面向全球,刊发整合植物生物学研究的重要创新成果,包括宏观和微观领域有创新性的重要研究论文、综述、简讯、新资源、新技术和评论性文章等。2023年2年SCI_IF: 9.3,位于植物科学TOP 3.2%,SCI的Q1区。2023年Scopus数据库中CiteScore: 18.0,位于植物科学TOP 2%。JIPB位于中国科学院期刊分区生物学大类1区和植物学小类1区,中国科协《植物科学领域高质量期刊分级目录》T1级,并入选中国科技期刊卓越行动计划。


长按二维码

关注JIPB



点击阅读原文,查看更多内容。

JIPB
关注JIPB动态,传播期刊信息
 最新文章