iMeta | 浙大儿院倪艳/傅君芬组-MetOrigin 2.0微生物代谢物的发现和溯源

学术   2024-11-18 21:02   天津  

点击蓝字 关注我们

MetOrigin 2.0:推动微生物代谢物的发现和溯源

iMeta主页:http://www.imeta.science

研究论文

 原文: iMeta (IF 23.8)

 原文链接DOI: https://doi.org/10.1002/imt2.246

● 2024年11月6日,浙江大学医学院附属儿童医院,国家儿童健康与疾病临床研究中心倪艳、傅君芬课题组在iMeta在线发表了题为“MetOrigin 2.0: advancing the discovery of microbial metabolites and their origins”的文章。

● 本文推出最新版本MetOrigin 2.0在线分析软件(http://metorigin.met-bioinformatics.cn),旨在推进微生物组和代谢组大数据整合分析,加快微生物代谢物的发现和溯源。

  第一作者:俞刚

  通讯作者:倪艳 (yanni617@zju.edu.cn)、傅君芬(fjf68@zju.edu.cn)

  合作作者:徐翠芳、王晓艳、鞠峰

  主要单位:浙江大学医学院附属儿童医院,国家儿童健康与疾病临床研究中心、西湖大学工学院,浙江省海岸带环境与资源研究重点实验室

 亮 点

●  MetOrigin 2.0整合了三大分析模式,拥有八个独立的分析功能,推进更系统、深入的微生物代谢物鉴定分析;

● 数据库更新、快速搜索、同源分析、和中介分析等新功能,显著拓展分析平台的多样性和功能性;

●  MetOrigin 2.0 作为一个系统的在线分析软件,旨在整合微生物组和代谢组数据,加快微生物代谢物的发现和溯源。

摘  要

MetOrigin于2021年首次推出,而后迅速成为一款强大的网络服务器,用于鉴定微生物代谢物和识别参与特定代谢过程的细菌。基于对微生物组和代谢组之间相互作用的理解日益深入,以及对用户反馈的回应,MetOrigin 进行了重大升级,更新至 2.0 版本。增强版包含三个新模块:(1) 快速搜索模块,快速识别与特定代谢物相关的细菌;(2) 同源分析模块,对接代谢酶同源基因和相关的细菌;(3) 中介分析模块,分析细菌、代谢物和表型之间潜在的因果关系,强调代谢物的中介作用。此外,MetOrigin数据库更新了来自七个公共数据库(KEGG、HMDB、BIGG、ChEBI、FoodDB、Drugbank和T3DB)的最新数据,将覆盖范围扩大到210,732种代谢物及其各自来源。MetOrigin 2.0可免费访问,网址是:http://metorigin.met-bioinformatics.cn。

视频解读

Bilibili:https://www.bilibili.com/video/BV1GJmpYLE8J/

Youtube:https://youtu.be/CaN5yFsSxXI

中文翻译、PPT、中/英文视频解读等扩展资料下载

请访问期刊官网:http://www.imeta.science/

全文解读

引  言

MetOrigin 是一个交互式分析软件,能够进行微生物代谢物的鉴定以及微生物组和代谢组的整合分析。自推出以来,它迅速引起了宏基因组学和代谢组学领域的广泛关注。目前,该平台每月平均处理约4,000个任务,用户群体已超过1,800名,使用平台的研究人员涵盖多个领域,包括临床与公共卫生、药物研发、营养科学、食品与农业、动物科学等。

微生物代谢物在宿主与微生物群的交互作用中充当重要的中间体和信号分子,为预防和/或治疗代谢性疾病提供了有新靶点。实际上,微生物产生的小型生物活性化合物已成为众多治疗药物的基础。最近研究发现由特定肠道微生物种群产生的新型胆汁酸,例如3-琥珀酰化胆酸(3-sucCA)和3-氧化石胆酸(3-oxoLCA)。这些化合物在缓解代谢性疾病和炎症性疾病方面展示出显著的临床应用潜能。尽管进行直接的实验验证是最准确的方法,但筛选产生特定代谢产物的菌株是一项既具挑战性又耗费精力的工作。研究人员可能需要筛选数百个可培养的细菌菌落,并在不同条件下将它们与化学底物共同培养,再对代谢产物进行定量分析,来验证不同细菌菌株的代谢过程。为解决这些问题,相关研究人员已经开发了先进的生物信息学工具和综合数据库,使用单组学数据或整合多组学方法,包括基因组学、转录组学、蛋白质组学和代谢组学,以有效预测微生物代谢物。MetOrigin通过整合宏基因组和代谢组数据进一步推动了这一领域的发展,简化了微生物代谢产物及其相应细菌来源代谢物的识别。该系统提高了微生物生物标志物发现的效率和准确性。

随着宏基因组学和代谢组学领域研究的不断深入,为探索微生物与其代谢产物之间复杂的交互作用,对更先进的分析工具的需求日益增加。针对用户反馈和领域内的新需求,MetOrigin 2.0 进行了重大升级,相较于原版 MetOrigin 有了显著改善。新版本包括以下新功能:

(1)    数据库更新:MetOrigin 数据库更新了来自七个代谢产物库的最新数据(KEGG、HMDB、BIGG、ChEBI、FoodDB、Drugbank 和 T3DB)。 

(2)    快速搜索模块:该新模块能够快速识别特定代谢产物及相关微生物。 

(3)    代谢产物来源扩展:代谢产物来源已被精炼并扩展为五个主要类别:宿主、微生物群、食物、药物和环境。 

(4)    同源分析模块:对接代谢酶同源基因与其相关微生物。 

(5)    中介分析模块:用于探索细菌、代谢产物和表型之间潜在的因果关系。

所有这些新功能都包含在MetOrigin 2.0 中,可以通过链接 http://metorigin.met- bioinformatics.cn/进行访问。此外,我们对现有分析模块的关键功能进行了升级,包括提供定制化选项服务和升级图形输出功能。我们还在网站上更新了教程和常见问题解答(FAQs),以解决用户的常见问题,实现用户与平台的有效互动。

结  果

MetOrigin 2.0 概述

MetOrigin 2.0 是一个强大的网络交互式平台,旨在推进微生物组和代谢组研究的数据整合分析。平台的核心功能主要包括三种模式(图1),具体总结如下:

(1)    快速搜索:用户无需上传数据,通过查询 MetOrigin 数据库即可确定特定化合物/代谢物与细菌之间的联系,快速获得代谢反应及其相关微生物。

(2)    简单 MetOrigin 分析(SMOA):与之前的版本一致,SMOA 用于研究代谢组学所获得的差异代谢物,可进行代谢物溯源分析、代谢通路富集分析、探索代谢反应相关微生物群并通过 Sankey 网络可视化分析。

深度 MetOrigin 分析(DMOA):包含七个独特分析模块,该模式需要三个初始数据文件:包含样本和分组数据的“样本信息”表,包含化合物详细信息的“代谢物”表,以及由测序分析得到的包含微生物注释和丰度数据的“微生物”表。除了第一版本提供的分析功能(溯源分析、通路分析、相关性分析、Sankey 可视化分析和网络分析)外,DMOA 还引入了同源分析和中介分析两个新功能。通过提供来自宏基因组的 KEGG 同源基因信息表,同源分析能够将代谢酶同源基因与相应细菌联系起来。通过提供表型相关数据,中介分析能够探索细菌、代谢物和表型之间的潜在因果关系。

图1. MetOrigin 2.0 三种模式

MetOrigin 数据库

MetOrigin 集成了七个权威数据库的数据,包括京都基因组与基因百科全书 (KEGG) 、人类代谢组数据库 (HMDB)、BIGG、生物学相关化学实体 (ChEBI)、食品数据库 (FoodDB)、Drugbank和毒素与毒素靶标数据库 (T3DB),这些数据库在代谢物来源和生物体信息方面的数据非常丰富。MetOrigin自推出以来不断更新数据库,积极整合公共资源,拓宽代谢物信息的范围。

图 2A展示了代谢物和物种信息原始数据的收集、处理和加工过程。首先,我们一共收集了420280种代谢物,其中210732种是“非冗余”代谢物。这些“非冗余”代谢物至少拥有一个数据库的链接,并含有明确来源信息,具体可分为5类,包括宿主(哺乳动物)、微生物群(古菌、真菌、细菌)、食品(食品和植物)、药物和环境(毒素和污染物)。单一代谢物也可以归属为多个类别。例如,同时归类于宿主和微生物群类别的代谢物被称为“宿主-微生物”共同代谢物。其次,我们收集了共计12649种来自不同的宿主和微生物群的物种信息,其中10325种是“非冗余”,可进一步分为动物、植物、细菌、真菌和古菌。

快速检索

MetOrigin 2.0的快速检索功能使用户能够快速检索数据库中现存的化合物或代谢物,迅速获取与其相关的代谢反应、相应的代谢酶以及参与反应的相关微生物。通过计算数据库中相关细菌的数量,可评估微生物在这些代谢反应中的参与程度。MetOrigin 2.0使用Sankey 网络展示代谢物与不同层级细菌的关联。Sankey 图的交互功能可根据用户偏好进行自定义设置。举一个例子,在搜索微生物代谢物乙酸时,快速检索功能识别出8条不同的代谢途径、23种代谢反应(图 2B)。这些代谢反应相关的微生物总数范围在59到5083之间(图 2C)。Sankey 网络会自动生成与每个特定代谢反应相关的不同层级的微生物(图 2D)。

图2. 数据来源及快速检索功能

(A)代谢物和物种原始数据的收集、处理和加工过程;(B)快速检索功能识别的代谢途径和代谢反应;(C)相关的微生物总数统计;(D)Sankey 网络可视化图。

同源分析

同源性分析是MetOrigin 2.0引入的新模块,旨在深入分析微生物特异的代谢特征和酶-代谢物的交互作用。该功能基于数据库代谢反应,将代谢物与KEGG同源基因(KO)进行关联。首先,通过代谢通路富集分析获得差异代谢通路。然后,MetOrigin 2.0通过代谢网络将底物、产物、代谢反应(酶)以及相关的KO基因联系起来(图 3A-B),并进一步提供每个代谢酶相关的微生物及其相对组成判别分析(图 3C-D)。

中介分析

中介分析是通过中介变量分析自变量和因变量之间因果关系的工具,该方法已应用于临床研究中识别重大疾病的风险因素或早期指标。MetOrigin 2.0以代谢物为中介变量,使用中介分析来揭示肠道微生物群(GM)变化与疾病发生之间的复杂联系。这项分析能够促进我们挖掘对微生物群体应对宿主致病因素的相关机制。中介分析模块首先对微生物组、代谢组数据和表型参数进行斯皮尔曼相关性分析(图 S1A-B)。然后使用Sankey网络识别并可视化与微生物和表型参数均相关的代谢物(图 S1C)。在Sankey网络图的指导下,用户可以选择感兴趣的特定代谢物,再通过中介分析进行进一步验证,揭示肠道微生物群在人体健康或疾病发生中的作用和潜在因果关系(图 S1D)。

附图S1. 中介效应分析流程

(A) 显示与微生物和表型参数均显著相关的差异代谢物的韦恩图。(B) 条形图展示选定代谢物与微生物或表型参数相关性的总数。(C) 微生物、代谢物和表型之间相关性的桑基网络图。(D) N-乙酰苯丙氨酸在梭菌与肥胖关系中的中介效应。BMI,体质指数;SP,收缩压;ALT,丙氨酸氨基转移酶;DP,舒张压。

案例分析与性能验证

我们通过一项代谢相关脂肪性肝病(MASLD)的肠道微生物组和代谢组研究,来展示MetOrigin 2.0的工作流程和新功能。首先,在该研究中总共识别出923种代谢物,初步分为5类:240种宿主(人类)相关代谢物、351种微生物代谢物、217种药物相关代谢物、642种食品相关代谢物和51种环境相关代谢物(图 S2A)。其中,217种代谢物为宿主-微生物群共同代谢物(图 S2B)。其次,通过比较该研究中肥胖组与健康对照组的代谢通路富集分析发现,宿主代谢物有3条显著的代谢通路,微生物代谢物有2条显著的代谢通路,宿主-微生物群共同代谢物有31条显著的代谢通路(图 S2C-D)。

附图S2. 代谢物溯源分析和代谢通路富集分析(MPEA)

(A) 条形图展示不同类别中代谢物的数量;(B) 韦恩图展示宿主、微生物群和共代谢中代谢物的数量;(C) 韦恩图显示基于不同来源的MPEA分析中富集的代谢通路数量;(D) 基于宿主、微生物群和共代谢中代谢物亚组的MPEA分析。

苯丙氨酸代谢(Ko00360)是微生物代谢物中最显著的代谢通路,我们通过该通路展示MetOrigin 2.0的新功能。在同源分析中,通过连接差异代谢物和 KO 基因(p < 0.05)构建苯丙氨酸代谢的网络(图 3A),用户可以放大网络的每个部分。举例说明,K00817对应的代谢反应酶是参与苯丙酮酸和苯丙氨酸代谢的组氨酰磷酸转氨酶 [EC: 2.6.1.9]。K00817基于不同细菌相对组成所作的饼图显示,位于前三的细菌为拟杆菌属 (Bacteroides species)、布氏菌属 (Bubacteriales species)和毛螺菌属 (Lachnospiraceae species)(图 3B)。判别分析显示,两组间拟杆菌属(Bacteroides)的相对丰度存在显著差异(图3C)。在中介分析中,通过桑基网络图鉴定出六种与微生物群和表型均有显著相关性的差异代谢物(图S1C)。进一步分析表明,梭菌属(Clostridium)可能通过提高N-乙酰苯丙氨酸的水平(30%,p < 0.05)促进肥胖的发生(图S1D)。

为了进一步验证 MetOrigin 生成的发现,我们集中研究了鞘脂,作为宿主-微生物群共同代谢物进行针对性验证。鞘脂是哺乳动物中的重要信号分子,在代谢紊乱的发展中发挥关键作用。以往研究表明,鞘脂也可以由拟杆菌(Bacteroidetes)产生,这些鞘脂会影响宿主的肝脏代谢。在这项案例研究中,我们发现鞘脂代谢中的多种鞘磷脂在 MASLD 患者中显著增加,被 MetOrigin 分类为宿主-微生物群共代谢产物。Sankey 网络分析进一步揭示,鞘磷脂与临床肝损伤生物标志物丙氨酸氨基转移酶 (ALT) 以及其他代谢标志物呈正相关(图 3D)。值得注意的是,MASLD 患者中的拟杆菌属(Bacteroides species)显著减少,并与这些鞘磷脂呈负相关,这表明鞘脂合成与代谢途径之间存在失衡。随后,中介分析表明,Bacteroides uniformis可能通过降低鞘磷脂水平(44%,p = 0.02)在减轻肝损伤方面发挥保护作用(图 3E)。这些结果有力支持了拟杆菌属在 MASLD 中通过调节宿主-微生物群鞘脂代谢的稳态所具有的保护作用。

图3. 同源分析和中介分析

(A)将底物、产物、代谢反应(酶)以及相关的KO基因联系起来的代谢通路网络;(B)K00817同源基因相关微生物及其相对组成;(C) K00817同源基因相关微生物相对丰度判别分析;(D)微生物-代谢物-表型数据相关性分析Sankey网络;(E-F)代谢物behenoyi dihydrosphingomyelinspingomyelin的中介分析。

讨  论

MetOrigin 2.0旨在进一步推动微生物代谢物的发现及其溯源分析。该版本最显著的特点是灵活性和多功能性,通过提供三种不同的操作模式来实现:快速搜索(Quick Search)、简单 MetOrigin 分析(SMOA)和深度 MetOrigin 分析(DMOA)。这些模式使用户能够在研究的各个阶段进行分析,从初步探索到深入调查。快速搜索模式使用户能够在开始组学研究之前,对代谢物、代谢反应及相关细菌进行全面的调研。该模式特别有利于加速初步探索阶段,为后续研究打下夯实的基础,并作为文献回顾过程的补充工具。在完成代谢组学研究后,SMOA 模式帮助用户区分差异代谢物的来源,进行特定微生物代谢物的通路分析,并识别细菌与每个代谢反应之间的联系。当微生物组和代谢组研究都已完成时,DMOA 模式提供了包含七个功能的全套分析,以探索微生物组和代谢组数据之间在不同层面和维度的复杂关系。该模式的分析目标是通过广泛深入的分析揭示为微生物-代谢物-疾病表型的因果关系,最终有助于更深入地理解影响人类健康的潜在作用机制。

MetOrigin 2.0 提供系统的逐步分析的策略,探索微生物-代谢物之间的相互作用,显著提高生物标志物发现和验证过程的效率。MetOrigin 2.0 中的整合分析分为五个不同层面进行(图 4):(1) 数据库搜索,以识别特定代谢物的相关细菌;(2) 代谢物分类,将代谢物分类为不同来源,以便进行进一步的代谢途径分析;(3) 相关分析,评估微生物组和代谢组之间的生物学和统计学相关性;(4) 同源性分析,确定参与特定代谢过程的细菌;(5) 中介分析,探索代谢物介导微生物对表型的因果作用,挖掘其潜在作用机制。

考虑到微生物组中成千上万种未知的次级代谢物,目前用于预测这些次级代谢物的生物信息学方法和工具涵盖了多个领域,包括基因组学、蛋白质组学、转录组学和代谢组学数据。每种工具在可扩展性和基本原理方面都有其独特的优势和局限性。未来微生物代谢物预测的进展将取决于至少三个关键因素:组学数据整合、数据库的稳健性和可视化能力。第一点,许多现有工具集中于单个组学领域,但多组学数据的整合能够提供更全面和丰富的微生物功能和作用信息。第二点,数据库的发展在支持数据整合和代谢物预测方面起着至关重要的作用。第三点,可视化对于深入理解微生物代谢物之间的相互作用至关重要。MetOrigin 通过整合宏基因组学和代谢组学数据,连接后端数据库,并提供创新的可视化功能(包括 Sankey 网络、KO-代谢物通路和微生物-代谢物关联网络)有效地捕捉了这些关键特征。综上所述,微生物代谢物预测是一个不断发展的领域,受益于组学数据整合、数据库开发和可视化技术的进步。

最后, MetOrigin 2.0 还会持续升级,在未来的研究中中,我们将进一步扩展数据库,加入更全面的宿主信息,以支持来自不同背景研究人员的多样化需求。此外,我们将通过文本挖掘和自然语言处理技术,持续更新和扩展代谢物的来源,纳入来自文献的数据。近年来培养组学的发展已经促成了大量微生物菌落的分离。此外,利用基于质谱的代谢组学对菌株进行代谢分析,使得微生物产物的识别和定量成为可能。这些突破性进展发现了新的细菌、代谢物和代谢过程,提供了微生物代谢物及其来源的宝贵见解。因此,这些有关细菌代谢活动的准确数据将被整合到 MetOrigin 中,帮助用户更有效地验证其研究发现。

图4. MetOrigin 2.0集成分析的五个不同层面



引文格式

Yu, Gang, Cuifang Xu, Xiaoyan Wang, Feng Ju, Junfen Fu, and Yan Ni. 2024. “MetOrigin 2.0: Advancing the Discovery of Microbial Metabolites and their Origins.” iMeta e246. https://doi.org/10.1002/imt2.246

作者简介


俞刚(第一作者)

 浙江大学医学院附属儿童医院信息科,计算机科学专业博士。

 研究方向为医学信息学、医学人工智能相关研究。

倪艳(通讯作者)

 浙江大学医学院附属儿童医院,国家儿童健康与疾病临床研究中心,生物信息学专业博士,研究员,博士生导师。

 研究方向为代谢性疾病的肠道微生物和代谢物相互作用机制研究、开发肠道微生物组和代谢组学数据整合分析方法。

傅君芬(通讯作者)

 浙江大学医学院附属儿童医院,国家儿童健康与疾病临床研究中心,教授,博士生导师。

 研究方向为儿童内分泌代谢性疾病临床研究。

更多推荐

(▼ 点击跳转)

高引文章 ▸▸▸▸

iMeta | 引用14000+,海普洛斯陈实富发布新版fastp,更快更好地处理FASTQ数据

高引文章 ▸▸▸▸

iMeta | 德国国家肿瘤中心顾祖光发表复杂热图(ComplexHeatmap)可视化方法

高引文章▸▸▸▸

iMeta | 高颜值绘图网站imageGP+视频教程合集                                        

1卷1期

1卷2期

1卷3期

1卷4期

2卷1期

2卷2期

2卷3期

2卷4期

3卷1期

2卷2期封底

2卷4期封底

3卷2期

3卷3期

3卷3期封底

3卷4期

3卷4期封底

1卷1期

期刊简介

iMeta” 是由威立、肠菌分会和本领域数百千华人科学家合作出版的开放获取期刊,主编由中科院微生物所刘双江研究员和荷兰格罗宁根大学傅静远教授担任。目的是发表所有领域高影响力的研究、方法和综述,重点关注微生物组、生物信息、大数据和多组学等。目标是发表前10%(IF > 20)的高影响力论文。期刊特色包括视频投稿、可重复分析、图片打磨、青年编委、前3年免出版费、50万用户的社交媒体宣传等。2022年2月正式创刊发行!发行后相继被Google Scholar、SCIE、ESI、PubMed、DOAJ、Scopus等数据库收录!2024年6月获得首个影响因子23.7,位列全球SCI期刊前千分之五(107/21848),微生物学科2/161,仅低于Nature Reviews,同学科研究类期刊全球第一,中国大陆11/514!

iMetaOmics” 是“iMeta” 子刊,主编由中国科学院北京生命科学研究院赵方庆研究员和香港中文大学于君教授担任,是定位IF>10的高水平综合期刊,欢迎投稿!

iMeta主页:

http://www.imeta.science

姊妹刊iMetaOmics主页:

http://www.imeta.science/imetaomics/

出版社iMeta主页:

https://onlinelibrary.wiley.com/journal/2770596x

出版社iMetaOmics主页:

https://onlinelibrary.wiley.com/journal/29969514

iMeta投稿:

https://wiley.atyponrex.com/journal/IMT2

iMetaOmics投稿:

https://wiley.atyponrex.com/journal/IMO2

邮箱:

office@imeta.science



生信宝典
学生信最好的时间是十年前,其次是现在!10年经验分享尽在生信宝典!
 最新文章