代谢组学涉及对生物系统中所有小分子的综合研究。它具有广泛的应用,从基础生化研究到疾病的临床研究、食品安全评估、环境监测等。用户友好且易于访问的生物信息学工具对于处理代谢组学研究产生的复杂数据至关重要。MetaboAnalyst是一个用户友好、基于 Web 的平台,旨在为代谢组学数据分析提供全面支持。早期版本主要侧重于支持目标代谢组学数据的统计和功能分析。在最新版本的MetaboAnalyst 中,已逐步引入对液相色谱-质谱 (LC-MS) 实验中非靶向代谢组学数据的越来越多的支持。高分辨率LC-MS仪器生成的非靶向代谢组学数据通常由数千个化学特性未知的峰为特征。为了帮助化合物鉴定,在实验过程中,通常从混合的QC 样品中收集串联 MS谱图。常用的两种MS2方法是数据依赖性采集(DDA)和数据非依赖性采集(DIA),其中全理论质谱顺序窗口采集(SWATH)是后者的一个有前途的特例。DDA 数据通常在母离子和相应的母离子谱之间具有明显的关联,而DIA数据通常需要对MS数据进行反卷积以重建与其母离子的关联。将MS处理和注释整合到非靶向代谢组学工作流程中可以大大改善化合物注释和功能解释。暴露组学是一个新兴领域,其中心是分析个人在其一生中遇到的一整套暴露,这通常涉及对传统上植根于毒理学和公共卫生的化学混合物的MS 分析。基于非靶向LC-MS的代谢组学越来越多地应用于暴露组学和毒理学研究。由于其观察性质,来自人类队列的暴露组学数据通常与复杂的表型数据相关联。这需要更复杂的数据分析和可视化方法,这些方法可以考虑多个因素或协变量。暴露组学研究通常会产生一长串与感兴趣的表型显着相关的潜在生物标志物。从大量代谢物-表型关系中识别出因果关系是自然而然的下一步。最近,随着许多将代谢物和基因型联系起来的代谢组学全基因组关联研究(mGWAS) 的出现,这已成为可能。通过将 mGWAS 数据与将基因型与各种表型相关联的可比GWAS 数据,我们现在可以通过孟德尔随机化(MR)来估计代谢物和目标表型之间的因果关系。通常进行剂量反应实验以进一步量化因果关系。这些实验通常在多个剂量水平下进行,使用体外测定或动物模型来计算用于化学暴露风险评估的剂量反应曲线。MetaboAnalyst
6.0 在各种模块中总共接受五种不同的数据类型,包括光谱处理、统计分析、功能分析、元分析以及与其他组学数据的集成。上传数据后,所有分析步骤都在一致的框架内进行,包括数据完整性检查、参数定制和结果可视化。在 LC-MS 谱图处理工作流程中支持 asari 和MS2 谱图
LC-MS谱图处理仍然是非靶向代谢组学领域的一个活跃的研究课题。随着时间的推移,已经开发了许多强大的工具,包括XCMS、MZmine、MS-DIAL 和asari。除了使用不同的峰值检测算法外,大多数工具还需要手动调整参数以确保良好的结果。这种做法往往会导致结果差异很大。为了缓解此问题,引入了MS2谱图处理和代谢物鉴定。MS2 谱图处理和代谢物鉴定是非靶向代谢组学的重要组成部分。现在认识到,MS2光谱反卷积对于获得 DDA 和 SWATH-DIA 数据的高质量化合物鉴定结果是必要的。MetaboAnalyst 6.0 为 MS2 光谱反卷积提供了一个高效的、自动优化的管道。当提供MS2 谱图重复时,将执行额外的步骤以在重复之间生成一致的谱图。根据MetaboAnalyst 精选的 MS2 参考数据库搜索共识谱图,以根据点积或谱熵相似性分数进行化合物鉴定。DDA和 SWATH-DIA 的完整流程可从光谱处理[LC–MS w/wo MS2] 模块获得。通过双样本孟德尔随机化进行因果分析
了解代谢物和表型之间的因果关系在代谢组学和暴露组学中都具有重要意义。GWAS已经建立了遗传变异(例如单核苷酸多态性或SNP)与各种表型之间的联系,而最近的mGWAS提供了基因型与代谢物或代谢物浓度变化之间的联系。可以估计代谢物与目标表型之间的因果关系。如果某种代谢物是特定疾病的病因,那么影响该代谢物水平的遗传变异,无论是直接通过影响相关酶,还是通过影响生活方式选择(如饮食习惯)间接影响,都应导致更高的疾病风险。这些因果效应可以通过孟德尔随机化分析来估计。MR依赖于遗传变异在人群中随机分布的原理,类似于临床试验中随机分配治疗方法的方式。通过利用这种随机分配,MR可以评估代谢物和表型之间的关系是否是因果关系,同时减少经常困扰观察性研究的混杂因素和反向因果关系的影响。MetaboAnalyst中的MR分析基于2SMR方法,该方法允许使用来自非重叠个体的汇总统计数据来应用 MR 方法。用户应首先选择感兴趣的暴露(即代谢物)和结果(即疾病)。根据选择,该程序搜索与我们最近的大量mGWAS研究和OpenGWAS数据库中的疾病相关的潜在工具变量(即SNP)。下一步是执行 SNP 过滤和协调,通过连锁不平衡(LD) 聚集来识别独立的 SNP。当GWAS数据库中缺少SNP时,使用LD识别代理SNP。此外,协调SNPs至关重要,以确保SNPs对两种暴露的影响大小和结果都针对相同的参考等位基因。进行MR 分析前的最后一步是排除影响多种代谢物的 SNP,以减少水平多效性,当遗传变异通过感兴趣的暴露以外的途径影响结果时,就会发生水平多效性。MetaboAnalyst的 MR 分析页面提供了多种统计方法(目前有12 种),每种方法都有自己的优点和局限性。例如,加权中位数方法对某些遗传变异违反MR假设具有鲁棒性,而Egger回归方法对水平多效性具有更鲁棒性。用户可以将鼠标指向每种方法旁边的相应问号上以了解更多详细信息。剂量反应分析
剂量反应分析通常用于毒理学和药理学,用于了解不同浓度的化学物质如何影响生物系统。它在化学品暴露的风险评估中起着关键作用。剂量反应分析的一个关键输出是基准剂量(BMD),即相对于对照组产生明显、低水平健康风险的物质的最小剂量。从暴露组学中鉴定出的化学物质通常进行剂量反应研究,以了解其作用机制或不良结果途径。剂量反应实验设计包括一个对照组(剂量= 0)和至少三个不同的剂量组,通常每组的重复次数相同。数据应格式化为csv 文件,其剂量信息应包含在第二行或第二列中。分析工作流程包括四个主要步骤:(i) 数据上传、完整性检查、处理和规范化;(ii)差异分析,以选择随剂量水平变化的特征;(iii) 根据一套线性和非线性模型对这些选定特征的强度或浓度值进行曲线拟合,以及 (iv) 计算每个特征的 BMD 值。用于剂量-反应分析的算法改编自我们开发的用于转录组学 BMD 分析的算法。
谢谢!
课题设计与申报|分子生物学实验|细胞功能|机制调控|多组学检测分析