代谢组学旨在利用多维度的坐标来描述复杂生物组织中代谢物的整体变化。超高压液相色谱串联高分辨率质谱目前已经成为代谢组学研究的有力手段,近年来,离子淌度质谱的出现进一步增加了系统的分离能力以及鉴定结果的可靠程度,同时,随机和系统误差也随着数据维度的增加而增加。这对于数据质量控制工作来说是一个很大的挑战。因此,QC实验的设置和QC数据质量的科学评估就显得尤为重要。
QC样本制备
混标QC:混标QC是将一定数量的标准品混合于溶剂或者生物基质中,在数据收集过程中穿插采集。混标QC可以有针对性的对系统的性能(已知标品的保留时间稳定性、峰型、信号响应、质量准确度等)进行评估,但是混标QC中化合物的数目有限,很难对数据进行整体评估,另外混标中化合物的代表性也需要进行考量。 Pooled QC:Pooled QC是代谢组学实验中更常见的质控手段。Pooled QC是将待分析的样品等量进行混合后进行采集,因此Pooled QC数据集中包含了全部待分析化合物的信息,具有更广泛的代表性。
QC样本数据采集
QC样本数据处理
从QC样本中选择比较有代表性的离子,通常这些离子会覆盖不同的保留时间和强度,比较这些离子在不同样本中的保留时间、质量数、强度等信息的重复性,从而评估整体数据集的可靠性。
对QC数据进行峰提取、对齐等预处理后,计算每一个Feature峰强或者峰面积的相对标准偏差,通常在一批数据中,有70%的Feature的相对标准偏差小于20%,则认为数据的质量满足要求。 对整批数据进行主成分(PCA)分析,观察QC样本的聚集程度。
图2:数据采集完后进行QC分析
以上方法虽然可以很好的评估整体数据质量,但是所有操作都是在数据采集完成之后进行的。对于漂移和偏差较大的数据只能进行删除或重新采集而没有更好的办法进行补救。因此,一种实时的数据质量监测手段以及科学的数据后校正的方法就显得非常重要。
RealTime QC
解除大规模代谢组学分析的后顾之忧
布鲁克TASQ 2023b崭新推出的RealTime QC的模块,可以在数据采集过程中实时的对数据质量进行监控。我们利用尿液标准品(NIST SRM 3672),基于布鲁克impact II VIP QTOF高分辨质谱平台,连续采集300针样品。
图3:实时QC分析
数据采集完成后,布鲁克MetaboScape软件可以很方便的对QC样本进行后审查和校正,包括:提取和查看统计Features、进行PCA的统计分析等,如图所示,在300次进样中,共提取到2448个Feature,其中76.8%的Feauture的RSD值小于20%(图4),完全满足FDA对于生物样本数据重复性和稳定性的要求。
图4:Features RSD值统计
更重要的是,MetaboScape可以应用LOESS(局部加权回归)的算法,对数据在采集过程中发生的响应偏差进行校正,进一步的确保数据的稳定性。(图5)
图5:MetaboScape软件
利用LOESS算法对数据进行后校正
综上所述,布鲁克通过RealTime QC和MetaboScape软件,可以对数据采集过程中以及数据采集后全过程的数据质量进行全面的控制。保证代谢组学数据的高置信度,同时最大限度的避免数据重复采集浪费的时间成本。
相关文献下载
参考文献
[1] Evaluation of the repeatability of ultra-performance liquid chromatography–TOF-MS for global metabolic profiling of human urine samples
▼▼ 点击阅读原文,下载应用报告