单细胞RNA测序批次校正方法比较

健康   2024-10-19 11:13   广东  


引言:

随着单细胞RNA测序(scRNA-seq)实验规模和复杂性的增加,整合不同实验中的数据变得愈发重要。然而,批次效应,即不同数据集之间的技术差异,往往会掩盖真实的生物信号,因此需要进行纠正。为此,开发了多种批次效应校正方法,但它们的策略和表现各不相同。Pall Melsted等评估了七种广泛使用的批次效应校正方法,以评估它们在消除批次效应的同时保留生物学信号的效果。




关键发现:

1. 批次效应校正方法的表现:本研究评估了七种方法:Combat、Harmony、LIGER、MNN、SCVI、Seurat和BBKNN。每种方法采用了不同的策略——有些直接修改了计数矩阵,而另一些则侧重于低维嵌入或K-最近邻(KNN)图。Harmony和Combat在所有指标中表现最好,既有效消除了批次效应,又引入了最少的伪影。

2. 对聚类和差异基因表达的影响:像Harmony和Combat这样的方法对细胞聚类和差异表达分析的影响最小。而MNN、SCVI和LIGER等方法则引入了显著的变化,导致错误的聚类分配和基因表达谱的人工改变,这些扭曲使这些方法在某些分析管道中的应用值得担忧。

3. 对基因表达谱的影响:研究还发现,像MNN和Seurat这样的校正不佳的方法在差异基因表达分析中导致了大量的假阳性,使得这些方法不够可靠。相比之下,Harmony始终显示出与未校正数据的最高重叠,使其成为保持scRNA-seq数据生物学相关性时的安全选择。



结论:

本研究得出结论,尽管有多种批次效应校正方法可用,但Harmony在确保保留真实生物信号的同时最小化伪影引入方面表现最为可靠。虽然Combat也有效,但在某些应用中可能不如Harmony稳健。由于MNN和SCVI方法过度改变数据的倾向,不建议使用它们。



影响:

这些发现对进行scRNA-seq分析的研究人员具有重要意义。批次效应校正是一个关键步骤,选择合适的方法可以显著影响下游分析的结果,例如细胞聚类和基因表达研究。该研究为批次效应校正的最佳实践提供了明确的指导,推荐Harmony作为scRNA-seq工作流程中最可靠的工具。






参考文献

Sindri Emmanuel Antonsson et al. Batch correction methods used in single cell RNA sequencing analyses are often poorly calibrated. bioRxiv. 2024

智预
“智预”谐音“治愈”,代表我们的愿景。深圳智预生命科技有限公司致力于开发基于定量建模方法的个体化癌症画像流程,提供技术咨询和技术服务。
 最新文章