引言
近年来,单细胞RNA测序(scRNA-seq)在揭示基因表达的细胞级别多样性上取得了重要进展。然而,由于scRNA-seq数据的高度变异性(来自生物学和技术噪音的双重来源),其分析仍面临许多挑战。传统的差异表达分析方法难以精确区分生物变异与技术噪音,且在处理数据稀疏性方面也存在局限。UCSF的Chun Jimmie Ye等介绍了一种基于矩方法(MoM)的统计框架——Memento,它可以更好地估计和比较scRNA-seq数据中的分布参数(均值、变异性和基因相关性),从而提高差异表达分析的准确性和计算效率。
关键发现
1. 创新统计框架:
Memento通过将scRNA-seq数据建模为超几何采样过程,有效处理了技术噪音,并准确估计了基因表达的关键统计参数(均值、方差和协方差)。
2. 高效引导法:
Memento采用了优化的引导法,以便在稀疏数据中快速估计置信区间,使其适用于大型scRNA-seq数据集的分析。
3. 增强的差异表达分析:
不同于常规的汇总细胞计数方法,Memento保留了单细胞级别的信息,从而进行更为准确的差异表达分析,并在准确性和可重复性方面显著优于传统方法。
4. 在多种生物系统中的应用:
该框架在四种不同的生物背景中得到了应用,展示了其灵活性,包括(a)识别上皮细胞中的干扰素响应基因,(b)重建CRISPR-Cas9扰动T细胞中的基因调控网络,(c)绘制不同细胞类型中的基因表达性状的遗传变异图谱,和(d)在CELLxGENE Discover数据集中进行可扩展的差异表达分析。
结论
Memento提供了一种鲁棒、可扩展且高效的scRNA-seq数据差异表达分析方法,大大提高了对细胞基因表达变异性和调控网络的研究能力。通过将生物和技术变异整合到模型中,Memento为scRNA-seq研究中基于细胞级的推断设定了新的标准。
启示
Memento的开发对基因组学研究和应用具有重要意义。对于基础研究,Memento为理解细胞异质性、免疫反应和疾病进展提供了改进的工具。在临床研究中,Memento可用于发现生物标志物,通过识别在不同条件或患者群体中表达模式不同的基因来揭示疾病相关的生物学机制。
参考文献
Min Cheol Kim et al. Method of moments framework for differential expression analysis of single-cell RNA sequencing data. Cell. 2024