干货 | 单细胞转录组标准和个性化分析解析

学术   2024-12-16 11:29   湖北  

单细胞测序已在医学、动植物领域展现了重要应用价值。在医学领域,它能精准解析肿瘤细胞异质性,深入揭示癌症机制,为靶向治疗和个性化医疗提供依据,还推动了免疫相关疾病的研究与治疗。在动物研究中,该技术可追踪胚胎发育中的细胞分化轨迹,揭示复杂组织和器官的形成机制,并解析珍稀动物种群的遗传多样性,为保护策略提供支持。在植物领域,单细胞测序帮助研究植物细胞应对干旱、盐碱等环境胁迫的机制,追踪细胞分化路径,挖掘植物生长发育规律,为优良作物培育奠定基础。

单细胞转录组和Bulk转录组分析在研究细胞转录水平上有显著差异。如图所示,单细胞分析从单个细胞的起始材料中获取基因表达数据,能够解析每种类型或亚群细胞的独特表达模式,揭示成千上万个细胞间的异质性和精细的表达特征。而Bulk分析则从大量细胞的RNA起始材料中获取平均表达数据,展现整体的基因表达趋势,但由于不同细胞类型的表达差异被平均化,难以识别细胞间的异质性。因此,单细胞分析在探究细胞多样性和功能特异性方面具有显著优势,而Bulk分析更适用于宏观整体表达趋势的研究需求。

图1单细胞RNA-seq和bulk RNA-seq

目前,我们可提供三个单细胞平台进行单细胞RNA-seq,包括10xGenomics、寻因SeekOne® DD、华大DNBelab C-TaiM 4。这三个平台均采用液滴法,其流程涉及细胞悬液制备、液滴生成、细胞裂解与mRNA捕获、逆转录和扩增、文库构建和测序,以及后续的数据分析。油包水生成的示例图如下:

图2单细胞测序油包水生成示意图
拿到测序数据我们就可以进行后续分析了,接下来看一下我们分析的内容吧。

1

数据质控(以10x数据结果为例)。
单细胞测序完后,我们通常会拿到Web网页报告,主要关注以下指标:
·  Estimated Number of Cells :捕获细胞数
·  Median Genes per Cell:基因中位数
·  Fraction Reads in Cells:带有细胞相关barcodes且唯一比对到转录组的reads(百分比较低意味着细胞中濒死或死亡细胞RNA比例较高),主要范围>70%。
·  Median UMI per Cell:每个细胞相关barcodes的UMI计数中位值,与测序深度有关。
·  Median Gene per Cell:每个细胞相关barcode中检测到的基因中位数,与测序深度有关。
·  Mean Reads per Cell:常用来表示测序深度,有效reads(valid reads)的数量除以估计的细胞数(Estimated Number of Cells)。
·  Saturation:即测序饱和度,其大小和测序深度有关,也和文库复杂度有关,一般测90G之后>60%。

此外,Barcode Rank Plot需要有明显的拐点。

图3数据质控

2

Seurat数据过滤与质量评估
通过可视化细胞的基因数分布图,UMI数分布图,可以评估样品所有细胞及表达的基因情况,对于检测到基因数明显异常细胞可能是潜在的多重细胞(multiplets)。细胞基因数,UMI 数小提琴如下:

图4数据过滤

·  nFeature_RNA: 被检测到的基因数

·  nCount_RNA: 被测序到的转录本的数量

·  percent_mt: 被检测到的线粒体基因百分数,一般细胞有>5%线粒体基因表达的话,被认为是死细胞。

3

细胞聚类和分群

针对样本内的高质量单细胞和基因的UMI序列数,计算每个细胞的UMI总数,采用中位数标准化处理将每个细胞中的基因UMI数归一化到所有细胞UMI总数的中位数为基因表达量,计算每个基因的平均值和离差。采用PCA降维的方式来看细胞之间的相似性,样本距离越近表示细胞基因的表达趋势越接近。针对PCA结果中解释方差最大的前15个主成分,采用UMAP对单细胞群聚类进行可视化。

图5UMAP分群

4

细胞亚群注释

若研究物种为人和小鼠,将利用singleR软件,通过计算参考数据集中每个样本的单细胞表达量与待检测数据集的斯皮尔曼系数。筛选相关性高的数据,通过迭代算法,最终定义待检测细胞亚群类型。若研究物种植物(拟南芥,水稻,玉米,番茄,大豆,烟草),我们将参考PCMDB数据库(https://www.tobaccodb.org/pcmdb/homePage)做初步细胞注释,其余物种待进一步沟通确认。

图6细胞亚群自动注释

在自动注释的基础上,老师们可以根据样本情况检查和调整细胞类型的注释,比如可以通过查阅文献或者CellMarker/Plantmarker网站提供不同亚群对应的marker基因,反馈我们后台进行手动注释,以提高准确性

图7 Cell Marker数据库

5

不同细胞亚群差异分析

差异分析是基于细胞分群结果进行的,FindClusters函数实现该过程。通过比较每个cluster中的细胞,和剩下其他cluster所有细胞的基因表达情况,我们可以鉴定出每个cluster特有的marker基因。

图8 Marker基因展示

6

差异基因的GO和KEGG富集分析

基因本体(Gene Ontology,简称GO)是一个旨在标准化描述基因和基因产物属性的框架。GO提供了一套详细的术语(terms),用于描绘基因功能的概念或类别,以及这些概念之间的相互关系。GO数据主要分为三大类:细胞学组件(Cellular Component, CC)、分子功能(Molecular Function, MF)和生物学途径(Biological Process, BP)。

KEGG(Kyoto Encyclopedia of Genes and Genomes)是一个综合性的生物信息数据库,它提供了一个关于生物系统在细胞、生物体和生物圈层面的分子交互和反应网络的计算机模型。KEGG数据库的核心是KEGG通路图,这些通路图是手工绘制的,包含了代谢、遗传信息处理、环境信息处理、细胞过程、有机体系统、人类疾病和药物开发等方面的分子间相互作用和反应网络。针对差异基因采用clusterProfiler软件进行GO和KEGG功能分析。

图9 GO气泡图和KEGG富集网络图

7

拟时序分析(个性化分析)

在细胞发育过程中,它们会响应刺激并转变功能状态,表达不同的基因组以产生所需的蛋白质和代谢物。单细胞RNA测序技术能够揭示这些状态变化,无需物理分离细胞。Monocle是一个分析工具,它通过算法学习细胞在动态生物过程中的基因表达变化序列,而不是依赖于实验分离的离散细胞状态。Monocle能够确定每个细胞在发育轨迹中的位置,并通过差异分析识别受调节的基因。如果发育过程有多个结果,Monocle还能重建分支轨迹,帮助识别影响细胞决策的基因。伪时间是Monocle用来衡量细胞在分化过程中进展的方法,它解决了细胞异步性带来的问题。伪时间不是实际时间,而是一个抽象的进度单位,表示细胞在轨迹上的位置。通过伪时间,研究者可以更清晰地理解细胞状态转换时的基因调控变化。Monocle利用反向图嵌入技术,通过差异基因分析、降维和构建最小生成树,为单细胞数据构建拟时轨迹,以模拟细胞发育或分化过程。

如下左图这个二维散点图通过UMAP算法展示了单细胞转录组数据的降维结果。右图展示这个二维散点图每个点代表一个细胞,颜色编码显示特定基因的表达水平或伪时间,揭示细胞在分化过程中的状态转换和发育轨迹。

图10 拟时序分析

8


细胞通讯分析(个性化分析)

细胞通讯分析是一种关键的生物信息学和系统生物学方法,它专注于揭示细胞之间通过信号分子进行的信息交流和信号传递机制。这种分析不仅有助于识别细胞间的相互作用,而且对于理解这些相互作用在生理和病理状态下的作用至关重要。通过鉴定信号分子和受体,构建细胞通讯网络,研究者能够深入探索细胞通讯在免疫反应、组织修复、肿瘤发展等关键生物学过程中的功能。此外,细胞通讯分析还能够监测细胞通讯在细胞分化、发育和疾病进展中的动态变化,为发现新的治疗靶点和疾病治疗策略提供科学依据。

如下左边弦图(Chord Diagram),用于展示不同细胞类型或状态之间的通讯模式,以及它们在不同生物学过程中的参与程度。弦图通过连接不同扇区的弦来表示细胞间的相互作用。

右边桑基图(Sankey Diagram),用于展示细胞通讯中信号分子(ligands)、受体(receptors)和转录因子(TFs)之间的相互作用和流动关系。

图11 细胞通讯分析

9

精细亚群注释(个性化分析)

对于获得的细胞亚群,可以重新计算细胞簇,并观察不同类别在UMAP图上的分布情况,然后采用数据库的方式进行手动注释。下面是内皮细胞的细分群。

图11精细亚群注释

其他个性化分析如转录因子分析、CNV分析、细胞周期分析、WGCNA分析等,我们均可以提供,欢迎有需要的老师咨询

然后我们针对这些分析画了一下这个流程图,质控分析-基因表达矩阵-UMAP分群-亚群细胞注释-差异分析-个性化分析。老师们可以根据这个流程一步一步和我们完善您的单细胞分析结果,挖掘更多信息来解决您的科学问题。

以上就是单细胞的分析内容了,我们还可以通过结合其他组学,比如单细胞ATAC和空间转录组进行联合分析。后面会分享,敬请期待。
如果您计划开展单细胞的科研项目,欢迎联系我们~
项目咨询
   关于我们  
武汉爱基百客生物科技有限公司(简称爱基百客),位于武汉高农生物园,是一家专业提供表观组学科研服务、单细胞与空间组学测序分析和高通量测序分析的新型生物科技服务企业。公司先后引入ChIP、WGBS、ATAC-seq、DNBSEQ-T7、10x Genomics、SeekOne® DD、DNBelabC-TaiM4和Stereo-seq等实验平台,不断提升公司的科研服务能力。

运营至今合作的科研客户超2000家,涵盖国内知名科研院所、高校以及相关生物企业,科研成果曾多次在Science、Cancer Cell、Nature Communications、J HEMATOL ONCOL、Plant Cell 等国际高水平学术期刊发表,受到了客户广泛好评,是国内成长最迅速的高通量测序科研服务企业之一。

 了 解 更 多 
{ 往 期 精 彩 回 顾 }

 精选合集,欢迎收藏哟! 

点个「在看」 天天发SCI

爱基百客生物
爱基百客是一家专业提供表观组学、单细胞与空间组学以及高通量测序分析的新型生物科技服务企业,旗下拥有DNBSEQ-T7、10xGenomics等平台,依托表观技术的优势,为生命科学研究和医疗健康等领域提供方案设计到数据分析一站式服务。
 最新文章