来自Nature Reviews Cardiology的综述《Single-cell transcriptomics for the assessment of cardiac disease》描述了用于心脏疾病研究的单细胞转录组学的方法。
心脏样本包含比较丰富的细胞类型,其中的心肌细胞,神经元等细胞需通过抽核(Nucleus isolation)获得转录信息,同时进行单细胞解离(Cell isolation)实验。抽核实验往往带来很多的细胞碎片,在核数量足够的情况下,最好可以过流式去除细胞碎片(详见:单核转录组测序,这个步骤必须得有 | 流式专题 超链接)。
由于抽核和解离方法在转录本的获取上存在一定的偏差,会导致技术原因的批次效应,所以在数据分析中,需要通过批次效应去除的方法减少不同实验方法带来的差异,得到相同细胞类型较好的聚集。在此基础上可以进行后续的一系列分析:比例统计,差异分析,细胞通讯等。集成化的数据分析方法主要有基于R的Seurat和基于python的Scanpy。
这篇综述中提到的人类心脏图谱《Cells of the adult human heart》,是我们比较熟悉的一篇经典文献。
为了获得全面的细胞类型,这项工作同时使用了scRNA-seq(total 及CD45+富集)和snRNA-seq。CD45+富集是为了增加最终获得的免疫细胞的数量。
在经过数据合并后,获得了比较好的细胞类型拟合,未出现不同实验方法带来的批次效应。
这篇文章的分析主要借助Scanpy完成,具体到数据合并,主要有三个步骤:(1)对每批数据分别进行分析和注释,寻找每个cluster的显著高表达基因。(2)参考显著高表达基因对cluster进行注释。(3)将所有的数据集合并成一个AnnData,并使用ScGEN做去批次处理,使用SCCAF做细胞聚类的评估。
来自江西农大黄路生院士组的这项工作中《Single-cell dynamics of liver development in postnatal pigs》,对不同时期成年猪的肝脏进行了单细胞(scRNA-seq)及单细胞核测序(snRNA-seq),以获取肝脏发育过程中各不同细胞的动态信息。
作者对scRNA-seq和snRNA-seq数据进行合并的主要步骤:(1)对scRNA-seq和snRNA-seq数据分别进行合并,并对合并的数据分别用harmony进行批次矫正。(2)对scRNA-seq,snRNA-seq数据分别划分cluster,绘制umap图。(3) 使用scanpy中的sc.tl.rank_genes_groups函数寻找每个cluster的标记基因,通过标记基因对每个cluster进行注释,并去除生物学上不合理的cluster。(4)使用scDIOR软件将scRNA-seq,snRNA-seq的数据集合并(merge),并转化为Seurat object格式。(5)使用Seurat v4的IntegrateData功能将scRNA-seq,snRNA-seq的数据集整合(integrate)成一个数据集。保留了每个方法产出数据的原始细胞注释。
由华大生命科学研究院Lars研究所罗永伦教授等完成的《Endothelial cell heterogeneity and microglia regulons revealed by a pig cell landscape at single-cell level》绘制了家猪20个器官/组织的单细胞图谱。
实验中同时使用了单细胞(Sinlgle-cell)和单细胞核(Single-nucleus)的实验方法。
具体到数据集整合的方法:来自10X平台的scRNA-seq数据和来自华大DNBelab C4平台的snRNA-seq,使用Seurat V3进行整合。(1)使用SCTransform函数对数据进行归一化,之后使用ScaleData函数进行缩放。(2)使用FindIntegrationAnchors函数找到整合的锚点(Anchors),使用SelectIntegrationFeatures函数选择前3000个高可变的特征,使用IntegrateData函数完成数据整合。(3)整合后,进行单细胞分析的常规流程,即PCA降维(RunPCA),umap/tsne绘图(RunUMAP/RunTSNE);同时,使用FindNeighbors和FindClusters功能进行无监督聚类和cluster划分。
对于单细胞实验而言,通过解离和抽核等不同方法来获取不同细胞中的基因表达信息已经是比较成熟的技术手段,在必要的时候我们也可以在同一研究课题中集成应用两种不同的技术手段来实现自己的研究目的。对于跨实验批次、平台或条件的数据整合,通常是单细胞测序数据分析工作流程中的重要一步,现在已经有不同的技术手段可以实现snRNA-seq和scRNA-seq的数据整合,整合分析可以帮助匹配数据集之间的共享细胞类型和状态,以直观统计和展示,也有助于跨数据集进行准确的比较分析。单细胞和单细胞核的数据整合中常见的数据整合形式,一般先对scRNA-seq和snRNA-seq的数据分别进行降维聚类和鉴定,之后以Seurat的Integrate方法进行整合。目前Seurat已经升级到V5版本,提供了包括基于锚点(Anchors)的CCA/RPCA,harmony,MNN,scVI等5种整合方法,使用简便,数行代码即可完成,整合效果也非常好,具体可参考Seurat提供的参考文档(https://satijalab.org/seurat/articles/seurat5_integration),也可以根据研究方案的设计,合理选用其他数据处理和合并方法。
首篇植物单细胞图谱文章解析 | Plant Physiology:植物根尖单细胞图谱
Plant Cell | 植物单细胞(核)转录组学的执行、分析和数据存储的最佳策略
用户文章|Olink+单细胞多组学助力揭示肥大细胞在胆管癌-胆汁相互作用模式中的功能
本文系联川生物公众号原创文章,未经授权禁止转载,侵权必究! 扫描下方二维码 点分享
点点赞
点在看