不太好的单细胞数据,如何确定其类群!

学术   健康   2024-10-01 09:15   上海  

往期推荐


单细胞03.一表一图,单细胞数据分析的套路

单细胞02.单细胞数据分析环境搭建!

单细胞01.单细胞时代,再简单的差异分析都值得重做一遍!

GEO数据库提供的单细胞数据大致分为三类,①原始数据:fastq格式的测序数据;②经过Cellranger标准化后的10X数据;③counts数据。

##使用VlnPlot画marker小提琴图VlnPlot(scobj, features = c("CD8B","CD3D"))    # CD8 T     VlnPlot(scobj, features = c("IL7R","CD3D"))    # CD4 TVlnPlot(scobj, features = c("MS4A1", "CD79A")) # B VlnPlot(scobj, features = c("PPBP", "PF4"))    # Platelet  VlnPlot(scobj, features = c("S100A9","CD14"))  # CD14+ Monocyte       VlnPlot(scobj, features = c("CDKN1C"))         # CD16+ Monocyte VlnPlot(scobj, features = c("CD74"))           # DC
FeaturePlot(scobj,pt.size = 0.75, reduction = "tsne", c("CD8A","IL7R","MS4A1","CD14","CDKN1C","CD1C"), order = TRUE,ncol=3)
从这张Featureplot的数据看,Marker基因的特异性很差,CD8A出现在CD4+ T 细胞;IL7R(CD4+ T 细胞的Marker基因)可以出现在CD8+ T 细胞;其他Marker基因也散在分布在几乎所有的细胞(尽管有特异性聚集的cluster)。这个单细胞测序数据的质量似乎没那么高。
##注释结果可视化DimPlot(scobj, reduction = "tsne", group.by ="celltype",         pt.size = 1,        label.size = 5,        label = T,        raster = F) +  NoLegend() +  RotatedAxis()
##subset和downsample 可以随机取每个群的细胞数DoHeatmap(subset(scobj, downsample = 500),           features = marker_genes,size = 3) +          theme(axis.text.y = element_text(size = 10))

在这种情况下,需要结合多个Marker基因综合分析,以确定细胞类群。

参考资料

  1. 单细胞数据下载和Seurat对象的构建(上)

  2. 单细胞数据下载和Seurat对象的构建(下)

  3. 读取不同格式的单细胞转录组数据及遇到问题的解决办法

芒果师兄
1.生信技能和基因编辑。2.论文发表和基金写作。3. 健康管理和医学科研资讯。4.幸福之路,读书,音乐和娱乐。
 最新文章