5种方式美化你的单细胞umap散点图

学术 2025-01-11 15:46 广东

我们生信技能树的单细胞月更群里面经常看到小伙伴提出的图片美化需求，这就来看看单细胞umap美化工具吧！

第一种：SCP 包（这个包非常的出色）

关于SCP，我们前面也有一个专门的专辑对其进行了大篇幅的介绍，不知道大家用起来了没呢？

其学习的官网地址为：https://zhanghao-njmu.github.io/SCP/index.html

没有安装的，这次就不要再错过啦：

# 安装
devtools::install_github("zhanghao-njmu/SCP")

本次，我们使用的数据为来自 GSE128531 数据注释后的seurat对象，你自己用的时候可以使用任何一个经过了注释后的seurat对象。

rm(list=ls())
library(COSG)
library(harmony)
library(ggsci)
library(dplyr) 
library(future)
library(Seurat)
library(clustree)
library(cowplot)
library(data.table)
library(dplyr)
library(ggplot2)
library(patchwork)
library(stringr)
library(qs)

# 导入数据
sce.all.int <- readRDS('2-harmony/sce.all_int.rds')
sp <- 'human'
head(sce.all.int@meta.data)
load("phe.Rdata")
head(phe)
sce.all.int <- AddMetaData(sce.all.int, metadata = phe)

Idents(sce.all.int) <- "celltype"
table(Idents(sce.all.int))

看一下它对UMAP可视化的厉害之处！

1、先看默认主题一键出图：

################## umap1
library(SCP)
head(sce.all.int@meta.data)
CellDimPlot(sce.all.int, group.by = "celltype", reduction = "UMAP")

这个配色非常CNS，且图中展示了总细胞数，每个亚群的细胞数这些信息：

2、坐标改成左下小箭头，也是大家非常常见的需求！

# 左下小箭头
CellDimPlot(sce.all.int, group.by = "celltype", reduction = "UMAP", theme_use = "theme_blank")

3、只显示X、Y轴

还可以一键调整整体字体大小：

CellDimPlot(sce.all.int, group.by = "celltype", reduction = "UMAP", 
            theme_use = ggplot2::theme_classic, theme_args = list(base_size = 16))

上面三个是我最喜欢的ump风格，还有很多其他，总有你的一款：

第二种：Nebulosa（r包）

Nebulosa 是一个基于核密度估计可视化单细胞数据的 R 包，主要通过结合细胞之间的相似性来恢复丢失特征中的信号，从而实现细胞特征的“卷积”。

学习官网：https://bioconductor.org/packages/devel/bioc/vignettes/Nebulosa/inst/doc/nebulosa_seurat.html

Nebulosa 的主要功能是 plot_density，让我们按照以下方式绘制一些marker基因的核密度估计图，展示的marker基因表达水平高低：

# 安装一下
options(BioC_mirror="https://mirrors.westlake.edu.cn/bioconductor")
options("repos"=c(CRAN="https://mirrors.westlake.edu.cn/CRAN/"))
BiocManager::install("Nebulosa")
library(Nebulosa)

1、绘制一个基因PTPRC

这种图也是在很多CNS级别的文章中出现的：

# 绘制一个基因PTPRC
p1 <- plot_density(sce.all.int, c("PTPRC"),size = 0.3)
p1

2、绘制多个基因

# 同时绘制多个基因
p3 <- plot_density(sce.all.int, c("CD3D","CD4","CD8A","CD68"),size = 0.3)
p3

结果如下：

3、绘制基因共表达

这里可以同时展示两个基因都表达的地方：

# combine = FALSE 只保留两个基因都表达的区域
p4 <- plot_density(sce.all.int, c("CD8A", "CCR7"), joint = TRUE,combine = FALSE) 
p4

第三种：scCustomize（r包）

学习官网：https://samuel-marsh.github.io/scCustomize/index.html

# 安装
# Base R
install.packages("scCustomize")

绘图：可以绘制一个marker，也可以展示多个marker：

################## umap4：scCustomize
library(viridis)
library(Seurat)
library(scCustomize)

FeaturePlot_scCustom(seurat_object = sce.all.int, features = c("VWF","CD3E"), order = F)

这种风格很像早期的椒盐绘图风格：你看这个着色点是不是很像洒在鸡腿上面的椒盐！（椒盐风格这个词我在一篇单细胞文献中遇到过，现在找不见了，当时还专门在群里问了来着哈哈哈哈）

还可以轻松地修改配色：

# 修改颜色
# Set color palette
pal <- viridis(n = 10, option = "D")
FeaturePlot_scCustom(seurat_object = sce.all.int, features = c("VWF","CD3E"), 
                     colors_use = pal, order = T,pt.size = 0.3)

第四种：ggplot2绘制细胞密度umap图

在seurat包中有人提出一个绘图需求：https://github.com/satijalab/seurat/issues/6962

这种图主要用来处理数据点重叠问题时非常有用，使用 MASS::kde2d() 进行二维核密度估计，并通过等高线显示结果，geom_density_2d() 绘制等高线，而 geom_density_2d_filled() 绘制填充的等高线带。

链接：https://ggplot2.tidyverse.org/reference/geom_density_2d.html

library(cetcolor)
library(Seurat)
library(ggplot2)

# 设置颜色
scale.col <- cet_pal(16, name = "fire")

# generate UMAP plot
pl1 <- UMAPPlot(sce.all.int, combine = FALSE) # returns full ggplot object
pl1

# make plot
pl1[[1]] & 
  stat_density_2d(aes_string(x = "umap_1", y = "umap_2", fill = "after_stat(level)"), 
                  linewidth = 0.2, geom = "density_2d_filled", 
                  colour = "ivory", alpha = 0.4, n = 150, h = c(1.2, 1.2)) & 
  scale_fill_gradientn(colours = scale.col) & 
  DarkTheme()

这种风格很独特：

第五种：ggpointdensity（r包）

在二维坐标系中可视化数据点有几种方法：如果你有大量的数据点重叠在一起，geom_point() 无法为你提供重叠点的数量估计。

刚刚上面介绍的geom_density2d() 和 geom_bin2d() 可以解决这个问题，但它们使得无法调查个别异常点，而这些异常点可能具有研究价值。

geom_pointdensity() 旨在通过结合两者的优点来解决这个问题：各个点根据邻近点的数量进行着色。这使得你既能看到整体分布，也能看到个别点。

学习官网：https://github.com/LKremer/ggpointdensity

细胞密度图：

# 安装
install.packages("ggpointdensity")
library(ggpointdensity)

# 提取umap坐标数据
dat <- Embeddings(sce.all.int, reduction = "umap")
head(dat)
# umap_1    umap_2
# SC67mf2_AAACCTGAGAGTAATC -3.541568  5.127461
# SC67mf2_AAACCTGAGCGCTTAT -6.623588 -3.025122
# SC67mf2_AAACCTGAGGACACCA -4.586405  1.513219

ggplot(data = dat, mapping = aes(x = umap_1, y = umap_2)) +
  geom_pointdensity() +
  scale_color_viridis()

当然，它还可以展示marker特征基因表达：

# 提取umap坐标以及特征基因表达
df <- FetchData(object =sce.all.int, vars = c("umap_1", "umap_2", "CD3D"), layer = "data")
head(df)

# umap_1    umap_2     CD3D
# SC67mf2_AAACCTGAGAGTAATC -3.541568  5.127461 0.000000
# SC67mf2_AAACCTGAGCGCTTAT -6.623588 -3.025122 1.430228
# SC67mf2_AAACCTGAGGACACCA -4.586405  1.513219 0.000000

p <- ggplot(df, aes(x= umap_1, y= umap_2 )) +
  geom_point(data = df %>% filter(CD3D == 0), color = "#440154FF", size = 0.6) +
  ggpointdensity::geom_pointdensity(data = df %>% filter(CD3D > 0), size = 0.6) +
  viridis::scale_color_viridis() +
  theme_classic(base_size = 14) +
  labs(color= "CD3D")
p

结果如下：

上面哪一款是你的菜？可以在评论区大声说出来（爱就要勇敢说出来！）。

友情宣传：

生信入门&数据挖掘线上直播课2025年1月班

时隔5年，我们的生信技能树VIP学徒继续招生啦

满足你生信分析计算需求的低价解决方案

生信技能树

生物信息学学习资料分析，常见数据格式及公共数据库资料分享。常见分析软件及流程，基因检测及癌症相关动态。

最新文章

miRNA体外诊断试剂盒可靠吗？

转录噪声对RNA-Seq实验中基因和转录本表达量估计的影响

物种Beta多样性PCoA分析

Benchmarking：新鲜出炉的单细胞自动化癌细胞注释

nature communications 杂志同款三元图：Ternary plots

ggplot2（r包）绘制基因棒棒糖图

画出像烟花一样的单细胞umap图，原因竟然是？

G3viz（r包）绘制基因棒棒糖图

Omni-ATAC：更新和优化的ATAC-seq协议（NatProtoc）

GenVisR（r包）介绍：基因组可视化工具

生信技能树2025年展望

春节期间单细胞转录组数据分析全免费

再牛叉的技术也无法解决你网络问题（但是政策可以啊）

Python应该要会一点吧

绘制NC杂志同款高颜值小提琴图

maftools（r包）绘制棒棒图等

IF10+杂志文章只用统计学显著的差异基因做GSEA就合理吗？

trackview（r包）包绘制基因棒棒图

公众号已经接入人工智能大模型啦！

如何使用 uniprot ID 进行 KEGG 和 GO 富集？

如何对应两个不同单细胞数据集的分群结果？

python单细胞学习笔记-day6

综述：ATAC-Seq 数据分析工具大全

北京大学—统计基因组与遗传流行病学、功能与单细胞多组/AI方向诚聘博士后

python版本的功能富集分析：GSEApy

在这里看有哪些配色，2500+种！一键复制超方便

给你的单细胞umap图加个cell杂志同款的圈

python单细胞学习笔记-day5

喜大普奔，从此就没有了四青人才！

掌握Python，解锁单细胞数据的无限可能

python单细胞学习笔记-day4（续）

这种作者只提供了每组多个重复样本合并后数据的怎么办

年度总结 | 2024年Nature Communications计算生物学方法论文精选

高颜值复杂热图绘制小技巧

housekeeper基因在肿瘤与正常样本中会发生显著差异表达吗？

65款单细胞亚群注释工具你用过几款？

一种很新的功能富集结果展示方法

100篇！华大时空组学Stereo-seq助力生命科学成果大爆发

单个基因在单细胞里面如何分析呢？

三种方式下载GEO芯片注释文件GPL

单基因绘制组间差异箱线图及ROC曲线

线粒体基因缺失之谜

python单细胞学习笔记-day4

顶刊 Science 文献两分组差异结果比较图复现

KEGG富集结果7大分类展示

5种方式美化你的单细胞umap散点图

python单细胞学习笔记-day3

顶刊Cell中这幅mRNA和蛋白质表达相关性图的生物学意义是什么？

python单细胞学习笔记-day1

python单细胞学习笔记-day2

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉

5种方式美化你的单细胞umap散点图

第一种：SCP 包（这个包非常的出色）

1、先看默认主题一键出图：

2、坐标改成 左下小箭头，也是大家非常常见的需求！

3、只显示X、Y轴

第二种：Nebulosa（r包）

1、 绘制一个基因PTPRC

2、绘制多个基因

3、绘制基因共表达

第三种：scCustomize（r包）

第四种：ggplot2绘制细胞密度umap图

第五种：ggpointdensity（r包）

2、坐标改成左下小箭头，也是大家非常常见的需求！

1、绘制一个基因PTPRC