scRNA｜ComplexHeatmap自定义单细胞转录组celltype-level 热图可视化

学术其他 2023-09-26 09:00 北京

前面介绍过单细胞常见图形的可视化scRNA复现|所见即所得，和Cell学umap，plot1cell完成惊艳的细胞注释umap图，scRNA分析 | 定制美化FeaturePlot 图，你需要的都在这，scRNA分析| 和SCI学定制化聚类点图（Dotplot ），含二行代码出图方式，scRNA分析| Seurat堆叠小提琴图不满足？那就ggplot2 堆叠各种元素，在 scRNA分析| DoHeatmap 美化，dittoSeq ，scillus 一行代码出图，你PICK谁中也介绍了多种方式绘制美化版的cell level热图，本次将从0开始介绍如何使用ComplexHeatmap绘制封面图所示的celltype层面热图注释：包含数据处理，各种celltype-level注释角度（细胞数，各种评分，细胞占比），构建注释信息以及最终的成图。

一载入R包，数据

使用之前注释过的sce.anno.RData数据，后台回复 anno 即可获取

library(ComplexHeatmap)library(circlize)library(tidyverse)library(Seurat)library(scater)
load("sce.anno.RData")head(sce2,2)
#计算marker 基因all_markers <- FindAllMarkers(object = sce2)marker_gene <- all_markers %>% group_by(cluster) %>% top_n(3, avg_log2FC)head(marker_gene)

二 ComplexHeatmap 可视化

1，构建Heatmap 主体

首先将Seurat转为SingleCellExperiment ，然后利用aggregateAcrossCells 函数获取各celltype的平均表达矩阵 ，通过subset.row函数指定待计算均值的基因。可以通过

A：colorRamp2 自定义基因表达量的颜色；

B：这里选择经典marker基因展示，也可以是Findmarker找到的marker gene等；

sce <- as.SingleCellExperiment(sce2)
col_exprs  <- colorRamp2(c(0,1,2,3,4),                         c("#440154FF","#3B518BFF","#20938CFF",                          "#6ACD5AFF","#FDE725FF"))# cell type markersmarker_sign <- c("CD3E", 'CD3D', 'EPCAM', 'CD4', 'CD8A','SPP1', 'CD19', 'COL1A1', 'IGLC1')
celltype_mean <- aggregateAcrossCells(as(sce, "SingleCellExperiment"),                                        ids = sce$celltype,                                       statistics = "mean",                                      use.assay.type = "counts",                                       subset.row = marker_sign                                      )celltype_mean@assays@data@listData$counts

注：该功能类似于Seurat的AverageExpression 函数，在之前的多个推文中scRNA分析|单细胞GSVA + limma差异分析-celltype分组？样本分组？使用过了。

2，基础热图绘制

h_type <- Heatmap(t(assay(celltype_mean, "counts")),                  column_title = "type_markers",                  col = col_exprs ,                  name= "mean exprS",                  show_row_names = TRUE,                   show_column_names = TRUE)h_type

3，添加"天马行空"注释

注意SingleCellExperiment中的colData(celltype_mean) 存储的为类似seurat的metadata信息，这里熟悉下SingleCellExperiment的用法。

1) 添加celltype_mean中的细胞个数

anno <- colData(celltype_mean) %>%   as.data.frame %>%   select(celltype,ncells)anno
#             celltype ncells#Epi               Epi   9152#Myeloid       Myeloid   1615#Fibroblast Fibroblast   2401#T                   T    543#Endo             Endo    138#un                 un    161

2）meta信息中其他信息

首先group到celltype维度，然后计算每种celltype的 AUCell 均值。

AUCell <- colData(sce) %>%   as.data.frame() %>%   select(celltype, AUCell) %>%   group_by(celltype) %>%   summarise(AUCell = mean(AUCell)) %>%   as.data.frame() %>%   column_to_rownames("celltype")AUCell#              AUCell#Epi        0.1264182#Myeloid    0.1067336#Fibroblast 0.1288063#T          0.1010705#Endo       0.1283561#un         0.1066168

3）计算每种celltype 有多少样本注释到

n_PID <- colData(sce) %>%   as.data.frame() %>%   select(celltype, sample) %>%   group_by(celltype) %>% table() %>%   as.data.frame() %>%   dplyr::filter(Freq>0) %>%   dplyr::group_by(celltype) %>%   dplyr::count(name = "sample") %>%   column_to_rownames("celltype")n_PID#           sample#Epi            16#Myeloid        15#Fibroblast     12#T              15#Endo           14#un             10

4）计算不同celltype的sample/group 占比

indication <- unclass(prop.table(table(sce$celltype,sce$sample), margin = 1))indication2 <- unclass(prop.table(table(sce$celltype,sce$group), margin = 1))

5）其他celltype的结果

这里以GSVA为例scRNA分析|单细胞GSVA + limma差异分析-celltype分组？样本分组？，其他可以转到celltype水平的结果均可以添加

library(msigdbr)library(GSVA)#选择基因集合human_KEGG = msigdbr(species = "Homo sapiens", #物种                     category = "C2",                     subcategory = "KEGG") %>%   dplyr::select(gs_name,gene_symbol)#这里可以选择gene symbol或者IDhuman_KEGG_Set = human_KEGG %>% split(x = .$gene_symbol, f = .$gs_name)#list
expr <- aggregateAcrossCells(as(sce, "SingleCellExperiment"),                                        ids = sce$celltype,                                       statistics = "mean",                                      use.assay.type = "counts")gsva.kegg <- gsva(expr@assays@data@listData$counts,                   gset.idx.list = human_KEGG_Set,                   kcdf="Gaussian",                  method = "gsva",                  parallel.sz=1)head(gsva.kegg)

4，构建注释信息

ComplexHeatmap可以自定义绝大多数的注释信息，信息非常多，这里简单介绍下热图，柱形图，点图，色块几种常见的注释方式，更多的相见官网About | ComplexHeatmap Complete Reference (jokergoo.github.io)

1) GSVA结果热图

除了主体的热图外，还可以拼接其他celltype形式的图，这是使用GSVA热图示例。通过col设置颜色，使之颜色贴近主体的基因表达热图

h_state <- Heatmap(t(gsva.kegg[1:10,]),                   column_title = "state_gsva",                   #col = colorRamp2(c(-3,0,3), c("green","white","red"))                   col = colorRampPalette(c("#440154FF", "#20938CFF", "#FDE725FF"))(10),                   name= "gsva ",                   show_row_names = TRUE,                   show_column_names = TRUE)
h_state

2）细胞类型注释

最常见的肯定是添加细胞类型的注释（分类变量），可以自定义颜色，尽量和umap图颜色一致

my36colors <-c('#53A85F', '#F1BB72', '#D6E7A3', '#57C3F3', '#476D87',               '#E95C59', '#E59CC4', '#AB3282', '#23452F', '#BD956A', '#8C549C', '#585658',               '#9FA3A8', '#5F3D69', '#C5DEBA', '#58A4C3', '#E4C755', '#F7F398',               '#AA9A59', '#E63863', '#E39A35', '#C1E6F3', '#6778AE', '#91D0BE', '#B53E2B',               '#712820', '#DCC1DD', '#CCE0F5', '#CCC9E6', '#625D9E', '#68A180', '#3A6963',               '#968175', '#E5D2DD', '#E0D4CA', '#F3B1A0')col.list <- list(celltype = c(Epi = "#53A85F",                               Myeloid = "#F1BB72",                               Fibroblast = "#D6E7A3",                              T = "#57C3F3",                              Endo = '#476D87',                              un = '#E95C59'                       ))
# Create HeatmapAnnotation objectsha_anno <- HeatmapAnnotation(celltype = anno$celltype,                             border = TRUE,                              gap = unit(1,"mm"),                             col = col.list,                             which = "row")

3) 其他信息注释

上述相关的统计变量均可以进行注释，通过width设置该部分注释图的宽度。

ha_meta <- HeatmapAnnotation(n_cells = anno_barplot(anno$ncells, width = unit(10, "mm")),                             n_PID = anno_barplot(n_PID, width = unit(10, "mm")),                             AUCell = anno_points(AUCell, width = unit(10, "mm")),                             indication = anno_barplot(indication,width = unit(20, "mm"),                                                       gp = gpar(fill = my36colors)),                             indication2 = anno_barplot(indication2,width = unit(10, "mm"),                                                       gp = gpar(fill = my36colors)),                             border = TRUE,                              annotation_name_rot = 90,                             gap = unit(1,"mm"),                             which = "row")

5，绘制复杂热图

将前面各部分的注释通过+号连接即可；通过legend添加图例信息

# Create HeatmapList objecth_list <- h_type +  h_state +  ha_anno +  ha_meta# Add customized legend for anno_barplot()lgd <- Legend(title = "celltype_sample",               at = colnames(indication),               legend_gp = gpar(fill = my36colors))lgd2 <- Legend(title = "celltype_group",                at = colnames(indication2),                legend_gp = gpar(fill = my36colors))# Plotdraw(h_list,annotation_legend_list = list(lgd,lgd2))

OK，最终得到如上所示的图，其他celltype level的注释均可以添加上去。

参考资料：

About | ComplexHeatmap Complete Reference (jokergoo.github.io)

◆ ◆ ◆ ◆ ◆

精心整理（含图PLUS版）|R语言生信分析，可视化（R统计，ggplot2绘图，生信图形可视化汇总）

RNAseq纯生信挖掘思路分享？不，主要是送你代码！（建议收藏）

http://mp.weixin.qq.com/s?__biz=MzIyNDI1MzgzOQ==&mid=2650401213&idx=1&sn=433f488396f4fef8de31611a6063be1f

生信补给站

生信，R语言， Python，数据处理、统计检验、模型构建、数据可视化，我输出您输入！

最新文章

只要捞偏门，篇篇都是生信顶刊！

scRNA复现|所见即所得，和Cell学umap，plot1cell完成惊艳的细胞注释umap图

scRNA | scTCR中 T细胞动态变化（Startrac）vs scRNA指数评分

scTCR+scRNA | APackOfTheClones - umap坐标下球形展示celltype的clone size

单细胞免疫组库VDJ|和Nature学STARTRAC，定量T细胞动态变化

单细胞免疫组库VDJ| 从零开始scRepertoire分析，解决真实场景中可能的问题

单细胞免疫组库VDJ|从数据下载开始完成cellranger vdj分析（1）

RNAseq|批量操作，构建预后模型，还需要那些图，通过数据预处理提高模型准确性！

单细胞数据挖掘进阶分析之亚群细分

scRNA | CSOmap-R版利用单细胞转录组预测细胞类型的空间通讯

RNAseq｜Mime代码版-终极101 种机器学习算法组合构建最优预后模型

scRNA | scTCR中 T细胞动态变化（Startrac）vs scRNA指数评分

scRNA|单细胞测序技术迎来新的机遇和挑战，国内顶尖课题组斩获殊荣！

scRNA | 和顶刊学分析，OR值展示不同分组的细胞类型差异

scRNA|R版CytoTRACE v2从0开始完成单细胞分化潜能预测

scRNA|使用scMetabolism完成单细胞代谢激活分数估计

RNAseq | ComplexHeatmap绘制临床数据热图（所见即所得）

scTCR+scRNA | APackOfTheClones - umap坐标下球形展示celltype的clone size

RNAseq-ML | SuperPC 算法构建预后模型并预测

纯生信！公共数据库，轻松解锁SCI文章，简简单单小白可上手!

Seurat_V5|单细胞转录组 + 蛋白，WNN方法分析单细胞多模态数据

高效论文写作技巧大揭秘！ChatGPT/GPT4科研实践与论文写作，掌握最新AI大模型应用！

scRNA分析| gghalves绘制单细胞数据的豆荚图/对半小提琴图

Seurat V5|当单细胞进入百万细胞时代，BPCell 给出一种“解”决参考

资源贴|送你singleR的7个内置注释数据集

Seurat V5|一个函数就能解决多种去批次方法，按需尝试

RNAseq-ML|CoxBoost生存分析完成预后模型变量筛选以及预测

RNAseq-ML|弹性网络回归算法Enet（Elastic Net）完成预后模型变量筛选-模型库+2

重磅！速发SCI，机器学习助力生信研究，再创新高！

RNAseq-ML|randomForestSRC完成随机森林生存分析-预后模型库+1

空转 | CellChat-V2，揭秘空间转录组数据的细胞通讯分析

迸发！Nature | 生信研究" 究极 " 套路，为该领域打开新的突破口！

经典综述，当肿瘤学遇到免疫学（更新版）

Nature重磅！最新研究成果公布，生信研究领域再度掀起一阵热潮！

scRNA｜ComplexHeatmap自定义单细胞转录组celltype-level 热图可视化

观众预报名破“千”，百余家参会单位阵容强大，2023广州多组学与科研技术大会再次掀起行业浪潮（附大会最新议程）

20小时快速通关R语言个性化制图

RNAseq | IPS评分-TCIA数据库了解一下，非TCGA数据用IOBR评估

零代码，不会R，科研小白如何4个月完成SCI？

RNAseq｜oncoPredict 药物反应预测，+基因，+分型，+模型的联合可视化

空转|CARD2-可基于基因集合进行spot注释，还可以提升到单细胞水平？

手把手，一步一步教你完成第1篇SCI

空转|CARD-结合scRNA解决空间转录组spot注释，还能增强空间精度？！

学术会议，大咖云集！2023多组学与科研技术大会，100+行业知名学术专家、100+企业单位、1500+高校学生出席

空转 | 我，SPOTlight，用解卷积，解决空间转录组spot注释！

scRNA分析| Seurat堆叠小提琴图不满足？那就ggplot2 堆叠各种元素

scRNA分析| DoHeatmap 美化，dittoSeq ，scillus 一行代码出图，你PICK谁？

scRNA分析| 和SCI学定制化聚类点图（Dotplot ），含二行代码出图方式

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉