scRNA|使用scMetabolism完成单细胞代谢激活分数估计

学术其他 2024-04-23 20:58 北京

之前介绍过 scRNA分析|使用AddModuleScore 和 AUcell进行基因集打分，然后可视化目标基因集合的打分，这里介绍scMetabolism包-整合了多个可以完成细胞代谢相关通路评估方法的R包。

一载入R包，数据

首先根据官网GitHub - wu-yc/scMetabolism: Quantifying metabolism activity at the single-cell resolution的介绍安装相关的R包，需要注意的是VISION要安装v2.1.0版本。

然后使用之前注释过的sce.anno.RData数据，为节省资源，每种细胞类型随机抽取30%的数据。

install.packages(c("devtools", "data.table", "wesanderson", "Seurat", "devtools",                    "AUCell", "GSEABase", "GSVA", "ggplot2","rsvd"))#Please note that the version would be v2.1.0devtools::install_github("YosefLab/VISION@v2.1.0") devtools::install_github("wu-yc/scMetabolism")# 加载R包library(scMetabolism)library(tidyverse)library(rsvd)library(Seurat)library(pheatmap)library(ComplexHeatmap)library(ggsci)# 加载数据load("sce.anno.RData")sce2@meta.data$CB <- rownames(sce2@meta.data)# 按照细胞类型抽取一定比例的数据sample_CB <- sce2@meta.data %>%   group_by(celltype) %>%   sample_frac(0.3)# 提取数据sce3 <- subset(sce2,CB %in% sample_CB$CB) head(sce3，2)

二计算代谢得分

该包比较简单，主函数可以选择sc.metabolism.Seurat 输入Seurat的单细胞对象（推荐），也可以选择 sc.metabolism 输入矩阵（作者不太建议）。

Idents(sce3) <- "celltype"countexp.Seurat <- sc.metabolism.Seurat(obj = sce3,  #Seuratde单细胞object                                      method = "AUCell",                                       imputation = F,                                       ncores = 2,                                       metabolism.type = "KEGG")

其中obj是一个包含 UMI 计数矩阵的 Seurat 对象，记得指定Idents 。

method支持VISION、AUCell、ssgsea和gsva四种，默认的是VISION 方法。

metabolism.type支持KEGG和REACTOME，分别对应不同的代谢相关通路。

1，查看函数

可以用过View(sc.metabolism.Seurat) 查看函数的主体，结构还是比较清楚的，（1）预设了KEGG和REACTOME中代谢相关通路，（2）根据VISION、AUCell、ssgsea和gsva 四种常见方法计算代谢通路相关的得分。

注：gmt可以改为你课题需要的通路，然后放到signatures_KEGG_metab输出的路径下。

也可以如 scRNA分析|使用AddModuleScore 和 AUcell进行基因集打分使用相关方法的函数直接计算。

signatures_KEGG_metab <- system.file("data", "KEGG_metabolism_nc.gmt",                                       package = "scMetabolism")signatures_KEGG_metab#[1] "C:/Users/XXX/AppData/Local/R/win-library/4.3/scMetabolism/data/KEGG_metabolism_nc.gmt"

2，提取结果-添加至meta信息

代谢评分的结果存放在新的assays -- METABOLISM中，可以通过如下方式得到每个基因的代谢通路的活性分数。

如截图所示细胞barcode的"-1"变为了".1"，通过str_replace_all简单处理后添加至meta中，以备后面可能的相关分析。

#提取score结果score <- countexp.Seurat@assays$METABOLISM$scorescore[1:4,1:4]#将score中barcode的点转为下划线score_change <- score %>%   select_all(~str_replace_all(., "\\.", "-"))  #基因ID不规范会报错,下划线替换-#确定细胞barcode椅子identical(colnames(score_change) , rownames(countexp.Seurat@meta.data))#[1] TRUEcountexp.Seurat@meta.data <- cbind(countexp.Seurat@meta.data,t(score_change) )
#可以直接使用Seurat的相关函数p1 <- FeaturePlot(countexp.Seurat,features = "Glycolysis / Gluconeogenesis")p2 <- VlnPlot(countexp.Seurat,features = "Glycolysis / Gluconeogenesis")p1 + p2

三可视化

可以使用scMetabolism自带的函数完成一些可视化展示。

1，umap展示某条通路的代谢得分

DimPlot.metabolism(obj = countexp.Seurat,                    pathway = "Glycolysis / Gluconeogenesis",                    dimention.reduction.type = "umap",                    dimention.reduction.run = F, size = 1)

2，指定通路-细胞类型点图

可以选择直接指定目标通路或者展示前几个，注意将phenotype 参数改为需要展示的列。

#直接指定input.pathway<-c("Glycolysis / Gluconeogenesis",                  "Oxidative phosphorylation",                  "Citrate cycle (TCA cycle)")#展示前10个input.pathway <- rownames(countexp.Seurat@assays$METABOLISM$score)[1:10]
DotPlot.metabolism(obj = countexp.Seurat,                    pathway = input.pathway,                    phenotype = "celltype",  #更改phenotype 参数                   norm = "y")

3，指定通路-箱线图

可以使用ggsci 包修改一下颜色

BoxPlot.metabolism(obj = countexp.Seurat,                    pathway = input.pathway[1:4],                    phenotype = "celltype",                    ncol = 2) +  scale_fill_nejm()

4，自定义热图

首先计算每种细胞类型的相关代谢通路得分的均值，然后可以使用pheatmap 直接绘制热图，或者参照scRNA｜ComplexHeatmap自定义单细胞转录组celltype-level 热图可视化绘制复杂热图

#可以计算celltype均值，然后绘制df <- countexp.Seurat@meta.data#19列开始是代谢通路的得分，按照celltype计算均值avg_df = aggregate(df[,19:ncol(df)],                   list(df$celltype),                   mean)#热图需要转为矩阵avg_df <- avg_df %>%   select(1:20) %>% #展示前20个  column_to_rownames("Group.1") avg_df[1:4,1:4]

也可以手动选择想展示的代谢通路。

（1）直接pheatmap绘制

pheatmap(t(avg_df),          show_colnames = T,         scale='row',          cluster_rows = T,         color=colorRampPalette(c('#1A5592','white',"#B83D3D"))(100),         cluster_cols = T)

（2）组合复杂热图

作为复杂热图的一个组件。为使图形更好看，我们先手动对数据进行标准化。

exp <- apply(avg_df, 2, scale)rownames(exp) <- rownames(avg_df)# 组件h_state <- Heatmap(t(exp),                   column_title = "state_gsva",                   col = colorRampPalette(c('#1A5592','white',"#B83D3D"))(100),                   name= "gsva ",                   show_row_names = TRUE,                   show_column_names = TRUE)
h_state

然后可以scRNA｜ComplexHeatmap自定义单细胞转录组celltype-level 热图可视化添加更多的信息组合绘制下面的图。

参考资料：

GitHub - wu-yc/scMetabolism: Quantifying metabolism activity at the single-cell resolution

◆ ◆ ◆ ◆ ◆

精心整理（含图PLUS版）|R语言生信分析，可视化（R统计，ggplot2绘图，生信图形可视化汇总）

RNAseq纯生信挖掘思路分享？不，主要是送你代码！（建议收藏）

觉得对您有点帮助的希望可以点赞，在看，转发！

http://mp.weixin.qq.com/s?__biz=MzIyNDI1MzgzOQ==&mid=2650402116&idx=1&sn=09f64e171bb53a4fd45d6e964c5c20d1

生信补给站

生信，R语言， Python，数据处理、统计检验、模型构建、数据可视化，我输出您输入！

最新文章

只要捞偏门，篇篇都是生信顶刊！

scRNA复现|所见即所得，和Cell学umap，plot1cell完成惊艳的细胞注释umap图

scRNA | scTCR中 T细胞动态变化（Startrac）vs scRNA指数评分

scTCR+scRNA | APackOfTheClones - umap坐标下球形展示celltype的clone size

单细胞免疫组库VDJ|和Nature学STARTRAC，定量T细胞动态变化

单细胞免疫组库VDJ| 从零开始scRepertoire分析，解决真实场景中可能的问题

单细胞免疫组库VDJ|从数据下载开始完成cellranger vdj分析（1）

RNAseq|批量操作，构建预后模型，还需要那些图，通过数据预处理提高模型准确性！

单细胞数据挖掘进阶分析之亚群细分

scRNA | CSOmap-R版利用单细胞转录组预测细胞类型的空间通讯

RNAseq｜Mime代码版-终极101 种机器学习算法组合构建最优预后模型

scRNA | scTCR中 T细胞动态变化（Startrac）vs scRNA指数评分

scRNA|单细胞测序技术迎来新的机遇和挑战，国内顶尖课题组斩获殊荣！

scRNA | 和顶刊学分析，OR值展示不同分组的细胞类型差异

scRNA|R版CytoTRACE v2从0开始完成单细胞分化潜能预测

scRNA|使用scMetabolism完成单细胞代谢激活分数估计

RNAseq | ComplexHeatmap绘制临床数据热图（所见即所得）

scTCR+scRNA | APackOfTheClones - umap坐标下球形展示celltype的clone size

RNAseq-ML | SuperPC 算法构建预后模型并预测

纯生信！公共数据库，轻松解锁SCI文章，简简单单小白可上手!

Seurat_V5|单细胞转录组 + 蛋白，WNN方法分析单细胞多模态数据

高效论文写作技巧大揭秘！ChatGPT/GPT4科研实践与论文写作，掌握最新AI大模型应用！

scRNA分析| gghalves绘制单细胞数据的豆荚图/对半小提琴图

Seurat V5|当单细胞进入百万细胞时代，BPCell 给出一种“解”决参考

资源贴|送你singleR的7个内置注释数据集

Seurat V5|一个函数就能解决多种去批次方法，按需尝试

RNAseq-ML|CoxBoost生存分析完成预后模型变量筛选以及预测

RNAseq-ML|弹性网络回归算法Enet（Elastic Net）完成预后模型变量筛选-模型库+2

重磅！速发SCI，机器学习助力生信研究，再创新高！

RNAseq-ML|randomForestSRC完成随机森林生存分析-预后模型库+1

空转 | CellChat-V2，揭秘空间转录组数据的细胞通讯分析

迸发！Nature | 生信研究" 究极 " 套路，为该领域打开新的突破口！

经典综述，当肿瘤学遇到免疫学（更新版）

Nature重磅！最新研究成果公布，生信研究领域再度掀起一阵热潮！

scRNA｜ComplexHeatmap自定义单细胞转录组celltype-level 热图可视化

观众预报名破“千”，百余家参会单位阵容强大，2023广州多组学与科研技术大会再次掀起行业浪潮（附大会最新议程）

20小时快速通关R语言个性化制图

RNAseq | IPS评分-TCIA数据库了解一下，非TCGA数据用IOBR评估

零代码，不会R，科研小白如何4个月完成SCI？

RNAseq｜oncoPredict 药物反应预测，+基因，+分型，+模型的联合可视化

空转|CARD2-可基于基因集合进行spot注释，还可以提升到单细胞水平？

手把手，一步一步教你完成第1篇SCI

空转|CARD-结合scRNA解决空间转录组spot注释，还能增强空间精度？！

学术会议，大咖云集！2023多组学与科研技术大会，100+行业知名学术专家、100+企业单位、1500+高校学生出席

空转 | 我，SPOTlight，用解卷积，解决空间转录组spot注释！

scRNA分析| Seurat堆叠小提琴图不满足？那就ggplot2 堆叠各种元素

scRNA分析| DoHeatmap 美化，dittoSeq ，scillus 一行代码出图，你PICK谁？

scRNA分析| 和SCI学定制化聚类点图（Dotplot ），含二行代码出图方式

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉