scRNA|R版CytoTRACE v2从0开始完成单细胞分化潜能预测

学术其他 2024-04-25 23:15 北京

CytoTRACE v2 在2024.03月发表在预印本Mapping single-cell developmental potential in health and disease with interpretable deep learning。V2 使用可解释性的AI算法来预测单细胞RNA测序数据的细胞分化潜能。除了给出从0（分化）到1（全能）的连续发育潜能度量结果外，还根据细胞的发育潜能进行分为6类：具有广泛分化潜能的全能(totipotent)和多能(pluripotent)干细胞，到能够产生不同数量的下游细胞类型的 谱系限制性多能细胞（lineage-restricted oligopotent），多能(multipotent)和单能(unipotent)细胞，再到最终的 分化（differentiated）细胞。

相较V1的功能和理论的改进详见文献正文，在代码实现上CytoTRACE v2中拆分为了R版本和Python版本，安装R版本的话无需配置python的环境，使用门槛大幅降低。

一载入R包，数据

1，R包安装及解决报错

根据https://github.com/digitalcytometry/cytotrace2?tab=readme-ov-file中的方式进行安装

（1）使用devtools::install_github直接安装

devtools::install_github("digitalcytometry/cytotrace2", subdir = "cytotrace2_r") library(CytoTRACE2)
# 出现报错Using github PAT from envvar GITHUB_TOKENDownloading GitHub repo digitalcytometry/cytotrace2@HEADError in utils::download.file(url, path, method = method, quiet = quiet,  :   download from 'https://api.github.com/repos/digitalcytometry/cytotrace2/tarball/HEAD' failed

（2）如果出现上述的报错，这时候只要将报错内容的“https://api.github.com/repos/digitalcytometry/cytotrace2/tarball/HEAD” 复制到网址搜索栏回车，就会下载一个文件tar.gz的压缩文件，然后我们再本地安装即可。

# 本地安装remotes::install_local("./digitalcytometry-cytotrace2-6fe2bad.tar.gz",                       subdir = "cytotrace2_r", # 特殊的                       upgrade = F,dependencies = T)library(CytoTRACE2)library(tidyverse)library(Seurat)

注：打开tar.gz压缩包可以看到作者分的python 和r 版本，所以这里需要使用subdir参数指定为cytotrace2_r 。

注：其他的github包出现类型报错也可以使用上述方式进行解决，一般不需要设置subdir 。

2，准备单细胞数据

然后使用之前注释过的sce.anno.RData数据，为节省资源，每种细胞类型随机抽取30%的数据。

load("sce.anno.RData")sce2@meta.data$CB <- rownames(sce2@meta.data)sample_CB <- sce2@meta.data %>%   group_by(celltype) %>%   sample_frac(0.3)sce3 <- subset(sce2,CB %in% sample_CB$CB) sce3# An object of class Seurat

二 CytoTRACE v2 分析

1，CytoTRACE v2 分析

该版本可以接受单细胞对象 或者 单细胞矩阵的两种形式，物种可以是人或者小鼠（默认）。本推文是使用人的单细胞对象（sce3）进行cytotrace2分析的示例。

#######输入seurat 对象###########cytotrace2_result_sce <- cytotrace2(sce3,                                 is_seurat = TRUE,                                 slot_type = "counts",                                 species = 'human',                                seed = 1234)cytotrace2_result_sce
An object of class Seurat 51911 features across 4202 samples within 1 assay Active assay: RNA (51911 features, 2000 variable features) 4 dimensional reductions calculated: pca, umap, tsne, harmony

输入的是单细胞对象，得到的也是单细胞对象，且meta信息中包含了相关score的结果。

其中CytoTRACE2_Relative为score的具体数值结果；CytoTRACE2_Potency为文章开头提到的的六类结果。

注1：cytotrace2默认的是小鼠，所以需要指定species = 'human' ；如果是单细胞对象的话需要指定is_seurat = TRUE ；指定seed 方便后续的结果复现。。

2，CytoTRACE v2可视化

（1）v2在 plotData

同cytotrace v1的可视化函数不一样，v2在 plotData函数中包装了一些常见的可视化结果，可以先设定待展示的表型（celltype） 。

# making an annotation dataframe that matches input requirements for plotData functionannotation <- data.frame(phenotype = sce3@meta.data$celltype) %>%   set_rownames(., colnames(sce3))
# plottingplots <- plotData(cytotrace2_result = cytotrace2_result_sce,                   annotation = annotation,                   is_seurat = TRUE)# 绘制CytoTRACE2_Potency的umap图p1 <- plots$CytoTRACE2_UMAP# 绘制CytoTRACE2_Potency的umap图p2 <- plots$CytoTRACE2_Potency_UMAP# 绘制CytoTRACE2_Relative的umap图 ，v1 p3 <- plots$CytoTRACE2_Relative_UMAP # 绘制各细胞类型CytoTRACE2_Score的箱线图p4 <- plots$CytoTRACE2_Boxplot_byPheno
(p1+p2+p3+p4) + plot_layout(ncol = 2)

（2）调整出图的风格，与V1接近（plotData函数中的代码）

FeaturePlot(cytotrace2_result_sce, "CytoTRACE2_Relative",pt.size = 1.5) +   scale_colour_gradientn(colours =                            (c("#9E0142", "#F46D43", "#FEE08B", "#E6F598",                                       "#66C2A5", "#5E4FA2")),                          na.value = "transparent",                          limits = c(0, 1),                          breaks = seq(0, 1, by = 0.2),                          labels = c("0.0 (More diff.)",                                     "0.2", "0.4", "0.6", "0.8", "1.0 (Less diff.)"),                          name = "Relative\norder \n",                          guide = guide_colorbar(frame.colour = "black",                                                 ticks.colour = "black")) +   ggtitle("CytoTRACE 2") +   xlab("UMAP1") + ylab("UMAP2") +   theme(legend.text = element_text(size = 10),         legend.title = element_text(size = 12),         axis.text = element_text(size = 12),         axis.title = element_text(size = 12),         plot.title = element_text(size = 12,                                   face = "bold", hjust = 0.5,                                   margin = margin(b = 20))) +   theme(aspect.ratio = 1)

单细胞的很多可视化都是可以使用ggplot2进行自定义的。更多ggplot2 的调整可以参考ggplot2 | 关于标题，坐标轴和图例的细节修改，你可能想了解,ggplot2|详解八大基本绘图要素,ggplot2|theme主题设置，详解绘图优化-“精雕细琢” 等。

（3）细胞类型-箱线图

除了p4自带的箱线图，也可以根据需求自行绘制 scRNA分析|使用AddModuleScore 和 AUcell进行基因集打分，可视化

library(ggpubr)p1 <- ggboxplot(cytotrace2_result_sce@meta.data, x="celltype", y="CytoTRACE2_Score", width = 0.6,                 color = "black",#轮廓颜色                fill="celltype",#填充                palette = "npg",                xlab = F, #不显示x轴的标签                bxp.errorbar=T,#显示误差条                bxp.errorbar.width=0.5, #误差条大小                size=1, #箱型图边线的粗细                outlier.shape=NA, #不显示outlier                legend = "right") #图例放右边 ###指定组比较my_comparisons <- list(c("Epi", "un"), c("T", "un"),c("Myeloid", "un"))p1+stat_compare_means(comparisons = my_comparisons,                      method = "wilcox.test")

3，结合monocle2 确定起点

相关的预测结果已经在metadata中了，可以在monocle2中绘制基于分化 score的结果，以此来帮助确定起点。

参考资料：

[1]Mapping single-cell developmental potential in health and disease with interpretable deep learning

[2]Single-cell transcriptional diversity is a hallmark of developmental potential

◆ ◆ ◆ ◆ ◆

精心整理（含图PLUS版）|R语言生信分析，可视化（R统计，ggplot2绘图，生信图形可视化汇总）

RNAseq纯生信挖掘思路分享？不，主要是送你代码！（建议收藏）

觉得对您有点帮助的希望可以点赞，在看，转发！

http://mp.weixin.qq.com/s?__biz=MzIyNDI1MzgzOQ==&mid=2650402126&idx=1&sn=eb8e30a56f95448671f9b7bf10b63ece

生信补给站

生信，R语言， Python，数据处理、统计检验、模型构建、数据可视化，我输出您输入！

最新文章

只要捞偏门，篇篇都是生信顶刊！

scRNA复现|所见即所得，和Cell学umap，plot1cell完成惊艳的细胞注释umap图

scRNA | scTCR中 T细胞动态变化（Startrac）vs scRNA指数评分

scTCR+scRNA | APackOfTheClones - umap坐标下球形展示celltype的clone size

单细胞免疫组库VDJ|和Nature学STARTRAC，定量T细胞动态变化

单细胞免疫组库VDJ| 从零开始scRepertoire分析，解决真实场景中可能的问题

单细胞免疫组库VDJ|从数据下载开始完成cellranger vdj分析（1）

RNAseq|批量操作，构建预后模型，还需要那些图，通过数据预处理提高模型准确性！

单细胞数据挖掘进阶分析之亚群细分

scRNA | CSOmap-R版利用单细胞转录组预测细胞类型的空间通讯

RNAseq｜Mime代码版-终极101 种机器学习算法组合构建最优预后模型

scRNA | scTCR中 T细胞动态变化（Startrac）vs scRNA指数评分

scRNA|单细胞测序技术迎来新的机遇和挑战，国内顶尖课题组斩获殊荣！

scRNA | 和顶刊学分析，OR值展示不同分组的细胞类型差异

scRNA|R版CytoTRACE v2从0开始完成单细胞分化潜能预测

scRNA|使用scMetabolism完成单细胞代谢激活分数估计

RNAseq | ComplexHeatmap绘制临床数据热图（所见即所得）

scTCR+scRNA | APackOfTheClones - umap坐标下球形展示celltype的clone size

RNAseq-ML | SuperPC 算法构建预后模型并预测

纯生信！公共数据库，轻松解锁SCI文章，简简单单小白可上手!

Seurat_V5|单细胞转录组 + 蛋白，WNN方法分析单细胞多模态数据

高效论文写作技巧大揭秘！ChatGPT/GPT4科研实践与论文写作，掌握最新AI大模型应用！

scRNA分析| gghalves绘制单细胞数据的豆荚图/对半小提琴图

Seurat V5|当单细胞进入百万细胞时代，BPCell 给出一种“解”决参考

资源贴|送你singleR的7个内置注释数据集

Seurat V5|一个函数就能解决多种去批次方法，按需尝试

RNAseq-ML|CoxBoost生存分析完成预后模型变量筛选以及预测

RNAseq-ML|弹性网络回归算法Enet（Elastic Net）完成预后模型变量筛选-模型库+2

重磅！速发SCI，机器学习助力生信研究，再创新高！

RNAseq-ML|randomForestSRC完成随机森林生存分析-预后模型库+1

空转 | CellChat-V2，揭秘空间转录组数据的细胞通讯分析

迸发！Nature | 生信研究" 究极 " 套路，为该领域打开新的突破口！

经典综述，当肿瘤学遇到免疫学（更新版）

Nature重磅！最新研究成果公布，生信研究领域再度掀起一阵热潮！

scRNA｜ComplexHeatmap自定义单细胞转录组celltype-level 热图可视化

观众预报名破“千”，百余家参会单位阵容强大，2023广州多组学与科研技术大会再次掀起行业浪潮（附大会最新议程）

20小时快速通关R语言个性化制图

RNAseq | IPS评分-TCIA数据库了解一下，非TCGA数据用IOBR评估

零代码，不会R，科研小白如何4个月完成SCI？

RNAseq｜oncoPredict 药物反应预测，+基因，+分型，+模型的联合可视化

空转|CARD2-可基于基因集合进行spot注释，还可以提升到单细胞水平？

手把手，一步一步教你完成第1篇SCI

空转|CARD-结合scRNA解决空间转录组spot注释，还能增强空间精度？！

学术会议，大咖云集！2023多组学与科研技术大会，100+行业知名学术专家、100+企业单位、1500+高校学生出席

空转 | 我，SPOTlight，用解卷积，解决空间转录组spot注释！

scRNA分析| Seurat堆叠小提琴图不满足？那就ggplot2 堆叠各种元素

scRNA分析| DoHeatmap 美化，dittoSeq ，scillus 一行代码出图，你PICK谁？

scRNA分析| 和SCI学定制化聚类点图（Dotplot ），含二行代码出图方式

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉

scRNA|R版CytoTRACE v2从0开始完成单细胞分化潜能预测

1，R包安装 及 解决报错

2，准备单细胞数据

2，CytoTRACE v2可视化

（3）细胞类型-箱线图

3，结合monocle2 确定起点

[2]Single-cell transcriptional diversity is a hallmark of developmental potential

1，R包安装及解决报错