CytoTRACE2：单细胞转录组细胞分化潜能推断-拟时起点参考（R语言版及Python版）

学术 2024-09-10 09:30 重庆

偷偷问一下，关注了吗？

内容获取

1、购买打包合集（《KS科研分享与服务》付费内容打包集合），价格感人，可以加入微信VIP群（答疑交流群，甚至有小伙伴觉得群比代码更好），可以获取建号以来所有内容，群成员专享视频教程，提前更新，其他更多福利！

2、《KS科研分享与服务》公众号有QQ群，进入门槛是20元（完全是为了防止白嫖党，请理解），请考虑清楚。群里有免费推文的注释代码和示例数据（终身拥有），没有付费内容，群成员福利是购买单个付费内容半价！

需要者详情请联系作者（非需要者勿扰，处理太费时间）：

我们之前发布过CytoTRACE推断细胞发育潜能（CytoTRACE：推断拟时细胞起点辅助（结尾有彩蛋）），还可以作为拟时的起点参考，目前CytoTRACE2出来了，年初的事情，CytoTRACE2不是CytoTRACE包的升级版。那么写这个内容一方面是与时俱进，CytoTRACE2优化了算法，我们可以应用。另一方面也是小伙伴使用CytoTRACE2的时候出现了错误，我们尝试一下，是否也会出现，如果有解决它。此外，CytoTRACE2具有R语言和python版，两者是分开的，R语言当然大多数没有问题，有些小伙伴也有python需求，所以我们这个帖子介绍两种版本的使用。这个方法支持小鼠和人的数据分析。

关于CytoTRACE2可以详细阅读它的文章：Minji Kang*, Jose Juan Almagro Armenteros*, Gunsagar S. Gulati*, Rachel Gleyzer, Susanna Avagyan, Erin L. Brown, Wubing Zhang, Abul Usmani, Noah Earland, Zhenqin Wu, James Zou, Ryan C. Fields, David Y. Chen, Aadel A. Chaudhuri, Aaron M. Newman.bioRxiv 2024.03.19.585637; doi: https://doi.org/10.1101/2024.03.19.585637 (preprint)

The predicted potency scores additionally provide a continuous measure of developmental potential, ranging from 0 (differentiated) to 1 (totipotent).
Underlying this method is a novel, interpretable deep learning framework trained and validated across 31 human and mouse scRNA-seq datasets encompassing 28 tissue types, collectively spanning the developmental spectrum.
This framework learns multivariate gene expression programs for each potency category and calibrates outputs across the full range of cellular ontogeny, facilitating direct cross-dataset comparison of developmental potential in an absolute space.

R语言版：

CytoTRACE2官网：https://github.com/digitalcytometry/cytotrace2

加载数据并安装R包，数据还是使用的之前的一篇Nature的，可以作为参考：

###加载数据及安装包library(Seurat)DimPlot(sce1, label = T)sce_sub <- sce1[,sce1$cluster %in% c("YSMP","GMP","Myeloblast","Monocyte")]
devtools::install_github("digitalcytometry/cytotrace2", subdir = "cytotrace2_r")library(CytoTRACE2)

CytoTRACE2的运行是很简单的，它的input可以是表达矩阵，也可以直接是seurat object。这里我们做了一个对比，使用counts和data得到的结果是一样的。

#data running-主要函数cytotrace2cytotrace2_sce <- cytotrace2(sce_sub, #seurat对象                             is_seurat = TRUE,                              slot_type = "counts", #counts和data都可以                             species = 'human')#物种要选择，默认是小鼠

class(cytotrace2_sce)# [1] "Seurat"# attr(,"package")# [1] "SeuratObject"


# cytotrace2_res <- cytotrace2(sce_sub@assays$RNA$data, #seurat对象#                              species = 'human')#物种要选择，默认是小鼠# # class(cytotrace2_res)# [1] "data.frame"

结果可视化；

annotation <- data.frame(phenotype = sce_sub@meta.data$cluster) %>%   set_rownames(., colnames(sce_sub))
# plotting-一次性生成多个图，然后储存在一个list，用$查看即可plots <- plotData(cytotrace2_result = cytotrace2_sce,                   annotation = annotation,                   is_seurat = TRUE)

#如果这些图您需要放在文章中，需要修饰也是可以的#因为是基于ggplot的作图，所以修饰就很简单了#比如我们修饰一下主题library(ggplot2)for(i in 1:(length(plots)-1)) {

  plots[[i]] <- plots[[i]]+theme_bw()

}


#可以一个个查看图并保存# #p1# plots$CytoTRACE2_UMAP# #p2# plots$CytoTRACE2_Potency_UMAP# #p3# plots$CytoTRACE2_Relative_UMAP# #p4# plots$Phenotype_UMAP# #p5# plots$CytoTRACE2_Boxplot_byPheno
#我们这里为了方便展示，组合展示library(cowplot)plot_grid(plots[[1]],plots[[3]],plots[[4]],          plots[[5]],ncol=2)#ncol=4表示图片排为几列

得到的结论和CytoTRACE1是一致的。从图1到图5，可以看出celltype的分化潜能，总之分析和可视化都特别的方便简单！接下来看看python版本的！

Python版：

CytoTRACE2官网：
https://github.com/digitalcytometry/cytotrace2/tree/main/cytotrace2_python

首先还是安装CytoTRACE2包，终端安装即可。安装比较费时间，大概得30min。

cd data_analysis/cytotrace2_py/git clone https://github.com/digitalcytometry/cytotrace2cd cytotrace2/cytotrace2_pythonconda env create -f environment_py.ymlconda activate cytotrace2-pypip install .

python版本的CytoTRACE2的输入文件需要gene expression matrix以及celltype annotation data。如果是Seurat object，这些文件在R中准备即可：


gene_exp <- as.matrix(GetAssayData(sce_sub, layer = "counts"))write.table(gene_exp, file = "gene_exp.txt", sep = '\t',quote=F)
cell_anno <- data.frame(cellid = rownames(sce_sub@meta.data),                        celltype = sce_sub@meta.data$cluster)write.table(cell_anno, file = "cell_anno.txt", sep = '\t',quote=F, row.names = F)

如果你的单细胞文件是python结果，scanpy准备这些文件，因为我们没有这样的数据，所以我们将演示的seurat obj转化为h5ad，演示数据获取：

getwd()setwd("/home/tq_ziv/data_analysis/cytotrace2_py/")

# sce_sub <- sce1[,sce1$cluster %in% c("YSMP","GMP","Myeloblast","Monocyte")]# save(sce_sub, file = "sce_sub.RData")
library(sceasy)library(reticulate)use_condaenv('sceasy')loompy <- reticulate::import('loompy')sceasy::convertFormat(sce_sub, from="seurat", to="anndata", outFile='sce_sub.h5ad')

import scanpy as scadata=sc.read_h5ad("./sce_sub.h5ad")

expression_matrix = pd.DataFrame(adata.to_df().T) #需要转置一下expression_matrix.head()expression_matrix.to_csv('expression_matrix.txt',sep="\t")

cell_annotations  = pd.DataFrame(data=adata.obs["cluster"])cell_annotationscell_annotations.to_csv('cell_annotations.txt',sep="\t")

运行方式也有两种，一种是终端运行，方式类似于pyscenic：

#直接终端运行cytotrace2 --input-path gene_exp.txt --annotation-path cell_anno.txt --species human

另外一种python运行，调用函数即可：

#python中运行from cytotrace2_py.cytotrace2_py import *exp_path = "./expression_matrix.txt"annotation_path = "./cell_annotations.txt"species = "human"
results =  cytotrace2(exp_path,                     annotation_path=annotation_path,                     species=species)

输出结果和R是一样的，也是5个图。总体而言，还是R使用着得心应手，很舒服。如果觉得python版本太过于麻烦或者可能出现一些位置错误，建议将数据转化为seurat或者得到矩阵和注释文件，使用R版进行分析！

觉得我们分享有些用的，点个赞再走呗！

关注我们获取精彩内容：

关注不迷路：扫描下面二维码关注公众号！
B站视频号链接：https://space.bilibili.com/471040659?spm_id_from=333.1007.0.0

关注 KS科研分享与服务，
认清正版优质内容和服务！
优质内容持续输出，物超所值！
合作联系：ks_account@163.com
→（新的板块-重要通知-双向选择）

http://mp.weixin.qq.com/s?__biz=Mzg5OTYzMzY5Ng==&mid=2247489792&idx=1&sn=b71fc51f2b76e70167afc7382291fbc9

KS科研分享与服务

科研学习交流于分享，生信学习笔记，科研经历和生活！

最新文章

infercnvpy：Python版单细胞infercnv分析

KS科研分享与服务---微信VIP付费内容合集

生信服务器---有root权限、可解决问题的服务器 (注册领取200优惠券)！

(视频教程): Monocle3分析流程-分析简化函数和可视化函数

KS科研分享与服务---微信VIP付费内容合集

生信服务器---有root权限、可解决问题的服务器 (注册领取200优惠券)！

(视频教程): Monocle2安装包测试、分析流程及可视化修饰

CytoTRACE2：单细胞转录组细胞分化潜能推断-拟时起点参考（R语言版及Python版）

KS科研分享与服务---微信VIP付费内容合集

生信服务器---有root权限、可解决问题的服务器 (注册领取200优惠券)！

KS科研分享与服务---中秋-国庆-开学季优惠、抽奖活动公告

逛github发现吃奶骂娘：丢国人的脸！

单细胞亚群分析不确定用哪个基因定义细胞群（Xgene+/high cells），不妨试试这个NC的思路！

付费内容合集---价格已标注，虽然不便宜，但可比肩几千的内容

没有服务器能做单细胞分析吗？回答：可以，但不咋爽？ (注册领取200优惠券)！

当代年轻人主打一个"没苦不硬吃"---KS原创函数合集

Seurat包VlnPlot小提琴图修饰---顺带一个函数展示基因表达小提琴图+细胞比例饼图

付费内容合集---价格已标注，虽然不便宜，但可比肩几千的内容

没有服务器能做单细胞分析吗？回答：可以，但不咋爽？ (注册领取200优惠券)！

单细胞通讯KS合集(分析+个性化作图）

你有我有全都有呀!-连续出击cellphonedb v5受配体多组比较气泡图（原创函数）

付费内容合集---价格已标注，虽然不便宜，但可比肩几千的内容

没有服务器能做单细胞分析吗？回答：可以，但不咋爽？ (注册领取200优惠券)！

连夜更新---别说两组了，这个cellchat多组比较气泡图函数10组也能做了

(原创函数)-Cellchat受配体多组比较气泡图函数

付费内容合集---价格已标注，虽然不便宜，但可比肩几千的内容

没有服务器能做单细胞分析吗？回答：可以，但不咋爽？ (注册领取200优惠券)！

付费内容合集---价格已标注，虽然不便宜，但可比肩几千的内容

没有服务器能做单细胞分析吗？回答：可以，但不咋爽？ (注册领取200优惠券)！

复现cell子刊图表：Seurat包DotPlot纯修饰分面气泡图展示基因表达

（更新）复现Cell子刊图表：GSEA多组结果可视化函数

付费内容合集---价格已标注，虽然不便宜，但可比肩几千的内容

没有服务器能做单细胞分析吗？回答：可以，但不咋爽？ (注册领取200优惠券)！

气泡图展示富集结果-Ingenuity Pathway Analysis（IPA）结果展示之一

基础不够，AI来凑呀，甚至还可以在七夕哄哄小对象！

付费内容合集---价格已标注，虽然不便宜，但可比肩几千的内容

没有服务器能做单细胞分析吗？回答：可以，但不咋爽？ (注册领取200优惠券)！

气泡图展示cellchat单细胞互作受配体结果

10X-Visum空间转录组(4)---cellchat V2空转互作分析及可视化

Cellphonedb单细胞互作分析数据库更新及自定义

《KS科研分享与服务》付费内容打包集合

2024年你拥有一个具有Rstudio、有jupyter、具有root权限的服务器了吗？ (注册领取200优惠券)！

人大博士的举报：废“它”还是废我？

《KS科研分享与服务》付费内容打包集合

2024年你拥有一个具有Rstudio、有jupyter、具有root权限的服务器了吗？ (注册领取200优惠券)！

Cellchat分析受配体数据库更新（自定义）

《KS科研分享与服务》付费内容打包集合

2024年你拥有一个具有Rstudio、有jupyter、具有root权限的服务器了吗？ (注册领取200优惠券)！

复现《Cell stem cell》图表：STRING互作分析+igraph绘制大型蛋白互作网络图

《KS科研分享与服务》付费内容打包集合

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉