(视频教程): Monocle2安装包测试、分析流程及可视化修饰

学术 2024-09-13 09:28 重庆

偷偷问一下，关注了吗？

内容获取

1、购买打包合集（《KS科研分享与服务》付费内容打包集合），价格感人，可以加入微信VIP群（答疑交流群，甚至有小伙伴觉得群比代码更好），可以获取建号以来所有内容，群成员专享视频教程，提前更新，其他更多福利！

2、《KS科研分享与服务》公众号有QQ群，进入门槛是20元（完全是为了防止白嫖党，请理解），请考虑清楚。群里有免费推文的注释代码和示例数据（终身拥有），没有付费内容，群成员福利是购买单个付费内容半价！

需要者详情请联系作者（非需要者勿扰，处理太费时间）：

前面我们刚更新完CytoTRACE2，那么也是想着用将其与monocle2分析结合起来，一方面看看效果，一方面辅助起点确定。同时近期不止有一个小伙伴在跑monocle2分析，但是还是因为包出了问题，我们之前发布过一个终集修改版2.26.0（Monocle2终极修改版），使用起来是没有问题的，但是小伙伴确有问题，这让我下定决心要找出问题。此外，也想将整个流程做一个视频讲解，弥补之前没有视频教程的遗憾，有很多小伙伴有此需求。完整代码及视频教程已发布微信VIP！

Monocle2个性化作图

一键跑完monocle2？

ggplot2个性可视化monocle2结果

ggplot修饰monocle2拟时热图：一众问题全部解决

单细胞拟时分析：基因及通路随拟时表达变化趋势

首先说结论，为什么终极修改包有些人出错，有些人不出错。经过我们的测试发现，安装monocle 2.26.0修改版在R 4.2中，无论是服务器还是本地电脑的运行中，ordercell和BEAM都不会出此案错误，但是在R 4.3中，ordercell没有问题，BEAM依然报错，可见2.26.0修改版与R版本有些关系。那么如果是R4.3，总不能为了monocle降级吧，我们测试发现monocle 2.32.0 在R 4.3中Ordercell没有问题，BEAM有问题，所以对2.32.0也做了修改版，让其在R 4.3中运行无障碍。（注意了：包修改的是它本身的问题，如果是因为流程或者数据的错误，需要自行检查）

（此结果经过我们实际运行测试，没有吹牛！包的修改见视频教程！）

接下来走走monocle2的流程吧，这里为了方便，数据也小，我们直接包装了一个函数，实际运行我们还是建议自己按照流程，因为需要中间调整参数。如果你的参数流程已经探索没有问题了，那么可以包装函数，方便分析：

library(Seurat)library(monocle)library(viridis)#========================================================================================setwd("D:\\KS项目\\公众号文章\\视频教程---monocle2分析测试")#load data-加载之前做了cytroTRACE2的那个obj#可以结合辅助看看cell起点load("D:/KS项目/公众号文章/CytroTRACE2：单细胞转录组数据推断细胞发育潜能/sce_trace.RData")DimPlot(cytotrace2_sce, label = T, pt.size = 1)#这个数据是大群里面直接提取了目标细胞进行分析#========================================================================================
#monocle pieline function#pay attention---Seuratobject version 5.0.0 ks_run_Monocle2 <- function(object, #seurat obj or expression matrix (建议数据格式转为matrix,如果数据量大转化为稀疏矩阵as(as.matrix(data), "sparseMatrix"))                            layer, #used when object is a seurat obj                            assay, #used when object is a seurat obj                            lowerDetectionLimit = 0.1,                             VARgenesM=c("dispersionTable","seurat","differentialGeneTest"),                            cellAnno=NULL,                             define_root=F,                            root_state,                            reverse=NULL                            ){      if(class(object)[1] == 'Seurat') {        data <- GetAssayData(object=object, layer=layer, assay=assay)#get expression matrix data        pd <- new("AnnotatedDataFrame", data = object@meta.data)    fData <- data.frame(gene_short_name = row.names(data), row.names = row.names(data))    fd <- new("AnnotatedDataFrame", data = fData)        if(all(data == floor(data))) {      expressionFamily <- negbinomial.size()    } else if(any(data < 0)){      expressionFamily <- uninormal()    } else {      expressionFamily <- tobit()    }        #Creates a new CellDateSet object.    monocle_cds <- newCellDataSet(data,                                  phenoData = pd,                                   featureData = fd,                                  lowerDetectionLimit=0.1,                                  expressionFamily=expressionFamily)      }else{        print("This fucntions only apply for a seurat obj")  }        #Estimate size factors and dispersions  #数据处理  monocle_cds <- estimateSizeFactors(monocle_cds)#size facotr标准化细胞之间的mRNA差异  monocle_cds <- estimateDispersions(monocle_cds)    #质量控制-filter cells  monocle_cds <- detectGenes(monocle_cds, min_expr = 0.1)  # print(head(fData(monocle_cds)))  # print(head(pData(monocle_cds)))  # expressed_genes <- row.names(subset(fData(mouse_monocle), num_cells_expressed >= 10))  monocle_cds <- monocle_cds[fData(monocle_cds)$num_cells_expressed >= 10, ]      #select methods for VariableFeatures  if(VARgenesM=="dispersionTable"){        disp_table <- dispersionTable(monocle_cds)    ordering_genes <- subset(disp_table,                             mean_expression >= 0.1 &                               dispersion_empirical >= 1.5* dispersion_fit)$gene_id      }      if(VARgenesM=="seurat"){        ordering_genes <- VariableFeatures(FindVariableFeatures(object, assay = "RNA"), assay = "RNA")      }  
  if(VARgenesM=="differentialGeneTest"){        diff_test_res <- differentialGeneTest(monocle_cds,fullModelFormulaStr = paste0("~",cellAnno))##~后面是表示对谁做差异分析的变量    diff_test_res_sig <- diff_test_res[order(diff_test_res$qval,decreasing=F),]        ordering_sce <- diff_test_res_sig[diff_test_res_sig$qval< 0.01,]        if(nrow(ordering_sce)>3000){            ordering_genes <- ordering_sce$gene_short_name[1:3000]          }else{            ordering_genes <- rdering_sce$gene_short_name    }      }      #Marks genes for clustering  monocle_cds <- setOrderingFilter(monocle_cds, ordering_genes)  plot_ordering_genes(monocle_cds)      #cluster  monocle_cds <- reduceDimension(monocle_cds, max_components = 2,reduction_method = 'DDRTree')    #order cells  monocle_cds <- orderCells(monocle_cds, reverse=reverse)    if(define_root){    monocle_cds <- monocle_cds <- orderCells(monocle_cds,root_state = root_state)  }      return(monocle_cds)  }

分析数据以及一些基本可视化修饰：

#run monocle2sce_CDS <- ks_run_Monocle2(object = cytotrace2_sce,                           layer = 'counts',                           assay = "RNA",                           VARgenesM="dispersionTable",                           cellAnno = "cluster")

#可视化拟时plot_cell_trajectory(sce_CDS,show_branch_points = F,color_by = "Pseudotime",cell_size = 3)+  scale_color_gradientn(colours = colorRampPalette(c('blue','green','yellow','red'))(100))

#按照celltype着色plot_cell_trajectory(sce_CDS,show_branch_points = F,color_by = "cluster",cell_size = 3)+  theme_dr(arrow = grid::arrow(length = unit(0, "inches")))+  theme(panel.grid.major = element_blank(),        panel.grid.minor = element_blank())+  scale_color_manual(values = c("#E69253", "#EDB931", "#E4502E", "#4378A0"))+  geom_curve(aes(x=9,y=2,yend=0,xend=5),             arrow=arrow(length=unit(0.03,"npc")),             size=1,curvature=0,             color="black")+  annotate("text", x=6.5, y=1.5, label = "bold(YSMP)", parse = TRUE, angle=45, size=4)+  geom_curve(aes(x=-4,y=-1,yend=3,xend=-6),             arrow=arrow(length=unit(0.03,"npc")),             size=1,curvature=0,             color="black")+  annotate("text", x=-4, y=1, label = "bold(Monocyte~Fate)", parse = TRUE, angle=-75, size=4)+  geom_curve(aes(x=-5,y=-3,yend=-5,xend=-6),             arrow=arrow(length=unit(0.03,"npc")),             size=1,curvature=0,             color="black")+  annotate("text", x=-6.5, y=-4, label = "bold(Neu~Fate)", parse = TRUE, angle=75, size=4)

#结合可视化cytroTRACE2结果plot_cell_trajectory(sce_CDS,show_branch_points = F,color_by = "CytoTRACE2_Relative",cell_size = 3)+  scale_colour_gradientn(colours = (c( "#000004FF", "#3B0F70FF", "#8C2981FF", "#DE4968FF", "#FE9F6DFF", "#FCFDBFFF")),                         na.value = "transparent",                         limits=c(0,1),                         breaks = c(0,1),                         labels=c("(More diff.)", "(Less diff.)"),                         name = "Relative\norder \n" ,                         guide = guide_colorbar(frame.colour = "black", ticks.colour = "black"))+  theme_dr(arrow = grid::arrow(length = unit(0, "inches")))+#坐标轴主题修改  theme(panel.grid.major = element_blank(),        panel.grid.minor = element_blank())

做一下拟时差异热图；

#=======================================================================================#拟时差异基因expressed_genes=row.names(subset(fData(sce_CDS),use_for_ordering=="TRUE"))peu_gene <- differentialGeneTest(sce_CDS[expressed_genes,],fullModelFormulaStr = "~sm.ns(Pseudotime)",cores = 1)# write.csv(peu_gene,file='peu_gene.csv')#保存好文件，这个分析过程挺费时间peu_gene <- peu_gene[which(peu_gene$qval<0.01 & peu_gene$num_cells_expressed>100),]#筛选显著是的# peu_gene %>% arrange(qval)  -> peu_gene#按照qval排个序# peu_gene <- peu_gene[1:100,] #这里我们取前100个基因演示#改造热图函数，展示需要的基因source('./new_heatmap.R')library(pheatmap)library(grid)p1 <-plot_pseudotime_heatmap(sce_CDS[peu_gene$gene_short_name,],                             num_clusters = 4,                             cores = 2,                             show_rownames = T,return_heatmap =T,                             hmcols = viridis(256),                             use_gene_short_name = T,                             clustercolor  = c("#d2981a", "#a53e1f", "#457277", "#8f657d"))

p1

#只展示感兴趣的基因genes <- c("C1QB","C1QC","C1QA","MRC1","LGMN","MS4A7","MAF","FOLR2",           "HLA-DPA1","CLEC10A","IL10RA","CD163","KCTD12","CLEC7A","MS4A6A","CD14",           "ITM2A","CYTL1","MDK","SELP","CD24",           "S100A8","S100A9","S100A12")
source('./add.flag.R')add.flag(p1, kept.labels = genes, repel.degree = 0.2)

#提取module基因，进行富集分析，结合热图展示
library(clusterProfiler)library(ggplot2)source('./Monocle2_gene_enrichment.R')GOannlysis <- Monocle2_gene_enrichment(p,knum=4,species='org.Hs.eg.db',                                       pvalueCutoff=0.05,                                       qvalueCutoff=0.05)
table(GOannlysis$Cluster)#module1基因最少，没有显著性富集# 1  2  3  4 # 0 76 43 77 write.csv(GOannlysis, file = 'GOannlysis.csv')

分析分支差异基因：

library(RColorBrewer)plot_cell_trajectory(sce_CDS,show_branch_points = T,color_by = "State",cell_size = 3)#BEAM#查看在分叉处的差异基因BEAM_res <- BEAM(sce_CDS, branch_point = 3, cores=2)BEAM_res <- BEAM_res[order(BEAM_res$qval),]BEAM_res <- BEAM_res[,c("gene_short_name", "pval", "qval")]# write.csv(BEAM_res,file = "BEAM_res.csv")branch_p <- plot_genes_branched_heatmap(sce_CDS[row.names(subset(BEAM_res, qval < 1e-8)),],                            branch_point = 3,                            num_clusters = 4,                            cores = 2,                            hmcols = colorRampPalette(c("steelblue", "white","darkorange2", "orangered4"))(100),                            use_gene_short_name = T,                            show_rownames = T,                            return_heatmap = T)

总之，整个流程是比较简单的，最重要的自己对于结果的把握和解释，以及一些新的发现。希望我们的流程对您有所帮助！

觉得我们分享有些用的，点个赞再走呗！

关注我们获取精彩内容：

关注不迷路：扫描下面二维码关注公众号！
B站视频号链接：https://space.bilibili.com/471040659?spm_id_from=333.1007.0.0

关注 KS科研分享与服务，
认清正版优质内容和服务！
优质内容持续输出，物超所值！
合作联系：ks_account@163.com
→（新的板块-重要通知-双向选择）

http://mp.weixin.qq.com/s?__biz=Mzg5OTYzMzY5Ng==&mid=2247489808&idx=1&sn=3247c69f69d1faae87bf63ccf36a42b0

KS科研分享与服务

科研学习交流于分享，生信学习笔记，科研经历和生活！

最新文章

infercnvpy：Python版单细胞infercnv分析

KS科研分享与服务---微信VIP付费内容合集

生信服务器---有root权限、可解决问题的服务器 (注册领取200优惠券)！

(视频教程): Monocle3分析流程-分析简化函数和可视化函数

KS科研分享与服务---微信VIP付费内容合集

生信服务器---有root权限、可解决问题的服务器 (注册领取200优惠券)！

(视频教程): Monocle2安装包测试、分析流程及可视化修饰

CytoTRACE2：单细胞转录组细胞分化潜能推断-拟时起点参考（R语言版及Python版）

KS科研分享与服务---微信VIP付费内容合集

生信服务器---有root权限、可解决问题的服务器 (注册领取200优惠券)！

KS科研分享与服务---中秋-国庆-开学季优惠、抽奖活动公告

逛github发现吃奶骂娘：丢国人的脸！

单细胞亚群分析不确定用哪个基因定义细胞群（Xgene+/high cells），不妨试试这个NC的思路！

付费内容合集---价格已标注，虽然不便宜，但可比肩几千的内容

没有服务器能做单细胞分析吗？回答：可以，但不咋爽？ (注册领取200优惠券)！

当代年轻人主打一个"没苦不硬吃"---KS原创函数合集

Seurat包VlnPlot小提琴图修饰---顺带一个函数展示基因表达小提琴图+细胞比例饼图

付费内容合集---价格已标注，虽然不便宜，但可比肩几千的内容

没有服务器能做单细胞分析吗？回答：可以，但不咋爽？ (注册领取200优惠券)！

单细胞通讯KS合集(分析+个性化作图）

你有我有全都有呀!-连续出击cellphonedb v5受配体多组比较气泡图（原创函数）

付费内容合集---价格已标注，虽然不便宜，但可比肩几千的内容

没有服务器能做单细胞分析吗？回答：可以，但不咋爽？ (注册领取200优惠券)！

连夜更新---别说两组了，这个cellchat多组比较气泡图函数10组也能做了

(原创函数)-Cellchat受配体多组比较气泡图函数

付费内容合集---价格已标注，虽然不便宜，但可比肩几千的内容

没有服务器能做单细胞分析吗？回答：可以，但不咋爽？ (注册领取200优惠券)！

付费内容合集---价格已标注，虽然不便宜，但可比肩几千的内容

没有服务器能做单细胞分析吗？回答：可以，但不咋爽？ (注册领取200优惠券)！

复现cell子刊图表：Seurat包DotPlot纯修饰分面气泡图展示基因表达

（更新）复现Cell子刊图表：GSEA多组结果可视化函数

付费内容合集---价格已标注，虽然不便宜，但可比肩几千的内容

没有服务器能做单细胞分析吗？回答：可以，但不咋爽？ (注册领取200优惠券)！

气泡图展示富集结果-Ingenuity Pathway Analysis（IPA）结果展示之一

基础不够，AI来凑呀，甚至还可以在七夕哄哄小对象！

付费内容合集---价格已标注，虽然不便宜，但可比肩几千的内容

没有服务器能做单细胞分析吗？回答：可以，但不咋爽？ (注册领取200优惠券)！

气泡图展示cellchat单细胞互作受配体结果

10X-Visum空间转录组(4)---cellchat V2空转互作分析及可视化

Cellphonedb单细胞互作分析数据库更新及自定义

《KS科研分享与服务》付费内容打包集合

2024年你拥有一个具有Rstudio、有jupyter、具有root权限的服务器了吗？ (注册领取200优惠券)！

人大博士的举报：废“它”还是废我？

《KS科研分享与服务》付费内容打包集合

2024年你拥有一个具有Rstudio、有jupyter、具有root权限的服务器了吗？ (注册领取200优惠券)！

Cellchat分析受配体数据库更新（自定义）

《KS科研分享与服务》付费内容打包集合

2024年你拥有一个具有Rstudio、有jupyter、具有root权限的服务器了吗？ (注册领取200优惠券)！

复现《Cell stem cell》图表：STRING互作分析+igraph绘制大型蛋白互作网络图

《KS科研分享与服务》付费内容打包集合

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉