单细胞亚群分析不确定用哪个基因定义细胞群(Xgene+/high cells),不妨试试这个NC的思路!

学术   2024-09-02 10:02   重庆  

偷偷问一下,关注了吗

内容获取


1、购买打包合集(《KS科研分享与服务》付费内容打包集合),价格感人,可以加入微信VIP群(答疑交流群,甚至有小伙伴觉得群比代码更好),可以获取建号以来所有内容,群成员专享视频教程,提前更新,其他更多福利!


2、《KS科研分享与服务》公众号有QQ群,进入门槛是20元(完全是为了防止白嫖党,请理解),请考虑清楚。群里有免费推文的注释代码和示例数据(终身拥有),没有付费内容,群成员福利是购买单个付费内容半价!


需要者详情请联系作者(非需要者勿扰,处理太费时间):

有小伙伴发来一张图,一篇NC的文章。图如下,就是回归,没啥可说的(复现《Cell》图表:ggplot做回归、折线图并添加置信区间)。之所以要复现,是因为这篇文章的思路,我们做亚群的时候,在其他文章中也看到了,某某基因high的亚群,这个代表基因怎么选就是一个难题,要么这个基因是一些约定的或者确定的可以代表细胞群的,要么突出表现这群的特征。这篇文章这幅图就提供了一个思路,让我们在亚群分析的时候确定特征基因。详细见方法部分:

(reference:Li, Y., Jiang, M., Aye, L. et al. UPP1 promotes lung adenocarcinoma progression through the induction of an immunosuppressive microenvironment. Nat Commun 15, 1200 (2024). https://doi.org/10.1038/s41467-024-45340-w

我们也尝试复现了整个过程(从亚群分析到最后结果呈现),至于方法是否有效,可能还需要探讨,但是至少是一个思路。同时也跟数据有关,我们的结果并不能凸显!

详细Methods(有理解不对的地方敬请指正)

我们用之前的示例数据,挑选其中的Epi进行亚群分群,进行这个演示(请注意,数据无任何生物学意义,仅仅是方法演示,请勿过度理解!!!完整版内容已发布微信VIP,请自行下载!)。首先进行亚群的分群!
setwd('/home/data_analysis/基因与通路富集相关/')
library(AUCell)library(Seurat)
load("~/data_analysis/基因与通路富集相关/uterus.RData")DimPlot(uterus, label = T)Epi <- subset(uterus,cell_type=="Uepi")
#亚群分析DefaultAssay(Epi)="RNA"Epi.list<-SplitObject(Epi, split.by = "orig.ident")for(i in names(Epi.list)){Epi.list[[i]] <- NormalizeData(Epi.list[[i]], normalization.method = "LogNormalize")}for(i in names(Epi.list)){Epi.list[[i]] <- FindVariableFeatures(Epi.list[[i]], selection.method = "vst", nfeatures = 4000)}#cca intergratedEpi.anchors<- FindIntegrationAnchors(object.list = Epi.list, dims = 1:30,normalization.method='LogNormalize',reduction='cca')Epi.integrated <- IntegrateData(anchorset = Epi.anchors, dims = 1:40)

Epi.integrated <- ScaleData(Epi.integrated, vars.to.regress = c("S.Score", "G2M.Score","percent.mt", "nCount_RNA"), verbose = T)Epi.integrated <- RunPCA(Epi.integrated, npcs = 40, verbose = FALSE)Epi.integrated <- RunUMAP(Epi.integrated, reduction = "pca", dims = 1:15)Epi.integrated <- FindNeighbors(Epi.integrated, reduction = "pca", dims = 1:15)Epi.integrated <- FindClusters(Epi.integrated, resolution = 0.3)# DimPlot(Epi.integrated, label = T)# install.packages("SCpubr")# library(SCpubr)color_plot <- c("#d2981a", "#a53e1f", "#457277", "#8f657d", "#8dcee2")names(color_plot) <- unique(Idents(Epi.integrated))do_DimPlot(Epi.integrated,legend.position = "none", colors.use = color_plot, pt.size = 0.8, label = T)

顺便想用一下ggpie这个包,做一个空心嵌套饼图,看看每个样本中,各个亚群cluster的细胞比例的多少:颜色设置和前面的UMAP降维图一致。
# install.packages('ggpie')library(ggpie)ggnestedpie(data = Epi.integrated@meta.data,             group_key = c("seurat_clusters", "orig.ident"),             count_type = "full",            inner_label = F,            outer_label_type = "circle", # 设置外层环形            outer_label_pos = "in",            outer_label_info = "all",            outer_label_threshold = 10,            r0 = 1,r2 = 2,            inner_fill_color = c("#FF5744","#208A42", "#FCB31A"),            outer_fill_color = color_plot)


接下来做AUC评分,差异分析,marker基因筛选,归回分析及作图可视化:

KS科研分享与服务
科研学习交流于分享,生信学习笔记,科研经历和生活!
 最新文章