Bulk RNA-seq怎么找到与预后相关的​细胞类型和靶基因——学习下这篇NC,代码分析

文摘   2024-10-20 07:00   北京  

不设置🌟有时会收不到公众号内容,code一段时间后会失效,代码见文末

这个图先做了非负矩阵分析(NMF),做了分类。也做了病理组学,能跟这个分类对上。

小鼠模型的结果一定要和人的一致吗,不一样照样发顶刊——生信代码分享,NMF在空间应用(之前应该介绍过很多次 NMF)

这个图应该算是比较关键的图了,不仅找到了目标细胞(NK)还找到了目标基因(XCL1),这个思路比较值得学,而且我看也做了公共数据的各种肿瘤细胞系去做验证,这个数据咱们也是可以用的(下图 a)


食管鳞状细胞癌:综合分子和组织学分析揭示亚型特征与治疗前景

食管鳞状细胞癌(ESCC)是一种侵袭性极强的恶性肿瘤,其全球发病率和死亡率极高,尤其在亚洲和非洲地区。然而,现有治疗手段的有限性和肿瘤异质性严重影响了治疗效果。近日,一项来自中国的最新研究通过对120名中国食管鳞状细胞癌患者进行综合分子和组织学分析,揭示了该病的分子亚型及其潜在治疗靶点。这项研究为个体化治疗提供了新的方向。

分子亚型划分与临床预后

研究团队通过对食管鳞状细胞癌患者的基因组和转录组数据进行分析,并结合人工智能辅助的组织病理学图像分析,首次将ESCC划分为四种分子亚型:分化型、代谢型、免疫原型和干性型。这些亚型在分子特征和组织病理学特征方面各具特点。其中,干性型表现出最差的预后,且与免疫活动的下调、Wnt信号通路的功能突变和肿瘤内异质性显著相关。

干性型:最具侵袭性的亚型

研究发现,干性型ESCC亚型的标志基因包括WFDC2、SFRP1、LGR6和VWA2,该亚型与免疫活动的显著下调相关,表现出极高的肿瘤内异质性。特别是干性型患者体内常见的EP300突变及其在Wnt信号通路中的富集突变提示,干性型可能具有更强的侵袭性和更高的治疗耐药性。

免疫逃逸机制与治疗挑战

该研究的另一大亮点是揭示了ESCC的免疫逃逸机制。通过转录组和免疫组化分析,研究团队发现ESCC肿瘤细胞中天然杀伤细胞(NK细胞)标志物XCL1和CD160的高表达与免疫逃逸机制密切相关,且XCL1表达水平越高,患者对常见化疗药物的敏感性越低。这一发现不仅为未来免疫治疗提供了新的靶点,也为克服ESCC的治疗耐药性带来了新的希望。

人工智能助力组织学分析

为了更好地区分不同亚型的组织学特征,研究团队开发了一种基于深度学习的图像分析模型。通过对扫描的全视野病理切片进行特征提取和比较,AI模型识别出了与每个亚型高度相关的组织病理学特征,例如分化型中的角蛋白珍珠、代谢型中的嗜酸性胞质、免疫原型中的免疫细胞浸润等。这一技术不仅提高了诊断的准确性,也为未来通过组织病理学预测分子亚型提供了可能性。

下面是多因素 cox回归的代码,文中用来找预后相关的细胞了,这个切入点很重要

画出来就是这个效果

library(survminer)library(survival)load("data/Fig2C.rdata")da_cut=surv_cutpoint(data = danaher_survival,time = "time",event="status",variables = colnames(danaher_survival[3:ncol(danaher_survival)]),minprop = 0.20)da_cat=surv_categorize(da_cut,labels = c(0,1))da_cut=data.frame(summary(da_cut))hazard.ratio=function(x,time,event){newdata=data.frame(time=time,event=event,x=x)newdata=cbind(newdata,surdata[,c("sex","age","smoke","drink","T_stage","G_stage")])#this the new line added 20190904,result=summary(coxph(Surv(time,event)~x+sex+age+smoke+drink+T_stage+G_stage,data=newdata))result=data.frame(cbind(result$conf.int,result$coefficients[,5]))colnames(result)=c("hazard.ratio","exp(-coef)","lower","upper","pvalue")result[1,]}
hz=NULLfor ( x in rownames(da_cut)){tmp=NULLtmp=hazard.ratio(da_cat[,x],da_cat$time,da_cat$status)hz=rbind(hz,c(x,da_cut[x,1],tmp$hazard.ratio,tmp$lower,tmp$upper,tmp$pvalue))}
colnames(hz)=c("cell","cutpoint","hazard.ratio","lower","upper","pvalue")
hz=data.frame(hz)hz$source=rep("danaher",nrow(hz))hz$hazard.ratio=as.numeric(as.character(hz$hazard.ratio))hz=hz[order(hz$hazard.ratio),]hz$lower=as.numeric(as.character(hz$lower))hz$upper=as.numeric(as.character(hz$upper))hz$pvalue=as.numeric(as.character(hz$pvalue))hz$cell=factor(hz$cell,levels = hz$cell)

sigvalue=function(x){if (x <=0.001) {y=""}else if (x<=0.01 & x >0.001) {y=""}else if (x <=0.05 & x>0.01) {y=""}else if (x<=0.1 & x>0.05) {y="·"}else {y=""}y}
hz$signif=lapply(hz$pvalue,sigvalue)
options(repr.plot.width=8,repr.plot.height=8)ggplot(data=hz,aes(x=hazard.ratio,y=cell))+geom_point(size=3, color="blue", fill="white", shape=22)+geom_errorbarh(aes(xmin=lower,xmax=upper),height=0.2,cex=0.5,colour="#000033")+geom_vline(xintercept = 1,linetype=2)+geom_text(data=subset(hz,pvalue<=0.05),aes(x=upper+0.25,y=cell,label=signif),hjust=0,vjust=1, nudge_y = 0.15,size=10)+geom_text(data=subset(hz,pvalue<=0.10 & pvalue>0.05),aes(x=upper+0.25,y=cell,label=signif),hjust=0,vjust=0.5, nudge_y = 0,size=18)+xlim(0,max(hz$upper)+0.8)+labs(title="Danaher (China)")+scale_y_discrete(name="Immune Cells",limits=as.character(hz$cell))+theme(plot.title = element_text(hjust = 0.5),axis.text=element_text(size=12),axis.title=element_text(size=14))

想了解生信的,跟班的,可以看下面👇这个文章

单细胞、空转、生信基础手把手教学系列

这次主要强调的是空间组学的学习——空间组学都是学哪些内容?

关键词:单细胞测序,生信分析,bulk-RNA-seq转录组数据分析,生物信息学,公共数据挖掘

今日的参考文献

Jiang, G., Wang, Z., Cheng, Z. et al. The integrated molecular and histological analysis defines subtypes of esophageal squamous cell carcinoma. Nat Commun 15, 8988 (2024).

生信钱同学
北京大学在读博士生,记录自己的学习日常🌞分享生信知识:如单细胞和空间测序、多组学分析、宏基因组、病理组学、影像组学等生物信息学、机器学习和深度学习内容🌬
 最新文章