针对这个这个胃癌单细胞数据集GSE163558,我做了解读,详见 :单细胞转录组降维聚类分群过滤基因和过滤细胞的区别 。而且前面已经是完成了降维聚类分群,在学习单细胞亚群命名的层次结构 演示了一个降维聚类分群结果,就有了 2-harmony/sce.all_int.rds 文件,以及对应的 phe.Rdata 注释信息。
既然 单细胞亚群取子集后的细分亚群再命名的两个难题,b细胞和髓系都是有比较好的生物学背景知识整理,但是成纤维就是一个例外,让我们看看这个文章做的怎么样吧!
然后我强调了其实我们的第一层次降维聚类分群里面的成纤维细胞是一个混合物,里面混入了平滑肌细胞(Smooth Muscle Cells, SMCs)和周细胞(Pericytes),这个混合的单细胞亚群可以被称为“混合间充质细胞群”(Mixed Mesenchymal Cell Cluster)或“血管相关间充质细胞群”(Vascular-Associated Mesenchymal Cell Cluster),具体命名取决于细胞的来源和所处的组织微环境。以下是一些可能的命名方式:
成纤维细胞/平滑肌细胞/周细胞亚群(Fibroblast/Smooth Muscle Cell/Pericyte Subpopulation):
这种命名直接指出了亚群中包含的细胞类型。
由于周细胞和平滑肌细胞都与血管结构相关,这个名称强调了它们的血管周围定位。
如果这些细胞具有干细胞特性,这个名称可能适用。
如果这些细胞是从血管壁中分离出来的,这个名称可能更准确。
如果这些细胞来自特定的组织或器官,可以在名称中指定组织来源。
如果这些细胞具有多种功能或分化潜能,这个名称可以反映它们的多功能性。
在单细胞转录组分析中,研究者可能会使用聚类算法来区分不同的细胞亚群,并根据基因表达模式来识别和命名这些亚群。正确命名这些亚群有助于科学界理解和交流特定的细胞群体。
作者可能忽略了成纤维亚群里面的干扰细胞
如下所示,大家可以自行阅读这个胃癌单细胞数据集GSE163558对应的文献“Revealing the transcriptional heterogeneity of organ-specific metastasis in human gastric cancer using single-cell RNA Sequencing”,作者首先是默认第一层次降维聚类分群里面的成纤维细胞是纯粹的成纤维。然后就细分成为了 iCAF和myCAF 。
但是严谨的来说,如果成纤维里面的混入了平滑肌细胞(Smooth Muscle Cells, SMCs)和周细胞(Pericytes)并不能说它们是mCAF的:
而且这个文献的附件就有对他们细分成为了 iCAF和myCAF的特异性的go功能注释,都是有ECM。很明显就是iCAF不纯粹导致的:
成纤维本来就来源于其它单细胞亚群
好久之前的一个笔记里面:肿瘤样品的单细胞需要提取上皮细胞继续细分,提到了感兴趣的fibroblasts等细胞亚群占比非常少,所以研究者们做了第二次单细胞转录组数据,见:什么,你想要的单细胞亚群比例太少了?,其实这样的策略屡见不鲜。
在小鼠模型里面也有:4T1这个TNBC小鼠肿瘤模型的CAFs异质性,其实大家并不能很好的确定自己研究的对象就是成纤维细胞。比如这个 肿瘤相关成纤维细胞异质性 就是分成了6群:
Subcluster 0 被作者定义为 vascular CAFs ,高表达 GJA4, and RGS5 等 Subcluster 1 被作者定义为 matrix CAFs ,高表达 LUM, DCN, and VCAN等 Subcluster 2 被作者定义为 inflammatory CAFs ,高表达 complement genes (C3 and C7). 等 Subcluster 3 被作者定义为 antigen-presenting CAFs ,高表达CD74, HLA- DRA, and HLA-DRB1 等 Subcluster 4 被作者定义为 EMT-like CAFs ,高表达 KRT19, KRT8 等 Subcluster 5 被作者定义为 lip- ofibroblast–c5–FABP1 ,高表达APOA2, FABP1, FABP4, and FRZB等
所谓的 vascular CAFs ,高表达 GJA4, and RGS5 等,其实是周细胞,而 EMT-like CAFs ,高表达 KRT19, KRT8 可能就是上皮细胞。
另外一个2023发表的数据挖掘文章:《Cancer-associated fibroblast classification in single-cell and spatial proteomics data》,分析了已经发表的来自14名乳腺癌患者肿瘤组织的约11万细胞里面的16,704个基质细胞,分群12数量亚群后合并为10个生物学意义亚群,分别是(9 CAF types and one cluster of pericytes) ,最后的单细胞亚群的各自的基因如下所示:
RGS5 for pericytes MCAM for vCAFs MME (together with NDRG1 and ENO1) for tCAFs IDO1 for ifnCAFs HSPH1 for hsp_tCAFs MMP11 (together with COL1A1 and POSTN) for mCAFs PLA2G2A, CDF and CD34 for iCAFs MKI67 for dCAFs CCL21 (and CCL19) for rCAFs CD74 and HLA-DR for apCAFs PDPN and FAP for the general category of activated CAFs
而且这个团队(瑞士苏黎世大学的Bernd Bodenmiller等人)在2024又发表了一个综述汇总成纤维相关的单细胞层面亚群命名问题。题为“Classifying cancer-associated fibroblasts-The good, the bad, and the target”的文章,通过单细胞表型和CAF在不同癌症类型中的空间位置来简化和标准化CAF的分类。分类包括以下的9个caf类型:
基质CAF(mCAFs):参与细胞外基质的产生和维护。 炎症CAF(iCAFs):在肿瘤微环境中促进炎症反应。 血管相关CAF(vCAFs):与血管相关,参与血管生成。 分裂CAF(dCAFs):处于增殖状态并积极分裂。 肿瘤样CAF(tCAFs):表现出类似肿瘤细胞的特征。 热休克蛋白高表达的肿瘤样CAF(hsp_tCAFs):一种特殊类型的tCAF,表达高水平的热休克蛋白。 干扰素反应CAF(ifnCAFs):参与干扰素反应途径。 抗原呈递CAF(ap-CAFs):具有呈递抗原的能力,可能影响免疫反应。 网状CAF(rCAFs):在肿瘤内形成网络,通常与结构支持相关。
这一分类系统为理解CAF的功能多样性及其作为癌症治疗潜在靶点提供了框架。通过基于表型和位置定义清晰的类别,研究人员可以更好地研究CAF在不同癌症背景下的作用,并开发调节其活性的策略。
我们的降维聚类分群
同样的,提取第一层次降维聚类分群里面的成纤维细胞亚群作为子集,继续走降维聚类分群流程:
rm(list=ls())
options(stringsAsFactors = F)
source('../../scRNA_scripts/lib.R')
set.seed(123456789)
###### step1:导入数据 ######
sce.all.int = readRDS('../../2-harmony/sce.all_int.rds')
colnames(sce.all.int@meta.data)
load('../../phe.Rdata')
table(phe$celltype)
choose_cellIds=rownames(phe)[phe$celltype %in% c('fibro') ]
sce.all=sce.all.int[,choose_cellIds]
sce.all=CreateSeuratObject(
counts = sce.all@assays$RNA$counts,
meta.data = sce.all@meta.data
)
可以看到,如下所示的1群是低质量细胞亚群可以删除,然后5是有免疫细胞的干扰,8 是细胞增殖状态的成纤维细胞,如果把这3群删除掉 :
我定义的细胞亚群
#
celltype[celltype$ClusterID %in% c( 4 ),2]='MYH11'
celltype[celltype$ClusterID %in% c( 2,9 ),2]='RGS5'
celltype[celltype$ClusterID %in% c(0),2]='GJB2'
celltype[celltype$ClusterID %in% c(3),2]='SFRP1'
celltype[celltype$ClusterID %in% c(6),2]='iCAF'
celltype[celltype$ClusterID %in% c(7),2]='IGF1'
celltype[celltype$ClusterID %in% c(1),2]='low'
celltype[celltype$ClusterID %in% c(8),2]='cycle'
celltype[celltype$ClusterID %in% c(5),2]='immune'
如下所示:
值得注意的是我们本次数据分析里面 SFRP1 特异性成纤维其实是仅仅是存在于卵巢转移样品,所以它并不具有普遍性:
> table(sce.all.int$celltype,sce.all.int$orig.ident)
Li1 Li2 LN1 LN2 NT1 O1 P1 PT1 PT2 PT3
GJB2 0 0 0 0 0 0 37 0 165 0
iCAF 0 0 0 0 0 0 2 1 56 1
IGF1 0 0 0 4 0 0 17 0 32 6
MYH11 2 1 1 3 6 6 35 0 33 6
RGS5 0 1 0 2 3 14 51 0 66 9
SFRP1 0 0 0 0 0 113 0 0 0 0
我们也可以可视化文献里面的 iCAF和myCAF 的差异热图里面的基因,可以看到作者的mCAF其实是我们的MYH11和RGS5分别代表了平滑肌细胞和周细胞,是不是有点尴尬啊!
然后呢,作者吧GJB2和IGF1这两个单细胞亚群归入了iCAF里面,但实际上,它们并没有炎症相关基因或者功能的特异性:
如果我们看这些单细胞亚群的生物学功能,比如kegg数据库的注释结果,其实可以看到GJB2亚群肯定不是iCAF,它有可能是真正的mCAF啦。然后IGF1亚群可以叫做是代谢富集成纤维细胞亚群。
这个时候需要让人工智能大模型帮我们补充一下生物学背景知识:
成纤维细胞的来龙去脉
正常组织的成纤维细胞和,肿瘤相关成纤维细胞(CAF),是两种在组织结构和功能上具有重要作用的细胞类型。以下是它们的基本概述:
成纤维细胞(Fibroblasts):
形态:长梭形的间质细胞。 历史:由Rudolf Virchow于1858年首次描述,Ernst Ziegler于1881年命名。 功能:在所有组织中负责产生、维护和重塑细胞外基质(ECM)。 静止状态:在健康组织中通常处于静止状态。 激活:在伤口愈合和炎症过程中被激活,伴随着基因表达的变化,如ACTA2和FAP的上调,可以命名为肌成纤维细胞。 肌成纤维细胞:是激活后的成纤维细胞,分泌促炎细胞因子,促进伤口愈合和组织修复。 凋亡:在成功愈合后,通常会经历凋亡,以恢复组织稳态。
肿瘤相关成纤维细胞(Cancer-associated Fibroblasts, CAF):
相似性:与肌成纤维细胞有许多相似之处。 肿瘤微环境(TME):在TME中扮演关键角色,参与肿瘤的发生、发展、转移和治疗抵抗。 功能:分泌生长因子、细胞因子和细胞外基质组分,影响肿瘤细胞行为。 免疫调节:通过与免疫细胞的相互作用,调节肿瘤微环境中的免疫反应。 双重作用:在TME中具有促进和抑制肿瘤生长的双重作用,被称为“双刃剑”。 治疗靶点:CAF的功能多样性使它们成为癌症治疗的潜在靶点。 异质性:CAF的异质性给研究和临床应用带来挑战。 分类:依赖于单细胞RNA测序等技术,但缺乏统一的分类标准,导致不同研究中对CAF的命名和定义存在差异。
总的来说,成纤维细胞在正常组织中发挥结构和修复作用,而CAF在肿瘤微环境中具有更复杂的功能,包括促进肿瘤生长和调节免疫反应。CAF的异质性和可塑性使得它们在癌症治疗中既是挑战也是机遇。
写在文末
如果你也想做单细胞转录组数据分析,最好是有自己的计算机资源哦,比如我们的2024的共享服务器交个朋友福利价仍然是800,而且还需要有基本的生物信息学基础,也可以看看我们的生物信息学马拉松授课(买一得五) ,你的生物信息学入门课。