前面我们分享了各个组织器官的特色上皮细胞亚群以及其对应的标记基因列表,这个主要是因为不同器官都有可能会发展为癌症,而肿瘤样品里面往往是正常的上皮细胞和恶性的上皮细胞混合的,分析的时候需要根据拷贝数等特性拆开它们,然后正常的上皮细胞是可以有生物学名字的 :
但是我个人的时间精力确实是有限,不可能在每个生物学细分领域都精通,所以也是整理了一个大概,大家可以粗浅的参考,更深入的细分各个器官组织的上皮单细胞亚群其实就需要认真看各种文献和综述。而且如果是非肿瘤领域,也是可以自己看综述和相关文章,慢慢整理。比如接下来的:心脏的单细胞亚群对应的标记基因
可以参考重庆那边三军医大的科研团队,在2023年1月的文章:《Single-cell RNA sequencing reveals a mechanism underlying the susceptibility of the left atrial appendage to intracardiac thrombogenesis during atrial fibrillation》,给出来了如下所示的单细胞亚群,虽然是有一点点小瑕疵,比如已经是有了淋巴细胞还继续命名一个b细胞,其实b细胞是淋巴细胞的子集 ,可能这个地方直接叫做是t淋巴细胞会好一点:
这些单细胞亚群在生物学上具有重要的意义,它们代表了不同类型的细胞,这些细胞在组织结构、功能和疾病过程中扮演着关键角色。以下是对这些单细胞亚群的生物学意义的介绍:
心肌细胞(Cardiomyocytes):
心肌细胞是心脏的主要细胞类型,负责心脏的收缩和泵血功能。它们表达的ACTC1、MYL7和TNNT2等基因与心脏的收缩机制密切相关。
成纤维细胞(Fibroblasts):
成纤维细胞是结缔组织中的主要细胞类型,参与细胞外基质的产生和维护。它们在伤口愈合、组织修复和纤维化过程中起着核心作用。
内皮细胞(Endothelial Cells, ECs):
内皮细胞构成血管的内衬,参与血液和淋巴循环。VWF和CD36等基因与血管的完整性和功能密切相关。
周细胞(Pericytes):
周细胞是位于血管周围的一种特殊细胞类型,参与血管稳定性和修复。RGS5和ABCC9等基因与周细胞的功能有关。
平滑肌细胞(Smooth Muscle Cells, SMCs):
平滑肌细胞主要存在于血管壁,负责血管的收缩和舒张。ACTA2、MYH11和MYLK等基因与平滑肌的收缩功能相关。
巨噬细胞(Macrophages):
巨噬细胞是免疫系统的一部分,参与炎症反应和病原体清除。CD163和C1QA等基因与巨噬细胞的免疫调节功能有关。
淋巴细胞(Lymphocytes):
淋巴细胞包括T细胞和B细胞,是适应性免疫系统的关键组成部分。NKG7、CCL5和IL7R等基因与淋巴细胞的免疫应答功能有关。
单核细胞(Monocytes):
单核细胞是血液中的一种免疫细胞,可以分化成巨噬细胞或其他免疫细胞。S100A8等基因与单核细胞的免疫监视功能有关。
B细胞(B Cells):
B细胞是适应性免疫系统的一部分,负责产生抗体以对抗病原体。CD69和CD79A等基因与B细胞的活化和抗体产生有关。
间皮细胞(Mesothelial Cells):
间皮细胞覆盖在体腔表面,如胸膜和腹膜。MSLN等基因与间皮细胞的保护和修复功能有关。
这些单细胞亚群的标记基因不仅有助于识别和区分不同的细胞类型,还可以揭示它们在健康和疾病状态下的生物学功能和相互作用。通过研究这些亚群,科学家可以更好地理解组织和器官的复杂性,以及它们在疾病发展中的作用。
这些单细胞亚群对应的基因列表,在文章里面有写出来,简单的复制文献里面的内容然后粘贴给人工智能大模型(https://kimi.moonshot.cn/chat ),就可以得到如下所示的代码:
接下来就可以测试这些单细胞亚群对应的基因的有效性,如下所示的代码 :
# 创建一个包含单细胞亚群及其标记基因的向量
cell_type_markers <- list(
Cardiomyocytes = c("ACTC1", "MYL7", "TNNT2"),
Fibroblasts = c("DCN", "GSN", "COL1A2"),
EndothelialCells = c("VWF", "CD36"),
Pericytes = c("RGS5", "ABCC9"),
SmoothMuscleCells = c("ACTA2", "MYH11", "MYLK"),
Macrophages = c("CD163", "C1QA"),
Lymphocytes = c("NKG7", "CCL5", "IL7R"),
Monocytes = c("S100A8"),
BCells = c("CD69", "CD79A"),
MesothelialCells = c("MSLN")
)
# 打印向量以确认
print(cell_type_markers)
th= theme(axis.text.x = element_text(angle = 45, vjust = 0.5, hjust=0.5))
p2 = DotPlot( sce.all.int, features = cell_type_markers,
group.by = 'RNA_snn_res.0.1') + th
p2
ggsave('heart-0.1.pdf',width=12)
p2 = DotPlot( sce.all.int, features = cell_type_markers,
group.by = 'RNA_snn_res.0.5') + th
p2
ggsave('heart-0.5.pdf',width=12,height = 8)
p2 = DotPlot( sce.all.int, features = cell_type_markers,
group.by = 'RNA_snn_res.0.8') + th
p2
ggsave('heart-0.8.pdf',width=12,height = 12)
可以看到,这些基因的特异性还是蛮好的,大家可以把这个代码保存下来,下次在其它心脏相关的单细胞转录组数据集就可以应用啦 :
但这个时候仍然是需要依据上面的图来进行肉眼识别亚群的对应关系。
而且也不能说就看一个文献,心脏领域的单细胞转录组文章也是非常多的,比如美国华盛顿大学医学院的研究团队在2022年3月发表的:《Single-cell transcriptomics reveals cell-type- specific diversification in human heart failure》,给出来的心脏的单细胞亚群对应的标记基因也具有参考性:
写在文末
如果你也想做单细胞转录组数据分析,最好是有自己的计算机资源哦,比如我们的2024的共享服务器交个朋友福利价仍然是800,而且还需要有基本的生物信息学基础,也可以看看我们的生物信息学马拉松授课(买一得五) ,你的生物信息学入门课 。