单细胞分析全流程
一、数据准备:
这部分内容涉及到了单细胞上游相关知识; 如果有自测数据,那就涉及到送样前样本的获取,送样过程中样本的正确保存,送样后测序公司/机构的测序操作技术等一些因素控制,下机之后的数据上游分析流程质控。 如果是在线数据挖掘的,其实一般而言都不处理上游,最主要的原因是如果数据质量不好的话可以后面的开始常规分析的时候就进行过滤。
二、常规分析:
这一环节分为三个环节,分别是质控—聚类—分群 质控环节不需要过多纠结,因为这个没有绝对标准。 聚类环节需要观察数据的整合情况,其中harmony就是王者算法,几乎可以整合一切。但有时候也需要考虑是不是一定要整合。 分群环节是最关键的,这里涉及了许多生物学知识背景。一般采用先粗后细的分群方法,多维度验证(生物学上不同标志物的表达量点图,不同分辨率下簇与簇之间的差异基因分析,UMAP图上细胞群的数量大小形状和位置,不同条件下簇的细胞数量等等)。
三、探索分析:
笔者认为这一环节就需要围绕"问题”出发(临床/基础/科研),所有的探索分析都是为了探索/解决问题。 说难也难,说简单也简单,难得原因在于现在各种分析“工具”迭代很快层出不穷,简单的原因是“工具”其实是死的,学会了也就会用了。
探索性分析—细胞通讯分析
一、什么是细胞通讯
细胞发挥功能不是独立的,应是多种细胞之间进行相互作用的。笔者认为这里的相互作用简单的来说涉及多个维度:细胞自己作用于自己(自分泌/自我调节),同一类型细胞之间的相互作用(旁分泌/受配体直接作用,但由于即使是同一类型细胞也是存在异质性的),不同类型细胞之间的相互作用(旁分泌/受配体直接作用)
Cell-cell communication/interactions/chat 这三个都是同义词(PMID: 33969247 IF: 3.4Q1)。
2.1 a图cell-cell communication in tissue:同类型但不同细胞/不同类型细胞,受配体作用,作用导致的结果(产生下游改变/没有反应/由于空间太远不知道能不能反应)
2.2 b图inference in scRNA-seq:细胞大群,细胞大群中的亚群,单个细胞之间的作用分析
2.3 c图inference in spatial transcriptomics:结合了位置信息之后我们可以进一步探索/挖掘细胞间作用的情况。
二、细胞互作的几种分析逻辑:
一个配体—受体对介导的某一对细胞互作,如某种趋化因子-趋化因子受体; 若干个配体-受体对共同构成一个通路; 某两种细胞类型间的单个通路互作; 某两种细胞类型间的若干个通路互作; 任意两个细胞类型间(全部组合)的若干个通路互作;
三、常见的受配体互作数据库/细胞通讯软件
可以进去相应的网站去下载受配体数据库资料 常用细胞通讯互作软件:CellChat遥遥领先
四、Cellchat介绍
两个层次的分析:1)分子水平:受体-配体互作;2)细胞水平:细胞-细胞互作 单一数据集细胞通讯: 两个数据集细胞通讯:关键代码—读入不同的单细胞数据集并整合成一个数据集后整合分析
五、细胞通讯结果解读
单数据集结果
CellChat中会得到受配体作用的一个总表。笔者认为这部分内容完全可以自行提取然后个性化分析哦。关键点:不同配受体,不同细胞,作用概率及统计学意义关键点:作用数量和强度(两者一般是一致的,那么假设出现不一致或者所关心的内容变化趋势不同是不是可以重点分析?)关键点:有自己所关心的特定靶细胞类型关键点:以某一个通路开始看它在不同细胞类型中的强度情况,左图中可以看到MIF通路可能在inflam.TC中输出强度高,而在COL11A1+FIB细胞中输出强度较低。右图是incoming的信息,outgoing和incoming信息之间是存在互补的哦~ 一个细胞输出了信号,那么另外一定有一种细胞是能够接受信号的。关键点:可以看到不同细胞类型的outgoing或者incoming强度情况
关键点:具体通路在不同细胞中扮演的角色关键点:特定路通路在不同细胞间的作用情况(网络图和热图性质一样)关键点:一条通路中存在很多配受体通路,那么具体的配受体通路的贡献是怎么样的得到了关键的配受体对之后,可以再网络图中进一步观察关键点:确定了配套受体对之后还需要进一步观察表达量的情况, 关于这一点我们也能理解就是数量和强度之间的关系。虽然互作强度很高,但是要是表达量很低也许也不能发挥作用,但真实情况还是需要通过基础实验加以验证。(命名需要注意)组间比较结果关键点:命名规则(处理组 vs 对照组,处理组是分子,对照组是分母),仔细看读取数据的时候的顺序,ctrl是在前面,dise是在后面,这里面的逻辑跟差异分析中的组间命名是一样的。
关键点:红色代表互作变多/强,蓝色代表互作变少/弱关键点:展示细胞类型间互作的组间差异关键点:根据可视化结果去看哪些通路—细胞在不同组别中的差异情况,也要注意标题左边是ctrl,右边是dise,这里就可以看到THBS, IL1?这两个通路在不同组别中的incoming信息差异很大!关键点:左边是相对强度,右边是强度值,要综合考虑。如果发现差异通路,就可以提取通路基因集在进行后续分析,也可以做基础实验。
六、文献案例解析
找整体差异—细节分析 outgoing/incoming鉴定差异通路 空转证实FAP与SPP1的空间共定位表达,证明了FAP+Fib与SPP1+Macro存在了细胞互作 证明POSTN+CAF细胞和SPP1+Macro在空间上邻近,存在比较强的互作。
参考资料:
武汉大学/菲沙基因公开课 The landscape of cell-cell communication through single-cell transcriptomics. Curr Opin Syst Biol. 2021 Jun:26:12-23.
注:若对内容有疑惑或者有发现明确错误的朋友,请联系后台(欢迎交流)。更多内容可关注公众号:生信方舟
- END -