写在开头
久违的笔记整理系列,之前暑假学徒们在线下学习的时候,就无数次感叹他们笔记整理的详细,佩服于他们学习的积极性和好奇心。
前段时间也将近期一个学徒整理的笔记单细胞部分整理并分享出来了——#学徒笔记
最近也在尝试学习学徒们的好奇心和积极性,那就从笔记整理开始叭!
PS:本篇推文的来源推文均放在对应部分开头,有整理不详细的地方,还请自行阅读原推文!
细胞通讯分析的背景知识
数据库大全
数据库记录着参与细胞间通讯的相互作用蛋白列表,最常用的蛋白-蛋白的相互作用(PPI)是string数据库,但是
软件工具算法大全
主要是分成4种
基于差异分析 基于网络连通 基于表达量排序 基于张量等复杂的数学运算
具体原理及背景知识
细胞通讯是指一个信号产生细胞发出的信息通过介质(即配体)传递到另一个靶细胞并与其相应的受体相互作用,然后通过细胞信号转导产生靶细胞内一系列生理生化变化,最终表现为靶细胞整体的生物学效应的过程。
在生物体中,不同细胞类型和组织中的细胞之间相互作用(CCI)可以协调生物的发育。
CCI通过各种分子包括离子、代谢物、整联蛋白、受体、连接蛋白、结构蛋白、配体和细胞外基质的分泌蛋白来实现的。一些分子如激素、生长因子、趋化因子、细胞因子和神经递质等配体介导细胞之间的信息交流
细胞通讯类型
自分泌信号转导是指细胞内通讯,细胞分泌配体,这些配体用于通过同源受体诱导同一细胞上表达的那些分子的细胞应答。 -旁分泌细胞间的通讯不需要细胞间的接触,而是取决于信号分子在分泌后从一个细胞扩散到另一个细胞。 近分泌,即依赖于接触的细胞间通讯依赖于间隙连接或膜纳米管等其他结构,使信号分子直接在细胞之间传递,而不会分泌到细胞外。 内分泌细胞间的通讯代表细胞间的通讯,信号分子被分泌并通过诸如血浆的细胞外液传播很长一段距离。
细胞通讯简介
CCC背后的信号转导通常是由各种类型的蛋白质相互作用介导的,包括配体-受体,受体-受体和细胞外基质-受体的相互作用。 受体细胞通过同源受体触发下游信号传导,通常最终导致转录因子活性和基因表达发生改变,从而使这些表达发生改变的细胞进一步与其微环境相互作用
cellchat细胞通讯结果解读
单细胞转录组-cellchat细胞通讯结果解读
cellchat优势
CellChat相比其他软件,多了几个优点:(1)考虑多种subunits/ cofactors/ 聚合物等 (2)附带注释database并支持可视化结果图 (3)支持物种为人或者小鼠;
cellchat数据库介绍
CellChat细胞通讯数据库通过整合KEGG和文献,构建了细胞通讯数据库cellchatDB,数据库主要包括三部分:
旁分泌、自分泌的信号互作 胞外基质-受体互作 细胞直接互作 在这些直接互作的蛋白外,cellchat还将可溶性激动剂、拮抗剂等互作引子考虑在内。
细胞通讯原理
细胞通讯的可能性通过配受体基因表达量计算,如果配体是复合物,则取表达量的几何平均数,如果受体是复合物,则取表达量的几何平均数。对于受体配体的复合物来说,只要其中一个亚基的表达量为0,则认为这对受体配体对不起作用。 细胞通讯显著性计算采用置换检验来检验每个受体配体的显著性。置换检验的思路为随机置换细胞类群的标签,以此标签计算特定配体受体对的通讯可能性。置换的次数默认为100次,比较置换后的特定配体受体对通讯的可能性和真实的通讯可能性,计算显著性p值。
结果可视化方式
Hierarchical plot (层次聚类图)
Chord diagram (和弦图)
和弦图是环形关系图和桑基图结合的图表,它表示结构之间的依赖关系和强度,链接的线段不再是粗细统一的而是具有粗细比例的标识,且维度之间的长度也有表示。
Circle plot (环状图)
Bubble plot (气泡图)
可视化结果解读
细胞间受体配体可视化
统计不同细胞类群之间的受体-配体对数(interactions)和通讯强度(strength)。线越粗越互作越强,线的颜色和点的颜色相同表示点为source细胞(配体细胞,发出信号),另一端为target细胞(受体细胞,接受信号);
信号通路中分泌讯号对比展示
分泌传导物质的方式主要可以分为 autocrine(自分泌)/ paracrine(旁分泌)。每个颜色的点就代表一个细胞群,实心代表 Source、空心代表 Target,每一条线的粗细代表连结强度。
如果Source/ Target 颜色同,自己连到自己且无其他连出去的路径则代表是 autocrine,而若连到很多别的颜色则可能代表传导路径当中是 paracrine的形式传递物质(如果不易理解可参考Circel Plot,若有线绕回自己,则表示该群细胞是 autocrine)另外,例如信号通路 MIF 呈现结果如下图,左边的souce细胞类型为自己设置的感兴趣的细胞类群。
信号通路-细胞通讯相似性分析
通过细胞通讯网络的聚类分析相似性,细胞通讯网络的相似性,包括功能相似性和结构相似性,构建SNN(shared nearest neighbor),进行umap降维,最后进行聚类
下图图展示了根据功能相似性和结构相似性的聚类结果。途中不同的点表示不同的信号通路,距离越近表示具有相似的通讯网络;
细胞通讯角色识别
计算出细胞通讯的可能性后,可以判断特定细胞类群在细胞通讯网络中承担的角色。根据网络拓扑知识,我们可以将细胞类群承担的任务角色分为out-degree, in-degree, betweenness和information四种角色。
承担Out-degree角色的细胞类群被称为sender,这个角色被认为主要向外分泌配体传输信息,通过累加所有向外分泌配体的细胞通讯方式的可能性,得到sender的可能性(分数)。 承担in-degree角色的细胞类群被称为receiver,这个角色被认为主要接受受体刺激接受信息,通过累加所有接受配体刺激的细胞通讯方式的可能性,得到receiver的可能性(分数)。 承担betweenness角色的细胞类群被称为mediator,这个角色被认为作为gatekeeper控制两个细胞类群间通讯,通过flow betweenness score计算作为mediator的可能性(分数)。 承担Information角色的细胞类群被称为Influencer,这个角色被认为作为能够控制细胞通讯间的信息流,通过计算information centrality score作为mediator的可能性(分数)。
识别外发(Outgoing)或接收(Incoming)信号角色的细胞群,可以解答哪些信号对某些细胞组的外发或接收信号贡献最大的问题。以及哪些信号通路共享大小:
细胞通讯模式识别
Cellchat将每个受体配体对依据文献归类到二百多个个signaling pathways中,那么对于每个signaling pathway组成的通讯网络中有多对受体配体对。对于不同的signaling pathway组成细胞通讯网络,享有不同的通讯模式。
下图 Outgoing 表示计算出的 Cell-Cell communication 有向网路中做为 secreted 传出,Incoming 则是 target。左图可以看到 MYL 类型的细胞大部分具有一样的 pattern,而这些pattern 是因为这几个 TGFb/ IL1/ CSF/ TNF/ RANKL 可能有类似的输出;右图同理。
细胞通讯分析结果的解读
细胞通讯分析结果的解读——不同文章中的可视化及分析结果展示
PS:本部分推文笔记来源于生信菜鸟团#细胞通讯,推文中结果图片来源于infb数据细胞通讯分析可视化结果!
CellChat细胞通讯分析(一)
cellchat原理简介
无论是CellphoneDB还是CellChat,其基于单细胞转录组数据推断细胞间通讯,均是利用对受配体的先验知识,即基于当前已知的/已证明的互作的受配体对,对细胞与细胞之间的通讯情况进行建模,来预测细胞A和细胞B的受配体通讯情况,从而构建细胞间通讯网络。 CellChat采用了一种自上而下的方法,即从宏观角度为始,然后在信号机制上细化它的更详细的细节(微观解读),以识别不同层次的信号变化,包括细胞-细胞通讯的一般原则和功能失调的细胞群/信号通路/配体受体 CellChat回答三个角度的问题: 哪些细胞亚群和哪些细胞亚群互作(包括细胞A与自己本身,即为自分泌),互作的数量和强度; 细胞亚群A和细胞亚群B存在哪些通讯相关的通路,而本质上,配受体对应的基因构成了通讯通路; 回答亚群A和细胞亚群B存在哪些互作的配受体,其通讯概率多大。 CellChat 的github:https://github.com/sqjin/CellChat 数据库官网:http://www.cellchat.org/
cellChat进行细胞间通讯的推断与分析
CellChat对象的数据输入、处理和初始化
CellChat需要输入两部分数据:
一是单细胞的基因表达数据(例如用Seurat包的normalizeData后的data数据,表达矩阵储存在seurat.data@assays$RNA@data); 二是单细胞数据的meta.data,其中包含细胞类型的注释信息。
CellChatDB数据库是一个人工管理的数据库,包含了人类和小鼠的文献支持的配体-受体相互作用。
小鼠包含2021种已验证的分子相互作用,包括60%的分泌自分泌/旁分泌信号互作、21%的细胞外基质(ECM)受体互作和19%的细胞-细胞通讯互作。 人类包含1939个已验证的分子相互作用,包括61.8%的旁分泌/自分泌信号互作、21.7%的细胞外基质(ECM)受体互作和16.5%的细胞-细胞通讯互作。
细胞-细胞通讯网络的推断
cellChat通过给每个相互作用赋一个概率值并进行排列测试来推断生物意义的细胞-细胞通讯。CellChat通过整合基因表达和信号配体、受体及其辅助因子之间相互作用的先验知识,利用质量作用定律来建模细胞-细胞间通讯的概率。推断出的配体-受体对的数目显然取决于计算每个细胞组平均基因表达的方法。
CellChat通过汇总与每个信号通路相关的所有配体-受体相互作用的通讯概率,计算信号通路层面的通讯概率。
注意:推断出的每个配体-受体对的细胞间通讯网络和每个信号通路分别存储在' net '和' netP '插槽中。
CellChat细胞通讯(二)可视化篇
1.可视化的三个方向:
细胞层面的可视化,如细胞间与细胞间互作可视化; 通路层面的可视化,如A细胞与B细胞互作主要通过哪些通路; 基因,也就是配受体对的可视化,如A细胞与B细胞互作主要通过哪些受配体对。
CellChat为进一步的数据探索、分析和可视化提供了各种功能。
它提供了多种可视化cell-cell通讯网络的方法,包括hierarchical plot, circle plot, Chord diagram, 和bubble plot. 为推测网络的高阶信息提取和可视化提供便捷。例如,它可以预测细胞亚群的主要信号输入和输出,以及这些细胞群和信号如何协同工作。 它可以利用社会网络分析、模式识别和多种学习方法相结合的综合方法对推断的细胞-细胞通讯网络进行定量表征和比较。
2.CellChat的和弦图有两种展示方式:
一种是netVisual_chord_cell函数,用于可视化不同细胞亚群之间的细胞-细胞通讯(弦图中的每个扇区都是一个细胞亚群); 而netVisual_chord_gene函数,用于显示由多个配体-受体或信号通路(弦图中的每个扇区是一个配体、受体或信号通路)介导的细胞-细胞通讯。
3.计算每个配体-受体对L-R pairs对整个信号通路的贡献,并可视化单个配体-受体对介导的细胞-细胞通信
可视化单个配体-受体对介导的细胞-细胞通信,可以用Circle plot show L-R pairs,即可视化单个配体-受体对介导的细胞-细胞通信。作者提供了一个函数 extractEnrichedLR ,用于提取指定信号通路的所有L-R pairs和相关信号基因。
除了Circle plot可视化受配体对,还可以用和弦图,逻辑和可视化pathwaty是一样的,无非是多指定一个pairLR.use:
4.细胞-细胞通讯网络的系统分析
CellChat通过从图论、模式识别和空间信息流形学习中抽象出来的方法对网络进行定量测量:
CellChat可以确定主要的信号sources和targets,以及在给定的信号网络中使用来自网络分析的中心性度量的中介和影响者; CellChat利用模式识别方法,可以预测特定细胞类型的关键输入和输出信号,以及不同细胞类型之间的协调反应,利用模式识别方法; CellChat可以通过定义相似性度量和从功能和拓扑两方面执行多种学习来对信号通路进行分组; CellChat可以通过多网络的联合流形学习来勾画出保守的和上下文相关的信号通路。 CellChat通过计算每个细胞组的若干网络中心性度量,可以随时识别细胞间通信网络中的主要的发送者(senders)、接收者(receivers)、中介(mediators)和影响者(influencers)。
5.细胞通讯模式识别
Cellchat将每个受体配体对依据文献归类到二百多个个signaling pathways中,那么对于每个signaling pathway组成的通讯网络中有多对受体配体对。对于不同的signaling pathway组成细胞通讯网络,享有不同的通讯模式。
下图 Outgoing 表示计算出的 Cell-Cell communication 有向网路中做为 secreted 传出,Incoming 则是 target。
CellChat细胞通讯分析(三)多组别比较分析
比较细胞通讯相互作用的总数和相互作用的强度
为了判断细胞与细胞之间的通讯是否增强的问题,CellChat比较了不同生物条件下推断的细胞与细胞之间通讯网络的相互作用总数和相互作用强度。
不同细胞群间相互作用次数或相互作用强度的差异
使用热图更详细地显示相互作用的差异数量或相互作用强度。
顶部的彩色条形图表示热图(incoming, 传入信号)中显示的数值列的和。右边的彩色条形图表示一行值的和(outgoing, 输出信号)。在颜色条中,红色(或蓝色)表示与第一个数据集相比,第二个数据集中的信号增加(或减少)
差分网络分析只适用于成对数据集。如果有更多的数据集进行比较,我们可以直接显示每个数据集中任意两个细胞种群之间的交互次数或交互强度。
为了更好地控制跨不同数据集的推断网络的节点大小和边缘权值,我们计算每个cell组的最大cell数和跨所有数据集的最大交互次数(或交互权值)。
比较二维空间中的主要sources和targets
比较二维空间中传出和传入的交互强度,可以方便地识别在不同数据集之间发送或接收信号发生显著变化的细胞群。
还可以确定DC和BActives在CTRL和STIM之间的具体信号变化。识别与一个细胞组相关的信号变化:
比较与每个细胞群相关的传出outgoing(或传入incoming)信号
还可以比较两个数据集之间的传出(或传入)信号模式,从而识别出表现出不同信号模式的信号通路/配体受体。
我们可以将来自不同数据集的所有已识别的信号通路结合起来,从而并排比较它们,包括输出信号、输入信号以及通过将输出和输入信号聚合在一起的整体信号。注:rankNet也显示了整体信号的比较,但没有显示特定细胞群的信号强度。
上调和下调的信号配体受体对
可以比较一些细胞群与其他细胞群之间由配体-受体对介导的通讯概率。这可以通过在netVisual_bubble函数中设置比较来完成。 可以识别一个数据集中上调(增加)和下调(减少)的信号配体受体对。这可以通过指定max来完成。netVisual_bubble函数中的dataset和min.dataset。增加的信号意味着这些信号在一个数据集中比在另一个数据集中具有更高的通讯概率(强度) 通过差异表达分析识别功能失调信号——可以通过差异基因表达分析来识别上调和下调的信号配体受体对。具体来说,我们对每个细胞组进行了NL和LS两种生物学条件下的差异表达分析,然后根据发送者细胞和j接收者的配体的Foldchange得到上调和下调的信号:
使用层次图、圆圈图或者和弦图比较细胞间通讯
Edge color/weight, node color/size/shape:
在所有可视化图中,边缘颜色(Edge color)与the sources as sender一致,边缘权重(Edge weight)与交互强度(interaction strength)成正比。边线越粗,信号越强; 在Hierarchy图和Circle图中,圆的大小与每个单元组中的细胞数量成正比; 在Hierarchy图中,实心圆和开放圆分别代表源和目标; 在Chord图中,内部较细的条颜色表示从对应的外部条接收信号的target。内部bar图的大小与target接收到的信号强度成正比。这样的内部bar图有助于解释复杂的和弦图。
利用和弦图,CellChat提供了netVisual_chord_cell和netVisual_chord_gene两个函数,用于可视化不同目的和不同层次的cell-cell通讯。netVisual_chord_cell用于可视化不同细胞组之间的细胞-细胞通讯(弦图中的每个扇区是一个细胞组),netVisual_chord_gene用于可视化多个配体-受体或信号通路介导的细胞-细胞通讯(弦图中的每个扇区是一个配体、受体或信号通路)。