nature methods:从单细胞和空间转录组学推断模式驱动的细胞间流动

文摘   2024-10-17 18:01   江苏  

FlowSig 是一种新方法,利用图形因果建模和条件独立性从单细胞RNA测序(scRNA-seq)和空间转录组学(ST)数据中推断细胞间通信驱动的信息流。

通过实验皮质器官数据和数学模型生成的合成数据进行基准测试,FlowSig成功捕捉了胰腺胰岛的旁分泌信号变化、COVID-19严重程度增加引起的细胞间流转变以及小鼠胚胎发育中的形态发生素驱动的激活-抑制模式。

前言

细胞通过生化信号进行通信,驱动生物过程。单细胞RNA测序(scRNA-seq)和空间转录组学(ST)提供高维基因表达数据,现有方法主要提取基因表达模块(GEMs)或推断配体-受体相互作用网络。FlowSig方法通过图形因果建模条件独立性测试,识别由细胞内过程介导的配体-受体相互作用及其驱动的细胞间信号流,构建部分有向无环图(CPDAG)。FlowSig应用于非空间scRNA-seq和ST数据,通过差异表达分析和条件不变性测试提高准确性。验证包括模拟数据和皮质器官实验数据,应用案例包括胰腺胰岛刺激响应、COVID-19严重度影响及小鼠胚胎发育中的激活-抑制模式。

主要结果

FlowSig通过基因表达测量和细胞间通信推断结果,学习描述定向依赖的细胞间流(图1a)。使用图形因果模型,节点代表流动变量,通过条件独立性测试和UT-IGSP算法学习有向图。对非空间scRNA-seq数据,需克服无法直接测量细胞接收信号的问题,通过比较对照组和扰动组(如健康与疾病),并利用OmniPath数据库提取下游TF目标来量化信号流入(图1b)。对ST数据,使用COMMOT方法空间约束信号流入,并采用贪婪稀疏算法(GSP)分析(图1c)。

FlowSig的合成验证

FlowSig通过模拟数据验证其准确性,考虑三种场景:SHH信号诱导的单向流(图2a)、SHH诱导的组织模式(图2b)及SHH与BMP4竞争(图2c)。验证两个核心假设:准确测量流入信号和包含扰动数据提高推断准确性。通过比较结合受体和总受体表达,发现使用结合受体提高真阴性率(TNR),尤其对复杂流(图2e,f)。引入扰动数据减少TNR变异,减少假阳性发现(图2d–f)。

基准测试 FlowSig 与多细胞表征方法

FlowSig与多种方法(DIALOGUE、scITD、MOFAcellular、MOFAtalk、MultiNicheNet、Tensor-cell2cell)及CellChat输出对比,使用Kang等人的狼疮患者PBMC scRNA-seq数据。FlowSig从CellChat的6,886个潜在关系中推断出44个细胞间流,而其他方法识别的多细胞程序或因子与FlowSig推断的信号流有部分重叠。例如,DIALOGUE识别的MCPs涉及CD14+单核细胞和CD8+ T细胞(补充图2),scITD和MOFAcellular识别的因子富集于FlowSig的信号流出变量(补充图3、4),Tensor-cell2cell和MultiNicheNet识别的受体和配体相互作用与FlowSig结果一致(补充图5、6)。FlowSig在不同输入方法下仍保持稳健性。

使用皮质类器官系统验证FlowSig

FlowSig应用于皮质发育类器官模型scRNA-seq数据,分析FGF和BMP信号驱动的模式形成。类器官在D18和D35采集,D35视为受FGF和BMP影响的“扰动”数据。FlowSig识别26个差异流入信号和16个差异流出信号(图3a,b),构建20个GEMs(图3c)。FGF、MK、PTN和NRG是主要细胞间流驱动因素,FGF流入驱动多个信号流出(图3d)。EOMES和PAX6/NR2F1可能是FGF和BMP流入的调控候选(图3e)。通过激活FGF和BMP信号验证,RT-qPCR结果显示EOMES、PAX6和NR2F1表达变化(图3f,g),证实FlowSig准确捕捉细胞间流驱动因素。

FlowSig识别刺激引起的细胞间流动变化

FlowSig分析IFN-γ刺激的人胰腺胰岛scRNA-seq数据,构建10个GEMs(图4a)。IFN-γ增加FGF、IL-6、MIF、MDK和SST信号流入(图4b),改变GCG、INHBA等信号流出(图4c)。FlowSig识别FGF、IL-6、MDK和SST为主要细胞间流驱动因素(图4d)。GEMs在不同细胞簇中富集,提示细胞类型驱动细胞间流。ID1、NR1D1、TFF3和ZNF419可能是中介TFs。IFN-γ刺激下,构建上调和下调信号流出网络(图4e,f),GEM-3在上调网络中特异存在,提示其在α细胞中驱动GCG和NAMPT流出。其他信号和GEMs在两网络中共享,提示双重调控角色。

FlowSig利用多种扰动来发现疾病驱动的变化

FlowSig分析健康和不同程度COVID-19患者的支气管肺泡灌洗液(BALF)细胞scRNA-seq数据。识别各COVID-19组特异性差异流入和流出信号(图5c)。严重COVID-19中CCL和CXCL等炎症趋化因子表达上调。FlowSig揭示随COVID-19严重程度增加,信号流入和调控GEMs数量减少(图5d-f)。健康至中度COVID-19转变伴随上皮细胞、浆细胞、T细胞和巨噬细胞间流下调,肥大细胞间流上调。信号流入和GEMs在不同条件下的共享情况显示,健康与中度COVID-19组共享最多(图5g,h)。结果表明,COVID-19严重程度增加与调控细胞间流入减少和炎症趋化因子流出增加相关。

FlowSig识别空间细胞间流动的调节因子

FlowSig分析小鼠胚胎发育E9.5阶段的Stereo-seq空间数据,构建20个空间解析GEMs(图6a)。识别Shh流出高度空间变异,推断其上游驱动因子(Bmp4、Cxcl12等)和下游靶标(图6b,c)。通过随机森林和pyGAM模型,识别Shh流出的上游TFs(Foxa2、Foxp2等)和r-Shh流入的下游TFs(Barhl1、Nkx2-1等)(图6d,e)。发现Shh与Wnt5a存在双向调控:Shh通过Foxa2自我放大并驱动Wnt5a流出,r-Wnt5a通过Myc抑制Shh流出(图6f-h)。此模块类似激活-抑制系统,可能生成图灵模式,驱动细胞命运模式形成。

讨论与总结

FlowSig用于推断通过协调GEMs相互依赖的细胞间通信活动,结合图形因果建模和因果结构学习处理scRNA-seq和ST数据。FlowSig补充了多细胞表征程序构建方法(如DIALOGUE、MOFAcellular、scITD、MOFAtalk、Tensor-cell2cell),与MultiNicheNet相似但直接从数据确定依赖关系。使用CellChat和COMMOT构建信号流入和流出变量,可选其他通信方法(如CellPhoneDB、LIANA)和GEM构建方法(如cNMF)。FlowSig采用“粗粒度”细胞间流,假设GEMs包含调控TFs,但未精确识别GRNs,可结合SCENIC或开放染色质数据。FlowSig局限性包括需大样本量、假设线性高斯分布、变量增多导致假阳性、静态图无法捕捉动态流,未来需扩展至时空流分析。

文献来源:

Almet, A.A.; Tsai, Y.-C.; Watanabe, M.; Nie, Q. Inferring Pattern-Driving Intercellular Flows from Single-Cell and Spatial Transcriptomics. Nat Methods 2024, 21, 1806–1817, doi:10.1038/s41592-024-02380-w.

智慧识竹
和小周周一起学习新知识,探索更多的未知世界吧
 最新文章