如何融合基因表达与空间信息?——空间转录组进阶指南

文摘   科学   2024-11-29 18:01   上海  




    小伙伴们大家好!在上一期公众号文章《单细胞数据能解答哪些生物学问题?——进阶单细胞分析》中,我们详细介绍了单细胞测序中常见的几种高级分析方法。文章发布后,收到不少小伙伴的留言提问:“既然说了单细胞,那空间转录呢?有哪些高级分析可以开展?”应大家的热情需求,今天我们就来聊一聊空间转录测序中的高级分析。

    空间转录组测序(Spatial Transcriptomics,ST)作为一种结合空间信息和基因表达数据的测序技术,与传统的单细胞测序不同,空转在揭示基因表达差异的同时,还能保留细胞在组织中的原始空间位置信息。这种技术令科学家能够在组织切片的“地图”上精确定位基因的表达分布,帮助研究者更好地理解细胞在微环境中的功能、相互作用以及组织的空间结构,其技术特性使得空转广泛应用于癌症微环境研究、发育生物学、神经科学和组织再生等领域,为揭示复杂生物学过程提供了全新的视角。

图1. 空间转录组测序流程图(Rao A,et al,2021)

    本期公众号将围绕空转中的几项核心高级分析展开,例如细胞类型和功能区域的识别、空间配体-受体互作分析、基因共表达模块的空间分布解析、以及肿瘤微环境等。我们还会结合实际方法,带大家领略这些技术如何帮助解答复杂的生物学问题。






[空间细胞注释——如何在空间上精准定位细胞类型?]

    与单细胞测序类似,空转测序项目中细胞类型的注释也是关键的一步。然而,不同于单细胞测序具备单细胞级别的高分辨率,空转的分辨率往往更粗略,通常以捕获点(spot)为单位。这一差异使得空转的细胞注释成为一个颇具挑战性的难题。那么,在分辨率低于单细胞的情况下,如何实现准确的细胞类型注释呢?

    目前,主流的空间转录组注释方法主要分为以下两类:

1)整合单细胞数据

    当研究对象的同类组织中已有单细胞测序数据时,可以将单细胞数据中的注释特征去卷积/映射到空间转录组数据中。这种方法依赖于单细胞数据的高分辨率注释,借助算法将细胞类型信息“传递”到空间转录组spot上,从而实现较为准确的注释。常用方法包括SPOTlight、RCTD、Cell2location和MIA等。例如,SPOTlight能够通过稀疏非负矩阵分解(NMF)分解复杂组织的细胞类型;RCTD(Robust Cell Type Decomposition)通过贝叶斯框架进行细胞类型解码,从而更好地适应噪声较高的空间数据;Cell2location基于贝叶斯推断方法,实现多细胞类型的精确空间定位;MIA(Multi-Omics Integration for spatial transcriptomics)通过计算组织区域的差异基因与单细胞数据中细胞类型差异基因的重叠,来推断特定区域中细胞类型的富集情况。

图2. 以2套不同的SC数据为参考,使用 SPOTlight 去卷积法计算每个spot中各种细胞类型的比例(Zheqi Liu,et al,2024)

2)基于marker基因的推断

    在缺乏匹配单细胞数据的情况下,可以利用已知的细胞类型marker基因,通过其在空转中的表达分布,结合spot在组织切片中的空间位置信息,推断spot的潜在细胞类型。这种方法需要对研究对象的组织结构和细胞特征有较深入的了解,以确保注释的可靠性。此时,可以借助ssGSEA或Seurat中的AddModuleScore函数等工具,对每个spot进行评分,从而推测细胞类型的空间分布。此外,也可以使用类似于单细胞注释的策略,通过findmarker计算每个cluster的top marker基因,并利用marker基因的点图或小提琴图,结合背景知识对cluster进行注释。

图3. 使用AddModuleScore函数定义目标细胞群(Ji AL,et al,2020)

[空间CNV分析——发现基因组变异的空间分布规律]

    空间转录组学中,细胞拷贝数变异(Copy Number Variation, CNV)分析是一项重要的研究内容,尤其在研究癌症等异质性较高的组织时具有显著意义。常用的空间CNV检测方法包括利用单细胞转录组中的参考数据来计算表达偏差的加权值,从而推测出潜在的CNV区域。例如,inferCNV 和 CopyKAT通过将空间转录组数据中的表达谱与正常样本的表达基准进行比较,从表达水平的偏离中推断出可能的CNV,并进一步区分恶性和非恶性细胞。

图4. 使用inferCNV推断肿瘤比例(Ren Y,et al,2023)

[空间拟时序分析——在组织中追踪动态发育的时间轨迹]

    空间拟时序分析(Spatial Pseudotime Analysis)在空间转录组学中用于推断细胞在组织中的发育或疾病进展轨迹。利用Monocle2、stLearn等工具,将传统的拟时序分析拓展到空间维度,结合细胞的空间位置与转录特征,重建细胞状态在空间中的动态变化。空间拟时序分析通过分析基因表达的渐变模式,揭示了细胞在特定空间区域内的分化进程或病理变化路径,为组织样本中的细胞状态转变提供了时空信息。

图5. 将拟时间映射到空间上(Saul Det al,2023)

[空间通讯分析——揭示细胞间相互作用的空间模式]

    空间通讯分析(Spatial Communication Analysis)用于探究组织内不同细胞类型间的空间定位通讯模式。通过识别细胞之间的配体-受体相互作用,这类分析能够在特定空间环境中揭示细胞的调控关系,帮助理解发育、免疫反应及病变过程中细胞间的相互作用。结合CellPhoneDB、stLearn和CellChat-v2等工具,空间通讯分析可以精确定位细胞通讯的区域特异性,绘制出组织微环境中的细胞通讯网络,为疾病机制研究和靶向治疗提供重要参考。

图6. 使用CellChat-v2识别信号通路(Jin S,et al,2024)


[空间肿瘤微环境分析——探索肿瘤微环境的空间结构与功能]

    在肿瘤研究中,空间微环境的解析对理解肿瘤进展和治疗靶点识别至关重要。利用Cottrazm可以对肿瘤边界区域的空间微环境进行深入分析。Cottrazm通过三大模块实现肿瘤空间微环境的解析:首先,BoundaryDefine模块确定恶性和非恶性细胞之间的肿瘤边界,从而精确定位边缘区域;其次,SpatialDecon模块整合单细胞和空间转录组学数据,采用去卷积方法推断各空间点的细胞组成,以揭示不同区域的细胞构成;最后,SpatialRecon模块在sub-spot水平重建细胞类型特异的基因表达矩阵,进一步细化空间位置上的基因表达特征。除BoundaryDefine模块外,其余模块均需要结合与空间转录组匹配的单细胞数据。

图7. Cottrazm识别不同肿瘤样本边界(Xun Z,et al,2023)


[加权基因共表达网络分析——挖掘空间共表达模块与关键基因]

    加权基因共表达网络分析(Weighted Gene Co-expression Network Analysis, WGCNA)是一种用于探究基因表达模式的系统生物学方法,能够识别基因间的协同表达关系。hdWGCNA(high dimensional WGCNA,高纬度 WGCNA)是WGCNA的增强版,适用于高维数据的基因共表达网络构建。其关键在于采用加权表达相关性,精确构建基因间的共表达网络。

    首先,hdWGCNA基于基因表达的加权相关性构建网络,通过层级聚类识别出不同的基因模块。每个模块的聚类结果以聚类树的分枝和颜色标识,代表不同的基因集。如果有表型信息,可进一步计算基因模块与表型间的相关性,从而鉴定出与性状相关的模块,帮助识别潜在的功能性基因集。在系统层面上,hdWGCNA还可用于研究不同模块之间的关系,通过构建模块互作网络以揭示全局互作情况。对特定模块中具有关键作用的驱动基因进行筛选,有助于推断相关的未知基因功能。最后,通过导出拓扑重叠矩阵(TOM),为研究复杂生物系统中的基因互作提供可视化支持。

图8. hdWGCNA构建共表达网络

图9. hdWGCNA结果可视化


[空间GSVA分析——空间特异性的通路富集功能解析]

    在空间转录组学中, GSVA(Gene Set Variation Analysis)是一种关键的基因集富集分析方法,用于评估基因集合在特定样本或空间区域中的活性水平。通过将基因表达数据与预定义的基因集合(如信号通路或功能基因集)结合,GSVA 能够揭示不同空间位置或细胞类型之间的生物学差异。此外,GSVA 还可以揭示不同空间区域中基因表达的异质性,帮助研究组织的结构复杂性及其功能分区。在疾病研究中,GSVA 能够识别与病理状态相关的关键通路,提供关于肿瘤微环境或其他疾病机制的深刻见解。


图10. GSVA score热图(Wang Y,et al,2023)

[参考文献]

1.    Rao A, Barkley D, França GS, Yanai I. Exploring tissue architecture using spatial transcriptomics. Nature. 2021 Aug;596(7871):211-220. 

2.    Elosua-Bayes M, Nieto P, Mereu E, Gut I, Heyn H. SPOTlight: seeded NMF regression to deconvolute spatial transcriptomics spots with single-cell transcriptomes. Nucleic Acids Res. 2021 May 21;49(9):e50. 

3.    Liu Z, Zhang Z, Zhang Y, Zhou W, Zhang X, Peng C, Ji T, Zou X, Zhang Z, Ren Z. Spatial transcriptomics reveals that metabolic characteristics define the tumor immunosuppression microenvironment via iCAF transformation in oral squamous cell carcinoma. Int J Oral Sci. 2024 Jan 30;16(1):9.

4.    Ren, Y., Huang, Z., Zhou, L. et al. Spatial transcriptomics reveals niche-specific enrichment and vulnerabilities of radial glial stem-like cells in malignant gliomas. Nat Commun 14, 1028 (2023).

5.    Jin S, Plikus MV, Nie Q. CellChat for systematic analysis of cell-cell communication from single-cell transcriptomics. Nat Protoc. 2024 Sep 16. 

6.    Xun, Z., Ding, X., Zhang, Y. et al. Reconstruction of the tumor spatial microenvironment along the malignant-boundary-nonmalignant axis. Nat Commun 14, 933 (2023).

7.    Wang, Y., Liu, B., Min, Q. et al. Spatial transcriptomics delineates molecular features and cellular plasticity in lung adenocarcinoma progression. Cell Discov 9, 96 (2023).

8.    Saul D, Kosinsky RL. Spatial transcriptomics herald a new era of transcriptome research. Clin Transl Med. 2023 May.

9.    Ji AL, Rubin AJ, Thrane K, Jiang S, Reynolds DL, Meyers RM, Guo MG, George BM, Mollbrink A, Bergenstråhle J, Larsson L, Bai Y, Zhu B, Bhaduri A, Meyers JM, Rovira-Clavé X, Hollmig ST, Aasi SZ, Nolan GP, Lundeberg J, Khavari PA. Multimodal Analysis of Composition and Spatial Architecture in Human Squamous Cell Carcinoma. Cell. 2020 Jul 23;182(2):497-514.e22.

总结




       空间转录组测序作为一项前沿技术,为解析复杂组织中的基因表达和空间结构提供了强有力的工具,从细胞注释到肿瘤微环境解析,再到功能富集分析,各类高级分析方法正不断推动生物与医学研究的突破。纽科生物致力于为科研工作者提供专业的技术支持,包括单细胞与空间转录组数据分析服务,帮助您更高效地解答科学问题,加速研究进展。如需了解更多,请联系我们,共同探索科研新前沿!





关于我们

纽科生物提供专业的生物信息学数据分析和高通量测序服务。目前,公司已经和四川大学、复旦大学、上海交通大学、中山医院、华中科技大学等多所医院、高校的研究团队建立了长期良好的合作关系,提供高品质的数据分析和测序服务,帮助客户在European Heart JournalCirculation ResearchNature Communications等多个著名杂志期刊上发表高水平科研文章,欢迎各位老师前来咨询。

纽科生物
提供优质的高通量测序和生物信息学个性化数据分析服务,http://www.RNAstar.com
 最新文章