空间分辨转录组学(SRT)技术通过结合空间信息测量基因表达谱,使得研究组织内转录组异质性成为可能。然而,这些技术(如10x Visium和Slide-seqV2)的一大局限性在于,基于测序的SRT技术只能从每个spot的细胞混合物中收集基因表达的平均值,这些细胞可能包含不同的细胞类型。这些技术无法在单细胞空间分辨率下捕获全转录组尺度的数据。组织内多个细胞类型的空间组织在很大程度上解释了表达变异,并主导了生物学相互作用和功能。因此,在SRT研究中,进行细胞类型解卷积并推断细胞类型的空间异质性成为理解复杂组织结构的关键分析任务。
为了克服SRT技术的局限性,提出了各种解卷积方法。这些方法在分析具有清晰定义离散细胞类型的scRNA-seq数据时取得了良好的结果。然而,这些方法在解卷积过程中没有利用scRNA-seq数据中固有的细胞相似性关系,因此不适用于细胞难以轻易分为离散类型或亚型的情境。此外,大多数现有方法在解卷积每个spot的细胞类型组成时,都是独立进行的,忽视了spot之间的功能相似性。这些方法使得解卷积结果更容易受到各种技术限制(如数据稀疏性和噪声)的影响。事实上,spot之间的相似性关系可能包含对解卷积极为宝贵的信息。直观地说,组织内功能相似的spot之间的细胞类型组成可能比那些差异较大的spot更为相似。spot之间的相似性不仅体现在转录组数据中,还体现在SRT数据的其他模态(即组织学图像和空间位置)中,这一点在一些空间域检测的工作中得到了验证。因此,整合SRT的多模态数据并利用spot之间的相似性关系来提高解卷积的准确性和生物学解释仍然是一个重要的挑战。
鉴于此,中国科学院分子细胞科学卓越创新中心和国科大杭州高等研究院陈洛南研究员团队在Small Methods期刊上提出一种新的空间感知领域适应方法(SpaDA: Spatially Aware Domain Adaptation),能够整合来自SRT的多模态数据(即转录组学、组织学图像和空间位置),准确估计细胞类型的空间分布。SpaDA首先采用自表征变分自编码器,分别从空间多模态SRT数据和单细胞RNA测序(scRNA-seq)数据中学习空间图表征。然后,它对这些图表征之间的全局和空间局部分布进行对齐,以增强聚类分配的一致性。接着,SpaDA将细胞类型注释信息在spot和细胞之间的相似性图上进行传递,从而有效地估计每个spot的细胞类型组成。值得注意的是,SpaDA提供的空间图表征不仅通过整合多模态SRT数据修正了低质量的基因表达数据,还利用spot之间的功能相似性来增强细胞类型解卷积的性能(图1)。
图1 SpaDA的示意图概览。 (A) SpaDA模型的概念设计。利用带注释细胞类型的scRNA-seq数据作为源数据,SpaDA通过自表征变分自编码器和深度空间分布对齐预测来自多模态SRT数据的spot的细胞类型组成。该框架实现了复杂空间和分子数据特征的精确整合与分析。(B) 学习和对齐图表征。SpaDA使用自表征变分自编码器分别从scRNA-seq数据中学习图表征,并从空间多模态SRT数据中学习空间图表征。为了根据聚类分配整合这些表征,SpaDA在表征学习过程中采用了创新的深度空间分布对齐策略。此分布对齐确保了一致性并提高了跨不同数据模态的聚类结果的准确性。(C) SpaDA的生物学应用。SpaDA的应用包括空间域和细胞类型的识别、细胞类型解卷积和数据去噪。这些功能使SpaDA成为探索和理解组织环境中复杂相互作用的多功能工具,提供对细胞成分空间组织的深入洞察。
该文章全面评估结果表明,SpaDA在细胞类型解卷积和从不同scRNA-seq协议以及10x Visium和Slide-seq SRT平台中识别细胞类型和空间域方面,优于现有的最新方法。当应用于scRNA-seq和单核RNA测序(snRNA-seq)小脑数据集时,SpaDA展现了卓越的判别性能,并适用于跨不同测序平台的标签转移(图2)。同样,在应用于10x Visium小鼠大脑数据集时,SpaDA成功地进行了脑结构的深入研究,描绘了功能区域及其相关细胞类型。此外,SpaDA已经扩展到处理Slide-seqV2小鼠小脑数据集,通过细胞类型解卷积敏感地识别空间共定位的细胞类型,如Bergmann细胞和Purkinje细胞,以及关键标记基因(图3)。总之,这些结果确立了SpaDA作为一个新型强大且多功能的工具,用于解卷积多模态SRT数据。
图2 SpaDA在snRNA-seq和scRNA-seq小脑数据集之间转移生物学信息。真实与预测的细胞类型之间的混淆矩阵,展示了通过从snRNA-seq学习并在scRNA-seq数据上进行预测(A),或反向操作(B)的结果。颜色表示x轴上预测为y轴上细胞类型的细胞类型比例。基于SpaDA判别空间的UMAP可视化,在预测集中的细胞投影:scRNA-seq数据(C)和snRNA-seq数据(D)。颜色代表原始文献提供的细胞注释。(E) 对数转化后的y轴表示落在每个相关性区间(即x轴)的细胞数量。虚线标记了相关性为0.90的点。前50个判别向量(与PCA的前50个主成分相比)在区分最远的细胞群体(F)或邻近细胞群体(F)方面的判别能力。
图3 SpaDA在Slide-seq小脑数据中识别细胞类型。 (A) 使用来自Allen脑图谱和Cable等人先前研究的区域结构图,直接比较并展示解卷积结果。(B) 每个点上的主导细胞类型根据SpaDA和RCTD的解卷积结果着色。(C) SpaDA识别的小脑四个皮层结构。(D) 相应细胞类型特异性标记基因的表达水平显示在每个空间位置上。(E) 条形图展示了基于标记基因的平均基因表达水平,在四个皮层结构上不同解卷积方法的比较结果。
总之,SpaDA的提出不仅有效地学习反映数据固有结构的图表征,识别scRNA-seq数据上的细胞类型和多模态SRT数据上的空间域,还利用细胞和spot之间的相似性确保细胞类型空间分布预测的准确性,为未来的空间转录组学和疾病研究提供了强大支持。这一方法有望在组织异质性研究、肿瘤微环境分析以及临床医学中的复杂组织病理分析中发挥更大作用。中国科学院分子细胞科学卓越创新中心博士生王乐群为第一作者,国科大杭州高等研究院陈洛南首席教授、张传超助理研究员及华中农业大学史倩倩副教授为通讯作者。
论文信息:
Spatially Aware Domain Adaptation Enables Cell Type Deconvolution from Multi-Modal Spatially Resolved Transcriptomics
Lequn Wang, Xiaosheng Bai, Chuanchao Zhang*, Qianqian Shi*, Luonan Chen*
Small Methods
DOI: 10.1002/smtd.202401163
点击左下角「阅读原文」,查看该论文原文。
Small
Methods
期刊简介
Wiley旗下Small Methods期刊是创刊于2017年的高水平综合期刊。期刊集中收录有关纳微米尺度材料的实验技术进展,涉及领域包括材料学、生物医药、化学、物理学等合成、表征、应用技术。
WILEY
MaterialsViews
Wiley旗下材料科学类期刊官方微信平台
推送材料科研资讯|访谈材料大咖新秀
分享撰稿投稿经验|关注最新招聘信息
点击“分享”,给我们一点鼓励吧~