在生物学研究中,了解细胞的空间配置及其相关表达特征对于理解细胞功能至关重要。尽管空间转录组技术(Spatial Transcriptome, 简称ST)能揭示组织中转录本的空间表达特征,但很多ST技术存在分辨率不足,单个空间采样点(spot)往往混杂了多个细胞的信息,且每个spot捕获的转录本有限,因此缺乏真正意义上的对单个细胞表达谱的精细解析能力。更早前的单细胞RNA测序(single cell RNA sequencing, 简称scRNA-seq)能深度剖析单个细胞的转录组,但在样品处理过程中会丢失空间定位信息,因此如何有效整合scRNA-seq以丰富ST数据的单细胞精度信息成为了ST计算分析的一个重要挑战。
为此,北京大学基础医学院周源研究员团队提出了一种名为Celloc的新型计算方法。Celloc运用图注意力自编码器的人工智能模型与一套新设计的综合损失函数,以实现从scRNA-seq单个细胞到ST数据的单个spot间的精准对应(映射)。Celloc的独特之处在于它不仅能够根据每个spot推算出细胞数量,用scRNA-seq数据填充spot,增强其单细胞分辨率,解析各spot具体由哪些单个细胞构成(面向ST数据的常规映射);而且还能将scRNA-seq中的所有细胞都分配到它们最可能的空间位置,还原细胞表达谱的空间坐标信息(面向scRNA-seq数据的贪婪映射)。与之前只能解析每个spot中细胞类型组成比例的反卷积(deconvolution)算法相比,Celloc实现了spot与单个细胞之间的直接关联,更有利于灵活、全面地开展ST和scRNA-seq数据的整合分析。
Celloc的工作流程包括四个主要步骤:首先,将scRNA-seq和ST数据分别投影到嵌入空间;其次,基于RNA丰度估计或高分辨率苏木精-伊红染色(H&E-staining)组织切片图像上的细胞核分割,估算每个spot的预期细胞数量。然后,通过优化综合损失函数确定映射矩阵,该综合损失函数包含三项:①基于表达的映射项,确保表达谱差异较小的细胞和spot具有更高的映射分数;②基于嵌入的映射项,确保映射的细胞和ST点在嵌入空间中具有较高的相似度;③细胞数量约束项,确保映射到每个ST点的细胞数量等于每个ST点的估计细胞数量,并增加映射分数的方差以保证可变性。最后,从映射矩阵中找到最佳匹配的细胞-点对,完成单细胞到空间点的一一映射关联。
实验证明,Celloc在常规和贪婪映射任务中,Celloc能够准确重建不同噪声水平和分辨率的数据集中的细胞空间分布特征,展现出稳定优于现有的同类方法如CytoSPACE、Tangram、CellTrek等的准确性。此外,Celloc的映射结果还能反映出每个spot的细胞类型组成,而在这方面的推断结果也明显比传统的空间反卷积方法如Cell2location、CARD、RCTD、SpatialDWLS等更为准确。Celloc已成功应用于癌症、心肌梗死等多种复杂疾病的真实ST数据的单细胞映射,从而实现对肿瘤亚克隆的空间定位,肿瘤局部免疫微环境特征及其标志基因的提取,以及心肌梗死中梗死灶关联细胞中特异激活的信号通路的识别。
综上所述,Celloc作为一种高效且灵活的单细胞到空间转录组映射工具,为探索生物组织中细胞的空间组织开辟了新路径。通过整合scRNA-seq和ST数据的优点,Celloc有助于深化我们对细胞间相互作用、微环境构建的理解,对疾病的机理研究和治疗方案开发有重大意义。
论文信息:
Accurate and Flexible Single Cell to Spatial Transcriptome Mapping with Celloc
Wang Yin, Xiaobin Wu, Linxi Chen, You Wan, Yuan Zhou*
Small Science
DOI: 10.1002/smsc.202400139
点击左下角「阅读原文」,查看该论文原文。
WILEY
MaterialsViews
Wiley旗下材料科学类期刊官方微信平台
推送材料科研资讯|访谈材料大咖新秀
分享撰稿投稿经验|关注最新招聘信息
点击“分享”,给我们一点鼓励吧~