Cottrazm | 识别空转数据中的肿瘤核心区域

文化   2024-07-30 11:00   陕西  

前言

肿瘤微环境(TME)在肿瘤的发生、发展、转移以及免疫检查点抑制(ICB)治疗响应中起着关键作用,不同的TME具有不同的细胞组成和相互作用。空间转录组学结合了空间位置信息和基因表达数据,有助于揭示肿瘤的生物学特性及其与微环境的复杂关系。肿瘤边界往往是TME中免疫细胞和基质细胞互相作用的核心区域,因此是研究者们关注的重点。肿瘤边界的细胞组成、细胞相互作用和分子网络调控对TME的重塑具有深远的影响。然而肿瘤边界的界定依赖于免疫组化(IHC)染色数据或病理专家的主观描述,缺乏明确一致的标准。为了克服这一挑战,2023年2月,一篇题为Reconstruction of the tumor spatial microenvironment along the malignantboundary-nonmalignant axis的研究发表在nature communication,开发了Cottrazm这一工具。

目前,空间转录组学主要通过细胞类型映射和反卷积方法来推断单个spot内的细胞类型。然而,细胞类型映射的方法会损失细胞组成信息,而反卷积方法则忽略了空间转录组数据固有的位置信息和形态学特征。为了解决这些问题,Cottrazm基于形态学特征调整了空间转录组(ST)数据,并结合拷贝数变异(CNV)特征来定义肿瘤边界,还能在sub-spot水平上重建细胞类型特异性的基因表达谱。结合细胞间相互作用和功能富集分析,研究发现表达SPP1的巨噬细胞和表达APSN的成纤维细胞在肿瘤边界富集,从而确定了肿瘤边界中的潜在治疗靶点。

总的来说,Cottrazm方法可以定义肿瘤边界、解析TME的细胞组成和重建高分辨率的细胞类型特异的表达谱,对于揭示肿瘤微环境的复杂性和寻找新的治疗靶点具有重要意义。

主要结果

1.Cottrazm: 基于空间转录组学识别肿瘤边界微环境

Cottrazm结合单细胞转录组、空间转录组和H&E染色的组织学图像实现了3个核心功能:确定肿瘤边界(Cottrazm-BoundaryDefine)、反卷积空间转录组(Cottrazm-SpatialDecon)和sub-spot水平重建空间基因表达矩阵(Cottrazm-SpatialRecon)。

Cottrazm-BoundaryDefine:

A)作者通过对空间转录组学ST数据应用空间形态基因表达(SME)归一化算法获得形态学调整后的表达矩阵。

B)使用形态学调整后的表达矩阵,通过K-最近邻(KNN)算法对spots进行聚类,并基于免疫特征计算正常评分,从而获得正常组织内的聚类值。

C)假设具有最高拷贝数变异(CNV)评分的区域为恶性核心区域。

D)基于曼哈顿距离识别出于肿瘤核心相邻的spots,并够根据umap距离确定spot是恶性(Mal)spot还是边界(Bdy)spot。

E)当所有恶性spots的邻域都不是恶性时,推断过程结束,剩余的spots被标注为非恶性区域(nMal)。

Cottrazm-SpatialDecon:

A)基于scRNA-seq中每种细胞类型特异的signature,计算每个spot的得分。

B)使用PAGE计算每个spot中细胞类型的富集得分。

C)将KNN聚类结果与恶性区域、肿瘤边界和非恶性区域的位置信息整合生成主题向量。

D)基于特征矩阵和富集得分确定每个主题向量的细胞类型。

E)使用阻尼加权最小二乘法(DWLS)对spot的细胞类型组成进行反卷积。

Cottrazm-SpatialRecon:

基于scRNA-seq参考数据,计算每种细胞类型的特征权重,根据反卷积结果中的细胞比例和特征权重,计算包含特定细胞类型的sub-spot的特征表达,从而在sub-spot水平重建细胞类型特异性基因表达谱(GEPs)。

接下来,作者将Cottrazm-BoundaryDefine应用在了6种癌型的12个样本上,算法很清晰的识别了每个样本的肿瘤边界,且在CNV得分和肿瘤特异的signature得分上进行了验证。CNV得分和肿瘤signature得分在恶性区域的spot内显著高。

以HCC3这个样本为例,上图f展示了算法识别的肿瘤边界,而上图g展示了病理学家鉴定的肿瘤边界,上图h表示距离病理学家边界≤1个spot的边界点所占比例。以上实验证明了Cottrazm在预测肿瘤边界时具有极高的准确性。

2.Cottrazm在sub-spot水平上解析细胞组成并重构细胞类型特异的基因表达谱

作者首先应用模拟的ST数据将Cottrazm-SpatialDecon与现有的已发表的ST反卷积算法(Stereoscope,Cell2Location,RCTD,SpatialDWLS, STRIDE,SPOTlight)和Bulk RNA-seq反卷积算法(CIBERSORTx,MuSiC)进行了性能比较。从准确性、F1值、特异性三个指标证明了Cottrazm-SpatialDecon良好的性能,此外,SpatialDWLS和RCTD也具有较好的性能。

接下来,作者计算了每个spot内单一细胞类型比例的真实值和算法预测值之间的Spearman相关系数(上图b);每个spot内不同细胞类型比例的真实值和预测值之间的Spearman相关系数(上图c);每个spot内细胞类型预测值与真实值之间的Jensen–Shannon散度(JSD)(JSD值越小,表示预测数据集与真实数据集的相似度越高,上图d),以全面评估算法的性能。

紧接着,作者使用了一套独立的CRC scRNA-seq作为参考数据集,使用Cottrazm-SpatialRecon获取之前创建的CRC模拟混合物在sub-spot水平上的基因表达谱(GEPs)。结果表明预测结果与真实数据具有高度的一致性(上图h Rs代表spearman相关系数,Rp代表pearson相关系数)。

3.Cottrazm 描绘了沿恶性-边界-非恶性空间轴的细胞组成

为了展示Cottrazm在真实空间转录组学数据中的实用性,作者首先使用Cottrazm-BoundaryDefine将CRC(结直肠癌)组织划分为恶性区、肿瘤边界区和非恶性区。随后使用Cottrazm-SpatialDecon解析了这些区域中CRC组织的细胞组成,并比较了各区域间的不同组成。发现恶性spot主要由恶性细胞组成,缺乏T细胞或其他细胞浸润。边界spot由髓样细胞、成纤维细胞和内皮细胞组成,而非恶性spot则排除了恶性细胞。

三级淋巴结构(TLSs)是异位淋巴器官,形成于非淋巴组织中的慢性炎症部位。TLS spot含有较大比例的T细胞和B/浆细胞,较少比例的基质细胞和髓样细胞。正常上皮组织相关的spot含有高比例的上皮细胞和较少的免疫细胞和成纤维细胞,而基质相关的spot则含有高比例的成纤维细胞和内皮细胞,以及较少的免疫细胞。

为了进一步细化上述细胞类型的亚群特征,作者将每个spot中的不同细胞类型定义为sub-spot,然后使用Cottrazm-SpatialRecon在sub-spot水平上利用多种癌症类型的ST数据重建细胞类型特异的基因表达谱(GEPs)。使用Harmony算法整合不同肿瘤样本的sub-spot GEPs数据。在三例CRC ST样本中获得了15,555个sub-spot,在四例HCC ST样本中获得了43,813个sub-spot。聚类和UMAP结果表明,sub-spot GEPs可以显著区分不同细胞类型,且所有肿瘤样本中都存在所有细胞类型(上图4c)。

在CRC中,作者基于sub-spot将髓系细胞注释为三种亚型,分别为单核细胞/树突状细胞(Mono/DC),FOLR2+巨噬细胞(Macro-FOLR2)和SPP1+巨噬细胞(Macro-SPP1)。与恶性和非恶性区域相比,Macro-SPP1在肿瘤边界显著富集,而Macro-FOLR2倾向于在非恶性区域富集,Mono/DC细胞则倾向于在TLS周围区域富集。类似的,在HCC中的髓样细胞被注释为单核细胞、Macro-TGFB1、Macro-SPP1和Macro-MARCO四个亚型。Macro-SPP1在边界区域也显著富集。Macro-MARCO在非恶性区域富集,Macro-TGFB1在恶性区域富集。由于Macro-SPP1在CRC和HCC中都富集于肿瘤边界区域,因此作者推测Macro-SPP1是肿瘤边界中的关键细胞组成,作者进一步检查了BRCA、ccRCC和OV中的Macro-SPP1特征评分,发现Macro-SPP1也在上述癌症类型的边界区域中显著富集。

同样的方法作者也分析了成纤维细胞,发现无论是在HCC还是CRC样本中,Fib-APSN皆倾向于定位在肿瘤边界。此外,Fib-APSN特征评分在BRCA、OV和ccRCC样本的边界区域中也显著富集。

总的来说,作者使用Cottrazm揭示了Macro-SPP1和Fib-APSN在各类癌症中优先富集于肿瘤边界。

4.Macro-SPP1、Fib-ASPN和恶性细胞在肿瘤边界的相互作用促进了免疫排斥

为了研究肿瘤边界区域发生的不同生物过程,作者使用边界特异基因进行了富集分析,富集结果为细胞外基质(ECM)组织、胶原纤维组织、细胞-基质黏附、趋化性正调控和对TGF-β的反应等,这些生物学过程有助于形成硬化结构。随后作者计算了肿瘤边界区域的细胞-细胞相互作用(包括边界spot、第一内圈的恶性区域和第一外圈的非恶性区域)。作者识别出Macro-SPP1和Fib-APSN是肿瘤边界的主要细胞组成部分,它们与肿瘤细胞三者之间表现出强烈的相互作用(上图e, f)。随后作者进一步探索了恶性细胞、Macro-SPP1和Fib-APSN中的主要调控信号通路和关键互作分子(上图g)。同时发现ST样本通常显示恶性区域内的淋巴细胞浸润水平较低(上图5h),这可能是Macro-SPP1和Fib-APSN富集的肿瘤边界有助于形成与肿瘤免疫排斥微环境(TIEM)相关的硬化边界结构,这些细胞限制T细胞浸润到恶性区域。为了验证这一假设,作者检查了T细胞浸润的分布,发现杀伤性T细胞(T-KLRB1)显著富集在恶性区域外,而衰竭性T细胞(T-HAVCR2)在肿瘤边界富集(上图i)。接下来作者使用TIEM特异性肿瘤边界的基因特征评分(免疫排斥评分 ieScore)评估肿瘤中的免疫排斥水平。使用GSVA计算了CRC队列中每位患者的ieScore,并将患者分为ieScore高低组。结果表明高ieScore患者与较低的淋巴细胞和CD8+T细胞浸润相关(上图j);高ieScore与较差的总体生存率和无进展生存率相关。基于在肿瘤边界与其他区域相比上调的37个基因和下调的20个基因,作者将这些基因映射到Connectivity Map(CMAP)识别出了可作为药物靶点的候选基因。例如,在映射的药物中具有最高负连接性评分的基因包括与抑制剂D-4476偶联的TGF-β受体。这些药物可能用于靶向肿瘤边界,以破坏屏障结构并增强T细胞向恶性区域的浸润,从而提高患者对免疫治疗的敏感性。

小结

相比于单细胞转录组学,空间转录组学的位置信息使我们能够聚焦于肿瘤核心区域及其边界,研究这些区域的细胞组成和功能机制,这对于了解肿瘤的发生发展、探寻耐药机制、寻找新的治疗靶点等具有重要意义。Cottrazm是一个专门针对肿瘤空间转录组数据开发的算法,主要实现了以下三个核心功能:

  1. 确定恶性区域、边界区域和非恶性区域。作者使用CNV得分、肿瘤特征得分以及与病理学家的一致性来证明算法的准确性。
  2. 反卷积空间转录组。作者通过与多种反卷积算法的比较,证明了Cottrazm算法在这方面的优异性能。
  3. 在sub-spot水平重建空间基因表达矩阵。这一部分使用模拟数据证明了算法的准确性。

因此,作者将Cottrazm应用于真实的空间转录组数据,确定了肿瘤边界,比较了三种区域不同的细胞组成,并结合功能富集和细胞通讯等分析,探索了肿瘤边界区域的生物学过程,从而确定了潜在的治疗靶点。

总的来说,Cottrazm是一个研究实体肿瘤空间转录组数据的有力分析工具,实现了更深层次的数据信息挖掘。在接下来的推文中,我们将介绍Cottrazm的算法原理和实操,与大家一起学习如何将Cottrazm应用于自己的研究中。

好啦,今天的分享就到这里了,我们下期再会~

参考文献:https://www.nature.com/articles/s41467-023-36560-7

关注公众号,下回更新不迷路


生信宝库
本公众号只用于生信知识的收集与传播,以及生信人之间互相交流和学习,不会涉及任何商业利益。本公众号各小编平时忙于科研,更新文章较其它同类型公众号较慢,但保持宁缺毋滥的本心,只更新对大家有用的推文。
 最新文章