SpaCET:基于空转数据鉴定肿瘤功能区域 | 算法原理介绍

文化   2024-08-09 11:00   陕西  

前言

SpaCET是一个分析肿瘤空间转录组数据的R包,它能估计细胞谱系和肿瘤微环境中的细胞互作。SpaCET首先通过整合常见的恶性肿瘤模式推断肿瘤细胞,然后采用约束线性回归模型来校准局部组织密度,并基于全面的非恶性细胞图谱确定基质和免疫细胞谱系分数。此外,SpaCET能够揭示肿瘤微环境中假定的细胞间相互作用,特别是在肿瘤免疫界面处。值得注意的是,尽管SpaCET不需要任何参考细胞表达谱来分析肿瘤空转数据,但SpaCET仍然可以将匹配的scRNA-seq数据集作为定制参考,以对任何空转数据集进行细胞类型反卷积。
原文链接:https://doi.org/10.1038/s41467-023-36062-6

肿瘤细胞占比推断

SpaCET分3步推断相关spot中肿瘤细胞占比,分别为聚类、推断肿瘤类群和估计肿瘤细胞比例。

空间spot聚类

层次聚类

首先对空间spot进行层次聚类。所谓层次聚类,就是按照树状结构对spot进行聚类。初始状态下,每一个单独的spot就是一个类,通过计算每两个类之间的距离,选取最接近的两个类合并为一个类,知道所有spot都归为一个类,这样就形成了一个树状的聚类树。那么我们只要垂直于“树枝”,也就是下图的横坐标选择一个合适的cutoff值,就可以把spot聚成任意数目的类别。

轮廓系数

那么,具体应该聚成几类呢?这里我们需要用到轮廓系数。而要明白轮廓系数的定义,我们首先要引入不相似度的概念。
我们假设聚类数为K,样本i的簇内不相似度是指该样本到簇内其他样本的距离均值,在下图中,簇内不相似度的计算公式为

样本i到其他某簇的不相似度则为该样本与某簇的所有样本的距离均值,比如样本i与簇C1的不相似度为

那么样本点i的簇间不相似度则为该样本点与最近的簇的不相似度,即

那么样本i的轮廓系数

而聚类结果的轮廓系数就是所有样本轮廓系数的均值,显然轮廓系数越大,聚类效果就越好,所以我们选择聚类轮廓系数最大时的K值。

肿瘤细胞亚群的确定

首先对每个亚群中spot的表达谱进行均值中心化。然后计算spot的表达谱与肿瘤类型特异性(CNA或者表达)标签的Pearson相关系数。将满足下面两个标准的亚群划分为肿瘤亚群:

  1. 亚群内spot的平均相关系数显著大于0(单侧Wilcox符号秩检验, p<0.05)
  2. 与肿瘤类型特异性标签正相关的spot(Pearson's r>0且双侧相关性检验p<0.05) 在确定肿瘤类型特异性标签时,如果该肿瘤是具有明显拷贝数变异(CNA)的肿瘤,那么优先使用CNA作为肿瘤特异性标签。如果该肿瘤不是具有明显拷贝数变异的肿瘤,那么优先使用肿瘤类型特异性表达作为标签。如果该肿瘤是不存在与数据库中的肿瘤类型,则使用泛癌表达标签。

所有spot中肿瘤细胞占比的估计

根据确定的肿瘤亚群,计算肿瘤亚群中所有spot的平均表达谱作为空间特异性肿瘤细胞的表达谱。计算每个spot表达谱与肿瘤细胞表达谱的Pearson相关系数(r),那么对应spot中肿瘤细胞的占比可以计算为:

其中为r的95%和5%分位数。非肿瘤细胞的占比为

非肿瘤细胞占比的层次反卷积

SpaCET可以完成非肿瘤细胞从大群到亚群的反卷积。设空间特异性肿瘤细胞表达谱为,对于每个spot,它的基因表达谱为,那么它的非肿瘤细胞表达谱可以计算为

为细胞类型c的参考表达谱和比例,那么满足

因为数据库中的细胞类型参考表达谱几乎涵盖了所有基因,所以未知的细胞类型几乎可以忽略不计,因此最终回归模型为:

通过限制性最小二乘法即可估计出的值。因而为被鉴定的组分可以计算为

基于大群的反卷积结果,可以进一步对大群中的亚群进行反卷积,例如,巨噬细胞可以分为M1和M2两个亚群,因此可以用下面的回归模型进行反卷积

细胞互作分析

共定位分析

计算空间细胞互作,首先对细胞进行共定位分析。SpaCET主要计算的是细胞类型在空间中定位的Spearman相关系数。

L-R分析

首先使用BiRewire包对配受体对网络进行1000次随机重排,但是保留了每个节点的度分布,也就是保证了接受特定配体的受体数和结合特定受体的配体数都是固定的。对与一个spot,第i个配受体对的表达量分别为。<>代表1000个随机网络中的均值,那么这个spot的互作网络分数和p值分别为

对于每一对共定位的细胞类型,SpaCET将空间spot分类4类:共定位、其中一种细胞类型的定位区和其他区域。如果这对细胞类型在共定位区域的NS显著高于单一细胞类型定位区(双侧Wilcox秩和检验,p<0.05),那么认为这两类细胞存在互作。

关注公众号,下回更新不迷路


生信宝库
本公众号只用于生信知识的收集与传播,以及生信人之间互相交流和学习,不会涉及任何商业利益。本公众号各小编平时忙于科研,更新文章较其它同类型公众号较慢,但保持宁缺毋滥的本心,只更新对大家有用的推文。
 最新文章