SpaCET:基于空转数据鉴定肿瘤功能区域

文化   2024-08-02 11:00   陕西  

前言

在如今空间组学(ST)数据越来越多的大背景下,如果能做到像挖掘单细胞转录组测序数据那样整合分析大队列ST数据,想必也会得到更加有趣的结果。特别是近几年各大期刊上发表了大量有关肿瘤研究的空间组学数据,这将是一个非常宝贵的资源,但是由于空间组学分析的软件还没有像单细胞转录组那样种类多样,功能多样。因此,我们迫切需要更多基于肿瘤研究的空间组学分析的生信工具。

生信宝库在之前陆续推出了两款在空间组学数据中鉴定肿瘤区域的软件,分别是:Cancer-Finder:一站式迅速精准的鉴定出scRNA和ST数据中的癌细胞Cottrazm | 识别空转数据中的肿瘤核心区域,均得到了大家比较不错的反响。

最近Immugent又找到另一款类似功能的软件:SpaCET,对应的文章于去年发表在NC杂志上,考虑到多个软件多一个选择,后面几期推文生信宝库将对这个软件进行系列介绍,敬请期待!



主要内容

总的来说,SpaCET 通过整合常见恶性肿瘤的拷贝数变异和表达变化的基因模式词典来估算肿瘤细胞丰度。然后,使用一个受限回归模型校准局部细胞密度并确定免疫和基质细胞谱系的分数。基于模拟和匹配双盲组织病理学注释的真实 ST 数据,SpaCET 提供了比现有方法更高的准确性。

值得一提的是,SpaCET关注的是同一个 ST 点内细胞之间的紧密接触,而不是不同 ST 点之间的接触,因为点之间的间隙(例如,Visium 平台约为 50 微米)可能跨越多个细胞。通过计算所有 ST 点上的细胞比例的线性相关性来评估细胞类型的共定位。为了推断物理相互作用,作者进一步测试在同一个 ST 点内,共定位细胞类型对的配体和受体基因的共表达。

软件好不好使,得拿实际分析出的结果说话。随后作者就使用SpaCET对10x genomics官网上的一个乳腺癌的数据进行分析。

通过和其它反卷积软件以及空间组学数据打分软件进行细胞类型鉴定结果的双盲比较,发现SpaCET相对于其它软件有更高的准确率。而且通过SpaCET鉴定出的肿瘤核心区域基本上和病理学家圈出的范围基本一致,鉴定出的其它区域也比西现有的软件要准确。

ST数据相对于普通的单细胞转录组数据,最主要的优势就在于其提供了空间位置信息,这也为更准确的揭示细胞间相互作用提供了条件。为从ST数据中识别细胞间相互作用,SpaCET采用了两步法:评估细胞共定位;然后进行配体-受体(L-R)共表达分析。基于估计的细胞分数,研究团队计算了ST点上细胞类型对之间的Spearman相关性,细胞类型对的强正相关表明其细胞共定位。

作者随后通过实例来展示SpaCET分析ST数据来揭示细胞相互作用的结果,通过分析ST点内L-R的相互作用以证明细胞相互作用。其中每个ST点的L-R评分表明了每个位点配体-受体的相互作用强度,而非细胞类型之间的特定相互作用。因此,SpaCET进一步对每个细胞类型对进行了L-R评分的富集分析。例如,对于乳腺肿瘤组织中CAF和M2细胞的共定位,SpaCET将所有ST点分为四类:CAF - M2共定位、CAF或M2占主导地位以及其他;并发现CAF-M2共定位的点比CAF/M2占主导地位的点具有更高的L-R得分。



说在最后

上面介绍完了SpaCET,也夸了它的优点,下面也要认清其存在的几个局限性:首先,在估计恶性细胞比例时,通过对肿瘤ST数据中所有已识别的恶性细胞点的表达谱进行平均生成了ST特定的恶性细胞表达谱。因此,在分析包含非常不同癌细胞状态的肿瘤ST数据时,恶性细胞比例的估计准确性可能会降低。

其次,在去卷积过程中,作者假设参考细胞类型的标记基因在未知细胞类型中不表达。然而,作者的模拟数据分析结果却显示,超过30%的现有参考标记基因在未知细胞类型中高表达会导致低估未知细胞比例。

当然作者也给出了出型上述情况的两种解决方案:(1)未知细胞类型可能与现有细胞类型具有密切的谱系关系,因此应将其分类为已知细胞类型而不是未知类型;(2)使用者应预先估计新组织的现有细胞谱系组成。

最后需要注意的是,如果SpaCET的默认谱系不能全面覆盖输入样本中的细胞种类,使用者可能需要额外的细胞特征,并使用自定义参考运行SpaCET。



【参考文献】

https://www.nature.com/articles/s41467-023-36062-6




关注公众号,下回更新不迷路



生信宝库
本公众号只用于生信知识的收集与传播,以及生信人之间互相交流和学习,不会涉及任何商业利益。本公众号各小编平时忙于科研,更新文章较其它同类型公众号较慢,但保持宁缺毋滥的本心,只更新对大家有用的推文。
 最新文章