全面的人类癌症空间转录组学数据库

学术   2024-12-26 16:01   北京  

今天给各位介绍这一篇哈医大Juan Xu教授等人发表在Nucleic Acids Research上的文章。该团队利用空间转录组学数据集成数据库,并可提供五个主要分析模块以解决空间转录组学分析的主要需求,包括切片注释,空间可变基因的鉴定,免疫细胞和肿瘤细胞的共定位,功能分析和细胞间通信。究竟怎么样,我们一起看看吧!

添加微信

精彩推送不错过


一、 研究背景

肿瘤细胞与微环境的相互作用在肿瘤的发生、发展和转移过程中起着关键作用。而空间转录组学技术的出现为揭示癌症中细胞状态和细胞-细胞相互作用的复杂动力学提供了机会。目前可用的空间转录组学数据主要由基于测序的技术生成。但由于缺乏互动工具和癌症类型,它们的可用性受到限制。因此,需要一个全面的癌症空间转录组资源,以交互式可视化和分析空间转录组数据。在此基础上,研究人员开发了一个集成的癌症空间组学资源(SORC, http://bio-bigdata.hrbmu.edu.cn/SORC)。手动整理目前可用的17种癌症的空间转录组学数据集,包括269个切片上的722899个位点,将参考的scRNA-seq数据与大多数空间转录组学数据集进行了匹配。所有数据都被处理成统一的格式,并在数据库中可用。除此之外,SORC为每个片段提供了五个主要分析模块,以满足空间转录组学分析的主要需求。用户可以方便地查询、浏览、下载和访问数据和分析结果。

二、数据内容与使用

1、 数据库概述

SORC是一个全面、便捷的平台,用于分析人类癌症的空间转录组数据,为TME内的细胞类型特异性分布提供了方法(图1A)。基于严格的数据整理和过滤,收集了82个数据集中17种不同癌症类型的269个组织切片,包括722 899个斑点(图1B)。SORC 为每个点提供细胞类型分析,与相应的 scRNA-seq 参考互补(图 1C)。空间切片和特定标记基因的详细注释有助于剖析不同细胞类型的空间表达模式。值得注意的是,数据库还补充了每个切片和数据集中的免疫细胞和恶性细胞共定位,这一特性对人类癌症机制的分析具有重要的价值。SORC 集成了几个交互模块(图 1A),呈现出易于理解的图表和表格格式。用户可以毫不费力地浏览、搜索和下载所有可用的数据。 

图1. SORC的设计和统计概述。

2、用户界面

①、数据浏览和搜索

用户可以浏览所有空间转录-脚本组学数据集的广泛列表,或基于特定癌症类型和空间测序技术应用过滤器。通过点击标题或切片,用户可以访问基本信息、相关文章链接和详细分析结果。此外,用户可以通过搜索任何感兴趣的关键字来进行大规模筛选,或者通过点击人类图表旁边的文本链接来访问相关数据(图2A)。


②、细胞类型标注

SORC为每个数据集中的空间点提供细胞类型注释,这是分析细胞组织局部的关键步骤(图2B)。通过整合scRNA-seq参考数据,并演算推断出每个点的细胞类型的概率分数,并根据最高分数或预先存在的生物学知识定义细胞类型。值得注意的是,用户可以使用工具页上的套索工具任意选择切片中的点,分析特定区域的细胞组成。此外,我们已经确定了在每个空间转录组学集群中特异性表达的标记基因。用户可以检查感兴趣的基因在空间位置和细胞类型中的表达水平。此外,两种空间转录组学标记基因的表达模式可以在同一组织切片中并排比较,为探索特定标记的定位差异提供了基础(图2B)。


③、空间可变基因的识别

不同部位的基因转录活性的显著变化通常表明它们特定的细胞状态和功能。因此,SORC为每个切片提供了空间可变基因(spatially variable genes,SVGs)的列表及其各自的统计数据。用户可以探索SVGs与其空间位置之间的再通,并观察它们在不同区域的和空间转录组簇中的表达水平(图2C)。同时,数据还说明了从相应scRNA-seq数据中细胞类型下载的不同选择基因的表达水平。此外,为了评估SVGs的表达模式,还为每个基因提供了特异性强的空间转录组簇和细胞类型。值得注意的是,与空间转录组学簇的标记不同,SVGs的表达显示了整个切片的整体变化。


④、免疫细胞与肿瘤细胞之间的共定位

免疫细胞和肿瘤细胞在TME内的空间分布紧密交织,潜在地增强了免疫细胞的抗肿瘤反应。SORC根据空间位置的细胞类型计算存档了每个切片的不同类型之间共定位的概率分数。用户可以通过热图直观地识别与肿瘤细胞分布密切相关的免疫细胞(图2D)。此外,对于这些明显共定位的免疫细胞,还提供了有价值的后续分析,以帮助研究人员了解免疫细胞在不同区域中的作用。


⑤、与肿瘤细胞共定位的免疫细胞功能分析

为了研究在癌症进展过程中与肿瘤细胞共定位的免疫细胞的作用,数据库提供了各种功能基因集进行分析,例如基因本体论。用户可以根据感兴趣的特定癌症或细胞类型筛选结果。功能注释的结果以图表格式显示,其中包括富集的显著性、通路活性和使用的标记基因(图 2E)。通过该模块,用户可以识别与组织切片肿瘤细胞显著相关的免疫细胞的空间位置和潜在功能。


⑥、共定位免疫细胞和肿瘤细胞之间的细胞通讯

在切片中识别出与肿瘤细胞相关的免疫细胞后,数据库可以进一步推断出这些细胞之间的相互作用。用户可以查看相互作用的强度和介导细胞-细胞相互作用的受体-配体对。结果以表格和河流图的形式显示(图2F)。该模块的细胞相互作用结果可用于研究空间密切相关细胞之间的串扰及其在不同癌症中的潜在机制。

图2. SORC数据库用户界面。

3、案例研究

图3. SORC中IAC期LUAD (LUAD-IAC)患者病例分析。

(A) LUAD-IAC中两切片的基本信息和点分布。

(B)左侧的空间转录组图谱描绘了点簇,右侧的条形图显示了每个点的细胞类型演算。

(C) TD1中选择的标记。小提琴图显示了标记基因TM4SF1在每个集群中的表达情况。右侧的空间转录组图谱描绘了以TM4SF1为标记的集群的空间分布。

(D)所选标记物TM4SF1作为SVG在TD1中的表达。

(E)热图显示肿瘤细胞和免疫细胞在TD1中共定位。

(F) TD1中与肿瘤细胞共定位的免疫细胞功能分析结果。

(G)基于TD1中候选配体-受体对的表达预测肿瘤细胞与免疫细胞之间的通讯。


三、总结

研究人员集成空间转录组学数据开发SORC,这是一个全面的人类癌症空间转录组学数据资源,它可以交互式地可视化每个肿瘤组织切片的形态特征。此外,SORC还提供了包括切片注释、SVGs鉴定、免疫细胞与肿瘤细胞共定位、功能分析和细胞间通讯在内的五大分析模块,涵盖了空间转录组学分析的基本需求。随着空间转录组学技术的不断发展,未来将继续更新和整合更多的数据集到SORC中以提供对空间转录组更丰富的理解。总之,SORC数据库是一个宝贵的资源,可以为癌症提供前所未有的空间分辨率细胞图谱,并识别特定的基因和功能途径,以更好地了解TME。更多详情还请大家移步原文,仔细品鉴。


添加微信

精彩推送不错过


最新文章汇总(持续更新ing)


最新热点方向

1、今天开心,安利一个超好发版干湿结合思路

2、掌握孟德尔随机化发20分不是梦

3、研究中草药难发SCI?

4、公开数据纯分析发7+,内容不卷赢在选题

5、人手一篇的“淋巴转移”,摇身一变50+


生信人课堂

1、临床医生科研规划

2、热点基因集预后实操课程

3、孟德尔随机与基因组

4、R语言入门


课题设计 | 生信分析 | 数字产品

概普生物 让科研丰富

生信人

专注于基因技术相关知识分享
扫码关注 获取更多






END


生信人
共同学习生物信息学知识,共同探究生物奥秘。
 最新文章