跟着Seurat官网学Xenium空转分析

文摘 2025-01-11 11:25 美国

Xenium是由 10x Genomics 推出的一种先进的空间转录组学技术，能够在单细胞分辨率的基础上，精确地检测和定位组织切片中的基因表达情况。这项技术结合了分子检测与空间定位的优势，为研究细胞在组织中的位置及其功能关系提供了重要工具。这里看一下AI对Xenium的理解，描述的非常详细：

Xenium 的核心原理：Xenium 的核心是基于高通量的原位杂交 (In Situ Hybridization, ISH) 技术。通过使用特异性探针捕获 RNA 分子，并在组织切片上直接检测信号，Xenium 能够实现以下目标：

单细胞分辨率：识别每个细胞的基因表达模式。
空间信息整合：保留组织切片中细胞的物理位置，揭示细胞间的空间关系。
高通量检测：同时检测数千个目标基因，满足复杂样本的多维度分析需求。

Xenium 的技术优势：

空间与分子信息结合：能够同时获得基因表达的数量和细胞所在的组织位置。
无需解离组织：保留了细胞与组织环境的原始结构关系，避免传统单细胞 RNA 测序中组织解离造成的信息丢失。
高通量：相比于传统的空间转录组学方法，Xenium 提供了更高的基因检测通量和精度。

Xenium 的应用场景：Xenium 技术在许多生物医学研究领域具有广泛应用，包括但不限于：

肿瘤微环境研究：研究肿瘤细胞与免疫细胞之间的空间关系，揭示潜在的调控机制。
神经科学：解析大脑组织中不同神经元的空间分布及基因表达特性。
发育生物学：监测胚胎发育过程中细胞分化与空间分布的动态变化。
免疫研究：探索免疫细胞在组织中的分布及其与病原体或其他细胞的交互。

下面跟着Seurat学习Xenium的分析流程。Seurat官方教程在https://satijalab.org/seurat/articles/seurat5_spatial_vignette_2

首先下载示例数据：

## Mouse_Brain
wget https://cf.10xgenomics.com/samples/xenium/1.0.2/Xenium_V1_FF_Mouse_Brain_Coronal_Subset_CTX_HP/Xenium_V1_FF_Mouse_Brain_Coronal_Subset_CTX_HP_outs.zip

unzip Xenium_V1_FF_Mouse_Brain_Coronal_Subset_CTX_HP_outs.zip

一. 读入数据

首先，我们读取数据集并创建一个Seurat对象。提供Xenium运行的数据文件夹的路径作为输入路径。RNA数据存储在Seurat对象的Xenium分析中。这一步大概需要一分钟。

library(Seurat)
library(qs)
library(ggplot2)
library(dplyr)

path <- "./Rawdata"
# Load the Xenium data
xenium.obj <- LoadXenium(path, fov = "fov")
# remove cells with 0 counts
xenium.obj <- subset(xenium.obj, subset = nCount_Xenium > 0)

空间信息被加载到Seurat对象的插槽中。

可视化每个细胞基因数量（nFeature_Xenium）和每个细胞的转录本计数情况（nCount_Xenium）：

VlnPlot(xenium.obj, features = c("nFeature_Xenium", "nCount_Xenium"), ncol = 2, pt.size = 0)

Xenium数据使用ImageDimPlot进行spatial的可视化，这里可以使用这个函数展示一些感兴趣的marker基因：

ImageDimPlot(xenium.obj, fov = "fov", molecules = c("Gad1", "Sst", "Pvalb", "Gfap"), nmols = 20000)

我们还可以使用ImageFeaturePlot（）在单细胞水平上可视化关键基因的表达水平。基于这个函数，我们可以设置一个参数调整基因表达的最大值以提高可视化的对比度，例如每个基因的截止值大约为其计数分布的第90个百分位数（可以用max.cutoff='q90'指定）。

ImageFeaturePlot(xenium.obj, features = c("Cux2", "Rorb", "Bcl11b", "Foxp2"), max.cutoff = c(25,
    35, 12, 10), size = 0.75, cols = c("white", "red"))

我们可以使用Crop函数放大选定区域。一旦放大，我们可以看到细胞分割边界以及单个分子。

cropped.coords <- Crop(xenium.obj[["fov"]], x = c(1200, 2900), y = c(3750, 4550), coords = "plot")
xenium.obj[["zoom"]] <- cropped.coords
# visualize cropped area with cell segmentations & selected molecules
DefaultBoundary(xenium.obj[["zoom"]]) <- "segmentation"
ImageDimPlot(xenium.obj, fov = "zoom", axes = TRUE, border.color = "white", border.size = 0.1, cols = "polychrome",
    coord.fixed = FALSE, molecules = c("Gad1", "Sst", "Npy2r", "Pvalb", "Nrn1"), nmols = 10000)

二. 标准化分析流程

接下来，我们使用SCTransform进行标准化，然后是降维和聚类分析：

xenium.obj <- SCTransform(xenium.obj, assay = "Xenium") %>% 
  RunPCA(npcs = 30, features = rownames(xenium.obj)) %>% 
  RunUMAP(dims = 1:30) %>% 
  FindNeighbors(reduction = "pca", dims = 1:30) %>% 
  FindClusters(resolution = 0.3)

然后，我们可以通过在UMAP空间中使用DimPlot或在图像上使用ImageDimPlot可视化聚类结果：

DimPlot(xenium.obj)

#FeaturePlot检查marker在umap上的分布情况
#FeaturePlot(xenium.obj, features = c("Cux2", "Bcl11b", "Foxp2", "Gad1", "Sst", "Gfap"))
ImageDimPlot(xenium.obj, cols = "polychrome", size = 0.75)

利用每个细胞的位置信息，计算空间生态位。我们使用来自艾伦大脑研究所的皮质参考来注释细胞，所以我们首先从Xenium数据中取子集，得到皮质细胞。Allen Brain参考可以安装在这里（https://www.dropbox.com/s/cuowvm4vrf65pvq/allen_cortex.rds?dl=1）。

我们使用Slc17a7表达来帮助确定皮质区域。

p1 <- ImageFeaturePlot(xenium.obj, features = "Slc17a7", axes = TRUE, max.cutoff = "q90")
p1

crop <- Crop(xenium.obj[["fov"]], x = c(600, 2100), y = c(900, 4700))
xenium.obj[["crop"]] <- crop
p2 <- ImageFeaturePlot(xenium.obj, fov = "crop", features = "Slc17a7", size = 1, axes = TRUE, max.cutoff = "q90")
p2

三. RCTD解卷积

Seurat v5现已纳入RCTD算法分析流程（Robust Cell Type Decomposition），用户可以使用scRNA-seq参考数据集，对空间数据集的spot或者单个细胞进行反卷积分析。

RCTD安装：

devtools::install_github("dmcable/spacexr", build_vignettes = FALSE)

基于Xenium数据，构建RCTD的query数据：

library(spacexr)

query.counts <- GetAssayData(xenium.obj, assay = "Xenium", slot = "counts")[, Cells(xenium.obj[["crop"]])]
coords <- GetTissueCoordinates(xenium.obj[["crop"]], which = "centroids")
rownames(coords) <- coords$cell
coords$cell <- NULL
query <- SpatialRNA(coords, query.counts, colSums(query.counts))

然后是单细胞参考数据集的处理，构建RCTD的Reference数据：

# allen.corted.ref can be downloaded here:
# https://www.dropbox.com/s/cuowvm4vrf65pvq/allen_cortex.rds?dl=1
allen.cortex.ref <- readRDS("/brahms/shared/vignette-data/allen_cortex.rds")
allen.cortex.ref <- UpdateSeuratObject(allen.cortex.ref)

Idents(allen.cortex.ref) <- "subclass"
# remove CR cells because there aren't enough of them for annotation
allen.cortex.ref <- subset(allen.cortex.ref, subset = subclass != "CR")
counts <- GetAssayData(allen.cortex.ref, assay = "RNA", slot = "counts")
cluster <- as.factor(allen.cortex.ref$subclass)
names(cluster) <- colnames(allen.cortex.ref)
nUMI <- allen.cortex.ref$nCount_RNA
names(nUMI) <- colnames(allen.cortex.ref)
nUMI <- colSums(counts)
levels(cluster) <- gsub("/", "-", levels(cluster))
reference <- Reference(counts, cluster, nUMI)

运行RCTD：

# run RCTD with many cores
RCTD <- create.RCTD(query, reference, max_cores = 8)
RCTD <- run.RCTD(RCTD, doublet_mode = "doublet")

处理RCTD的结果：

annotations.df <- RCTD@results$results_df
annotations <- annotations.df$first_type
names(annotations) <- rownames(annotations.df)
xenium.obj$predicted.celltype <- annotations
keep.cells <- Cells(xenium.obj)[!is.na(xenium.obj$predicted.celltype)]
xenium.obj <- subset(xenium.obj, cells = keep.cells)

关于RCTD我已介绍多次了，HD空转分析也是采用了RCTD流程。详见：

本质上就是使用单细胞数据以及单细胞注释好的标签来注释空转数据。

更多内容详见官方教程：https://satijalab.org/seurat/articles/seurat5_spatial_vignette_2

生信菜鸟团

生信菜鸟团荣誉归来，让所有想分析生物信息学数据的小伙伴找到归属，你值得拥有！

推荐账号，扫码关注

最新文章

基因组数据在精准医学中扮演什么角色

计算视觉 | Nat.Methods | 一个用于跨九种模态的生物医学对象联合分割、检测和识别的基础模型

前瞻 | Nature | 人类细胞图谱：从细胞普查到统一的基础模型

精准医学 | Nat.Med | 使用常规血液检测和临床数据预测癌症检查点抑制剂免疫治疗的疗效

Nat.Genet | 从 DNA 序列预测 RNA-seq 覆盖度作为基因调控的统一模型

生信程序 | Nat.Genet | 在疾病关联位点精细定位因果组织和基因

期刊泛读 | Cell 出版社 | 优质期刊

数据库合集 | 更新至 67 个

数据挖掘之中性粒细胞胞外陷阱相关预后模型

玩转服务器—你的数据是否完整？

ChIP-Seq 简介

基因的功能推断之单细胞亚群的特异性高表达

能根据差异基因来反推样品的分组情况吗

基因的功能推断之敲减过表达的干扰它

基因的功能推断之大队列的共表达分析（比如：WGCNA）

基因的功能推断之大队列表达量相关性排序后gsea分析

基因的功能推断之大队列高低分组后差异分析然后功能富集

单细胞揭示了结直肠癌微环境中肥大细胞的激活

共享服务器助力学习与分析！

你选择哪种三代测序

如何用血常规发 Nature，临床常见指标的深度挖掘

综述 | Nature | 更新一下关于 2 型免疫的认知

生信算法 | 矩阵分解除了NMF，也可以试试这个 NatGenet 新发的 GBCD 算法

机器学习模型都值得用Nature新算法尝试一下，作者似乎想要干掉传统机器学习

数据库介绍 | NAR | LncSEA 2.0：用于长非编码 RNA 相关的集合和富集分析

空间组学 | NatMethods | SpatialData: 一个开放和通用的空间组学数据框架

期刊泛读 | Cancer_Cell | 第 1 期 | If 48.8

髓外中性粒细胞生成：狡兔三窟？

玩转服务器—Jupyterhub一键开启Python学习之旅

学生信，谁还不是一个菜鸟啊？（至少曾经是吧）

肿瘤病人和正常人有差异表达但并不是说他们的血液层面就很显著

第一眼差点就被这个变化倍数唬住了

还有必要背诵和掌握正则表达式语法规则吗

硕博赶紧用起来！Cell53,026人蛋白质-表型资源库

如何用大语言模型做富集分析，这篇NatMethods文章教你

scRNA分析之后，如何看待结果和进行实验验证？这篇文章告诉你

人工智能 | NatMed | 用于疾病诊断辅助的通用医学语言模型

生信程序 | NatGenet | 使用潜在嵌入多变量回归分析多条件单细胞数据

数据库介绍 | NAR | SPDB：一个全面的资源和知识库，用于单细胞分辨率下的蛋白质组数据

细胞图谱 | NatMed | 人类血管细胞的器官型图谱

Cell | 健康与疾病中 53,026 名成人的血浆蛋白质组图谱 | 提供结果数据和源代码

玩转服务器—从卡顿到秒装，Conda焕新极速体验

10X单细胞转录组全方位吊打BD平台吗

转录组测序的表达量的两个归一化方向会影响差异分析吗

读《人类线粒体基因组》|系统回答：线粒体基因表达阈值到底卡多少合适

基于Python的Xenium空转分析流程

跟着Seurat官网学Xenium空转分析

肿瘤新抗原该怎么分析

强烈推荐！好看免费全面的在线绘图平台，点点即可快速组合成好看的示意图！

泛读合集 | 2024 全年 | Nature 系列优质期刊

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉