空间转录组多样本整合分析—stlearn

文摘科学 2024-10-03 17:00 江苏

大家好，今天介绍一款空间转录组整合分析的python软件——stlearn。

如果你还不会安装，可以看下之前的推文，windows系统本地安装stlearn：本地安装jupyterlab，并创建conda小环境——以空间转录组细胞互作之stlearn安装为例。如果大家感兴趣，后期再写Linux服务器安装stlearn的教程。下面从三个方面进行stlearn的空间转录组整合分析。

1. 为什么空间转录数据需要整合分析？
2. stlearn整合空间转录组样本的思路
3. stlearn整合空转数据代码实战

提出问题

1.为什么空转数据需要整合分析？

提高数据分析的准确性和可靠性：空转数据通常具有较高的噪声和异质性，整合分析可以通过融合来自不同来源的数据来提高数据的准确性和可靠性。
发现新的生物学信息：空转数据整合分析可以帮助发现新的生物学信息，例如细胞类型之间的相互作用、基因表达的空间模式等。

通常10x的空转测序数据都是4张slide为一组，因此我们大概率会用到多个空转样本的整合分析。那么如何进行多个样本的空转数据的整合分析呢？

注意：这里的整合不是单细胞和空间转录组整合，而是多个空间转录组测序样本的整合

解决问题思路

先把多个样本merge到一起之后；
然后使用harmony去除批次效应，降维聚类分群；
进而得到每个细胞（barcode）的亚群；
最后把每个细胞的亚群信息放回单个样本中。

代码实战

https://stlearn.readthedocs.io/en/latest/tutorials/Integration_multiple_datasets.html

import stlearn as stimport scanpy as scimport numpy as np
st.settings.set_figure_params(dpi=150)  # 设置图形输出分辨率

1 #数据处理# 连接两个样品adata_concat = block1.concatenate(block2)
# 预处理# 过滤基因：过滤表达细胞少于 3 个的基因sc.pp.filter_genes(adata_concat, min_cells=3)# 归一化数据sc.pp.normalize_total(adata_concat, target_sum=1e4)# 对数转换sc.pp.log1p(adata_concat)# 保存原始数据adata_concat.raw = adata_concat.copy()# 提取高变异基因sc.pp.highly_variable_genes(adata_concat, min_mean=0.0125, max_mean=3, min_disp=0.5)adata_concat = adata_concat[:, adata_concat.var.highly_variable]# 缩放数据sc.pp.scale(adata_concat, max_value=10)
# 降维：主成分分析（PCA）sc.pp.pca(adata_concat, n_comps=30, svd_solver='arpack')

2 #整合分析：Harmony# 准备元数据和 PCA 结果meta_data = adata_concat.obs  # 获取观察表（cell metadata）data_mat = adata_concat.obsm["X_pca"]  # 获取 PCA 降维后数据
# 导入并运行 Harmonyimport harmonypy as hmho = hm.run_harmony(data_mat, meta_data, "batch")  # 运行 Harmony，根据 "batch" 列进行批次校正
3 # 将结果映射回 AnnData 对象adata_concat.obsm["X_pca"] = ho.Z_corr.T  # 将校正后的数据替换原 PCA 数据Use code with caution. Learn more4 #聚类和可视化# 建立 KNN 图并运行 UMAPsc.pp.neighbors(adata_concat, n_pcs =30)sc.tl.umap(adata_concat)
# Leiden 聚类sc.tl.leiden(adata_concat, resolution=0.4)
# UMAP 可视化sc.pl.umap(adata_concat, color=["batch","leiden"])  # 同时以批次和聚类结果着色Use code with caution. Learn more

5 映射结果回原始样本
st.settings.set_figure_params(dpi=150)
# 将 Leiden 聚类结果映射回分块 A 第 1 个样品block1.obs["leiden"] = adata_concat.obs[adata_concat.obs.batch=="0"].leiden.values  # 根据 "batch" 列选择对应样品的数据
# 绘制聚类结果st.pl.cluster_plot(block1,use_label="leiden")
# 将 Leiden 聚类结果映射回分块 A 第 2 个样品block2.obs["leiden"] = adata_concat.obs[adata_concat.obs.batch=="1"].leiden.values
# 绘制聚类结果st.pl.cluster_plot(block2,use_label="leiden")
# 手动合并图像并调整坐标# 这是将两个样品放在同一个 AnnData 对象中的方法
# 初始化空间信息adata_concat.uns["spatial"] = block1.uns["spatial"]
# 水平拼接两个样品的高分辨率图像combined = np.hstack([block1.uns["spatial"]["V1_Breast_Cancer_Block_A_Section_1"]["images"]["hires"],                      block2.uns["spatial"]["V1_Breast_Cancer_Block_A_Section_2"]["images"]["hires"]])
# 将拼接后的图像映射到合并的 AnnData 对象

生信小博士

【生物信息学】R语言开始，学习生信。Seurat，单细胞测序，空间转录组。 Python，scanpy，cell2location。资料分享

最新文章

MS多发性硬化症|GWAS完整数据下载（孟德尔随机化分析用）

下载完整GWAS Catalog的snp数据（孟德尔随机化分析使用）

世界首例！本科生师弟连发3篇生信国际顶刊一跃成为特级教授！前途无量！

ChatGPT 今天宕机了！

使用R语言进行Elisa标曲制作——四参数拟合（4-pl）

人、小鼠、大鼠外周血免疫细胞比例大全

（蛋白）分子对接简明教程二

ggplot2中修改颜色|调色板

单细胞、转录组通路活性评分PROGENy

PROGENy--单细胞通路活性评分

一文厘清富集分析：GroupGO、enrichGO、gseGO、enrichKEGG、gseKEGG、enrichMKEGG

脂肪肝病的新名字——MAFLD！更科学，还是无奈的妥协？

全基因组关联分析（genome-wide association studies，GWAS）（一）

博士无成果？65万起安家费，你敢去吗？

天气骤冷，如何打赢“秋冬感冒战”？——亲身体验全攻略

R语言必会数据框操作dplyr

5分钟提交，24小时反馈！科研人的投稿噩梦结束了！

排名直接决定30万奖金？！你的学校上榜了吗？

从“论文工厂”到“学历工厂”：高学历人才的出路在哪里？

学术打假新战场：期刊编辑审稿的“公正性”还能相信吗？

硕博生的“打工时代”：是科研人才还是廉价劳动力？

学历贬值？全国硕士博士已被“明码标价”！

学习Abcam的完整实验步骤和流程

全国首发！“超级博后”计划强势来袭

如何使用wos下的clarivate 查询期刊近五年的影响因子IF？

单细胞空间转录组中细胞类型与通路关联分析（单细胞丰度与细胞通路相关性分析)-多组差异分析、相关性分析热图展示

空间转录组细胞通讯cellchat

单细胞、空转数据-细胞之间相关性

单细胞多组差异分析-多组火山图

Scientific Reports VS Heliyon：灌水期刊能否继续称霸？

harmony单细胞整合分析细节真让人纠结：数据集合并后取变异最大的3000个基因（即不取交集的方法）与取交集方法之间的优劣

单细胞整合专题：harmony、CCA、RPCA、LIGER、FastMNN、scvi、stlearn

harmony整合单细胞数据-去除批次效应

所有的样本都可以harmony合并分析吗？加测了TCR/BCR的单细胞数据能和普通的单细胞样本合并分析呢？

Seurat一键完成五种数据整合：harmony，CCA，RPCA,FastMNN,scVI，代码分享

多样本或批次的数据整合分析时，是否需要按样本分别进行ScaleData处理？

Cell发表的单细胞整合方法：LIGER，很好用！

空间转录组多样本整合分析—stlearn

如何在老板面前脱颖而出？选对CNS子刊是关键！

效率神器！最强GEO数据分析工具盘点，让科研不再头疼！

单细胞与空间转录组联合分析最佳教程！

Linux下载zenodo上的文件（conda）

流式细胞仪的空白对照、同型对照、FMO对照怎么做？

本科生获国自然青年学生基础研究项目！

Ly6G耗尽中性粒细胞

不同单细胞群相关性分析：提示亚群之间具有相关性

血泪教训：医生也不一定会区分血浆和血清！

单细胞中的data矩阵逆转为count矩阵

（蛋白）分子对接简明教程

HDOCK分子对接详细教程

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉

空间转录组 多样本整合分析—stlearn

提出问题

解决问题思路

代码实战

空间转录组多样本整合分析—stlearn