空间转录组细胞通讯-stLearn（cell2location/RCTD）

文摘科学 2024-03-20 17:25 浙江

复现：Lineage-specific regulatory changes in hypertrophic cardiomyopathy unraveled by single-nucleus RNA-seq and spatial transcriptomics.Cell discovery.2023

import stlearn as st
import scanpy as sc
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from pathlib import Path
import os
os.getcwd()

# 读取空转数据
adata_dct = {}
for i in Path("../").glob("rawdata_st/*"):
  _s = str(i).split('_')[2]
  _a = sc.read_visium(i,library_id=_s)
  _a.obs.index = [_s + "_" + bc[0:len(bc)] for bc in _a.obs.index.tolist()]
  _a.var_names_make_unique()
  adata_dct[_s] = _a
st_adata = sc.concat(adata_dct,label="library_id",uns_merge="unique")

st.pp.filter_genes(st_adata, min_cells=5)
st.pp.normalize_total(st_adata)

# 载入cell2location或RCTD注释文件
spot_mixtures = pd.read_csv('../st_cell2location_res.csv', index_col=0) # 或RCTD文件
# 修改字符
spot_mixtures['predicted.id'] = spot_mixtures['predicted.id'].str.replace('q05cell_abundance_w_sf_', '')
labels = spot_mixtures.loc[:,'predicted.id'].values.astype(str)
spot_mixtures = spot_mixtures.drop(['predicted.id','max.score'],axis=1)
spot_mixtures.columns = [col.replace('q05cell_abundance_w_sf_', '')
                         for col in spot_mixtures.columns]
spot_mixtures = spot_mixtures.loc[st_adata.obs.index,:]
# 查看细胞名是否一致
print('Spot mixture order correct?: ',
      np.all(spot_mixtures.index.values==st_adata.obs_names.values))

st_adata.obs['cell_type'] = labels
st_adata.obs['cell_type'] = st_adata.obs['cell_type'].astype('category')
st_adata.uns['cell_type'] = spot_mixtures
fig, axs = plt.subplots(1, 5, figsize=(20, 10))
for i, library in enumerate(
    ['D1','D2',"H1","D3","H2"]
):
    ad = st_adata[st_adata.obs.library_id == library, :].copy()
    sc.pl.spatial(
        ad,
        img_key="hires",
        library_id=library,
        color=['cell_type'],
        size=1.5,
        color_map='magma',
        ax=axs[i],
        legend_loc='right margin',
        frameon=False
    )
    plt.tight_layout()

lrs = st.tl.cci.load_lrs(['connectomeDB2020_lit'], species='human')
print(len(lrs))
2293

R
CellChatDB <- CellChatDB.human # set CellChatDB <- CellChatDB.mouse 调用小鼠数据库
interaction_input <- CellChatDB$interaction
complex_input <- CellChatDB$complex
cofactor_input <- CellChatDB$cofactor
geneInfo <- CellChatDB$geneInfo
write.csv(interaction_input, file = "interaction_input_CellChatDB.csv")
write.csv(complex_input, file = "complex_input_CellChatDB.csv")
write.csv(cofactor_input, file = "cofactor_input_CellChatDB.csv")
write.csv(geneInfo, file = "geneInfo_input_CellChatDB.csv")

lrs_cc = pd.read_csv('../interaction_input_CellChatDB.csv', index_col=0)
# stlearn目前配受体信息不能用多聚体形式，所以cellchat信息需自己调整
lrs_cc.index=lrs_cc['pathway_name']
# 选取特定通路上的配受体
lrs_cc = lrs_cc.query('pathway_name == "FGF"| pathway_name== "CXCL"|pathway_name== "NOTCH"')
lrs_cc = lrs_cc.loc[:,'interaction_name'].values.astype(str)

# 修改基因名-解决报错
st_adata.var.index =st_adata.var.index.str.replace('_', '')
# 转化对象-解决报错
st_adata = st.convert_scanpy(st_adata)
# 运行配体-受体分析
st.tl.cci.run(st_adata, lrs_cc,
                  min_spots = 5, #Filter out any LR pairs with no scores for less than min_spots
                  distance=None, # None defaults to spot+immediate neighbours; distance=0 for within-spot mode
                  n_pairs=10000, # Number of random pairs to generate; low as example, recommend ~10,000
                  n_cpus=4, # Number of CPUs for parallel. If None, detects & use all available.
                  )

lr_info = st_adata.uns['lr_summary']
# P值调整
st.tl.cci.adj_pvals(st_adata, correct_axis='spot',
                   pval_adj_cutoff=0.05, adj_method='fdr_bh')
lr= pd.DataFrame(st_adata.obsm['lr_scores'],index=st_adata.obs.index,columns=st_adata.uns['lr_summary'].index)
lr['interaction_score'] = lr.apply(lambda x: x.sum(), axis=1)
st_adata.X.todense()[:,0]
st_adata[:,0].X = csr_matrix(lr['interaction_score']).T
st_adata.X.todense()[:,0]

# 将score值替换某个基因表达量
st_adata.X.todense()[:,0]
st_adata[:,0].X = csr_matrix(lr['interaction_score']).T
st_adata.X.todense()[:,0]
st_adata.var.index[0]

# 提取其中某一样本进行可视化
ad = st_adata[st_adata.obs.library_id == 'H1', :].copy()
a = ad.uns.get('spatial').get('H1')
ad.uns['spatial'] = {}
ad.uns['spatial']['H1'] = a
st.pl.gene_plot(ad, gene_symbols=st_adata.var.index[0], contour=True,cell_alpha=0.5)

朴素的科研打工仔

专注于文献的分享，浙大研究生学习生活的记录。

最新文章

Compass| 单细胞代谢通量预测下游分析

细胞代谢|元细胞构建+代谢通量分析

相关性|空转+空代区域GSVA相关性分析

引爆学术界“ 核弹 ”寒门学子凭借这篇Nature一跃成为特级教授！独占鳌头！

细胞代谢|元细胞构建+代谢通量分析

共表达网络| WGCNA与hdWGCNA实操

细胞比例|一文打通单细胞转录组细胞类型丰度变化分析

数据整合|单细胞转录组多样本/不同测序手段整合

免费免费~影像组学论文拆解训练营火热开展中 | SCI制造机--影像组学+病理组学+深度学习人工智能培训班

Adv. Sci.丨宫内生长受限新生儿对肝损伤的性二型反应（解读）

空间转录组细胞信号流和轨迹推断-COMMOT/SPATA

空间转录组细胞通讯-stLearn（cell2location/RCTD）

单细胞和空间转录组联合分析-Cell2location+MIA

单细胞和空间转录组联合分析-RCTD去卷积

文献合集(五)｜单细胞如何做？做到什么程度？

文献合集(四)｜单细胞如何做？做到什么程度？

文献合集(三)｜单细胞如何做？做到什么程度？

文献合集(二)｜单细胞如何做？做到什么程度？

文献合集(一)｜单细胞技术如何应用？

拟时序| CytoTRACE +slingshot呈现

拟时序| monocle3+velo.R+scvelo呈现

文献合集(二)｜单细胞如何做？做到什么程度？

文献合集(一)｜单细胞技术如何应用？

2022 IF 正式发布

拟时序| monocle3+velo.R+scvelo呈现

WB| 条带变形计

共表达网络| WGCNA与hdWGCNA实操

这几个生信分析常用工具你真的学通了吗？单细胞，多组学or基因都能分析到底！

人工智能基因组学，Chip-Seq、RNA-Seq中预测premiRNA，您想知道的都在这！

单细胞/空间转录组分析常用工具汇总

新手入学ScRNA-seq分析流程

空间转录组|Seurat包初探

表观遗传学|Chip-seq、ATAC-seq分析流程

linux|合并文件命令

表观转录组|m6A-seq分析流程

整理| 常见注释数据库介绍

Shiny|自测单细胞数据供人访问

转录组|DESeq2差异基因分析-小趣事

空间转录组|Seurat包初探

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉