METAflux | 实操教程2-Bulk RNA-seq数据分析步骤拆解

文化 2024-10-10 11:00 黑龙江

我们在第一期教程中：METAflux | 实操教程1-简介和快速上手，简单介绍了Bulk RNA-seq和scRNA_seq的大致流程，没有对其进行详细解析。本期推文小编将详细介绍Bulk RNA-seq的工作流程。

1.Load the library

library(METAFlux)

2.Load data

2.1 Load gene expresssion data

METAFlux 需要基因表达数据作为输入。

基因表达矩阵应为基因 x 样本矩阵，其中行名称为人类基因名称（基因符号），列名称应为样本名称。请注意，METAFlux 不支持其他基因 ID。
在使用 METAFlux 之前，应将输入基因表达矩阵标准化（例如，对数转换等）。METAflux 不会对表达式数据执行任何归一化。
基因表达数据不能为负值。

2.2 Load the METAFlux underlying GEM information

在开始之前，我们可以看一下Human-GEM 文件。我们使用 Human-GEM（由 13082 个代谢反应和 8378 个代谢物组成）作为我们的基础代谢模型。对于每个反应，我们都有一个唯一的反应 ID 和 SUBSYSTEM（即该反应属于哪个途径）。

library(METAFlux)data("human_gem")

对于每个反应，我们还从该文件中获取其他重要信息，例如：反应是否可逆，发生在哪个隔室中，以及涉及哪些代谢物和基因。1对1关系在下面的卡通中用颜色编码。

2.3 Load the METAFlux medium

加载代谢物数据

data("cell_medium")# for cell line model
data("human_blood")# for human derived samples

2.3.1 what's is "medium" and why do we need it?

在METAFlux流程过程中，"medium"代表的是在肿瘤微环境中（TME）的营养物质（代谢产物）,这些营养物质可以被细胞吸收

option 1. if users do not have prior knowledge about their medium composition

如果对代谢物没有先验知识，这里提供2种通用代谢物。METAFlux中通用有 2 个 medium代谢物文件：cell_medium 和 human_blood medium。Cell_medium 可用于细胞系模型，人血培养基可用于患者来源的样品。细胞系培养基含有 44 种代谢物，其相应的交换反应可在“reaction_name”列下找到。人血培养基在人血中含有 64 种代谢物。

option 2. if users have prior knowledge about their medium composition

要删除营养物质，只需删除该营养物质所在的整行，但请不要更改列名称或删除列；要添加额外的营养物质，请参阅营养物质查找文件。

data("nutrient_lookup_files")

“营养查找文件”包含 1648 个交换反应（注意：交换反应是人工反应！将它们包括在这里，因为这是细胞如何摄取或释放代谢物的数学表示）。例如，如果我们需要添加代谢物 “萘”，可以在搜索框中搜索，然后就会找到相应的营养反应和方程式。接下来，需要将新的萘和HMR_7110行添加到当前的 medium 文件中。此更新的 medium 文件稍后将用于建模。

3.Calculate MARS (Metabolic Reaction Activity Score）

我们可以用 GPR（基因-蛋白质-反应）从基因表达中计算单个样品归一化后的代谢反应活性MRAS。

scores<-calculate_reaction_score(bulk_test_example)
head(scores)

4.Calculate flux

我们计算13082个反应的代谢通量。

#flux<-compute_flux(mras=scores,medium = cell_medium)#if data are cell line samples
flux<-compute_flux(mras=scores,medium = human_blood)#if data are human derived samples

5.Inspecting and interpreting the flux data

通量的迹象具有生物学意义。这里通量的 “sign” 表示方向。例如，对于营养物质吸收/释放情况（营养物质查找文件中的 1648 个交换反应），正值表示化合物的释放，负值表示化合物的吸收。对于其他反应，正值表示净通量是向前的，负的通量表示净通量是反向的。绝对值表示磁通量的大小。
需要注意的一点是，由于我们正在最小化模型中总通量的总和，因此我们将得到一个简洁的通量数据输出，这意味着许多反应将接近 0 通量。（例如，有些反应应该只向前进行，但预测的通量有一个非常小的负号，可以认为接近 0 通量）
提取目标数据。如果对代谢物的摄取或释放非常感兴趣，可以搜索 “nutrient lookup file” 来获得代谢物交换反应 ID。例如，如果我们想知道葡萄糖摄取，我们需要搜索 'glucose' 来获得葡萄糖摄取反应，即 HMR_9034。这些可以被视为葡萄糖代谢物摄取率。接下来，我们可以提取数据（提取感兴趣的代谢物的摄取率）：

data("nutrient_lookup_files")
glucose<-data.frame(glucose=flux[grep("HMR_9034",human_gem$ID),])
glucose
##            glucose
## Sample1 -0.1576912
## Sample2 -0.1896533
## Sample3 -0.1522470
## Sample4 -0.1692082
## Sample5 -0.1902032
## 这里就看到了具体样本的具体代谢物活性

library(ggplot2)
ggplot(glucose,aes(y=-glucose,x="sample"))+geom_boxplot()+ggtitle("Glucose uptake level")+xlab("")+ylab("Glucose uptake scores")

#HMR_4363: 2-phospho-D-glycerate[c] <=> H2O[c] + PEP[c]
HMR_4363<-data.frame(hmr4363=flux[grep("HMR_4363",human_gem$ID),])

我们还可以计算142条通路的通路水平活性。对于给定的通路，活性水平可以计算为与该通路相关的反应的平均通量，通路的活性水平是由相关代谢反应的通路反映。

#compute pathway level activity for all samples
pathway<-unique(unlist(human_gem$SUBSYSTEM))
pathway_score<-list()
for (i in pathway){
path=i
activity_score<-c()
for (d in 1:ncol(flux)){
activity_score[d]<-mean(abs(flux[which(unlist(human_gem$SUBSYSTEM)==i),d]))
} 
pathway_score[[i]]<-activity_score
}

all_pathway_score<-as.data.frame(do.call(rbind,pathway_score))

#heatmap 
mapal <- colorRampPalette(RColorBrewer::brewer.pal(11,"RdBu"))(256)
pheatmap::pheatmap(all_pathway_score,cluster_cols = F,color = rev(mapal),scale = "row")

如图所示展示就是研究对象的142条代谢通路活性的热图。

本期分享到这里就结束了，我们下期再会~~

关注公众号，下回更新不迷路

http://mp.weixin.qq.com/s?__biz=MzI4MjY5ODI1Nw==&mid=2247492657&idx=1&sn=98690645c70c0e7311a34857ab392037

生信宝库

本公众号只用于生信知识的收集与传播，以及生信人之间互相交流和学习，不会涉及任何商业利益。本公众号各小编平时忙于科研，更新文章较其它同类型公众号较慢，但保持宁缺毋滥的本心，只更新对大家有用的推文。

最新文章

Nature 云平台复现，正刊单细胞分析也能轻而易举搞定！

通俗基于信号通路打分对结直肠癌进行分型也能发Nature genetics？

METAflux | 实操教程4-源码理解

METAflux | 实操教程3-single cell RNA-seq分析步骤拆解

METAflux | 实操教程2-Bulk RNA-seq数据分析步骤拆解

METAflux | 实操教程1-简介和快速上手

METAFlux：特异解析肿瘤微环境的代谢重编程

METAflux | 实操教程3-single cell RNA-seq分析步骤拆解

METAflux | 实操教程2-Bulk RNA-seq数据分析步骤拆解

METAflux | 实操教程1-简介和快速上手

METAFlux：特异解析肿瘤微环境的代谢重编程

METAflux | 实操教程2-Bulk RNA-seq数据分析步骤拆解

METAflux | 实操教程1-简介和快速上手

METAFlux：特异解析肿瘤微环境的代谢重编程

METAflux | 实操教程1-简介和快速上手

METAFlux：特异解析肿瘤微环境的代谢重编程

DeepVelo: 颠覆传统的单细胞速率分析——基于神经常微分方程的深度学习

JEM：别出心裁！尿液单细胞测序揭示膀胱肿瘤的免疫微环境

IF=5.2 专题征稿|揭示免疫代谢：单细胞和空间转录组学阐明疾病动态

实操教程 | DeepVelo：基于深度学习的RNA速率分析

Genome Biology | 突破RNA速率分析新高度：DeepVelo如何征服多谱系数据

Cancer cell: 科学家揭示乳腺癌肺转移过程中的免疫调控机制

TCellSI:T细胞状态评分及免疫微环境预测工具

免疫细胞图谱揭示了肺腺癌中Tfh依赖的三级淋巴结构的抗肿瘤作用

文献解读 | 单细胞多组学研究揭示前庭神经鞘瘤的肿瘤微环境及其表观遗传状态

文献解读 | scRNA-seq揭示前庭神经鞘瘤免疫微环境的异质性

癌旁组织预测肺腺癌预后-简单的模型也能发高分

综述 | 单细胞技术在揭示免疫检查点阻断与联合治疗机制的应用

SpaCET：基于空转数据鉴定肿瘤功能区域 | 算法原理介绍

SpaCET实操教程二 | 空转数据的反卷积与基因集评分分析

SpaCET实操教程一|空间转录组学数据的反卷积与细胞通讯分析

SpaCET：基于空转数据鉴定肿瘤功能区域

SpaCET实操教程二 | 空转数据的反卷积与基因集评分分析

SpaCET实操教程一|空间转录组学数据的反卷积与细胞通讯分析

SpaCET：基于空转数据鉴定肿瘤功能区域

SpaCET实操教程一|空间转录组学数据的反卷积与细胞通讯分析

SpaCET：基于空转数据鉴定肿瘤功能区域

Cancer-Finder：一站式迅速精准的鉴定出scRNA和ST数据中的癌细胞

Cottrazm | 识别空转数据中的肿瘤核心区域

饮食与微生物群：调控免疫功能与炎症的关键因素

实体瘤免疫治疗的指南针：免疫检查点抑制剂生物标志物

文献解读 | 血液中循环游离RNA作为结核病检测的宿主反应标志物

张泽民老师综述：基因组学技术加速我们对癌症的认知

Open-ST：新型高分辨率三维空间转录组学平台

Cell metabolism综述：系统认识衰老和癌症之间的紧密联系

科研经费预存活动来袭：高增值，好礼多

重磅综述：一文说清T细胞耗竭对临床免疫治疗的影响

教你快速开展一项有意义的非肿瘤单细胞挖掘课题

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉