手写非靶代谢组t检验过程并优化可视化图形布局（数据工程）

学术 2024-09-29 11:29 江苏

本节内容属于思农数据工程产物，欢迎大家批评指正。

差异代谢物完整流程分析-t-test,整理出常用所有阈值结果，另外对于可视化结果进行进一步美化和调整。

rm(list = ls())#清空环境#加载工作目录setwd("C:/代谢组/data")#确定结果输出路径outpath <- "C:/代谢组/result"diffpath.2 = paste(outpath,"/2_差异代谢物分析/",sep = "")dir.create(diffpath.2)#载入相关包library(dplyr)library(phyloseq)library(ggplot2)#加载ps文件，包含代谢物相对丰度表，样本信息，代谢物信息ps <- readRDS("analysis1_level24_ra_metabolism.rds")ps= ps %>%filter_taxa(function(x) sum(x ) > 0 , TRUE)#过滤在任一样本中都不存在的微生物data <- t(data.frame((otu_table(ps))))#提取代谢物相对丰度数据group <- sample_data(ps)#提取组别信息data <- data[group$ID,]#保证代谢物数据和丰度数据样本顺序一致data <- cbind(group[,1:2],data)#添加ID和组别列data$Group <- factor(data$Group)#将组别列转换为因子，levels参数可指定因子顺序，labels参数可指定分组标签data.raw <- data#原始数据保存环境中#提取各组平均丰度tax <- data.frame(tax_table(ps))tax <- tax[,c("Mean1","Mean2","Mean3")]tax1 <-data.frame(matrix(as.numeric((unlist(tax))),ncol=ncol(tax),nrow=nrow(tax)))#将数据调整为数值变量，便于计算rownames(tax1) <- rownames(tax)#行名colnames(tax1) <- colnames(tax)#列名
#---Group1-Group0----#筛选对应分组变量group1 <- "Group1-Group0"log2FC <-log2((tax1$Mean1) /(tax1$Mean2))data <- data.raw[which(!data.raw$Group=="Group2"),]#差异检验result=data.frame(ID=colnames(data)[3:ncol(data)],                  p=sapply(data[,3:ncol(data)], function(x){t.test(x~data$Group)[["p.value"]]}),                  logFC=log2FC)#P值进行BH校正        result <- cbind(result,p_adj=p.adjust(result$p, method = "BH"))#到这与上次更新保持一致
#新增内容，多阈值结果统计#根据不同阈值筛选差异微生物result$level_padj_fc1 = as.factor(ifelse(as.vector(result$logFC)>0&as.vector(result$p_adj)<0.05, "enriched",                      ifelse(as.vector(result$logFC)<0&as.vector(result$p_adj)<0.05, "depleted","nosig")))result$level_fc2 = as.factor(ifelse(as.vector(result$logFC)>1&as.vector(result$p)<0.05, "enriched",                      ifelse(as.vector(result$logFC)<(-1)&as.vector(result$p)<0.05, "depleted","nosig")))result$level_fc1.5=as.factor(ifelse(as.vector(result$logFC)>log2(1.5)&as.vector(result$p)<0.05, "enriched",                        ifelse(as.vector(result$logFC)<(-log2(1.5))&as.vector(result$p)<0.05, "depleted","nosig")))result$level_fc1.2=as.factor(ifelse(as.vector(result$logFC)>log2(1.2)&as.vector(result$p)<0.05, "enriched",                        ifelse(as.vector(result$logFC)<(-log2(1.2))&as.vector(result$p)<0.05, "depleted","nosig")))result$level_fc1=as.factor(ifelse(as.vector(result$logFC)>0&as.vector(result$p)<0.05, "enriched",                                    ifelse(as.vector(result$logFC)<0&as.vector(result$p)<0.05, "depleted","nosig")))result1<-resultresult1$Genus = row.names(result1)#定义一列方便画图和流程化result1 <- result1[order(result$level_padj_fc1,result1$level_fc2,result1$level_fc1.5,result1$level_fc1.2,result1$level_fc1),]#按顺序排列#导出检验结果result1 <- cbind(tax1[rownames(result1),c("Mean1","Mean2")],result1)file = paste(diffpath.2,"/",group1,"t.test.csv",sep = "")write.csv(result1,file,quote = TRUE)#整理作图结果,以p<0.05,差异倍数选定为1作为阈值进行示例展示，具体阈值确定根据实际情况确定result2 <- result1 %>%   dplyr::mutate(ord = logFC^2) %>%  dplyr::filter(level_fc1!= "nosig") %>%  dplyr::arrange(desc(ord)) %>%  head(n = 5)#添加变化率前五标签file = paste(diffpath.2,"/",group1,"_plotlabel.csv",sep = "")write.csv(result2,file,quote = T)
result3 <- result1 %>%   dplyr::mutate(ord = logFC^2) %>%  dplyr::filter(level_fc1!= "nosig") %>%  dplyr::arrange(desc(ord))#总结所有差异物种 file = paste(diffpath.2,"/",group1,"_all_difference_metabolism.csv",sep = "")write.csv(result3,file,quote = TRUE)
#可视化，指定图例标签，包含level和其具体数量ld <- paste("depleted",nrow(result1[result1$level_fc1=="depleted",]),sep = " ")lr <- paste("enriched",nrow(result1[result1$level_fc1=="enriched",]),sep = " ")ln <- paste("nosig",nrow(result1[result1$level_fc1=="nosig",]),sep = " ")
p <- ggplot(result1,aes(x =logFC ,y = -log10(p), colour=level_fc1)) +  geom_point(alpha=0.83,size=1.1) +  geom_point(data=result2,aes(x =logFC ,y = -log10(p), fill=level_fc1),shape=21,size=2,colour="black")+  scale_fill_manual(values = c("enriched"="#ffad73","depleted"="#26b3ff","nosig"="grey"))+  geom_hline(yintercept=-log10(0.05),linetype="dashed",color = 'black',size = 0.5) +  geom_vline(xintercept=c(-1,1),linetype="dashed",color = 'black',size = 0.5) +  ggrepel::geom_text_repel(data=result2, aes(x =logFC ,y = -log10(p), label=Genus), show.legend=FALSE,force=2,size=3) +  scale_color_manual(values=c("enriched"="#ffad73","depleted"="#26b3ff","nosig"="grey"),  labels=c("enriched"=lr,"depleted"=ld,"nosig"=ln)) +   ggtitle(group1) + theme(panel.border=element_rect(colour= "black",fill=NA,size=0.75),                         panel.grid.minor=element_blank(),                         panel.background=element_blank(),                         plot.background=element_blank(),                         axis.title=element_text(face="bold",color="black",size=11),                         plot.title =element_text(face="bold",color="black",size=12),                          axis.text=element_text(color="black",size=10),                         legend.background=element_blank(),                         legend.title=element_blank(),                         legend.text=element_text(face="bold",color="black",size=10),                         legend.spacing.x=unit(0,"cm"),                         legend.key = element_blank(),                         legend.key.size =unit(0.6,"cm"),                         legend.position=c(0.99,0.99),                         legend.justification = c(0.95,0.84))+  guides(fill="none",color = guide_legend(override.aes = list(size=2)))#去除填充图例p#根据实际效果调整图例位置避免重叠可以调整legend.position=c(0.99,0.99),legend.justification = c(0.95,0.84)#legend.position表示图例在图中位置，参数分别代表其在坐标轴占比，前者x轴，后者y轴，c(1,1)表示图中右上角#egend.justification表示图例与所给位置对齐方式，前置代表x轴，后者代表y轴，c(0.5,0.5)表示居中对齐，即图例中心坐标为指定位置，0分别代表左对齐和下对齐，1分别代表右对齐和上对齐#保存结果file = paste(diffpath.2,"/",group1,"_","Edger_Volcano.pdf",sep = "")ggsave(file,p,width = 12/2.54,height = 10.5/2.54)
file = paste(diffpath.2,"/",group1,"_","Edger_Volcano.png",sep = "")ggsave(file,p,width = 12/2.54,height = 10.5/2.54)#出图效果如下图所示，该图片为随机数据出图，无实际意义

作者：思农生信团队成员：汪志祥

http://mp.weixin.qq.com/s?__biz=MzUzMjYyMDE2OQ==&mid=2247500894&idx=1&sn=a5695c9fc813e51567b92c18c290dfe2

微生信生物

根际互作生物学研究室是沈其荣院士土壤微生物与有机肥团队下的一个关注于根际互作的研究小组。本小组由袁军教授带领，主要关注：1.植物和微生物互作在抗病过程中的作用 2 环境微生物大数据整合研究3 环境代谢组及其与微生物过程研究体系开发

最新文章

根际细菌有助于缓解农药对植物产生的胁迫

期刊被on hold（警告）了，文章还能不能用于申请基金？

系统讨论和比较合成微生物群落构建方法

土壤真菌功能群内的物种型多样性驱动生态系统稳定性

系统发育树可视化复现实例（数据工程）

假单胞菌-地上部昆虫-叶片微生物-取食-菌群

使用tidverse 数据处理，以及热图可视化（数据工程）

Nature | 破解多年难题！中国学者对微生物研究再次突破，登顶国际舞台！

代谢组OPLS分析及可视化、ggClusternet中网络稳定性函数修正（数据工程）

微生物联合挖掘教程连载-PC-10-网络稳定性分析、分组之间距离比较和可视化、网络模块化分析

非靶向代谢组当前最佳性能限制排序OPLS-DA分析及其代谢特征挖掘（数据工程）

手写非靶代谢组t检验过程并优化可视化图形布局（数据工程）

利用大语言模型比对蛋白序列是否可以更新宏基因组研究中的序列比对过程？

微生物联合挖掘教程连载-PC-9-Correlation network analysis（相关和网络分析）

随机森林调参用于训练最佳模型（数据工程）

微生物联合挖掘教程连载-PC-8-群落构建过程

第二信使2'，3'-环磷酸腺苷对青枯菌生理和毒力的调控

六年前的这项技术创新，让微生物扩增子测序检测往前迈进一大步！

植物通过脯氨酸积累干扰植物病原真菌的非自我识别以促进真菌病毒的传播

数据分析 | 微生物宏基因组数据组装、分箱等高级分析如何可视化？

微生物种间相互作用促进多种物种生物膜中的关键物种以促进植物生长

重大进展！代谢组和宏基因组测序研究新思路，成为生信领域的“领头羊！

植物通过脯氨酸积累干扰植物病原真菌的非自我识别以促进真菌病毒的传播

第七届中国有机（类）肥料大会，现场领取《中国有机（类）肥料》巨著

江苏省农科院资环所土壤肥力与植物营养创新团队在基础性长期性监测方面取得系列进展

盐胁迫环境下不同微生物缓解碳限制的生态进化策略不同

【科研直播预告】土壤残体碳分析测试讲解+技术在线实时答疑，开学季活动&抽奖等你来！

利用效应蛋白对土传真菌病原菌的微生物组进行操纵

AsgeneDB：一个经过整理的砷代谢同源基因数据库及用于宏基因组注释的计算工具

微生信生物邀请您参加iMeta大会2024 (10.11-13深圳)

PCycDB：一个用于快速分析磷循环基因的全面且准确的数据库

终于整理好了！宏基因组数据分析教程+软件+代码

无机和有机处理对玉米根际微生物群落的影响

丛枝菌根真菌缓解干旱对土壤功能负面影响的研究

间作通过促进根际代谢物和微生物组之间的联系来促进玉米生长和养分吸收

结合代谢组学和转录组学策略揭示蓖麻植物在碱胁迫下萌发阶段的适应机制

微生物与植物之间通信渠道的构建

植物-病原互作中的糖类难题：转化酶和糖运输蛋白的作用取决于病害系统

枯草芽孢杆菌SL44与霍氏肠杆菌Wu15联合防治植物病害

有机基质与秸秆降解复合微生物剂复合系统提高了稻麦轮作土壤有机质水平和微生物丰度

土壤中的自然植物病害抑制作用延伸到对昆虫害虫的控制

全网关注！这个微生物宏基因组分析交流会到南京了！

嫁接到抗性砧木能改变根系分泌物成分有助于减少冠瘿病

上海市农业科学院园艺所设施茄果团队招聘博士后

植物-病原互作中的糖类难题：转化酶和糖运输蛋白的作用取决于病害系统

Purpureocilium lilacinum和Penicillium chrysogenum降解重油污泥中烃类及修复土壤潜力

链霉菌 Streptomyces setonii WY228 通过VOC调节植物生长并增强盐胁迫耐受性

种间相互作用促进关键种在多物种生物膜中的作用从而促进植物生长

宏基因组学揭示了在黑土地区长期施用化学肥料和有机肥料下土壤碳氮循环功能配置的差异

植物通过脯氨酸积累干扰植物病原真菌的非自我识别以促进真菌病毒的传播

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉