代谢组OPLS分析及可视化、ggClusternet中网络稳定性函数修正（数据工程）

学术 2024-10-13 20:28 江苏

本节内容属于思农数据工程产物，欢迎大家批评指正。

opls函数介绍

opls函数是ropls包中实现PCA、PLS-DA、OPLS-DA分析的函数。PCA、PLS-DA、OPLS-DA是代谢组学研究中常见的进行组间差异分析的多元统计方法，以OPLS-DA最为常见，首先对它们的原理进行简要了解。PCA即主成分分析，又为无监督学习的降维算法，其核心思想是通过找出一组最能反映数据特征的且线性无关的变量来对数据实行降维，简化分析过程；PLS-DA即偏最小二乘判别分析，其采用对变量X和Y都进行分解的办法，进而获取在不同特征下样品的得分，其对数据要求不高，同时适用于小样本量研究；OPLS-DA即正交偏最小二乘法判别分析，其在PLS-DA分析的基础上采用正交信号校正法，通过去除自变量X中与分类变量Y无关的数据变异，使分类信息主要集中在一个主成分中，从而模型变得简单和易于解释，然后剔除正交变量再次进行PLS-DA分析，进而将预测变量间的数据差异分为两个部分，第一部分代表与Y相关的差异，第二部分代表与Y不相关（正交垂直）的差异，OPLS可将这两部分差异进行区分，另外，其还可对样本分组进行预测。其在代谢组学中十分常见的原因除了能最大程度的展示组间差异信息外，还可以基于VIP值筛选出组间差异代谢物,VIP值越大代表其在模型进行组间区分时发挥的作用越大，常将VIP值大于1设置为差异代谢物的参考标准之一。

紧接着我们对于其在r中的实现进行学习，即基于opls函数，其基本形式如下，需要重点关注的参数为predI、orthoI、fig.pdfC；其中predI表示用来展示与Y相关的正交变量数量，最多为10个，设置为NA表示其根据情况自动调整，默认为NA；orthoI表示正交垂直变量数量即用来展示与Y不相关的差异的主成分个数，其数值决定此函数执行何种分析，当它设置为0时，表示进行PLS-DA分析，设置为非0整数时表示进行OPLS-DA分析，其最多为9个，NA代表自动调整，默认为0；fig.pdfC和info.txtc表示可以设置图片和文件显示和存储途径，none代表不进行显示，interactive代表存储交互环境中，即r环境中，myfile.pdf/txt代表指定输出路径，默认为interactive。

特别注意：设置导出为pdf格式且为特定导出路径后，若出现rstudio中plot里后续运行其他可视化代码不出图的情况，可先运行dev.off()退出导出pdf，后续可视化即可恢复正常；

opls(  x,  y = NULL,  predI = NA,  orthoI = 0,  algoC = c("default", "nipals", "svd")[1],  crossvalI = 7,  log10L = FALSE,  permI = 20,  scaleC = c("none", "center", "pareto", "standard")[4],  subset = NULL,  plotSubC = NA,  fig.pdfC = c("none", "interactive", "myfile.pdf")[2],  info.txtC = c("none", "interactive", "myfile.txt")[2])

不同分析实现代码：

#PCA，仅需导入代谢物相对丰度组成矩阵opls(data)#PLS-DA,需导入代谢物相对丰度组成矩阵、分组文件opls(data,group)#OPLS-DA,导入代谢物相对丰度组成矩阵、分组文件的同时需调整orthoI非0，正整数或NA,这里以NA举例opls(data,group,orthoI=NA)

OPLS-DA结果展示与解释

对于opls-da几种可视化方式进行学习，同时了解其图片背后的生态学意义，主要参考

https://mp.weixin.qq.com/s/XASA-pOlTccMK1YS9le2dQ、https://mp.weixin.qq.com/s/R7cjdpQmqImfSbnymezLjg

热图设置分组标签颜色

pheatmap:color <- list(Group=c(Group0="#ED7576",Group1="#86B1D4")，xx=c().....)

patchwork拼图报错

主要原因ggplot2更新至3.5.0导致patchwork不能正常使用，需将其退回至版本3.4.4，方可正常使用。

ggClusterNet::Robustness.Random.removal函数调整

在进行鲁棒性运算时报以上错误，初始时不知所云，故对函数进行逐行检查，发现了潜在的一些问题，并对其进行修改。原函数部分代码：

我们可以注意到14行物种的平均相对丰度是基于原始的otutab来进行计算的，而网络矩阵是基于相关矩阵的来进行筛选的，同时更新的物种的相对丰度向量也是基于相关矩阵来进行筛选的，这可能会导致一个问题，就是如果原始otutab和相关性矩阵物种顺序是否一致，如若不一致，将会导致sp.ra2中的物种无法和网络矩阵相匹配，我们对这一可能的问题进行检查：

首先检查otutab物种排列顺序：

其次检查相关性矩阵排列顺序：

显然，随着对前500物种的筛选，导致相关性物种矩阵顺序发生改变，因此sp.ra2=sp.ra[colSums(abs(cor))>0]这一代码将会导致错误的保留结果，无法与网络矩阵对应，因此，我们调整otutab的物种顺序与相关性矩阵一致后再计算sp.ra,同时因为相关性矩阵中保留物种并非全部物种，因此需保留原始otutab进行相对丰度计算，故对以上函数部分作出以下修改：

#去除第14行#25行后加入以下代码otutab1 <- otutab[,rownames(cor)]    sp.ra <- colMeans(otutab1)/mean(rowSums(otutab))#继续运行剩下代码#修改后 sum(row.names(network.raw) == names(sp.ra2))输出结果为网络矩阵行数#加权鲁棒性结果更正

作者：思农生信团队

http://mp.weixin.qq.com/s?__biz=MzUzMjYyMDE2OQ==&mid=2247500904&idx=1&sn=b5e1fa8bccb6c8be40b7d11a5490e5b7

微生信生物

根际互作生物学研究室是沈其荣院士土壤微生物与有机肥团队下的一个关注于根际互作的研究小组。本小组由袁军教授带领，主要关注：1.植物和微生物互作在抗病过程中的作用 2 环境微生物大数据整合研究3 环境代谢组及其与微生物过程研究体系开发

最新文章

根际细菌有助于缓解农药对植物产生的胁迫

期刊被on hold（警告）了，文章还能不能用于申请基金？

系统讨论和比较合成微生物群落构建方法

土壤真菌功能群内的物种型多样性驱动生态系统稳定性

系统发育树可视化复现实例（数据工程）

假单胞菌-地上部昆虫-叶片微生物-取食-菌群

使用tidverse 数据处理，以及热图可视化（数据工程）

Nature | 破解多年难题！中国学者对微生物研究再次突破，登顶国际舞台！

代谢组OPLS分析及可视化、ggClusternet中网络稳定性函数修正（数据工程）

微生物联合挖掘教程连载-PC-10-网络稳定性分析、分组之间距离比较和可视化、网络模块化分析

非靶向代谢组当前最佳性能限制排序OPLS-DA分析及其代谢特征挖掘（数据工程）

手写非靶代谢组t检验过程并优化可视化图形布局（数据工程）

利用大语言模型比对蛋白序列是否可以更新宏基因组研究中的序列比对过程？

微生物联合挖掘教程连载-PC-9-Correlation network analysis（相关和网络分析）

随机森林调参用于训练最佳模型（数据工程）

微生物联合挖掘教程连载-PC-8-群落构建过程

第二信使2'，3'-环磷酸腺苷对青枯菌生理和毒力的调控

六年前的这项技术创新，让微生物扩增子测序检测往前迈进一大步！

植物通过脯氨酸积累干扰植物病原真菌的非自我识别以促进真菌病毒的传播

数据分析 | 微生物宏基因组数据组装、分箱等高级分析如何可视化？

微生物种间相互作用促进多种物种生物膜中的关键物种以促进植物生长

重大进展！代谢组和宏基因组测序研究新思路，成为生信领域的“领头羊！

植物通过脯氨酸积累干扰植物病原真菌的非自我识别以促进真菌病毒的传播

第七届中国有机（类）肥料大会，现场领取《中国有机（类）肥料》巨著

江苏省农科院资环所土壤肥力与植物营养创新团队在基础性长期性监测方面取得系列进展

盐胁迫环境下不同微生物缓解碳限制的生态进化策略不同

【科研直播预告】土壤残体碳分析测试讲解+技术在线实时答疑，开学季活动&抽奖等你来！

利用效应蛋白对土传真菌病原菌的微生物组进行操纵

AsgeneDB：一个经过整理的砷代谢同源基因数据库及用于宏基因组注释的计算工具

微生信生物邀请您参加iMeta大会2024 (10.11-13深圳)

PCycDB：一个用于快速分析磷循环基因的全面且准确的数据库

终于整理好了！宏基因组数据分析教程+软件+代码

无机和有机处理对玉米根际微生物群落的影响

丛枝菌根真菌缓解干旱对土壤功能负面影响的研究

间作通过促进根际代谢物和微生物组之间的联系来促进玉米生长和养分吸收

结合代谢组学和转录组学策略揭示蓖麻植物在碱胁迫下萌发阶段的适应机制

微生物与植物之间通信渠道的构建

植物-病原互作中的糖类难题：转化酶和糖运输蛋白的作用取决于病害系统

枯草芽孢杆菌SL44与霍氏肠杆菌Wu15联合防治植物病害

有机基质与秸秆降解复合微生物剂复合系统提高了稻麦轮作土壤有机质水平和微生物丰度

土壤中的自然植物病害抑制作用延伸到对昆虫害虫的控制

全网关注！这个微生物宏基因组分析交流会到南京了！

嫁接到抗性砧木能改变根系分泌物成分有助于减少冠瘿病

上海市农业科学院园艺所设施茄果团队招聘博士后

植物-病原互作中的糖类难题：转化酶和糖运输蛋白的作用取决于病害系统

Purpureocilium lilacinum和Penicillium chrysogenum降解重油污泥中烃类及修复土壤潜力

链霉菌 Streptomyces setonii WY228 通过VOC调节植物生长并增强盐胁迫耐受性

种间相互作用促进关键种在多物种生物膜中的作用从而促进植物生长

宏基因组学揭示了在黑土地区长期施用化学肥料和有机肥料下土壤碳氮循环功能配置的差异

植物通过脯氨酸积累干扰植物病原真菌的非自我识别以促进真菌病毒的传播

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉