R语言:otu表格的绝对丰度转换为相对丰度

学术   科学   2025-01-06 08:54   上海  

在扩增子研究(amplicon study)中,相对丰度和绝对丰度是两种常见的数据表示方式,它们在微生物群落分析、生态学研究等领域都有广泛应用。它们的应用场景和区别如下:


1. 相对丰度(Relative Abundance)

定义:相对丰度指的是某一物种或类别在总样本中所占的比例,通常以百分比或比例的形式表示。具体计算方法是该物种的序列数或丰度除以总序列数或总丰度。


应用场景:

① 群落结构分析:在微生物群落分析中,研究者往往对物种的相对丰度进行比较,关注群落组成的变化。例如,比较健康与疾病样本中微生物的相对丰度差异。
② 群体变化趋势:相对丰度可以反映不同条件下群体的组成变化,比如时间、环境因素、药物处理等。
③ 群落多样性研究:利用相对丰度可以评估样本间的多样性与均匀度。例如,Shannon多样性指数、Simpson多样性指数等通常使用相对丰度作为输入。
④ 高通量测序分析:在基因组学中,尤其是在16S rRNA基因扩增子或宏基因组测序数据分析时,相对丰度能够有效简化数据,并且避免样本中绝对丰度因测序深度的差异而产生偏差。


2. 绝对丰度(Absolute Abundance)

定义:绝对丰度指的是某一物种或类别在样本中的真实数量,通常是某个物种的细胞数、DNA拷贝数或其他定量指标的实际值。


应用场景:

① 精准计数:当研究者需要了解某一物种在样本中的具体数量时,绝对丰度是非常重要的。例如,检测某种病原微生物的确切数量,以评估其致病性或临床意义。
② 生物量估算:例如,在植物或微生物群落中,绝对丰度可以用来估算某一物种的生物量或对环境的影响。
③ 标准化实验条件:当不同样本的测序深度和样本体积不一致时,绝对丰度可以帮助对不同实验条件下的物种数量进行标准化。
④ 环境污染物分析:在环境监测中,使用绝对丰度可以精确评估污染物(如微生物或化学物质)在环境中的实际浓度。


3. 相对丰度与绝对丰度的区别


4. otu表格的绝对丰度转换为相对丰度

otu表格的格式是每行是一个微生物,每列是一个样本,如下截图


相对丰度就是在这个样本中微生物的绝对丰度除以这个样本中所有微生物绝对丰度的和


用R语言的tidyverse包来实现,代码如下:

# 加载R包

library(tidyverse)

# 读取绝对丰度表格(制表符分隔)

df <- read.table("EXAMPLE_otutab.txt",header = T,check.names = F,sep = "\t")head(df)

# 将第一列列名设置为"otuID"

names(df)[1] <- "otuID"

# 将绝对丰度转换为相对丰度

new.df<-df %>%   pivot_longer(!otuID) %>%   group_by(name) %>%   mutate(total=sum(value)) %>%   mutate(relative_abun=value/total) %>%   pivot_wider(id_cols=c("otuID"),names_from = name,values_from = relative_abun)head(new.df)

# 导出转换结果为制表符文件

write.table(new.df,"relative.txt",row.names = F,sep = "\t")


推荐课程
【课程】《细菌与真菌扩增子测序:零基础到高级分析的全流程实战》聚焦于细菌和真菌的扩增子测序,使用16S rRNA基因、18S rRNA基因及ITS序列等测序数据基于QIIME2等软件进行微生物菌群多样性、组间差异等分析。课程不仅教授扩增子的分析流程和实操部分,还包含理论指导和结果解读。整套分析流程经过Docker封装后,能够直接在个人电脑的Windows系统或Linux系统中使用,非常适合零基础或未系统接触全套分析的研究人员学习和自主挖掘数据。

扫描下方二维码或根据链接获取课程

链接:https://college.mimazi.net/course/article-71.html

密码子实验室
我们一直坚持认为,让知识更有价值,让科学研究更简单,让实验室管理更智能化,让每一个热爱学习的人更有效率,是我们的使命。生物信息学实操、实验操作技能、科研绘图技巧、行业动态播报,这里只有干货。
 最新文章