菌群多样性研究之如何理解菌群α多样性
学术
科学
2024-10-11 09:18
上海
菌群α多样性指某个群落或生境内部的种的多样性。这个指标是指一个群落内物种的个数(species richness,丰富度)以及每个物种的数量及分布(evenness,均匀度)。所有的α多样性指标都是围绕着丰富度和均匀度这两个方面计算的。
通过比较不同样本的α多样性指数可以看出不同样本多样性差异。
2. 常用的α多样性衡量指标
数据样式:常OTUs/ASVs丰度表,列为样本,行为OTUs/ASVs,交叉区域为每种OTUs/ASVs在各样本中的丰度。
| Observed | Chao1 | ACE | Shannon | Simpson | Fisher | Coverage |
S1 | 4044 | 6369.44 | 6491.33 | 6.98 | 1.00 | 1352.53 | 0.93 |
S2 | 3941 | 6489.82 | 6456.59 | 6.95 | 1.00 | 1275.20 | 0.93 |
S3 | 2696 | 5017.13 | 5160.19 | 6.72 | 1.00 | 1040.54 | 0.89 |
S4 | 2625 | 5103.17 | 5168.03 | 6.60 | 1.00 | 980.51 | 0.89 |
S5 | 2886 | 5603.67 | 5894.36 | 6.33 | 0.99 | 980.23 | 0.91 |
S6 | 3119 | 5798.61 | 5987.37 | 6.35 | 0.99 | 982.31 | 0.93 |
2.1 丰富度(Community richness):一个群落或生境中物种种类数目的多少
高丰富度物种 (丰度>10)
稀有物种 (丰度=<10且不为0)
1)Observed features
最简单的α多样性指标,指单位时间内观测到单位区域的物种数量,即只考虑物种/ASV/OTU种类,不考虑丰度,值越大说明群落丰富度越高。2)Chao1指数
由Chao(1984)最早提出,通过计算只检测到1次和2次的物种数估计群落中实际存在的物种数,值越大说明群落丰富度越高。Chao1指数基于这样一种假设:当在群落中随机抽取个体时,若不断有新的物种被发现,则表明群落中尚存一些稀有物种还未被观测到;直到已经抽取到的所有物种均保证至少被抽到两次时,即未再出现新的物种被发现时,则可以认为该群落中的所有物种已经全部被观测到。据此可用于估算群落物种总数,且对稀有物种很敏感。3)ACE 指数
基于丰度的覆盖估计值(Abundance-based Coverage Estimator, ACE)是用来估计群落中物种数目的指数,是生态学中估计物种总数的常用指数之一,在计算时同时考虑稀有物种、样本覆盖度和稀有物种之间的变异情况,值越大说明群落丰富度越高。
2.2 多样性(Community diversity):物种丰富度和物种均匀度的综合指标
1)香农多样性指数
香农多样性指数(Shannon diversity index)或称香农熵指数(Shannon entropy index)、香农-威纳指数(Shannon-Wiener index),同时考虑了物种丰富度以及均匀度。Shannon指数值越高,表明群落的多样性越高。与Simpson指数相比对群落的丰富度以及稀有物种/OTU/ASV更敏感,更适用于复杂群落。2)辛普森指数
辛普森指数(Simpson index)同样考虑了物种丰富度以及均匀度,但与Shannon指数相比,它更受均匀度的影响。经典Simpson指数代表了在群落中两个随机选择的个体属于同一物种的概率,当群落物种丰富度增加时,这种概率降低,即Simpson指数随着物种丰富度的增加而降低。由于经典Simpson指数与物种丰富度相反的趋势不直观,如今常用演变而来的Gini-Simpson指数表示Simpson指数,即用1减去经典Simpson指数数值后得到,此时Simpson指数随着丰富度的增加而增加(二者保持一致的趋势)。3)Faith's PD指数
通过计算样本中的ASV/OTU代表序列在其构建的进化树中所占的进化枝的全长来评价群落的遗传多样性程度。该指数的计算需要基于进化树文件。当新增一个与群落中物种亲缘关系相近的ASV/OTU到群落中,则Faith's PD指数增加不大,但如果这个ASV/OTU与群落中的其他物种的亲缘关系都很远,那么此时Faith's PD将显著增大。
2.3 覆盖度(Community coverage)
1)Goods coverage
是计算群落中非singleton(仅含有一条read的OTU)的物种(ASV/OTU)占所有物种的比例,以此来评估测序对群落中物种的覆盖度。其值越接近于1,说明测序深度越合理,即该深度已经基本覆盖到样品中所有的物种;反之,测序深度不高,许多物种仅被测到了一次,暗示着很多低丰度物种可能尚未被测序测到。该指数反映本次测序结果是否代表了样品中微生物的真实情况。
3. 常用可视化方式
注:横坐标是分组名称;纵坐标是不同分组下的 Alpha 多样性指数的值。其中,箱子展示了指数的极值、上四分位、下四分位以及中位数,通过对中位数的比较来判断多样性指数的高低。中位数大,表示该组的多样性指数更高;反之亦然。箱子上的字母/统计标记,可以判断分组之间是否显著:如果不显示统计标记或显示为ns,表示两组之间无显著差异;若有显著差异,则用“*”或“**”表示。课程《微生物菌群研究必修课:从深入理解到灵活应用》立足于帮助微生物菌群多样性和宏基因组测序研究的科研人员深入理解微生物组学研究的方案设计、分析原理,课程还提供了关键结果的解读、异常结果的处理方案等,以此来指导科研人员灵活使用结果文件或对结果文件做合理的后续加工处理。本套课程作为微生物菌群多样性和宏基因组测序研究的入门课,可以引导科研人员快速梳理结果数据,实用性强,具有很高的含金量。主要内容:
(1)选对方法选对路:如何选择合适的测序方法?典型文章的设计思路是怎样的?可以怎么整合各类数据使文章更具有科研价值?
(2)深入浅出读懂α、β多样性:理解背后原理,学会灵活使用,避免误区。
(3)异常样本的识别与处理:如何判断和找出异常样本?如何合理处理异常样本?
(4)多组学关联分析与网络分析:提炼与升华,让文章和结果数据展示出更大的价值。
扫描下方二维码或根据链接获取课程
链接:https://college.mimazi.net/course/article-69.html
【关注我们】
我们专注于微生物组学的测序与个性化数据分析,建有微生物组学研究的科研讨论群,扫码联系客服即可加入微信交流群,随时咨询技术问题。