1960年,Whittaker首次定义了beta多样性。Beta多样性,又称生境间的多样性,是指沿环境梯度不同生境群落之间物种组成的相异性或物种沿环境梯度的更替速率,即不同地点群落间物种组成的差异。
无论是从扩增子还是宏基因组测序数据出发,beta多样性分析对整体上评估不同分组样本之间的相似性/差异性都至关重要。由于样本中的每个物种都是一个比较维度,因此常需要借助降维的思想将样本间多个物种组成的差异转化为样本间的距离从而便于统计比较。而在进行beta多样性分析前,要首选用来计算样本间差异的距离矩阵,常用的距离矩阵有euclidean、Bray-Curtis、Jaccard、weighted_unifrac和unweighted_unifrac等,在获得距离矩阵后可用于后续进一步的beta多样性分析和可视化。
主成分分析(PCA,Principal Component Analysis),简单来说就是在数据信息丢失最少的原则下,对多特征的数据进行降维处理。它基于euclidean(欧式距离),运用方差分解寻找造成样本间差异的主成分(特征值)及其贡献率。PCA 分析能够从原始数据中提取样本间最主要的差异特征,并根据这些差异特征将样本在新的低维坐标系中依次排序,使得样本在新坐标系中的距离远近能在最大程度上还原样本间的实际差异。在这排序过程中,每一坐标轴对原始数据中样本差异的解释比例依次下降。通常选择前两个坐标轴作图,对样本间的差异和相似程度进行量化。【联川苍穹-宏基因组云分析】已上线,可在【Beta多样性】模块实现,并可自主选择和剔除样本实时得到分析结果,同时可对关注的特定的微生物域(如细菌、古菌、真菌及病毒)进行单独分析,如下图:
主坐标分析PCoA(Principal Coordinates Analysis),是一种与PCA类似的降维排序方法,最大的差别是PCoA可以基于除欧式距离以外的其他距离尺度评价样本之间的相似度。通过对样本距离矩阵做降维分解,从而简化数据结构,最大程度的展现样本在某种特定距离尺度下的关系分布。在生态学研究中,通常选择前两个(或三个)特征值可视化样品间的关系,样品点之间的距离越近,说明样品之间物种组成结构越相似。【联川苍穹-宏基因组云分析】已上线,可在【Beta多样性】模块实现,并可自主选择和剔除样本实时得到分析结果,同时可对关注的特定的微生物域(如细菌、古菌、真菌及病毒)进行单独分析,如下图:
NMDS (Nonmetric Multidimensional Scaling)非度量多维尺度分析,与PCoA一样,也是一种基于样品(任何类型距离)距离矩阵的排序方法。与PCoA不同的是,NMDS不再基于距离矩阵数值,而是根据距离排位顺序进行降维计算。NMDS排序依赖于相异系数的大小顺序,并不依赖于准确的相异性系数值。如果排序的目的不是在于最大程度保留样品之间的实际距离,只是反映样品之间的顺序关系,这种情况下,非度量多维尺度分析是一种不错的解决方案。NMDS分析目标是保持样品排序关系不变,因此,如果两个样品距离较近,说明这两个样品物种组成越相似。【联川苍穹-宏基因组云分析】已上线,可在【Beta多样性】模块实现,并可自主选择和剔除样本实时得到分析结果,同时可对关注的特定的微生物域(如细菌、古菌、真菌及病毒)进行单独分析,如下图:
聚类分析主要指层次聚类(Hierarchical clustering)的分析方法,以等级树的形式展示样本间的相似度,通过聚类树的分枝长度衡量聚类效果的好坏。聚类分析可以采用任何距离评价样本之间的相似度,计算得到的样品距离矩阵,利用UPGMA(Unweighted Pair Group Method with Arithmetic Mean)方法对样品进行聚类,生成聚类树数据文件,该文件可以导入聚类树查看软件如Figtree。【联川苍穹-宏基因组云分析】已上线,可在【Beta多样性】模块实现,并可自主选择和剔除样本实时得到分析结果,同时可对关注的特定的微生物域(如细菌、古菌、真菌及病毒)进行单独分析,如下图:
Anosim(Analysis of similarities)相似性分析是一种非参数检验,用来检验组间(两组或多组)的差异是否显著大于组内差异,从而判断分组是否有意义。该分析基于beta多样性计算得到的样品距离矩阵,通过对样品距离等级排序来判断样品组内和组间差异的大小,并通过置换检验评价原始样品组间差异的统计学显著性。【联川苍穹-宏基因组云分析】已上线,可在【Beta多样性】模块实现,并可自主选择和剔除样本实时得到分析结果,同时可对关注的特定的微生物域(如细菌、古菌、真菌及病毒)进行单独分析,如下图:
PART.04
以上就是联川苍穹-宏基因组云分析平台进行beta多样性分析的部分功能介绍,beta多样性分析可以直观的表示样本间物种组成的差异程度,它可以帮助您从整体上把握样本间的相似或差异程度,还可以帮助您鉴别异常样本(离群样本),便于后续分析中剔除该样本进行下游分析,得到更加科学准确的数据。而联川苍穹-宏基因组云分析平台包含了强大的多方面功能,可以从物种、功能及其关联分析多方面帮助您挖掘和探索数据,欢迎您使用联川生物云平台(https://www.omicstudio.cn/home)推出的全新宏基因组云分析平台【联川苍穹】开启您的宏基因组测序数据探索之旅!
【联川苍穹】如何使用联川苍穹平台开展alpha多样性分析?
2025国自然热点:一站式理清Xenium探针定制
宏基因组——物种组成分析
国自然2025|单细胞ATAC-seq能够实现的分析内容都有哪些?
本文系联川生物公众号原创文章,未经授权禁止转载,侵权必究! 扫描下方二维码 点分享
点点赞
点在看