菌群多样性研究之LEfSe分析结果解读

学术   科学   2024-10-15 08:29   上海  

LEfSe分析即LDA EFfect Size分析,是一种用于发现和解释高维度数据生物标识(基因、通路和分类单元等)的分析工具,可以进行两个或多个分组的比较,它强调统计意义和生物相关性,能够在组与组之间寻找具有统计学差异的生物标识(Biomarker )。

LEfSe分析的核心优势

1)多层次数据整合

LEfSe不仅能够处理简单的分类信息,还支持处理多层次的数据结构,比如不同分类水平(门、纲、目、科、属、种)的微生物群落数据。通过分层次分析,研究者可以识别出在不同分类层次上显著富集的微生物类群。

2) 综合多种统计方法

LEfSe结合了非参数检验、线性判别分析(LDA)和效应量估计等多种统计工具。它首先通过Kruskal-Wallis检验找出在不同组间差异显著的特征,再使用LDA来评估每个特征在不同组别中的效应大小。最终,LEfSe提供一份排名靠前的生物标志物列表,这些标志物能够显著区分不同的实验组别。

3) 效果显著且易于解释

LEfSe分析的结果以清晰的条形图和LDA评分展示,帮助研究者直观地理解不同微生物特征的贡献。该分析能够揭示隐藏在复杂数据中的模式,使得结果易于理解和解释,尤其适合非统计背景的用户。


LEfSe结果解读

一般在微生物多样性分析结果中,会出现两个图,一张表(LDA值分布柱状图、进化分支图及特征表)。

1.LDA值分布柱状图

条形图展示了LDAscore大于预设值的显著差异物种,即具有统计学差异的Biomaker,此处预设值为4.0(看横坐标,只有LDA值的绝对值大于4才会显示在图中);柱状图的颜色代表各自的组别,长短代表的是LDA score,即不同组间显著差异物种的影响程度。


2 、进化分支图

小圆圈:图中由内至外辐射的圆圈代表了由门至属的分类级别(最里面的那个圆圈是界)。不同分类级别上的每一个小圆圈代表该水平下的一 个分类,小圆圈的直径大小代表了相对丰度的大小。
颜色:无显著差异的物种不进行着色 ,差异显著的物种Biomarker跟随组别进行着色,红色节点表示在红色组别中起到重要作用的微生物类群。蓝色节点表示在蓝色组别中起到重要作用的微生物类群。
未能在图中显示的Biomarker对应的物种名会展示在右侧,字母编号与图中对应。


3、特征表

第一列:Biomarker名称;
第二列:分析方法;
第三列:差异基因或物种富集的组名;
第四列:LDA值;
第五/六列:Kruskal-Wallis秩和检验的p值。


推荐课程
课程《微生物菌群研究必修课:从深入理解到灵活应用》立足于帮助微生物菌群多样性和宏基因组测序研究的科研人员深入理解微生物组学研究的方案设计、分析原理,课程还提供了关键结果的解读、异常结果的处理方案等,以此来指导科研人员灵活使用结果文件或对结果文件做合理的后续加工处理。
本套课程作为微生物菌群多样性和宏基因组测序研究的入门课,可以引导科研人员快速梳理结果数据,实用性强,具有很高的含金量。

主要内容:

(1)选对方法选对路:如何选择合适的测序方法?典型文章的设计思路是怎样的?可以怎么整合各类数据使文章更具有科研价值?

(2)深入浅出读懂α、β多样性:理解背后原理,学会灵活使用,避免误区。

(3)异常样本的识别与处理:如何判断和找出异常样本?如何合理处理异常样本?

(4)多组学关联分析与网络分析:提炼与升华,让文章和结果数据展示出更大的价值。

扫描下方二维码或根据链接获取课程

链接:https://college.mimazi.net/course/article-69.html


【关注我们】

我们专注于微生物组学的测序与个性化数据分析,建有微生物组学研究的科研讨论群,扫码联系客服即可加入微信交流群,随时咨询技术问题。

密码子实验室
我们一直坚持认为,让知识更有价值,让科学研究更简单,让实验室管理更智能化,让每一个热爱学习的人更有效率,是我们的使命。生物信息学实操、实验操作技能、科研绘图技巧、行业动态播报,这里只有干货。
 最新文章