对于微生物生态学研究,我们最关注的无疑是菌群所具备的代谢功能。随着数据分析技术的发展,我们现在能通过已知的微生物基因组数据进行菌群代谢功能的预测,把物种的“身份” 和它们的“功能”对应起来。根据菌群代谢功能预测结果,一方面能窥探菌群功能谱的概貌,发挥扩增子测序性价比高的优势;另一方面也能帮助指导后续宏基因组测序等的实验设计,更合理地筛选用于后续研究的样本。然而各式各样的功能预测软件让人眼花缭乱,作为新手,我们该如何选择合适的软件对微生物功能进行预测呢?本期内容将针对微生物功能预测分析中的常见问题,为大家一一解答。16S功能预测软件有四种,分别是PICRUSt、Tax4Fun、FAPROTAX、BugBase:①PICRUSt是基于Greengene数据库中OTU的进化树和基因信息,构建古菌和细菌域全谱系的基因功能预测谱,将测序得到的菌群组成“映射”到数据库中进行菌群代谢功能预测。PICRUSt2结合IMG数据库,基于序列构建系统发育树进行功能预测,预测准确性、真实性大大提高。②Tax4Fun和PICRUSt软件比较类似,是基于SILVA数据库对OTU进行物种分类,根据NCBI的基因组注释对16S拷贝数进行标准化,通过构建SILVA分类与KEGG数据库中原核分类间的线性关系,实现对微生物群落功能的预测。③FAPROTAX较适用于对环境样本(主要集中在海洋、湖泊等)的生物地球化学循环过程(特别是碳、氢、氮、磷、硫等元素循环)进行功能注释预测。因其基于已发表验证的可培养菌文献,其预测准确度较好,但相比于上述PICRUSt和Tax4Fun来说预测的覆盖度可能会降低。④BugBase是用于对微生物组数据进行高水平表型分类的工具,该工具根据七种表型对微生物群落进行分类:革兰氏阳性(Gram Positive)、革兰氏阴性(Gram Negative)、生物膜形成(Biofilm Forming)、致病性(Pathogenic)、移动元件(Mobile Element Containing)、氧需求(Oxygen Utilizing,包括Aerobic、Anaerobic、facultatively anaerobic)及氧化胁迫耐受(Oxidative Stress Tolerant)。ITS功能预测软件有两种,分别为PICRUSt和FUNGuild:①PICRUSt2统计整理了300多个真菌基因组信息,可以基于ITS序列利用MetaCyc数据库对代谢通路进行预测。②FUNGuild是基于已发表的文章数据所整合起来的一种称为“guild”的分类预测。因为真菌基因组数据的缺乏,很难做KEGG通路的预测,而Guild包含了动物病原菌、植物病原菌、木质腐生菌等12种功能分类。通过对Guild的预测,可以从生态功能角度研究真菌群落的共生、腐生、致病性等生态型分类。这些功能预测软件都有自己的特色和侧重点,我们可以根据自己研究的需要进行选择。以下是我们基迪奥客户已发表文章的相关案例,大部分图形源于Omicsmart在线报告。
图1 通过 PICRUSt2、Tax4Fun、FAPROTAX、BugBase预测得到的功能示例Omicsmart微生物在线报告涵盖上述五种功能预测软件,能够一键切换不同的软件进行比较,选择最佳分析结果,最大程度节省数据挖掘时间。根据上述软件的预测结果,可以获得每个样本对应各功能数据库的注释信息,以及预测得到的功能类群的丰度矩阵,这个时候我们就可以利用丰度表信息完成各类可视化结果展示了。通常从两种角度去分析,一种是展示功能丰度情况,另一种是对功能进行差异分析。从功能丰度展示角度,也分为两点:1.了解整体功能丰度信息;2.关注某个特定功能过程。假如我们希望通过功能预测找到在某个条件下哪些功能起到更重要的作用,那么可以在功能丰度图中寻找排名靠前的功能。例如,在Omicsmart微生物在线报告中,我们可以通过功能分布图或者热图展示KEGG三个层级的代谢通路或相关酶等信息。但如果我们只想关注具体的某个功能,那我们可以选择在图中只展示与研究相关的特定功能,使文章思路的表达更加清晰。例如在Omicsmart微生物在线报告中,我们可以通过清空表格勾选、搜索和勾选特定功能等步骤,来展示相应的功能分布图。图3 基迪奥Omicsmart微生物在线报告功能分布展示除此之外,在BugBase中我们还可以通过切换不同的表型,展示各物种对表型功能的贡献情况。图4 基迪奥Omicsmart微生物在线报告BugBase表型功能贡献情况展示从差异分析的角度,PICRUSt2等软件的统计检验使用STAMP分析结果和盒型图反映KEGG数据库不同分类层级下比较组之间各功能的差异程度。如果比较组间 box 整体相距较远,则各比较组间存在显著差异的可能性较大,具体差异程度可以通过非参数检验p-value 来显示,默认阈值为p-value<0.05。若存在两个比较组时,可选择Welch’s t检验或者Wilcoxon秩和检验。若存在三个或者三个以上比较组时,可选择KW秩和检验。Turkey HSD是在多组差异检验后进行多重比较,进一步分析两两比较组之间的差异。图5 基迪奥Omicsmart微生物在线报告功能差异分析通过上述功能丰度展示和差异分析等,我们可以得到与微生物群落功能相关的代谢通路信息,找到差异功能,指导后续的实验设计,更合理地筛选用于下一步研究的样本。此外,还可以结合宏基因组测序、验证实验等方法来共同佐证微生物的功能。自从OM平台推出AI客服以来,我们一直有在收集大家平时做微生物研究过程中遇到的问题,并尝试以推送的形式给大家解答:
以上只是Omicsmart解决微生物问题的一小部分示例,感兴趣的小伙伴可持续关注哦~基迪奥生物深耕数据分析领域,有丰富的微生物多组学研究经验,有行业中领先的多组学个性化关联分析与数据挖掘能力强大的Omicsmart在线分析平台助力研究发文。欢迎有微生物项目意向的老师联系我们~长按识别二维码填写意向
*未经许可,不得以任何方式复制或抄袭本篇文章之部分或全部内容。版权所有,侵权必究。
联系方式:020-39341079;service@genedenovo.com