微生物组学研究的深入有助于揭示微生物与宿主之间的复杂互作关系,并为阐明诸多疾病的病理机制提供了新的视角。近年来,高通量测序技术,尤其是鸟枪法宏基因组测序的广泛应用,使得对微生物群落结构和功能的解析成为可能。通过对宏基因组数据的深入挖掘,研究者能够系统地鉴定与宿主健康密切相关的,包括参与物质代谢、免疫调节、以及抵御病原菌感染等微生物功能。这些研究成果不仅有助于阐明微生物在维持宿主稳态中的关键作用,而且为基于微生物组的疾病诊断与治疗提供了重要的理论基础。近日,南京医科大学的刘星吟教授研究团队在Cell Reports Methods杂志发表题为RFW captures species-level full profile of metagenomic functions by integrating genome annotation information的研究论文,该研究报道了传统微生物组功能分析方法对宏基因组测序深度敏感,会引起大量微生物功能信息丢失,并研发了基于参考基因组的宏基因组功能谱推断(RFW)方法来推断更完整的微生物功能图谱。微生物功能谱是微生物群落代谢和生理能力的体现。该研究假定了微生物基因组信息充分包含微生物功能信息,进一步的,通过注释 GTDB 基因组数据库中高质量代表性基因组的蛋白质功能,该研究构建了微生物功能库,涵盖了来自广泛宿主环境的65703 个细菌和古菌物种基因组功能信息。为评估传统宏基因组功能分析工具在不同测序深度下的表现,该研究以构建的微生物功能库为参考,选取了细菌单克隆培养物(代表简单菌群)和人类肠道菌群(代表复杂菌群)的宏基因组数据,通过对其进行序列重采样,模拟不同测序深度的场景,并利用HUMAnN工具进行功能注释。结果表明:群落层面,当测序深度降低时,HUMAnN未能检测到的微生物组功能数量显著增加。即使在超深度测序数据中,仍存在部分功能被遗漏,即其仍低估微生物群落的潜在功能多样性。物种层面,在常规测序深度(约107条序列)下,相对丰度低于10%的物种,HUMAnN功能注释率急剧下降;而对于相对丰度低于1%的物种,HUMAnN仅能检测到其基因组中包含的功能的不到20%。图1 A, 当测序深度降低时,HUMAnN未能检测到的微生物组功能数量显著增加;B,以大肠杆菌为例,当测序深度降低时,HUMAnN未能检测到的微生物物种级别功能数量显著增加
考虑传统基于测序读段的功能预测方法在推断微生物群落功能时存在固有的信息损失。为了更全面地揭示微生物群落的潜在功能,该研究提出了基于参考基因组的宏基因组功能谱推断(RFW)方法。该方法中,研究人员在确定微生物群落中各物种的相对丰度后,基于已建立的微生物功能库,通过查询各个物种的基因组功能信息,将物种功能谱与其在群落中的相对丰度相乘,并对所有物种的功能谱进行加权求和,从而得到整个微生物群落的综合功能谱。微生物功能谱的完整性有助于提高组间微生物功能丰度差异分析能力,并支持更好的建立微生物功能与宿主表型之间的关联,利用RFW,该研究成功识别到16个与孤独症症状严重程度互相关联的微生物功能,包括微生物来源的Cystathionine β-synthas、Glutathione cysteine ligase等,这些微生物功能与谷氨酸、S-腺苷同型半胱氨酸、儿茶酚、肌苷代谢相关。传统的HUMAnN功能分析则由于信息丢失的原因未能识别相应关联。RFW为鸟枪法宏基因组测序提高了新的、更加全面的微生物功能分析方案,计算效率亦显著优于HUMAnN方法,据该研究报道,HUMAnN开展589例常规深度宏基因组样本分析共需42,714.28核时(@ Intel(R) Xeon(R) CPU E5-2696 v4),单例样本约为72.48核时;而RFW开展589例样本分析仅需37核时,约为HUMAnN方法的0.09%。该研究还提供了DFSCA-BC算法,支持组间微生物功能绝对丰度差异分析,目前RFW与DFSCA-BC程式已开源,读者可以在https://github.com/Xingyinliu-Lab/RFW 获取。南京医科大学刘星吟教授为本文通讯作者;南京医科大学刘星吟实验室米凯博士为论文第一作者。原文链接:https://www.sciencedirect.com/science/article/pii/S2667237524003229
制版人:十一
BioART战略合作伙伴
(*排名不分先后)
转载须知
【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。