NAR:GutMetaNet——人类肠道菌群HGT网络及功能冗余数据库

学术   2025-02-05 21:01   北京  

研究背景

宏基因组研究揭示了复杂的微生物相互作用,包括水平基因转移(HGT)和功能冗余(FR),在塑造肠道微生物组的功能和稳定方面的关键作用。已经开发了多种关于HGT事件和FR的分析方法和数据库,但对于肠道微生物这一领域,目前仍缺乏有针对性、全面的数据集成和系统分析方法。

针对这一现状,香港科技大学李帅成团队建立了GutMetaNet,一个包含21567个人类肠道宏基因组样本HGT事件及FR分析的数据库,该成果于2024年8月发表在Nucleic Acids Research上。

研究内容




研究团队对有关人类肠道微生物组的已发表文献进行了全面调查,从96个项目中收集到21567个样本的宏基因组数据。数据库样本大部分来自美国(4793)和中国(3800)。来自老年人(45-60岁)的样本最多(3703)。就健康状况而言,样本包括肠易激综合症(2090)、结直肠肿瘤(759)、肥胖(708)和早产(440)的患者。

研究团队使用Kraken2评估样本的分类学概况并计算相对丰度。根据UHGG数据库提取物种基因组,以KEGG Orthology(KO)标识符的形式注释基因组功能,由此构建基因组内容网络(GCN)以计算样本的FR。HGT事件的检测使用了团队此前开发的LocalHGT方法,确定供体和受体基因组上的截断点,并将具有相同截断点的 HGT 事件合并到 HGT簇 (HGTC) 中。根据肠道微生物组移动元件数据库(ImmeDB)和毒力因子数据库(VFDB)对HGTC进行了注释。

图1 GutMetaNet数据库构建流程





研究团队从样本中收集了14636个HGT事件,聚类到8049个HGTC中。包括1374 个转座子、336 个整合可移动元件、134 个基因组岛、117 个小基因组岛、104 个整合接合元件、100 个 II 类内含子和 14 个前噬菌体。GutMetaNet中可以查询这些HGT事件的供体受体区域、截断点位置、转移序列、侧翼序列和转移元件类型,并提供样本HGT网络、FR相对状况以及分类树的交互式可视化显示。此外,GutMetaNet还包括一个自动化分析工作流程,以方便用户分析他们自己获取的样本的HGT网络和FR状况。

总结

GutMetaNet是目前唯一针对肠道微生物组整合HGT事件数据和FR状况的数据库。相比HumanMetagenomeDB等其他人类肠道微生物组数据库,GutMetaNet提供了HGT和FR数据,更有利于研究微生物基因组可塑性和肠道生态系统整体功能稳定性之间复杂的相互作用。相比HGTree v2.0等HGT事件数据库,GutMetaNet的数据全部来源于人类肠道微生物组,能够更有针对性地反映肠道微生物组这一特定条件下的HGT网络特征,并且能够与相关的临床数据进行关联,便于研究各种疾病表型与肠道微生物组功能间的联系。

参考文献:

[1] Yiqi Jiang, Yanfei Wang, Lijia Che, Shuo Yang, Xianglilan Zhang, Yu Lin, Yucheng Shi, Nanhe Zou, Shuai Wang, Yuanzheng Zhang, Zicheng Zhao, Shuai Cheng Li, GutMetaNet: an integrated database for exploring horizontal gene transfer and functional redundancy in the human gut microbiome, Nucleic Acids Research, 2024;, gkae1007,https://doi.org/10.1093/nar/gkae1007


编译 | H

编辑 | 泉箫





高颜值免费 SCI 在线绘图(点击图片直达)


最全植物基因组数据库IMP (点击图片直达)

往期精品(点击图片直达文字对应教程)

机器学习




生信宝典
学生信最好的时间是十年前,其次是现在!10年经验分享尽在生信宝典!
 最新文章