Nature 文章截图
构建迄今为止最完整的海洋微生物组数据库
研究团队历时五年,通过对目前已公开的接近240Tb海洋微生物宏基因组数据进行重分析,构建了拥有超4.31万个海洋微生物基因组和24.58亿个基因序列的海洋微生物组数据库The Global Ocean Microbiome Catalogue(GOMC),包含从南极到北极、从近海到深远海、从表层海洋到万米超深渊等多样化的海洋生态系统。
该数据库是已报道海洋基因组数据库 Tara Ocean 的3倍、蛋白序列库的60倍。其中,2万多个微生物是潜在新发现物种,近1万个微生物为在深海等独特生境中首次发现。
全球海洋微生物基因组数据集概览
小课堂:
宏基因组,通常指特定环境中微生物群落所有遗传物质的集合,例如肠道菌群、土壤微生物等,由于其包含的微生物种类及数量极其庞大,研究者通常会将其作为一个整体来进行研究,分析其中各种微生物的功能和彼此之间的关系及相互作用。
本研究中,研究团队利用分箱技术对已有的240Tb海洋微生物宏基因组数据进行深度分析,成功重构了4.31万个海洋细菌和古菌基因组。这种方法避免了环境中大部分微生物无法通过人工培养获得的难题,如同打开了宏基因组的“盲盒”,对海洋微生物“暗物质”的挖掘及其功能资源化利用提供了基础。
该研究不仅极大拓宽了对海洋微生物多样性的理解,刷新了过去认知中海洋原核微生物基因组大小的上限,揭示了缺氧海洋环境对大基因组细菌的适应性演化提供了选择压力,解析了全球海洋微生物群落的生物地理分布规律,为理解微生物在不同海洋环境中的遗传连通性提供了新的视角。
解码“基因宝藏”,助力多领域产业突破
GOMC数据库犹如一座宝库,蕴藏着无数待发现的基因宝藏。研究团队针对该基因数据库,利用深度学习算法工具对其进行挖掘,发现了多项具有应用潜力的基因资源,将沧海“遗”珠打磨成耀眼的沧海“明”珠:
“本研究标志着海洋宏基因组学领域的一个新高度,凸显了海洋微生物组在改善人类福祉和促进环境可持续性发展上的关键作用。这些发现不仅为全球科学家对海洋的可持续探索和利用开辟了广阔前景,也为未来的生物技术和生物医学研究奠定了基础。”文章共同第一作者、华大生命科学研究院陈建威博士表示。
对于本研究成果,国际著名海洋微生物生态学研究专家A. Murat Eren教授表示:“该研究很好地证明了海洋微生物的无限可能,为在海量基因组数据中挖掘生物技术与生物医学相关的宝贵资源指引了方向”。
另一位海洋微生物多样性研究专家Tom O. Delmont教授也表示:“该成果将对于研究和利用海洋微生物相关的多个研究领域产生持续、长久的积极影响”。
华大生命科学研究院范广益研究员、章文蔚研究员,山东大学李盛英教授,英国东安格利亚大学Thomas Mock教授及华大生命科学研究院孙颖博士为论文共同通讯作者。华大生命科学研究院陈建威博士、贾洋洋博士、孙颖博士和山东大学刘琨助理研究员为论文共同第一作者。本研究受到国家重点研发计划、国家自然科学基金委、广东省海洋生物重点专项、青岛西海岸新区重大科技创新专项、青岛自贸片区千种海洋生物基因测序项目、三亚崖州湾科技城项目等项目联合资助。
本文转载:遇见生物合成