范广益/章文蔚/李盛英/孙颖等Nature:揭示全球海洋微生物基因资源利用潜力,助力生物技术与生物医药发展

文摘   2024-09-05 21:22   浙江  
9月4日晚,华大生命科学研究院联合山东大学、英国东安格利亚大学、中国海洋大学、厦门大学、丹麦哥本哈根大学等机构,在全球顶级学术期刊《自然》(Nature)上发表了一项重磅研究成果:“ Global marine microbial diversity and its potential in bioprospecting ”。通过对目前已公开的海洋微生物宏基因组数据进行分析和深度挖掘,不仅构建了迄今为止最完整的海洋微生物基因数据库,更从中发现了大量具有应用潜力的基因资源,为开发新型基因编辑工具抗菌肽PET塑料降解酶等提供了全新的思路,将极大地推动相关产业的应用发展。
该项研究作为青岛自贸片区“千种海洋生物基因测序项目”的第一年度重要成果,为海洋微生物的演化、环境适应性、生态学研究和遗传资源开发与利用提供了前所未有的机遇。

Nature 文章截图


构建迄今为止最完整的海洋微生物组数据库

研究团队历时五年,通过对目前已公开的接近240Tb海洋微生物宏基因组数据进行重分析,构建了拥有超4.31万个海洋微生物基因组和24.58亿个基因序列的海洋微生物组数据库The Global Ocean Microbiome Catalogue(GOMC),包含从南极到北极、从近海到深远海、从表层海洋到万米超深渊等多样化的海洋生态系统。

该数据库是已报道海洋基因组数据库 Tara Ocean 的3倍、蛋白序列库的60倍。其中,2万多个微生物是潜在新发现物种,近1万个微生物为在深海等独特生境中首次发现。

全球海洋微生物基因组数据集概览


本研究使用宏基因组分箱技术对海量数据进行重分析,可获取环境中大量不可培养微生物的全基因组序列,获得新物种的基因组及其功能信息等,避免了大部分海洋微生物无法通过传统分离培养获得导致的信息遗漏,得到的微生物基因组更全面。
而在未来基因资源利用上,基于已挖掘出有应用潜力的微生物基因组数据,结合合成生物学技术或可实现微生物活性功能的大规模开发利用。

小课堂:

宏基因组,通常指特定环境中微生物群落所有遗传物质的集合,例如肠道菌群、土壤微生物等,由于其包含的微生物种类及数量极其庞大,研究者通常会将其作为一个整体来进行研究,分析其中各种微生物的功能和彼此之间的关系及相互作用。


本研究中,研究团队利用分箱技术对已有的240Tb海洋微生物宏基因组数据进行深度分析,成功重构了4.31万个海洋细菌和古菌基因组。这种方法避免了环境中大部分微生物无法通过人工培养获得的难题,如同打开了宏基因组的“盲盒”,对海洋微生物“暗物质”的挖掘及其功能资源化利用提供了基础。



该研究不仅极大拓宽了对海洋微生物多样性的理解,刷新了过去认知中海洋原核微生物基因组大小的上限,揭示了缺氧海洋环境对大基因组细菌的适应性演化提供了选择压力,解析了全球海洋微生物群落的生物地理分布规律,为理解微生物在不同海洋环境中的遗传连通性提供了新的视角。



解码“基因宝藏”,助力多领域产业突破


GOMC数据库犹如一座宝库,蕴藏着无数待发现的基因宝藏。研究团队针对该基因数据库,利用深度学习算法工具对其进行挖掘,发现了多项具有应用潜力的基因资源,将沧海“遗”珠打磨成耀眼的沧海“明”珠:



新型“基因剪刀”:还记得“基因剪刀”CRISPR-Cas9吗?它被誉为生命科学领域的革命性技术。在本研究中,研究团队鉴定出了36个新型CRISPR-Cas9基因编辑系统,并挖掘出了一个具有潜在应用价值的新型Cas9编辑系统(Om1Cas9),将助力我国在基因编辑工具使用上具有更多独立性和选择。

抗生素替代:研究团队鉴定了117个新型抗菌肽,并通过生物合成和实验验证发现其中10个抗菌肽具有显著抗菌活性及广谱抗菌效果。基于该成果,华大目前已联合香港理工大学成立香港理工大学-华大•全球深海资源基因组学和合成生物学联合研究中心,实施进一步研发和产业化,或将为抗生素耐药性难题提供新的解决方案。

破解塑料污染难题:塑料污染是全球性难题。研究团队构建了包含24.58亿非冗余基因序列的蛋白质数据库(GOPC)。针对塑料废弃物对海洋环境造成的日益严峻的白色污染,利用GOPC进行了PET塑料降解酶的定向挖掘,从深海热液喷口及深渊海沟的样品测序数据中筛选出3个嗜盐耐热PET水解酶,其催化活性随NaCl浓度的升高而增加,比陆地微生物中发现的IsPETase活性高12-44倍。活性最高的dsPETase05可在3天内将PET膜大部分降解,降解率达到83%。这是国际上首次从深海中发现的高活性PET水解酶,不仅展示了GOPC在生物勘探领域的应用潜力,也为PET塑料的生物降解与再生这一热点领域提供了全新的工具。


目前,GOMC数据库已存储于国家基因库生命大数据平台(https://db.cngb.org/maya/datasets/MDB0000002)。研究团队基于GOMC和自有的极端生境基因数据,进一步开发了贯穿序列鉴定、结构预测与聚类、酶蛋白活性位点精准预测和高通量基因合成等全链条AI技术辅助的功能基因挖掘技术体系,并面向全球学者提供海洋及极端环境来源的新型酶高效挖掘技术服务平台。

本研究标志着海洋宏基因组学领域的一个新高度,凸显了海洋微生物组在改善人类福祉和促进环境可持续性发展上的关键作用。这些发现不仅为全球科学家对海洋的可持续探索和利用开辟了广阔前景,也为未来的生物技术和生物医学研究奠定了基础。”文章共同第一作者、华大生命科学研究院陈建威博士表示。

对于本研究成果,国际著名海洋微生物生态学研究专家A. Murat Eren教授表示:“该研究很好地证明了海洋微生物的无限可能,为在海量基因组数据中挖掘生物技术与生物医学相关的宝贵资源指引了方向

另一位海洋微生物多样性研究专家Tom O. Delmont教授也表示:“该成果将对于研究和利用海洋微生物相关的多个研究领域产生持续、长久的积极影响”。



华大生命科学研究院范广益研究员、章文蔚研究员,山东大学李盛英教授,英国东安格利亚大学Thomas Mock教授及华大生命科学研究院孙颖博士为论文共同通讯作者。华大生命科学研究院陈建威博士、贾洋洋博士、孙颖博士和山东大学刘琨助理研究员为论文共同第一作者。本研究受到国家重点研发计划、国家自然科学基金委、广东省海洋生物重点专项、青岛西海岸新区重大科技创新专项、青岛自贸片区千种海洋生物基因测序项目、三亚崖州湾科技城项目等项目联合资助。


本文转载:遇见生物合成

蛋白质工程与生物催化
广阔的生物世界
 最新文章