Amazing, 数据库也能发Nature?!

文摘   其他   2024-12-13 08:01   内蒙古  

海洋占地球表面积70%以上,蕴含的微生物资源尚未得到充分开发。近年来,海洋探采技术、高通量测序技术以及宏基因组学研究迅速发展,海洋微生物测序数据呈爆炸式增长,海洋微生物功能基因的开发应用有望取得重大突破。
2024年9月,Nature期刊在线最新发表了一篇迄今最完整的海洋微生物数据库——GOMC,该数据库包含了超过4.31万个海洋微生物基因组和24.58亿个基因序列。免费访问地址:https://db.cngb.org/maya/。

图1 数据库主页面

1、数据库的构建

研究者从24,395个公开的海洋宏基因组中收集了237.02 Tb的序列数据,覆盖了从极地到赤道、从海洋表面到深海沟的广泛海洋环境。基于这些宏基因组数据,重建了43,191个中/高质量的宏基因组组装基因组(MAGs),其平均完整性为82.33%,污染度为1.79%,其中,20,295个MAGs为潜在新发现物种。
为了提供一个详尽的海洋微生物基因组目录,研究者进一步整合了其他数据库(OMD4、OceanDNA6和NCBI)的海洋微生物基因组数据,得到一个包含 24,195个基因组的非冗余目录——GOMC。

图2 数据库构建流程图

2、数据库的功能基因挖掘

GOMC数据库大大提升了人们对海洋微生物的认知,本研究进一步分析了海洋微生物基因的功能。利用深度学习算法对其进行挖掘,发现了多项具有应用潜力的基因资源。

CRISPR-Cas9系统




CRISPR-Cas9系统被誉为生命科学领域的革命性技术。本研究鉴定到了36个新型CRISPR-Cas9基因编辑系统,并挖掘出了一个具有潜在应用价值的新型Cas9编辑系统(Om1Cas9),助力我国基因编辑技术进一步发展。

抗菌肽




研究团队鉴定到117个新型抗菌肽,并通过生物合成和实验验证发现其中10个抗菌肽具有显著抗菌活性及广谱抗菌效果,为抗生素耐药性难题提供新的解决方案。

图3 生物合成基因簇和AMP的鉴定

PET降解基因




海洋中的塑料污染是一个日益严重的全球性问题。根据联合国环境规划署的估计,目前海洋中塑料的总量在7500万至2亿吨之间,这些塑料垃圾不仅影响海洋生态系统,还对人类健康构成威胁。团队发掘了3个深海来源的高活性新型嗜盐PET塑料降解酶,3天内对PET薄膜降解率达到83%,其活性是已报道的塑料降解酶活性的44倍。为PET塑料降解提供新的方向,将助力我国实现PET塑料的绿色低碳可持续利用。

图4 嗜盐水解酶的水解活性

3、性化数据库的构建、挖掘

本研究通过对发表的海洋宏基因组数据进行重分析,整合现有的数据库得到迄今为止最大的海洋微生物数据库,并进一步挖掘了基因功能。解析了全球海洋微生物群落的生物地理分布,为理解微生物在不同海洋环境中的遗传连通性提供了新的视角。
看到这里,你有没有心动了呀!

凌恩生物专注于数据库研究工作,提供个性化数据库的构建、挖掘,从2014年至今,已协助客户发表多篇数据库文章(数据库客户案例:每个物种都需要一个数据库!)。从公共数据的下载、整合、重分析、数据库网站构建,凌恩生物为您提供一整套服务,所以,您和Nature之前就差一个电话:13032137192!凌恩生物,期待您的来电~


参考文献

Global marine microbial diversity and its potential in bioprospecting. Nature, 2024

凌恩生物
凌恩生物旗下综合性生物咨询和服务平台。
 最新文章