宏基因组 ( Metagenome)是由 Handelsman 等在1998年提出的概念, 其定义为“the genomes of the total microbiota found in nature” ,即环境中所有微生物基因组的总和。以环境样品中的微生物群体基因组为研究对象,直接从环境样品中提取全部微生物的DNA,构建宏基因组文库,利用测序技术分析环境样品所包含的全部微生物的群体基因组成及功能和参与的代谢通路,解读微生物群体的多样性与丰度。三代宏基因组技术就是依托于最新一代测序技术发展而来的一套研究方案。
宏基因组学可用于重建复杂微生物群落,目前主流的测序技术可分为短读长和长读长,这两种技术各有优缺点。因此,混合组装策略被提出,它可以结合两者优势。2024年3月份在Microbiology Spectrum期刊上发表了一篇题为“A comparison of short-read, HiFi long-read, and hybrid strategies for genome-resolved metagenomics”的文献,该文献详细论述了短读长、长读长以及混合组装三种策略的特点。该研究使用小鼠(雌雄各一只)作为研究对象,收集小鼠粪便样品进行测序,测序策略如下:
图1:研究设计概述
二三代测序成本比较
参考 2023 年年初多个商业测序服务提供商的价格,对 DNA 提取、文库制备和测序成本进行估算:
表1:成本估算
组装结果比较
二代组装的N50值约为20kbp,混合组装的N50值约为~40kbp,三代组装的N50值在235-519kbp之间,三代数据组装的连续性比二代和混合组装高9-18倍。从组装的基因组总长来看,三代组装总基因组长度最长。二代数据回比到组装基因组,混合组装策略的短读长映射率最高(96% - 97%)。
表2:组装指标统计
恢复MAGs的数量和质量比较
从恢复的MAGs数量来看,二代宏基因组策略在恢复MAGs数量上表现最佳。然而,三代组装策略恢复的MAGs的平均contig数量最小,且MAGs的N50普遍较大,混合策略次之,因此,三代宏基因组测序在MAG连续性方面表现最佳。此外,三代宏基因组恢复的环化MAGs数量最多,混合策略可以恢复微量的环化MAGs,二代宏基因组受限于其测序读长基本不能重建出环状的MAGs。在MAG的完整度和污染度方面总体差异不大。
表3:MAG指标统计
图2:MAG质量和连续性比较
次级代谢产物生物合成基因簇的长度一般在几十kbp以上,较短的测序读长在恢复BGCs的完整性上不占优势。这里比较了不同策略恢复BGCs的数量和完整性。虽然,短读长和混合组装策略产生的BGCs数量最多,均为334个,三代组装产生219个BGCs。这完全归功于短读长策略恢复的MAGs数量最多。三种策略在每个MAGs检测到的平均BGCs数量上基本相当。在BGCs的完整度和长度上,长读长组装策略远远优于其他策略。
表4:anti-SMASH预测的次级代谢生物合成基因簇统计
综上,二代宏基因组侧重于恢复更多物种的MAGs,三代宏基因组在恢复低丰度物种MAGs上的表现较二代宏基因组差。三代宏基因组因其读长优势,在组装基因组总长度、组装连续性和MAGs的连续性上,三代宏基因组表现最佳。而二代和三代技术混合策略平衡了二代宏基因组和三代宏基因组各自的优势。在各个指标上表现都比较均衡。虽然高深度的三代测序技术可以产生更多更高质量的组装,但相关成本仍然令人望而却步。最佳的测序策略取决于研究的特定目标和优先级。研究人员需要仔细评估恢复基因组的数量和质量之间的平衡,并考虑到染色体外元素的可用资源和项目需求。没有放之四海而皆准的方法,深思熟虑、量身定制的测序策略是必不可少的。
图3:不同宏基因组分析策略在七个指标上的表现
图4:不同策略对MAG重建性能的概述
三代宏基因组在发现植物微生物组新序列上应用
标题:Uncovering microbiomes of the rice phyllosphere using long-read metagenomic sequencing
发表期刊:Communications Biology
影响因子:5.2
发表时间:2024年
测序策略:全长扩增子测序+二代扩增子测序+三代宏基因组测序PB(140 Gb)
植物微生物组对于植物生长至关重要,但关于植物中特定细菌种类的遗传特性以及这些基因在染色体或质粒上的位置等许多问题仍不清楚。特别是水稻叶片表面(叶际)的微生物群落,对于植物生长和健康具有显著影响。以往的研究方法存在局限性,如培养方法无法涵盖所有微生物,短读长测序难以准确鉴定复杂的基因组。
通过三代宏基因组测序,共组装得到了26,067个contigs,其中包括142个环状序列。包含了669个完整的16S rRNA基因,这些基因被聚类到166个细菌种,其中121个与已知序列的相似性低于97%,表明它们可能是新种。三代长读长宏基因组分析的主要优势是有可能获得不可培养微生物的完整基因组序列。环状连续序列中包含了新的细菌染色体和大质粒,以及被定义为新质粒或噬菌体的较小环状连续序列。值得一提的是,识别出一个未被分离培养的细菌Candidatus Saccharibacteria(RRA8490)的完整染色体。该研究结果证明了基于长读长的宏基因组学在分析微生物群落和发现植物微生物组研究中的新序列方面的有效性。
表5:组装结果汇总
图5:预测选菌门Candidatus Saccharibacteria的潜在新菌株RRA8490的代谢利用kofamscan、Interproscan和相似性搜索重建代谢途径
图6:全长扩增子、二代扩增子和宏基因组测序中检测到的16S rRNA基因的相对丰度。每种测序方法的细菌门的相对丰度A和放线菌门B的相对丰度
图7:宏基因组中发现的T4SS基因的基因排列、预测宿主和估计质粒类型
紫色表示假设的或非T4SS成分基因
图:8:从宏基因组中恢复的MAGs的概况
三代宏基因组在微生物次级代谢产物方面应用
标题:Biosynthetic potential of uncultured anammox community bacteria revealed through multi-omics analysis
发表期刊:Bioresource Technology
影响因子:9.7
发表时间:2024年
测序策略:三代宏基因组测序( 26.7 Gb HiFi reads )+代谢组
微生物次生代谢产物(SMs)在医药、农业和能源等领域有广泛应用,由于耐药性、癌症和农药抗性等问题,急需发现新的 SMs。厌氧氨氧化(anammox)系统中的微生物大多未培养或未充分研究,是潜在的新SMs资源。宏基因组学可用于探索未培养微生物的多样性和代谢潜力,但二代测序技术存在序列碎片化和 GC 偏差问题,三代测序技术(如 HiFi 长读长测序)可解决这些问题。
利用HiFi长读宏基因组测序,从anammox微生物组中发现了1040个生物合成基因簇(BGCs),其中58%是完整的,并展示了丰富的多样性。它们中的大多数与已知的BGC表现出远亲关系,这意味着发现的这些BGC可能是新型的。未被探索的谱系(Chloroflexota和Planctomycetota)和变形菌(Proteobacteria)的成员含有大量BGCs,显示出巨大的生物合成潜力。代谢组学结果表明,浮霉菌门成员具有活性最高的BGCs,特别是那些生产潜在生物燃料ladderane的BGCs。总之,这些发现表明,anammox微生物组可以作为挖掘新的BGC和发现新的SMs的宝贵资源。
图9:中高质量标记的质量、系统发育分类和BGC计数
图10:活性BGCs表达水平比较
图11:1040个BGCs桑基图
图12:浮霉菌门中完整梯烷生物合成基因簇和基因表达
三代宏基因组在肠道微生组方面应用
标题:Intestinal mucosal microbiota mediate amino acid metabolism involved in the gastrointestinal adaptability to cold and humid environmental stress in mice
发表期刊:Microbial Cell Factories
影响因子:4.3
发表时间:2024年
测序策略:三代宏基因组测序+全长扩增子+代谢组
冷湿环境应激可引发胃肠(GI)紊乱,肠道菌群可能参与宿主对环境应激的适应性调节,但冷湿应激对微生物组和 GI 紊乱的影响尚未完全明确。同时,肠道菌群与宿主的氨基酸代谢可能相互作用,影响肠道黏液屏障。探究肠道菌群稳态对冷湿环境应激下肠道黏液屏障和 GI 紊乱的影响,通过三代宏基因组学+靶向代谢组学综合分析,解读肠道黏膜菌群与代谢物之间的内在联系。
本研究发现(1)冷、湿冷、潮湿环境压力分别干预肠道菌群紊乱小鼠和正常稳态小鼠后,对粪便、肠道内容物、肠道黏膜等肠道菌群进行细菌培养和FDA (fuorescein diacetate)微生物活性检测,提示冷湿环境应激降低了可培养菌群和微生物活性;其中肠道菌群紊乱加重了肠道黏液屏障的损伤和冷湿环境应激相关的胃肠道症状;(2)冷湿环境应激小鼠血清中谷氨酸丙酮转运酶(GPT)、谷草转氨酶(GOT)等氨基酸转移酶显著升高,表明肠道菌群通过调节宿主氨基酸代谢适应冷湿环境应激;(3)通过多组学整合分析,构建了基于罗伊氏乳酸菌丰度和宿主氨基酸水平的肠道黏液蛋白Muc2预测模型,调整R2为75.0%。
综上所述,冷、湿环境应激通过调节优势菌群罗伊氏乳杆菌的组成,调节了神经递质氨基酸在肠道黏膜菌群和宿主血清中的代谢功能,参与了冷、湿环境应激引起的肠道黏液屏障损伤和胃肠功能紊乱。
图13:OTU注释、基因丰富度和微生物组成的变化
图14:冷、湿环境胁迫下肠黏膜微生物群生物标志物研究
图15:肠黏膜微生物群与靶向氨基酸代谢的相关网络
图16:基于机器学习随机森林方法的Muc2预测模型
丰富的实验经验
菲沙基因发展至今拥有丰富的宏基因组实验经验,和极其丰度的三代PacBio Revio测序经验。针对特定样本和低丰度样本具有特定的提取方法和方案。样本DNA提取成功率高,DNA质量好。构建文库所需DNA浓度低,保证样品的有效处理。
严谨科学的生信分析流程
菲沙基因搭建了二代宏基因组、三代宏基因组、二+三代宏基因组分析平台,流程参照了多篇高分文献构建,保证分析的严谨性,数据科学可靠。
参考文献:
[1]. Eisenhofer R, Nesme J, Santos-Bay L, et al. A comparison of short-read, HiFi long-read, and hybrid strategies for genome-resolved metagenomics[J]. Microbiology Spectrum, 2024, 12(4): e03590-23.
[2]. Masuda S, Gan P, Kiguchi Y, et al. Uncovering microbiomes of the rice phyllosphere using long-read metagenomic sequencing[J]. Communications Biology, 2024, 7(1): 357.
[3]. Wang Y C, Fu H M, Shen Y, et al. Biosynthetic potential of uncultured anammox community bacteria revealed through multi-omics analysis[J]. Bioresource Technology, 2024, 401: 130740.
[4]. Zhang C Y, Peng X X, Wu Y, et al. Intestinal mucosal microbiota mediate amino acid metabolism involved in the gastrointestinal adaptability to cold and humid environmental stress in mice[J]. Microbial Cell Factories, 2024, 23(1): 33.
撰稿|王晓月
审核|孙可心