组会论文 | Science 高通量、具有菌株分辨率的单细胞微生物基因组学,应用于人体肠道微生物组

文摘   2023-10-10 13:38   湖南  

原文链接:https://www.science.org/doi/10.1126/science.abm1483


01.introduction

人体肠道微生物组是一个复杂的生态系统,每个个体都有数百种微生物。同一物种的不同菌株可以通过抗生素抗性和宿主-微生物组相互作用等重要方式对健康产生不同的影响。但是目前对微生物的研究主要是在物种水平进行分析,难以获知菌株水平上的重要差异。

现有的研究微生物组的技术主要有宏基因组测序技术、基于培养的方法和基于微孔板的单细胞测序。宏基因组测序可以广泛调查微生物群落的基因组含量,但无法捕捉菌株水平的变化;基于培养的方法和基于微孔板的单细胞测序的方法可以获得菌株的基因组,但只能获得有限数量的微生物菌株。因此,需要一种新的技术弥补上述方法的短板,便于在菌株水平解析微生物组。

02.method

作者开发了一种新的高通量单细胞微生物组学技术——Microbe-seq。其工作原理如图1所示。

•首先利用微流控装置将单个微生物包裹进液滴,液滴中含有裂解液,可以裂解微生物的DNA。

•将这些液滴通过第二个微流控装置,与含有扩增试剂第二个液滴合并为更大的液滴,合并后,微生物的DNA被扩增。

•然后进入第三个微流控装置与新的液滴合并,该液滴中的试剂可以使DNA片段化,并将adapter加到DNA上。 

•接着通过第四个微流控装置,和第四个液滴合并,该液滴包含一个条形码珠,一个带有DNA条形码引物的水凝胶微球,我们使用PCR将这些条形码引物连接到每个液滴内的碎片DNA分子上。

•最后破碎液滴,进行测序,根据barcode区分DNA的来源,具有相同barcode的测序序列的集合即称为一个single amplified genome (SAG)。

图1

为了验证每个SAG是否包含一个或多个微生物,以及每个SAG包含单个微生物基因组的多少,作者选取了一个模拟群落样本,这个样本由4个参考基因组已知的菌株(E. coli、Klebsiella pneumoniae、Bacillus subtilis、Staphylococcus aureus)组成。将该样本用Microbe-seq的方法,一共得到5497个SAG。将每个SAG的reads分别与四个参考基因组比对,取比对分数最高的结果作为SAG的纯度,发现84%(4612)的SAG纯度超过 95%,我们将其定义为高纯度(如图2)。这些数据表明,绝大多数SAG代表单个微生物基因组。

图2

作者还统计了每个SAG对于基因组的覆盖率,结果表明,革兰氏阴性菌大肠杆菌E.coli和肺炎克雷伯菌K.pneumoniae,平均基因组覆盖率分别为8%和10% ;革兰氏阳性菌枯草芽孢杆菌B.subtilis和金黄色葡萄球菌S.aureus,覆盖比例为17%和25% 。对于上述四种菌株,仅需要几十个SAG就能覆盖基本完整的基因组(图3)。

图3

03.human gut microbiome samples

1.species-level共组装

将Microb-seq的方法应用于人类肠道微生物组。从一名健康的28岁男性捐献者身上收集的7个粪便样本,时间跨度超过1年半。该样本的鸟枪法宏基因组数据集和培养的分离基因组都有单独的报道。

每个样品回收1000到7000个SAGs,共21914个SAGs 。每个SAG平均包含约70000条reads,因此每个样本包含几亿条reads。在每一个SAG中,根据reads之间的重叠区,将reads组装成contigs,对于每一个SAG之间的重叠区域很小甚至几乎没有,所以我们使用一个哈希函数来提取一个完整基因组的特征,根据特征将部分基因组相似的SAGs聚成初步的bin。将每个bin中的reads进行共组装成暂定基因组(如图4)。

由于多个bin可能包含了对应于同一物种的基因组,所以通过计算基因组的ANI(平均核苷酸同一性) ,如果ANI > 95%即表明两个基因组属于同一物种,通过这种方法生成了234个物种水平的bins。

图4

将234个bins进行共组装。通过CheckM评估,在这234个基因组中,有76个是高质量或者中等质量的基因组:

•52个共组装基因组的完整性>0.9,污染度<0.05。我们将它们定为高质量 。 

•24个基因组完整性>0.5 ,污染<0.1。我们将其指定为中等质量。

并且发现共组装基因组具有相应分离基因组的19个物种 (在图5中用*标记)

图5

2.可获得可靠基因组

将共组装基因组与可分离培养细菌的“gold standard”基因组进行比较,在76个物种中,有19个物种已经被成功分离培养,其中17个物种的共组装基因组与“gold standard”基因组高度一致,ANI超过99.5%,表明Microbe-seq可以获得与分离培养相似水平的可靠基因组。

3.微生物多样性

通过Microbe-seq检测到的属同宏基因组结果重合度高达96.9%-99.8%。说明Microbe-seq与宏基因组获得的微生物多样性类似。

图6

4.鉴定全新的菌株

为了探究共组装基因组中包含多个菌株的可能性,进一步考察了19个共组装基因组与培养的同种菌株之间的比较,计算genome fraction(每个共组装基因组中与来自同一物种的分离基因组共享的碱基的百分比)。发现Blautia obeum、B. vulgatus、Parasutterella excrementihominis这三个物种的基因组可能包括多个菌株或在培养的分离株中没有出现的菌株。

图7

5.根据SNP分辨菌株

将SAG的reads重新比对到物种水平的组装基因组,可以得到SAG相较于基因组的SNP信息,依照SNP信息对普通拟杆菌(B. vulgatus)的SAG进行层次聚类并进行UMAP降维可视化,SAG分为四个明显分离的聚类簇(图8A)。

每个普通拟杆菌的SAG聚类簇具有一致的基因型,而与其它SAG簇的基因型重叠程度很低。这说明每个SAG聚类簇代表不同的菌株(图8B)。

将共组装基因组和培养分离的菌株基因组比较,发现strainC和isolate S1的ANI大于99.9%,表明二者为同一菌株,同理,strainA和isolate S2属于同一菌株,同时还发现未培养的全新菌株StrainB(图8C)。

说明Microbe-seq能够正确鉴定到已知菌株和尚未培养的潜在新菌株。

图8

6.构建HGT网络

微生物群落的一个特别值得注意的基因组学方面是微生物如何交换遗传信息,其中最著名的机制之一是HGT。给定一个标准,两个物种存在至少5kb的共同序列,具有99.98%的相似性,说明两个物种之间发生了水平基因转移。

结果发现同一细菌门中的菌株之间的转移明显大于不同细菌门中的菌株之间的转移。

图9

7.人类肠道微生物群中的宿主-噬菌体关联

基于液滴的方法不仅封装了单个细菌,而且还封装了与之物理共定位的任何噬菌体,为检测寄宿主-噬菌体关联提供了直接的手段。crAssphage是目前从人类肠道微生物组中发现的最丰富的噬菌体,作者发现B. vulgatus是该个体中crAssphage的宿主,而且可以精确的发现,B. vulgatus的strainA和crAssphage存在明显的关联。

图10

04.discussion

利用Microbe - seq这种实验与计算相结合的高通量单微生物基因组学方法,可以在不培养的情况下获得数以万计的微生物个体的基因组信息。这种基于高通量微流控技术的方法允许对足够数量的微生物进行更实际的个体检测。

在人类肠道微生物组,通过对数十万个细胞进行测序,将有可能鉴定出目前几乎所有的物种和菌株,从而能够更准确地调查多样性和丰度。此外,将目前的研究扩展到更多的人群,可以直接探索关键的微生物途径和基因对人类健康的影响,为未来的治疗发展开辟了潜在的方向。

技术改进

•整合长读测序技术可能会大大延长共组装组,从而提高所产生基因组组装的质量和完整性 。

•探索额外的裂解条件将提高裂解的均匀性和效率 ,潜在地允许对其他门甚至其他领域的微生物进行研究。将这些方法与功能分选相结合,将功能与菌株水平的基因组信息和单细胞分辨率相关联。

作者介绍

本文通讯作者为哈佛大学物理系和工程与应用科学学院的博士后研究员Peter J. Lu、哈佛大学教授David A. Weitz,以及来自麻省理工学院的Eric J. Alm教授。文章共同第一作者为墨卓生物CTO郑文山和麻省理工学院生物工程系赵诗杰博士。

感谢阅读!

由于作者水平有限,

论文解读难免存在不准确,欢迎批评指正。


作者:陈恩莲


计算基因组学
分享计算基因组学与生物信息学相关的知识,研究进展等