揭秘Pore-C技术在动植物基因组组装中的妙用

企业   2024-11-20 17:21   天津  

众所周知,纳米孔测序技术是一种基于电信号检测的单分子测序方法,通过纳米孔蛋白上电流的变化来识别碱基。而染色体构象捕获技术(3C技术)是一种用于研究基因组三维结构的方法,它能让研究者了解DNA在细胞内的空间组织,即哪些DNA区域在物理上相互接近,这些区域可能参与基因调控和表达。两者碰撞的火花诞生了全新的“Pore-C”测序技术。今天,让我们共同揭开Pore-C技术的神秘面纱,见证其在动植物基因组中的妙用!


文献一




Haplotype-resolved genome assembly and resequencing provide insights into the origin and breeding of modern rose

Nature Plants

现代玫瑰

现代玫瑰是一种近期形成的种间杂交种,已成为最重要和最广泛种植的观赏植物之一。本研究报告了四倍体现代玫瑰品种“Samantha”(‘JACmantha’)的单倍型解析染色体水平基因组组装以及涉及各种野生种和古老与现代品种的 233 个玫瑰种质的基因组变异图谱。“Samantha”的同源染色体上存在频繁的同源染色体交换。种群基因组分析和基因组组成分析揭示了野生玫瑰种对现代玫瑰的贡献,并突出了大马士革玫瑰(R. odorata)及其衍生品种在形成现代玫瑰基因组结构方面的重要性,就像老粉红(R. chinensis ‘Old Blush’)一样。此外,研究人员还识别了与现代玫瑰育种中主要农艺性状选择消除作用,包括持续开花、双花、开花衰老和抗病性等。这项研究为深入了解现代玫瑰起源和育种历史的遗传基础提供了见解,并为玫瑰改良提供了前所未有的基因组资源。

Pore-C使用Pore-C reads将contig组装成28个假染色体。首先使用Cooler分析contig上的DpnII限制性位点,再将Pore-C与contig进行比对,并进行片段注释和成对接触矩阵的生成,成对接触矩阵用于使用LACHESIS锚定contig。为了识别组装染色体中的潜在坍塌区域,将PacBio HiFi读段与组装基因组进行比对。基于比对结果,使用mosdepth计算组装中每个100 kb非重叠窗口的比对深度。深度大于100×(是正常深度50×的两倍)的基因组区域被识别为潜在坍塌区域。然后将组装的contig与这些区域进行比对,生成相应的contig,再使用HiCUP 将它们重新锚定到染色体上。最终,使用 JuiceBox进行人工校正,得到28条等位基因分辨率的染色体。

图1 Pore-C、Hi-C辅助挂载热图对比

图2  7号同源染色体之间的 Pore-C 信号


文献二




Gapless assembly of complete human and plant chromosomes using only nanopore sequencing

Genome Research

人、番茄、玉米

ONT“Duplex”测序reads,可对 DNA 双链进行测序以提高质量,可实现每个碱基的高准确率。为了评估这种新型数据类型,我们为三个广泛研究的基因组(人类 HG002、番茄 Solanum lycopersicum Heinz 1706 和玉米 Zea mays B73)生成了 ONT Duplex 数据。对于二倍体HG002 基因组,还使用了“Pore-C”技术对单倍型基因组进行分相组装。

发现 Duplex 数据的准确率与 HiFi 测序相似,但读长更长,而 Pore-C 数据与现有的二倍体组装算法兼容。这种读长和准确率的组合能够构建高质量的初始基因组,可以使用超长读长进一步解析,最终使用 Pore-C 分相成染色体规模的单倍型。生成的基因组具有超过 99.999% 的碱基准确率(Q50)和近乎完美的连续性,大多数染色体组装成单个连续片段。有可能为完整基因组的重建提供单仪器解决方案。

Pore-C分别对50X Duplex/30X ONT UL及70X Duplex数据进行分相组装(50X Pore-C),其使用了Verkko中的GFAse,并将其结果与trio生成的分相单倍型基因组进行了结果比对,发现具有相似的scaffold、QV、基因组完整性和达成T2T的染色体数量。在这两种情况下,基因组都实现了近30条T2Tcontig,大约一半的染色体达到了T2T 水平。

表1 人类基因组 HG002 组装结果比较

以上两篇文章均使用了Pore-C技术进行了基因组的单倍型分相组装,当然,除此之外还有雀梅藤、山葵、亚利桑那沙漠金蝎等物种也均使用了Pore-C技术完成了染色体或单倍型级的基因组组装工作。由此可见,Pore-C技术已经广泛应用在动植物基因组中,再结合Nanopore官方推出的“T2T ONT Only计划”(Ultra Long + APK + Pore-C)即可完成人的T2T组装,相信Pore-C技术在未来的基因组领域会大放异彩。诺禾致源拥有成熟的Pore-C测序、辅助挂载、单倍型拆分技术,有兴趣的老师可以及时与我们联系,尝试最新技术。

表2 2024年部分应用Pore-C技术文章汇总


诺禾致源三代测序产品部




一直以来,诺禾致源全球化布局持续深化,全球区域化服务能力不断完善。依旧坚持以客户为中心,以本土化服务扎根全球本地客群,持续拓展服务范围和服务能力。在T2T(完美基因组)、图形泛基因、超大基因组及基因组多组学等经典领域均发表了高分文章,获得北京市新技术新产品证书1项、拥有专利授权18项、软件著作权40余项,2023年全年在国际期刊合作发表论文138篇,累计影响因子1070+,多年来共完成1000+物种的基因组图谱构建, 为您带来更加优质、稳定、高效的科学研究服务。向着成为“全球领先的基因科技产品和服务提供者”的目标不断迈进。


参考文献:

[1] Zhang, Z., Yang, T., Liu, Y. et al. Haplotype-resolved genome assembly and resequencing provide insights into the origin and breeding of modern rose. Nat. Plants 10, 1659–1671 (2024).

[2] Koren S, Bao Z, Guarracino A, et al. Gapless assembly of complete human and plant chromosomes using only nanopore sequencing.bioRxiv [Preprint]. 2024 Mar 19:2024.03.15.585294. doi: 10.1101/2024.03.15.585294. Update in: Genome Res. 2024 Nov 6. doi: 10.1101/gr.279334.124. PMID: 38529488; PMCID: PMC10962732.


诺禾致源科服
国内规模领先的高通量测序公司,高通量测序,生物信息分析,科研服务,临床检测。
 最新文章