育种应用|全基因组低深度重测序究竟潜力如何?

文摘   2024-08-19 18:04   北京  

测序技术的发展为低成本获取全基因组水平的标记奠定了基础。高密度标记可以明确全基因组层面的连锁不平衡信息,这为解决种群结构、复杂性状的遗传评估提供了可能。

大规模高深度全基因组测序成本昂贵。因此,如何低成本获取高密度标记成为当前基因组选择育种的一个关键问题。

SNP芯片、简化基因组等靶向测序技术近年来已被逐渐应用。全基因组低深度重测序(low-coverage whole-genome sequencing, LcWGS)是继靶向测序之后新一代标记开发方法,由于其检测位点更全面和低成本优势,LcWGS愈发展现出其在动植物育种中的潜力,下面我们来一窥究竟。

01

 基因组低深度重测序VS全基因组重测序


全基因组重测序具有检测变异类型丰富、应用广泛等优点。在进行个体全基因组重测序前,需根据研究目的选择测序深度。测序深度在10x以上时可以实现约99%的基因组覆盖度、约95%的SNP检测灵敏度和较低的测序错误率。

全基因组重测序应用于动植物性状研究时,测序深度多为10x-30x。尽管近年来测序价格迅速下降,大群体高深度全基因组测序成本仍然高昂。

图 2001 年至 2020 年每 Mb DNA 测序价格
图片来源:National Human Genome Research Institute

LcWGS通过对群体中所有个体进行低深度测序,基于连锁不平衡原理对缺失基因型进行填充,得到全基因组范围内的高密度SNP,极好地控制测序成本,在动植物育种应用方面充满潜力。

图 基因型填充使得低深度基因组测序获得高准确度基因型信息

02
全基因组低深度重测序VS SNP芯片

SNP芯片通过检测覆盖于全基因组的SNP标记,计算个体的基因组育种值,进而选择优秀个体。目前商业化SNP芯片存在以下几个问题:
1)标记数量有限,多数芯片位点数量在几十K,最高密度的SNP芯片位点数目也只有几百K
2)需要预设,无法检测新生变异;
3)针对某一物种的SNP芯片产品众多,不同芯片间位点不同,难以开展联合分析,影响多群体基因组选择或区域性联合育种的效果;
4)位点更新成本高。

图 3款猪50K芯片SNP标记数及基因型检测个体数[1]

通过基因型填充可获得更高密度标记信息。既往研究显示,LcWGS的基因型填充表现优于SNP芯片:2022年发表在《Frontiers in Genetics》的研究[2]表明,随着SNP密度增加,LcWGS的数据填充可靠性从0.25增加到0.99,错误率从18.43%降到0.07%;SNP芯片数据的可靠性从0.24增加到0.95,错误率从16.22%降到7.35%。

同时,该团队基于以上数据在大白猪群体(1423头)中进行了LcWGS填充策略试验[3]。结果显示,3种填充策略的平均填充准确度分别为0.9893、0.9899、0.9875,均高于SNP芯片(GeneSeek Porcine 50 K SNP芯片)的0.8522。此外,在荷斯坦牛中两者有相同的结果表现[4]。两款50K芯片的平均填充准确性仅超过0.8,80K以上芯片平均填充准确性超过0.9,而当LcWGS测序深度为1x时,其平均填充准确度已达97.6%。

基因组填充是LcWGS的核心。目前可用的数据填充工具包括STITCH、Beagle、GeneImp、GLIMPSE和loimpute等,并已在多个物种中得到了广泛应用[5-8]。在填充条件得到优化的前提下,准确度均已达到0.95(r2)甚至更高。


格致博雅依托海量大数据资源和高性能图形化处理技术,搭建了具有自主知识产权的LcWGS基因型填充智能分析流程,实现基因型填充的一键式高效分析。基于该流程,LcWGS基因型填充结果与20x全基因组测序之间的相关性达0.988以上。


图 格致博雅LcWGS基因型智能分析流程准确性测试结果

03
全基因组低深度重测序VS简化基因组测序

简化基因组测序( reduced -representation genome sequencing, RRGS)是通过酶切片段筛选对特定基因组区域进行靶向测序的一种方法。

基因组酶切位点分布广泛,RRGS一般可获取比中密度芯片更多的标记。同时,由于靶向测序成本较低,可进行更多个体测序。这也为大样本基因分型提供了可能。

由于技术局限性,简化基因组测序特有的误差和偏好性也需要值得注意。例如,当某一个酶切位点在不同的个体间出现多态时,有可能造成部分个体在此位点无法正常酶切,进而导致等位基因的丢失,最终导致某一杂合子位点被误判为纯合子位点。

研究显示,LcWGS的成本与RAD-seq(最常用的简化基因组测序方法之一)相当。但是在实际应用中,SNP位点的密度通常直接关系到基因组选择中的育种值评估的准确性。

RAD-seq仅可以对约1-10%的基因组进行测序分型[9],而LcWGS在未填充之前的基因组覆盖度即可达到58%(格致博雅实测结果)。另外,已有数据显示LcWGS在与SNP芯片、RAD-seq的育种值估计比较中准确度更高[10]

综上,LcWGS兼具经济性和超高密度多态位点优势。与高深度全基因组测序相比,成本明显降低,在大基因组物种基因分型中具有更显著的获益;与SNP芯片相比,无需预设,标记检测范围更广,可发现新的表型关联位点;与简化基因组测序相比,避免酶切效率不同带来的误差并获得更高的基因组标记覆盖度。

LcWGS可用于全基因组关联研究与基因组选择研究,是一种经济可靠的基因分型方法,在大规模基因组研究和基因组选择育种实践中具有良好应用前景。


参考文献

[1]邱奥,王雪,孟庆利,.3款猪50K SNP芯片基因型填充效果研究[J].中国畜牧杂志,2021,57(S1):33-38.DOI:10.19556/j.0258-7033.20210617-02.

[2] Deng T, Zhang P, Garrick D, Gao H, Wang L, Zhao F. Comparison of Genotype Imputation for SNP Array and Low-Coverage Whole-Genome Sequencing Data. Front Genet. 2022;12:704118. Published 2022 Jan 3. doi:10.3389/fgene.2021.704118

[3] Wang XQ, Wang LG, Shi LY, et al. Imputation strategies for low-coverage whole-genome sequencing data and their effects on genomic prediction and genome-wide association studies in pigs. Animal. Published online July 25, 2024. doi:10.1016/j.animal.2024.101258

[4]滕军.荷斯坦牛全基因组序列数据填充方法评估及产奶性状纵向全基因组关联分析[D].山东农业大学,2022.

[5] Wang D, Xie K, Wang Y, et al. Cost-effectively dissecting the genetic architecture of complex wool traits in rabbits by low-coverage sequencing. Genet Sel Evol. 2022;54(1):75. Published 2022 Nov 18. doi:10.1186/s12711-022-00766-y

[6] Song H, Dong T, Wang W, et al. Cost-effective genomic prediction of critical economic traits in sturgeons through low-coverage sequencing. Genomics. 2024;116(4):110874. doi:10.1016/j.ygeno.2024.110874

[7] Zhao C, Teng J, Zhang X, et al. Towards a Cost-Effective Implementation of Genomic Prediction Based on Low Coverage Whole Genome Sequencing in Dezhou Donkey. Front Genet. 2021;12:728764. Published 2021 Nov 3. doi:10.3389/fgene.2021.728764

[8Liu S, Martin KE, Snelling WM, et al. Accurate genotype imputation from low-coverage whole-genome sequencing data of rainbow trout. G3 (Bethesda). Published online July 23, 2024. doi:10.1093/g3journal/jkae168

[9]李勇.不同SNP分型技术在猪基因组选择中效果评估及全基因组关联研究[D].华中农业大学[2024-08-16].

[10] ,平平 刘,师 王.简化基因组测序在群体遗传进化分析中的应用[J].BIO-PROTOCOL, 2021.DOI:10.21769/BioProtoc.1010636.






北京格致博雅生物科技有限公司(简称“格致博雅”)是国内领先的高通量测序和生物信息学技术研发企业,自成立以来始终秉持着“让生命可知”的愿景,专注于动植物多组学测算服务,致力于为育种 4.0 提供智能化解决方案。格致博雅具备完整的基因检测技术链,拥有自动化的样本前处理平台、超高通量 DNBSEQ-T7 测序平台以及配备有大量自研数据处理流程的高性能计算中心,以“大数据+生物技术”为核心竞争力。格致博雅搭建有多基因分型检测、高通量测序和动植物多组学数据挖据的生物育种底层技术平台,提供基因组测序与分析、单细胞及多组学测序与分析和宠物基因检测三大技术服务。格致博雅现已获得北京市“专精特新”中小企业、国家高新技术企业、中关村高新技术企业、北京市“创新型”中小企业、ISO9001 质量体系认证等多项荣誉资质。 


格致博雅生物科技
Make Life Predictable
 最新文章