低深度重测序专题|探究LcWGS的多元化应用场景

文摘   2024-09-26 15:52   北京  


低深度全基因组重测序(Low coverage whole genome sequencing,LcWGS)是一种低成本的基因分型技术,其测序数据量可低至高深度重测序的1/10 ~ 1/100。


测序成本的降低可同时支持研究者纳入更多样本进行分析,从而提高复杂性状基因的定位精度。因此,LcWGS在大规模群体基因组学研究中具有广阔的应用前景。本期专题文章,我们将一起来探讨哪些场景更适合进行LcWGS检测。


1、大基因组物种的基因组学研究

当前,基因组学研究的关键问题在于如何以低成本获取高密度标记,这一问题在大型基因组物种研究中尤为突出。据统计,诸多常见动植物基因组均含上亿碱基对(表1)。


表1 常见物种的基因组大小


目前,高深度重测序是基因研究的重要工具,其优势在于可获得最全面的位点变异信息,并实现各类性状的基因定位。然而,其高昂的测序成本制约了大基因组物种研究的发展。


简化基因组和SNP芯片在一定程度上降低了测序成本,但是其获取的SNP位点信息量大幅减少,基因定位精度显著降低。


2、基于大规模群体的复杂性状定位研究

动植物育种中涉及到的重要性状大多为数量性状,数量性状受多个基因和环境因素的共同影响,遗传机制通常较为复杂。大规模群体分析可显著提升数量性状的定位精度。


据统计,若基于SNP芯片进行GWAS分析,通常需要纳入样本数在千余水平才能得到比较理想的分析结果;若基于WGS进行GWAS分析,所需样本量通常≥200,但测序深度需在5x~30X,测序成本高昂(表2、3)。


表2 部分畜禽全基因组关联分析研究样本数量[1]


表3 部分作物全基因组关联分析研究样本数量[2-7]


对于复杂性状定位,纳入个体数量的贡献度更高。Alex 等人在模拟数据中发现,使用 1×深度对 100 个体进行测序得到的群体信息与 0.5×深度对 200 个体进行测序得到的群体信息准确性基本一致,而后者可以提供更多的个体信息[8]


表4 驴群体基因组研究统计[9-12]


据统计,在驴(基因组大小约2.36G)的群体基因组研究中,碍于成本问题,以往样本量只能选取100左右,在将测序深度大幅降低之后,可以纳入更多样本量,从而获取到更精准的群体信息。



3、基因组学研究较少的物种/品种的育种应用

目前SNP芯片广泛应用于设计育种。SNP芯片可基于已有位点信息,对待测群体进行基因分型。


然而,SNP芯片检测位点有限,无法满足高精度定位需求。此外,SNP芯片只能检测已知突变,无法检测待测群体中的未知突变,具有滞后性。


目前,商业化芯片仅针对常见物种/品种。对于一些地方品种,难以通过主流品种的商业化芯片进行相关检测。上述问题一定程度上限制了这些物种的群体基因组学研究和育种发展。


LcWGS无需预设,可检测群体中的未知突变,可检测各类物种/品种。基于LcWGS提供的高密度基因分型结果,可进一步拓展全基因组关联分析、全基因组选择育种等下游应用(表5)。


表5 基于LcWGS进行GWAS、GS的研究[12-16]



图 GWAS分析结果中IcWGS比芯片存在更多的提示性显著信号峰[13]


综上所述,LcWGS是一种兼具低成本与基因分型标记准确性的方法,在大基因组的物种群体基因组研究中的优势表现尤为显著。




参考文献

【1】Ren J, Gao Z, Lu Y, et al. Application of GWAS and mGWAS in Livestock and Poultry Breeding. Animals (Basel). 2024;14(16):2382. Published 2024 Aug 16. doi:10.3390/ani14162382

【2】Yano, K., Yamamoto, E., Aya, K. et al. Genome-wide association study using whole-genome sequencing rapidly identifies new genes influencing agronomic traits in rice. Nat Genet 48, 927–934 (2016). https://doi.org/10.1038/ng.3596

【3】Fang, L., Wang, Q., Hu, Y. et al. Genomic analyses in cotton identify signatures of selection and loci associated with fiber quality and yield traits. Nat Genet 49, 1089–1098 (2017). https://doi.org/10.1038/ng.3887

【4】Hazzouri, K.M., Gros-Balthazard, M., Flowers, J.M. et al. Genome-wide association mapping of date palm fruit traits. Nat Commun 10, 4680 (2019). https://doi.org/10.1038/s41467-019-12604-9

【5】Zhang, MY., Xue, C., Hu, H. et al. Genome-wide association studies provide insights into the genetic determination of fruit traits of pear. Nat Commun 12, 1144 (2021). https://doi.org/10.1038/s41467-021-21378-y

【6】Liu, Y., Chen, J., Yin, C. et al. A high-resolution genotype–phenotype map identifies the TaSPL17 controlling grain number and size in wheat. Genome Biol 24, 196 (2023). https://doi.org/10.1186/s13059-023-03044-2

【7】Yuan X, Jiang X, Zhang M, et al. Integrative omics analysis elucidates the genetic basis underlying seed weight and oil content in soybean. Plant Cell. 2024;36(6):2160-2175. doi:10.1093/plcell/koae062

【8】Alex Buerkle C, Gompert Z. Population genomics based on low coverage sequencing: how low should we go?.Mol Ecol. 2013;22(11):3028-3035. doi:10.1111/mec.12105

【9】Song S, Wang S, Li N, et al. Genome-wide association study to identify SNPs and candidate genes associated with body size traits in donkeys. Front Genet. 2023;14:1112377. Published 2023 Feb 28. doi:10.3389/fgene.2023.1112377

【10】Zhou Z, Fan Y, Wang G, et al. Detection of Selection Signatures Underlying Production and Adaptive Traits Based on Whole-Genome Sequencing of Six Donkey Populations. Animals (Basel). 2020;10(10):1823. Published 2020 Oct 7. doi:10.3390/ani10101823

【11】Liu Y, Li H, Wang M, et al. Genetic architectures and selection signatures of body height in Chinese indigenous donkeys revealed by next-generation sequencing. Anim Genet. 2022;53(4):487-497. doi:10.1111/age.13211

【12】Yan S U N, Li Y H, Zhao C H, et al. Genome-wide association study for numbers of vertebrae in Dezhou donkey population reveals new candidate genes[J]. Journal of Integrative Agriculture, 2023, 22(10): 3159-3169.

【13】Zhang Z, Ma P, Zhang Z, Wang Z, Wang Q, Pan Y. The construction of a haplotype reference panel using extremely low coverage whole genome sequences and its application in genome-wide association studies and genomic prediction in Duroc pigs. Genomics. 2022;114(1):340-350. doi:10.1016/j.ygeno.2021.12.016

【14】Li J, Wang Z, Lubritz D, et al. Genome-wide association studies for egg quality traits in White Leghorn layers using low-pass sequencing and SNP chip data. J Anim Breed Genet. 2022;139(4):380-397. doi:10.1111/jbg.12679

【15】Wang D, Xie K, Wang Y, et al. Cost-effectively dissecting the genetic architecture of complex wool traits in rabbits by low-coverage sequencing. Genet Sel Evol. 2022;54(1):75. Published 2022 Nov 18. doi:10.1186/s12711-022-00766-y

【16】Song H, Dong T, Wang W, et al. Cost-effective genomic prediction of critical economic traits in sturgeons through low-coverage sequencing. Genomics. 2024;116(4):110874. doi:10.1016/j.ygeno.2024.110874





北京格致博雅生物科技有限公司(简称“格致博雅”)是国内领先的高通量测序和生物信息学技术研发企业,自成立以来始终秉持着“让生命可知”的愿景,专注于动植物多组学测算服务,致力于为育种 4.0 提供智能化解决方案。格致博雅具备完整的基因检测技术链,拥有自动化的样本前处理平台、超高通量 DNBSEQ-T7 测序平台以及配备有大量自研数据处理流程的高性能计算中心,以“大数据+生物技术”为核心竞争力。格致博雅搭建有多基因分型检测、高通量测序和动植物多组学数据挖据的生物育种底层技术平台,提供基因组测序与分析、单细胞及多组学测序与分析和宠物基因检测三大技术服务。格致博雅现已获得北京市“专精特新”中小企业、国家高新技术企业、中关村高新技术企业、北京市“创新型”中小企业、ISO9001 质量体系认证等多项荣誉资质。 


格致博雅生物科技
Make Life Predictable
 最新文章