参考基因组在现代生物学研究中发挥着极为关键的作用,通过将测序个体和参考基因组进行序列比对实现基因分型而获取遗传变异集,进而利用该遗传变异集进行下游的遗传学分析以及育种实践。目前最新的广泛应用的山羊参考基因组ARS1.2来自于单一的个体,然而单一参考基因组并不能代表该物种全部的基因组序列和遗传变异。泛基因组是一个物种内所有非冗余序列的集合,是更具有代表性的参考基因组,因此构建山羊的泛基因组有助于呈现该物种遗传多样性的全貌,捕获以往利用单一参考基因组无法捕获的遗传变异,探索山羊基因组的演化规律,有助于我们更好的开发利用和保护山羊种质资源。
近日,中国农业大学动物科学技术学院李孟华教授团队在国际知名期刊 Journal of Animal science and Biotechnology在线发表题为 “The goat pan-genome reveals patterns of gene loss during domestication” 的原创性研究成果。该研究收集了813个驯化山羊及野生近缘种个体(包括723个驯化山羊个体和90个野生近缘种个体),样本的地理分布如图1。通过将所有测序个体和ARS1.2进行序列比对,然后提取不能比对到ARS1.2上的序列进行基因组组装和注释,最终一共组装出146Mb的非参考基因组序列,随后在非参考基因组序列上一共注释到974个新的蛋白编码基因。通过将不能比对到ARS1.2的序列比对到新组装的非参考基因组序列上进行SNP calling,一共获取了3190 个新的SNPs。基于该SNP变异集对山羊野生祖先群体、野生近缘种群体以及驯化群体进行群体遗传学分析,结果显示该变异集可以较好的反映该样本的群体结构,如图2。该结果表明山羊泛基因组可以捕获以往利用单一参考基因组无法获取的遗传变异。
图1 构建泛基因组样本的地理分布
图2 基于novel SNPs进行的群体遗传学分析
存在/缺失变异(PAV)是一种重要的结构变异类型,该研究选取山羊野生祖先群体Bezoar、地方群体和奶用山羊群体,并以泛基因组为参考基因组进行PAV calling,对每个基因的存在频率进行统计,结果显示山羊的核心基因比例为89.73%,可变基因的比例为10.27%。泛基因组模型构建显示该山羊泛基因组表现出开放型泛基因组的特征。另外,从野生群体到地方群体以及从地方群体到改良群体,基因数目表现出逐渐下降的趋势,如图3。同时,该研究利用PAV变异集进行了驯化阶段和改良阶段的PAV选择分析,筛选到若干与免疫反应相关的基因,如CLEC2D, FAM26F等, 并且受到负向选择的基因明显多于受到正向选择的基因,整个进化过程中表现出基因丢失的趋势,如图4。
图3 基因PAV变异集的特征及泛基因组模型图
图4 PAV选择分析以及进化过程中基因数目的变化
该研究利用迄今为止最大的驯化和野生样本数据集构建了山羊的泛基因组,组装和注释了大量的非参考基因组序列以及新的蛋白编码基因,结果表明山羊泛基因组可以更全面的捕获遗传变异。山羊在驯化阶段和改良阶段中存在负向选择或者基因丢失的现象,山羊在进化过程中,与免疫相关的基因可能发挥重要的作用。该研究揭示了泛基因组对于挖掘新的遗传变异的重要性,改善了我们对山羊驯化和育种历史中基因组演化的理解。
中国农业大学为论文第一完成单位,动物科学技术学院吕锋骅副研究员、徐松松副研究员为共同通讯作者,动物科学技术学院博士研究生刘家鑫、硕士研究生石一龙为论文共同第一作者。本研究获得了中国科学院战略性先导科技专项(XDA24030205),国家自然科学基金(U21A20246, 32102511),国家重点研发计划(2021YFD1200900,2021YFD1300904)等项目的资助。
文章链接:https://jasbsci.biomedcentral.com/articles/10.1186/s40104-024-01092-7
信息来源:华南农业大学