点击蓝字关注我们
英文标题:Mapping and functional characterization of structural variation in 1060 pig genomes
发表期刊:Genome Biology(影响因子10.1)
发表时间:2024年5月
发表单位:中国农业科学院深圳农业基因组研究所(岭南现代农业科学与技术广东省实验室深圳分中心);美国农业部;奥胡斯大学
研究对猪基因组中的结构变异(SVs)进行了全面调查,涵盖了101个品种的1060个猪样本。研究建立了一个包括42,487个缺失(DEL),37,913个移动元件插入(MEI),3308个复制(DUP),1664个倒位(INV)和45,184个断端(BND)的SV目录,这些SVs对猪的复杂性状具有重要影响。通过分析SVs,研究人员能够推测不同品种的祖先和杂交情况,并发现了与特定表型相关的SVs。此外,研究还揭示了SVs与基因表达和经济重要性状的关联,为理解猪的遗传多样性和进化历史提供了宝贵资源。
研究背景:
猪(Sus scrofa)是人类最重要的家畜之一,为不断增长的世界人口提供了安全的食物供应。它们具有高度的生产潜力和经济价值,广泛用于肉类和其他畜产品的生产。此外,猪在解剖学和生理上与人类有较高的相似性,成为研究人类疾病和潜在异种移植器官供体的生物医学模式生物。尽管目前对于猪基因组研究取得了显著的进展,但仍存在许多挑战和待解决的问题,猪基因组中的结构变异和拷贝数变异等复杂变异形式的鉴定和功能解析仍需要更深入的研究。
研究内容:
研究团队从PigGTEx项目收集的1208个测序深度大于10X的短读长全基因组序列(WGS)数据集,对其进行筛选和过滤,最后使用的数据包括1060头猪和36个外群个体。通过标准的SV calling流程,研究团队对1060头猪的130,556个高质量SV进行了检测和基因分型。建立了一个包括42,487个缺失(deletion,DEL),37,913个移动元件插入(mobile element insertion,MEI),3308个复制(duplication,DUP),1664个倒位(inversion,INV)和45,184个断端 (breakend,BND)的SV目录。
研究团队对SV的遗传多样性进行了分析,研究发现在群体基因组中常见SVs的比例较高,而单态(allele count=1)SVs和罕见(1<allele count<10,allele frequency< 0.01)SVs的比例较低。SV的大小分布显示,长片段SV中DELs、INVs和MEIs频率较低,而DUPs频率在各SV长度中的分布相对稳定。此外,研究团队还发现MEIs在长度在250 bp和7500 bp时存在两个峰值,分别对应短散在元件(SINE)和长散在元件(LINE)的重复序列。
SV在1060只猪的个体、种群和基因组中的分布
研究团队基于基因序列、染色质状态、调控变异和猪的复杂性状QTL等不同基因组特征进行了重叠分析,通过分析SV所在的基因的功能、SV所在的基因组区域、SV所在区域的染色质状态,使用SV的数量和长度分别进行计算SV与这些区域的重叠比例,从而研究SV对基因组功能的影响。研究团队发现位于基因间区的SV比例明显高于基因内区域。通过SV和复杂性状QTL进行共定位,有26个性状的QTL在SV中显著富集,并涉及到猪的屠宰、抗性、产量、生长、质量和存活等性状。
sv相关基因、调控基因和e/sQTL
研究团队对于群体结构进行了分析,基于201,589个SV基因型对全部来自7个主要种群的112个亚种群进行最大似然方法聚类分析,得到了一个能够清晰将个体分组到其祖先群体的系统发育树。研究团队分别基于SV和SNP进行群体结构分析,主成分分析(PCA)显示,SV能够成功区分来自不同地理区域的个体,并与从SNP得到的分布结果相似。在去除36个外群个体后,从PC1来看,欧洲猪和亚洲猪分为两个主要群体,ASxEU群体位于两个主要群体之间。从PC2来看,欧洲猪内部进行了分离,其中济州黑猪、韩国本地猪、辽宁猪和闽猪等与约克夏猪接近。而杜洛克是欧洲猪中最独特的品种,与亚洲猪群体的关系较远。
1096个个体常染色体中SV基因型的群体结构
研究团队将每个品种进行比较,重点关注品种特异的SVs或具有最高1% FST值的品种差异性SVs,在分析中检测到了共计2246个SVs,并且发现了1286个与SVs相关的DEGs。其中,20.8%的基因在至少两种组织中表达差异,而20.7%的DEGs在至少两个亚群体中表达差异。研究团队进一步分析了几个与SV相关的基因,发现MYO9A基因的3'-UTR被Duroc具有亚群特异性的SINE/Pre0_SS截断,根据分析表示,这可能是Duroc与Yorkshir相比,在脂肪、血液和心脏中MYO9A的表达水平增加了约4倍的原因。此外,研究团队还发现了拷贝数增加的情况,如在Yorkshire中检测到了ABCG2基因内存在一个特异性拷贝数的增加,它可以重排染色质相互作用,导致在Yorkshire的血液、胚胎和子宫中ABCG2的表达产生下调。
研究团队还通过研究染色质状态和基因间相互作用来解释这些结构变异对基因调控的影响。例如,在Yorkshire中发现一个大的拓扑关联域(TAD)被ABCG2基因体上游的断点截断,导致生成了两个大小相似的TAD,而在第一个小的TAD中,研究团队观察到PPM1K基因与ABCG2之间的强染色质相互作用。
亚群体中与sv相关的DEGs
点击文末阅读原文,获取文献链接
往期精彩:
NAR解读|Direct RNA测序揭示U6 snRNA m6A 修饰在mRNA准确剪接中的关键作用
NC文献解读| Direct RNA测序能够消除传统抗体方法检测m6A修饰的假阳性问题
文献解读|小鼠肝脏对反复毒性损伤的耐受性与脂肪变性和炎症有关
Plant Cell文献解读 | 稻瘟病菌侵染植物的转录组景观揭示了时间共调控和结构保守的效应因子家族
文献解读 | The Plant Cell期刊发表十字花科植物基因间区长链非编码RNA的鉴定与功能注释成果
项目文章 | 纳米孔长读长RNA测序揭示人类血管平滑肌细胞中功能性的可变剪接变体
m7GHub V2.0:一个用于解析表观转录组m7G甲基化修饰的数据库
项目文章|贝纳基因Direct RNA测序助力牛脂肪细胞成脂机制研究
贝纳基因使用Nanopore平台完成全球第一个大型复杂植物基因组(菊花基因组)的组装和后续分析工作。提出并推动千种本草基因组计划,并构建药用植物基因组数据库,推动药材研究的发展。
贝纳基因使用Nanopore平台完成数千份细菌基因组、宏基因组测序和数据分析;完成数千份全长转录组和Direct转录组测序及分析。提出并推动基于Nanopore测序的万种微生物基因组完成图计划和十万人的Nanopore宏基因组研究计划。
贝纳基因开发了基于Nanopore平台的微生物检测体系,自主开发的数据库涵盖现已正式发表的所有微生物基因组,大型测序仪单机一次运行可以产生7.2T数据,小型便携式测序系统可用于临床检测和野外作业。
贝纳课堂-Nanopore交流QQ群:992789813(本群已满)
贝纳课堂-Nanopore交流QQ群2:923119248
生物信息交流QQ群:198746977
客服QQ:3277498363