点击蓝字关注我们
英文标题:Haplotype-resolved genome assembly and resequencing provide insights into the origin and breeding of modern rose
发表时间:2024.10.11
发表期刊:Nature Plants
影响因子:15.8
2024年10月中国农业大学在《Nature Plants》杂志在线发表了题为Haplotype-resolved genome assembly and resequencing provide insights into the origin and breeding of modern rose的研究成果。高俊平教授、马男教授和费章君教授为文章的共同通讯作者。张钊教授、杨拓博士、刘洋博士、吴杰博士,吴珊博士,孙宏贺博士,李永红教授为该论文的共同第一作者。该研究首次实现了对四倍体现代月季“萨曼莎”单倍型基因组的高质量组装,通过对233个蔷薇属野生种和月季栽培种的重测序,明确了现代月季(Rosa hybrida)的起源及育种过程,鉴定了现代月季驯化过程中农艺性状相关的关键基因。
研究背景
中国是蔷薇属植物最重要的起源中心,以光叶蔷薇、香水月季等为代表的野生种栽培和驯化,形成了中国古老月季类群。在欧洲地区,法国蔷薇等也通过栽培和杂交,构成了欧洲古老月季类群。长期的反复杂交导致现代月季遗传背景相对单一,传统杂交方式很难获得进一步突破性的优异新品种,因此亟需通过现代基因组学手段厘清其起源和驯化过程,从而为开展高效的基因组选择育种和定向分子育种奠定基础。
主要研究结果
1. 现代月季“萨曼莎”基因组组装和注释
研究团队前期通过基因组调查和流式细胞实验,预估现代月季的基因组大小为1.91 Gb-2.13 Gb。随后采用ONT ultra-long (237 Gb)、HiFi (103 Gb)、Pore-C (43Gb)、Hi-C (543 Gb)等多种测序技术相结合的策略,对四倍体现代月季“萨曼莎”(Samantha,2n=4x=28)进行基因组组装。其中,ONT ultra-long、HiFi和Hi-C用于基因组组装和分型,组装结果经过Pore-C技术解析染色体的远距离相互作用,将contig挂载到28条假染色体上,最后使用Hi-C数据对挂载结果进行人工校正(图1)。最终组装的基因组大小为1.97 Gb,N50大小为70 Mb,基因组组装的LTR指数为21.93,BUSCO评估结果为98.7%。对基因组进行注释后,发现重复序列占比59.32% (其中LTR-RTs占比最高39.02%),预测出141,827个蛋白质编码基因,其中有130,192个(91.79%)可以被注释为具有功能的蛋白质。
图 1 “萨曼莎”基因组组装的Pore-C和Hi-C互作热图
2. 现代月季的起源
针对现代月季复杂群体结构和遗传组成问题,研究团队对215个野生种、过渡品种(中国和欧洲老品种的杂交品种)和现代品种进行了全基因组重测序,并结合已经测序的18个品种,系统解析了月季的遗传组成。通过鉴定的SNP构建了233个月季品种的系统进化树,进一步通过种群结构分析,推断了现代月季可能的6个祖先种群的起源(图2)。
图2 月季的种群结构分析。a: 233份月季系统发育树,Hyb,现代品种;Int,过渡品种;Syn,合柱组;Chi,月季组;Rosa,蔷薇组;Can,犬蔷薇组;Cin,桂味组;其他组,包括芹叶组、小叶组、金樱子组、硕苞组和木香组。b: 月季PCA图。c:群体结构分析。d:月季的花型变化。e:月季6个潜在祖先种起源分布
另外,研究团队对现代月季“萨曼莎”基因组与6个潜在祖先种的基因组进行比较,推断现代月季的28条染色体起源。结果显示现代月季基因组中最大比例来源于大花香水月季,占基因组序列的18.25%,除了chr7b以外每一条染色体都来自于不同的祖先,表明在现代月季基因组中存在广泛的同源交换和基因渗入,与现代月季的节段异源多倍体的性质一致(图3)。chr7b主要来源于腺果蔷薇,其染色体明显短于其他三条同源染色体,这可能是缺乏同源交换的原因。此外,研究团队通过7号同源染色体之间的共线性,发现同源染色体之间存在大片段倒位,并通过Pore-C验证了这种倒位的存在(图4a 蓝色箭头,图4b)。
图 3 现代月季的28条染色体遗传结构
图 4 现代月季的7号同源染色体之间的Pore-C互作热图
3. 现代月季育种中的人工选择
为了研究在月季育种过程中受到选择影响的基因组区域,研究团队对现代品种(Hyb4)和过渡品种(int4)之间进行了选择消除分析,结果显示过渡品种的核苷酸多样性高于现代品种(图5a),反映了人类选择在品种改良过程中的作用。此外,过渡品种表现出比栽培品种更快的连锁不平衡衰减速度(图5b),再次支持了近期形成的现代品种遗传多样性的降低。根据核苷酸多样性和群体固定系数Fst,在现代月季的基因组中确定了44.42 Mb的选择区域,这些区域涉及连续开花、花序分生组织与花器官发育、花色、衰老、生长、抗病性以及皮刺形成等关键性状相关的基因,如ACOs、AP2L和KSN等(图5c)。
图 5 现代月季选择性清除分析
总结
本研究首次构建了一个高质量的现代月季“萨曼莎”的单倍型基因组,通过对200多个蔷薇属野生种和月季栽培种的重测序,明确了现代月季的起源及育种过程。这标志着在现代月季基因组组成、变异以及重要农艺性状遗传解析方面取得了重要突破,为未来现代月季基因组选择育种和分子定向育种提供了坚实的理论基础,为后续的月季比较基因组和进化分析提供资源。
参考文献:
Zhang, Zhao, et al. "Haplotype-resolved genome assembly and resequencing provide insights into the origin and breeding of modern rose." Nature Plants (2024): 1-13.
点击文末阅读原文,获取文献链接
往期精彩:
文献解读|首个棉花T2T参考基因组揭示着丝粒进化和折叠胚胎形成的分子调控与演化机制
NAR解读|Direct RNA测序揭示U6 snRNA m6A 修饰在mRNA准确剪接中的关键作用
NC文献解读| Direct RNA测序能够消除传统抗体方法检测m6A修饰的假阳性问题
文献解读|小鼠肝脏对反复毒性损伤的耐受性与脂肪变性和炎症有关
Plant Cell文献解读 | 稻瘟病菌侵染植物的转录组景观揭示了时间共调控和结构保守的效应因子家族
文献解读 | The Plant Cell期刊发表十字花科植物基因间区长链非编码RNA的鉴定与功能注释成果
项目文章 | 纳米孔长读长RNA测序揭示人类血管平滑肌细胞中功能性的可变剪接变体
m7GHub V2.0:一个用于解析表观转录组m7G甲基化修饰的数据库
项目文章|贝纳基因Direct RNA测序助力牛脂肪细胞成脂机制研究
贝纳基因使用Nanopore平台完成全球第一个大型复杂植物基因组(菊花基因组)的组装和后续分析工作。提出并推动千种本草基因组计划,并构建药用植物基因组数据库,推动药材研究的发展。
贝纳基因使用Nanopore平台完成数千份细菌基因组、宏基因组测序和数据分析;完成数千份全长转录组和Direct转录组测序及分析。提出并推动基于Nanopore测序的万种微生物基因组完成图计划和十万人的Nanopore宏基因组研究计划。
贝纳基因开发了基于Nanopore平台的微生物检测体系,自主开发的数据库涵盖现已正式发表的所有微生物基因组,大型测序仪单机一次运行可以产生7.2T数据,小型便携式测序系统可用于临床检测和野外作业。
贝纳课堂-Nanopore交流QQ群:992789813(本群已满)
贝纳课堂-Nanopore交流QQ群2:923119248
生物信息交流QQ群:198746977
客服QQ:3277498363