高质量的参考基因组是基因组学研究的重要基础。随着测序技术(超长ONT联合PacBio HiFi)的发展,许多植物的端粒到端粒基因组(Telomere-to-telomere genome,T2T基因组)不断被揭示。近期,国际知名期刊Horticulture Research发布了20+篇园艺作物T2T基因组合集,这意味着目前该期刊对T2T基因组的“好感”十足!那么,我们该如何“玩转”植物T2T基因组呢?
植物T2T基因组的发展现状
目前植物 T2T 基因组的研究现状呈现出多方面的积极进展。在研究成果方面,众多植物物种的 T2T 基因组已成功构建,如水稻、玉米、香蕉和西瓜等,涵盖了大田作物和经济作物等不同类型植物,为这些植物的后续研究和育种工作提供了重要的基础资源(表1)。
表1 部分植物物种中完整或近乎无间隙组装的状态 (Garg et al., 2024)
从技术层面看,主要应用新的三代测序技术如PacBio HiFi、超长ONT以及 Hi-C 技术等的应用,同时新的组装算法和策略也不断涌现,助力解决基因组中的重复序列、结构变异等难题,提高了基因组组装的准确性和连续性。目前,派森诺可承诺常规植物T2T基因组组装至少可达到全基因组50%以上全染色体0 gap水平!!(基因组复杂的植物类型需具体评估)
植物T2T基因组的应用
T2T基因组的应用范围非常广泛,可用于发现之前因基因组组装不完整而被遗漏的新基因,亦可进行遗传多样性评估和品种选育,更重要的是可以挖掘不同品种间更多、更全面的SNP、Indel等变异用于解析重要农艺性状的遗传机制(图1)。那么,让我们一睹Horticulture Research上T2T基因组应用经典案例的“芳华”吧。
图1 T2T基因组在作物改良中的应用(Garg et al., 2024)
案例1
首个砂梨T2T基因组+进化分析
文章题目:Telomere-to-telomere pear (Pyrus pyrifolia) reference genome reveals segmental and whole genome duplication driving genome evolution
研究材料:砂梨代表性品种“云红1号”
测序策略:Illumina(65x)+超长ONT(152x)+Hi-C(107x)+ PacBio HiFi(43x)
主要研究发现:
1.片段化复制分析:片段化复制能增加基因组复杂性并推动基因组重排与进化。基于组装的梨T2T基因组,对片段化复制序列进行鉴定,其数量大小约占占基因组序列的 10.76%。同时,这些区域内包含了1531 对重复基因,主要富集在类黄酮、苯丙素生物合成、淀粉和蔗糖代谢等通路中。
图2 砂梨T2T基因组中片段化复制分析
2.基因功能分化:全基因组复制分析发现梨基因组在最近一次事件中产生了大量重复基因,包括了与梨果实石细胞、糖、果锈、果皮色泽等性状相关的多个基因。例如,转录因子 MYB10 和 MYB114主要调控红梨果皮花青苷合成,分别经历了不同的基因复制事件,这可能导致重复基因在红梨果皮着色过程中发挥不同作用。
图3 基因功能分化分析
研究意义:
1.该研究建立了国际上首个梨T2T水平高质量0Gap基因组,是目前组装质量最高的梨参考基因组,为后续梨的相关研究提供了重要的基础和参考。
2.基于高质量梨基因组的重复基因鉴定、表达特征分析及功能分化研究,为解析重要性状的调控机制提供了新的证据,也为梨的分子育种提供了新的研究平台和遗传学基础。
案例2
首个甜瓜T2T基因组+比较基因组分析
文章题目:The haplotype resolved T2T reference genome highlights structural variation underlying agronomic traits of melon
研究材料:具有代表性的甜瓜品种(PI 313970自交纯化后代‘821’)
测序策略:Illumina(84x) +Hi-C(115x)+ PacBio HiFi(79x)+超长ONT
主要研究发现:
1.本研究结合多种测序技术获得品种“821”两个单倍型的染色体水平T2T基因组,其大小分别为373 Mb(Hap1) 和 364 Mb(Hap2)。通过k-mer分析和Hi-C热图等均表明T2T-821 基因组组装的高精度和一致性。
图4 砂梨T2T基因组中片段化复制分析
2.以821_Hap1作为参考基因组,通过比较基因组分析发现厚皮和薄皮甜瓜基因组之间存在大量结构变异 (SV)。在所有这些 SV 中,研究人员确定了厚皮和薄皮甜瓜基因组间各 3182 (~73.48 Mb)和 9488 (~61.62 Mb)特异性 SV,包括位于 11 号染色体上 ToLCNDV 抗性位点的拷贝数变异。
图5 厚皮与薄皮甜瓜的比较基因组分析
3.以821_Hap1作为参考基因组,调查了 117 个呼吸跃变和 82 个非呼吸跃变甜瓜种质并获得全基因组重测序数据。进一步,基于全基因组关联研究检测到与呼吸跃变相关的显著信号,并确定了一个候选基因 CM_ac12g14720.1 (CmABA2),编码细胞质短链脱氢酶/还原酶,控制脱落酸的生物合成,为未来的甜瓜育种研究提供了宝贵的遗传资源。
图6 厚皮与薄皮甜瓜的比较基因组分析
研究意义:
1.为甜瓜基因组学研究提供了更完整、更精确的基因组参考,有助于深入理解甜瓜基因组的结构和进化。
2.揭示了结构变异在甜瓜农艺性状形成中的重要作用,丰富了对植物性状遗传基础的认识。
参考文献:
Garg V, Bohra A, Mascher M, et al. Unlocking plant genetics with telomere-to-telomere genome assemblies. Nat Genet. 202456(9):1788-1799.
Li G, Tang L, He Y, et al. The haplotype-resolved T2T reference genome highlights structural variation underlying agronomic traits of melon. Hortic Res. 2023 10(10):uhad182.
Sun M, Yao C, Shu Q, et al. Telomere-to-telomere pear (Pyrus pyrifolia) reference genome reveals segmental and whole genome duplication driving genome evolution. Hortic Res. 2023 10(11):uhad201.
1
END
1