杂种优势(Heterosis)是杂交育种的理论基石,其遗传机制的研究是遗传育种领域的一个活跃前沿。林木,作为一类多年生植物,具有复杂的遗传背景和较长的育种周期,这使得杂种优势形成的遗传机制研究面临巨大挑战。等位基因特异性表达(Allele-specific expression, ASE)是调控杂种表型的关键遗传机制之一。然而,在二倍体生物中,同源染色体的区分存在挑战,这限制了对等位基因的鉴定及其表达模式的深入分析,导致对ASE遗传机制的理解尚显不足。高分辨率的杨树基因组组装和对ASE机制的深入解析,将为我们从全基因组层面理解杂种优势的分子调控网络提供新的视角。
2024年2月,北京林业大学毛建丰教授和安新民教授团队合作在Plant Physiology杂志上发表了题为“High-quality genome assembly enables prediction of allele-specific gene expression in hybrid poplar”的研究论文。研究团队公布了一个近乎无缺口(gap-free)的端粒到端粒(Telomere-to-telomere, T2T)的杂交杨树84K基因组组装,并运用机器学习(Machine Learning, ML)算法,揭示了调控等位基因特异性表达的潜在遗传机制。这一成果不仅为林木遗传改良提供了新的策略,也为植物基因组学和分子育种领域的发展做出了重要贡献。
研究团队采用了PacBio HiFi、Oxford Nanopore Technology (ONT) 三代长读长测序技术,结合高通量的染色体构象捕获技术(Hi-C),并运用了亲子代分型(trio-binning)策略,成功获得了种间杂种无性系84K杨的两个亲本的单倍型基因组组装。该组装的总大小为816.95 Mb,contig N50长度达到22.4 Mb。特别值得注意的是,其中一个亲本的亚基因组(腺毛杨,Populus glandulosa)实现了无间隙(gap-free)组装,而整个组装中仅在另一个亲本亚基因组(银白杨,P. alba)的9号染色体的潜在着丝粒区域发现了两个间隙(gaps)。此外,基于获得的高质量的单倍型基因组数据,研究团队结合机器学习算法,从遗传和表观遗传两个层面深入探究了亚基因组间的遗传分化模式及其背后的潜在机制。
在本项研究中,通过广泛的转录组测序(RNA-seq)数据采集,研究团队首先对杂种杨树中等位基因间的差异表达模式进行了深入分析。在染色体层面,并未观察到显著的亚基因组优势(subgenome dominance)现象。而在等位基因层面检测到了显著的表达偏倚(expression bias),这表明等位基因特异性表达(Allele-Specific Expression, ASE)在杂种杨树中普遍存在。为了深入理解与ASE密切相关的基因组特征,研究团队创新性地整合了DNA甲基化、序列多态性、染色质结构变异以及转座元件(Transposable Elements, TEs)等多种组学数据。利用机器学习模型,建立了一个高精度的预测系统,旨在预测等位基因特异性表达。模型分析结果揭示,基因体(gene body)区域的CHG甲基化模式、等位基因间的序列多态性以及基因附近区域的TEs含量是ASE的重要预测因子。
综上所述,本研究不仅为杨树基因组学和分子育种领域提供了宝贵的高质量基因组资源,而且对等位基因特异性表达(Allele-Specific Expression, ASE)和杂种优势(Heterosis)的遗传机制研究做出了重要贡献。这些发现对于指导高效的林木遗传改良策略设计和新品种的培育具有深远的意义,有望加速林木遗传改良的进程,为林业可持续发展提供强有力的分子工具。
北京林业大学毛建丰副教授和安新民教授为本文的通讯作者,博士研究生史天乐和山东省农科院贾凯华助理研究员为本文的共同第一作者。该研究得到了国家重点研发计划 (2022YFD2200103 和 2021YFD2200101) 和国家自然科学基金 (32171816) 等项目的资助与支持。
原文链接:
https://doi.org/10.1093/plphys/kiae078
相关推荐:
关于
Forestry Research
赶紧加入
ForRes交流群