Plant Commun. ||植物超级泛基因组的发展与前景

学术   2025-01-29 17:11   河南  
超级泛基因组产生背景
自人类基因组计划(HGP)实施以来,基因组学领域已从单一参考基因组的时代跨越至全基因组序列测定的新纪元。在植物科学领域,从最初的模式植物(例如拟南芥与水稻)基因组的公布,到如今“端粒至端粒”(T2T)的高质量基因组组装完成,植物基因组学取得了显著进步。然而,单一参考基因组的局限性逐渐凸显,特别是在探讨种群遗传多样性和复杂变异时,难以捕捉群体中稀有或复杂的基因区域。
在此背景下,泛基因组的概念应运而生:该概念最初源自细菌研究,后扩展至植物与动物领域,旨在涵盖某一物种群体内所有基因组的综合信息。超级泛基因组进一步跨越至属级或更高分类层次,通过整合多个物种的基因组,覆盖了更广阔的遗传与表型多样性,成为解析植物遗传多样性、进化历程及分子育种等问题的关键手段。
超级泛基因组的分类与构建

依据研究样本的广度与数据集构成,超级泛基因组的构建策略可划分为以下三类:

简单超级泛基因组(Simple Super Pangenome)

  • 选取每个物种的一个代表性样本,遵循传统泛基因组构建流程。

  • 适用于初步比较不同物种的基因组多样性,但无法充分展示多物种基因组的全面信息。

中间超级泛基因组(Intermediate Super Pangenome)

  • 特定物种中纳入多个样本,采样范围相对广泛。

  • 数据集能一定程度上反映各物种泛基因组的特征,处于简单与完整超级泛基因组之间。

完整超级泛基因组(Complete Super Pangenome)

  • 首先为各物种单独构建泛基因组,随后综合所有物种的泛基因组信息。

  • 尽管构建流程复杂,但能全面揭示目标分类单元的基因组全貌,最贴近超级泛基因组的理想定义。


文章还深入探讨了超级泛基因组的构建技术,各项技术适用于多样化的研究情境:

基于映射的泛基因组构建方法(Map-to-Pan)

通过把基因组测序数据映射至参考基因组,将未匹配的序列重新组装为新序列,最终与参考基因组整合。

  • 其优势在于成本相对较低,尤其适合解析复杂基因组。

  • 然而,它高度依赖于参考基因组的质量,难以全面捕捉大规模结构变异(SV)。

全基因组比对技术(Whole-Genome Alignment)

通过对高质量基因组序列进行全面比对,构建出不冗余的超级泛基因组。

  • 直接展现了样本间的遗传差异。

  • 但该方法在处理高重复序列、多倍体基因组时成本高昂,且组装流程错综复杂。

图形泛基因组方法(Graph-Based Pangenome)

  • 创新性地将所有基因组信息以图形结构存储,可直接应用于基因型检测,不仅能综合囊括种群中的所有遗传变异,还保持了序列的连续性,被视为未来参考基因组发展的重要方向。

  • 但是,目前图结构数据的存储与可视化工具仍处于开发的初级阶段。


超级泛基因组的研究成果与应用领域

当前,超级泛基因组的研究焦点集中在粮食作物与经济作物上,具体实例包括:

  • 水稻:通过整合251个水稻品种及其野生近缘种的基因组数据,所构建的超级泛基因组信息量高达单个水稻基因组的四倍。

  • 西瓜:汇集了西瓜属7个种的27个基因组,新增了399.2Mb的序列信息,其中超过半数源自野生种类。

  • 杨树:超级泛基因组覆盖了19种杨树,揭示仅有51.3%的基因属于核心基因范畴,凸显出显著的种间遗传差异。

主要研究领域涵盖:

  1. 复杂遗传变异的深入解析:超级泛基因组能够捕捉传统单一基因组难以揭示的变异类型,诸如倒位、重复序列及转座子等。

  2. 群体遗传学与多组学的综合整合:通过提供多物种基因型信息,超级泛基因组规避了单一参考基因组可能带来的偏差,为大规模种群遗传学研究提供了坚实基础。

  3. 进化与适应性的探索:超级泛基因组有助于识别属级层面的保守与变异基因,进而解析物种分化历程及生态适应性机制。

  4. 驯化与选择的研究:构建涵盖多物种的泛基因组数据集,能够全面审视驯化过程中的遗传多样性变迁,为驯化研究开辟新视角。

  5. 基因挖掘与分子育种的推进:通过整合野生与栽培品种的基因资源,超级泛基因组助力功能基因的挖掘,加速农艺性状改良及智能育种技术的发展。

展望与挑战

挑战

基因组复杂性:处理多倍体、高度杂合性以及富含重复序列的基因组时,面临技术上的巨大挑战。

工具局限性:图谱基因组的存储、可视化及专业分析工具尚不完备,限制了其在实际应用中的广泛推广。

质量评估标准缺失:当前,泛基因组的质量评估尚缺乏统一的标准和方法,影响了研究结果的准确性和可比性。

发展方向

技术革新:致力于构建更为高效、精确的坐标系统,并开发标准化的工具,以应对基因组复杂性的挑战。

多组学数据整合:将表观遗传学、代谢组学等多组学数据与泛基因组相结合,全面深入地解析植物重要经济性状的遗传基础。

物种拓展:将超级泛基因组的研究范围扩展至更多植物物种,实现跨属甚至跨科的超级泛基因组构建与分析。

智能技术应用:引入人工智能和机器学习算法,提升基因挖掘的效率和准确性,推动智能育种技术的发展。

总结

超级泛基因组为植物遗传多样性研究、进化历程探讨以及分子育种实践提供了全新的理论框架和实践工具。展望未来,随着技术的不断进步和应用领域的持续拓展,超级泛基因组将成为现代基因组学的重要支柱,为植物科学的发展注入新的活力。

原文链接:

https://doi.org/10.1016/j.xplc.2024.101230 来源:组学大课堂

溪远讲植物科学
推送最前沿植物科学研究进展及咨讯,分享常规植物学研究方法,为您成为植物学家助一臂之力!
 最新文章