泛基因组概念
泛基因组(pan-genome)指的是一个物种或群体内所有基因的总和,包括生物体内的核心基因研究和非核心基因研究。泛基因组的概念最早在研究细菌基因组时提出,但随着测序技术的进步,已经被广泛应用于各种不同的物种,构建泛基因组有助于深入理解基因组的复杂性和多样性,解析结构变异,高效挖掘功能基因,对推动现代驯化研究和品种选育具有重要意义。
【图】不同品种番茄
植物泛基因组发展历程及泛基因组构建方法
泛基因组学的起源可以追溯到2005年对8个不同的菌株组装成第一个细菌泛基因组。这一开创性工作被2014年首次在野生大豆中进行的植物泛基因组分析所继承,揭示了与疾病抗性、开花时间和种子组成相关的基因存在/缺失变异。这些早期研究表明,泛基因组学有望解开基因组变异复杂性和其对表型多样性的影响。2010年代以来测序成本的下降使人们能够获得更多的基因组数据,并且通过大规模测序来丰富我们对群体遗传多样性水平的理解。这个时期引入了许多新型计算方法和生物信息工具,旨在管理、分析和解释高通量测序平台产生的大量基因组数据。例如,迭代映射和组装方法对于识别物种内的基因PAV至关重要,用于构建泛基因组。
【图】主要植物泛基因组研究时间线
植物泛基因组在育种中的应用
泛基因组在植物遗传研究和育种中的应用 我们见证了过去二十年作物育种的重大进步,这主要得益于基因组资源和技术的快速发展,并且这些技术已经完全整合到标记辅助选择、基因聚合、全基因组选择(GS)以及基因编辑等方法中。泛基因组比传统单个参考基因组具有许多优势 (Bayer 等人,2020),因此将在作物遗传学研究和分子育种中发挥越来越重要的作用。
功能基因定位:基于泛基因组图谱的SV已成功用于大豆、水稻、番茄和黄瓜的GWAS,揭示了无法通过从线性参考中识别SNP来发现的新位点。
群体基因组分析:近年来,对作物进行了大规模的重测序工作,揭示了与作物驯化、适应和育种过程相关的遗传多样性、群体结构、选择性清除分析等。然而,这些分析几乎完全基于SNP或小的InDel。越来越多的证据表明,用SV估计的群体结构可能与用SNP估计的有所不同。使用泛基因组作为参考重新分析已发表的大规模重测序数据,以识别更全面的遗传变异并更新以前的人群基因组结果。
表观遗传学研究:表观遗传特征,包括DNA甲基化、组蛋白修饰、小非编码RNA、染色质可及性和三维组织,表现出很强的组织和细胞类型特异性,在植物中进行了广泛的研究。除了个体内的表观遗传变异外,表观遗传特征还作为表型等位基因在个体之间变化,可以捕获或创造以促进作物改良。越来越多的研究探索了与作物驯化和育种相关的群体表观遗传变异。
基因组选择(GS)育种:与GWAS类似,全基因组SNP也常用于GS。然而,早期研究表明,常见SNP仅解释了复杂性状窄系遗传力的少数部分,这是一个影响育种实践预测准确性的“缺失遗传力”问题。最近一项番茄的研究表明,使用图谱参考基因组识别SVs可部分挽救复杂性状的“缺失遗传力”,可能是因为SVs与致病变异之间的更强连锁不平衡难以通过常见SNP捕获,以及长期以来认为SVs更可能是致病变异的观点。这些新建立的测序方法,伴随着先进的预测算法如深度学习方法,有望进一步通过新型GS方法推动作物遗传收益的增长。
基因编辑:现在,主要由CRISPR-Cas9技术驱动的基因编辑提供了一种加速育种的新策略,通过创建以前不存在的等位基因来加快育种进程。植物基因编辑系统也在迅速发展,以提高编辑效率并扩大可编辑位点和受体的范围,来自更多样化的遗传背景。在这方面,泛基因组不仅可以提供值得编辑的主要候选基因清单,还可以通过为建立一个优化的编辑系统提供高质量的基因组序列,扩展可行的作物物种或品种。
【图】泛基因组学在遗传学研究和育种实践中的应用
泛基因组材料如何选择
1)开放泛基因组材料选择
对于开放泛基因组,由于其核心基因组和整个泛基因组含量需要更多个体才能充分展示物种内全部遗传信息,因此材料选择时通常需要考虑以下几点:
遗传多样性:选择具有丰富遗传多样性的材料,有助于发现更多的非核心基因和特有基因,从而更全面地了解物种的遗传变异。
生态地理类型:涵盖不同生态地理类型的材料,可以反映物种在不同环境下的适应性进化情况。
野生与栽培种质:结合野生种和栽培种进行研究,有助于发现驯化过程中遗传多样性的变化以及特有性状的基因资源。
2)闭合泛基因组材料选择
对于闭合泛基因组,由于其核心基因组和整个泛基因组含量会随着个体增加很快到达平台期,因此材料选择时可以考虑以下几点:
代表性样本:选择能够充分代表物种遗传和表型多样性的样本,有助于构建出具有准确性和可靠性的泛基因组图谱。
亲缘关系:选择亲缘关系相对接近的材料,可以在一定程度上减少泛基因组的规模和复杂性,同时保证核心基因组的稳定性和一致性。
已知基因组信息:优先选择已有较为完整基因组信息的材料,有助于在构建泛基因组时进行更准确的基因注释和比较分析。
3)根据生物学问题选择材料
物种起源与演化:为了研究物种的起源及演化等生物学问题,可以选择不同亚种的材料进行泛基因组测序。通过比较这些材料的基因组序列,可以揭示物种之间的亲缘关系和进化历程。
重要性状发掘:为了发掘与重要性状相关的基因资源,可以选择具有不同特性的种质资源进行泛基因组测序。例如,在作物育种中,可以选择具有高产、优质、抗逆等优良性状的品种进行测序,以发现与这些性状相关的基因变异。
适应性进化研究:为了研究物种的适应性进化问题,可以选择不同生态地理环境的种质资源进行泛基因组测序。通过比较这些材料的基因组序列和表型特征,可以揭示物种在不同环境下的适应性机制和进化历程。
因此,要根据物种特性和生物学背景,灵活选择材料个数,选择材料过多可能会造成资源的浪费,选择材料过少获取的泛基因组信息可能不够全面。
泛基因组测序策略
参考文献:
Shi J, Tian Z, Lai J, Huang X. Plant pan-genomics and its applications. Mol Plant. 2023 Jan 2;16(1):168-186. doi: 10.1016/j.molp.2022.12.009. Epub 2022 Dec 15. PMID: 36523157.
Hu H, Wang J, Nie S, et al. Plant pangenomics, current practice and future direction[J]. Agriculture Communications, 2024: 100039.
1
END
1