泛基因组是收集了某个物种多个个体的注释基因组序列的集合。这些数据集揭示的结构变异是作物植物遗传分析中的重要资源。
由德国IPK莱布尼茨研究所领导的国际研究团队报告了一个大麦泛基因组,包括76个野生和栽培基因组的长读长序列组装以及1,315个基因型的短读长序列数据。该作物中序列变异的扩展目录包括富含基因拷贝数变异且控制某些性状的结构复杂位点。2024年11月13日,这项研究成果在国际顶级学术期刊《自然》(Nature)上发表,题为Structural variation in the pangenome of wild and domesticated barley的研究论文。
可靠的作物产量促进了人类文明的兴起。随着人们接受新的生活方式,栽培植物也必须适应其驯化者的需要。野生环境与农田栖息地对植物的适应要求不同。例如,作物植株与其野生祖先在发起多少营养枝条或产生多少种子或果实的数量以及时间上存在差异。
作物保护者普遍担忧的是栽培植物遗传多样性危险地减少。但作物进化不一定是一个单一方向的多样性丧失过程。研究人员利用1,000种植物遗传资源和315个优良品种组成的样本,比较了作物及其野生祖先的泛基因组复杂性,证明了有价值的多样性可以在驯化后产生。
最近发布的人类草图泛基因组展示了如何利用连续的长读长序列来理解大量的序列数据。本项关于大麦泛基因组的研究阐明了作物进化和育种的问题。先前短读长序列组装的不足使得从长读长序列中浮现出来的模式几乎不可能被发现。研究人员首次能够研究结构复杂位点的进化,并检测出173个具有几乎相同串联重复序列和基因的位点。为了展示泛基因组的实用性,研究人员专注于几个位点——Mla、HvTB1、amy1_1、HvSRH1——以及它们控制的性状:抗病性、植株架构、淀粉动员和谷粒上的原始附属物的毛茸茸特性。而将环境视为一系列驱动自然选择的外源因素,大麦提供了一个既有趣又经济上重要的例子。
发芽过程涉及湿润的大麦籽粒发芽,推动酶的释放,将淀粉分解成可发酵的糖。只有基于长读长的高质量泛基因组才揭示了淀粉降解α-淀粉酶1_1家族基因的拷贝数差异和单倍型多样性,并使这些信息可用于育种。新的等位基因变异体现了泛基因组学的力量。研究人员的研究结果表明,他们在泛基因组中结构复杂位点观察到的许多等位基因多样性可能有助于作物植株适应农业生态系统中新出现的选择机制。
大麦是当今全球五大作物之一。由于大麦耐受恶劣和边缘环境并能适应干旱气候,其重要性在未来可能会增加。结构复杂位点的等位基因多样性可能有助于满足农民和育种者的需求。更加多样化的作物泛基因组将帮助我们了解过去驯化瓶颈和新出现的结构变异之间的相互作用力如何影响未来气候变化下的作物改良。
通过这项研究,IPK强调了其作为作物和基因库基因组学领域领先机构的角色,在大麦、小麦、黑麦和燕麦及其野生亲缘植物的基因组测序及早期泛基因组研究中发挥协调作用。大麦泛基因组项目汇集了来自12个不同国家的80名科学家,并由IPK发起和协调。