河北农业大学华北作物改良与调控国家重点实验室张彩英团队,于近期在国际遗传学顶尖期刊《自然·遗传学》(Nature Genetics)发表了题为“High-quality genome of a modern soybean cultivar and resequencing of 547 accessions provide insights into the role of structural variation”的研究论文。这项研究首次成功组装了高产、优质、抗病的现代大豆品种“农大豆2号”的高质量基因组,深入探讨了现代大豆育成品种特有的结构变异及其影响,并识别了对黄淮海区域大豆群体产量和品质性状产生影响的关键结构变异和基因,为大豆遗传改良提供了宝贵的理论依据和基因组资源。
为了更好地利用现代大豆育成品种中的基因组变异,研究者构建了一个包含“农大豆2号”和29个其他已公布大豆品种的图形化泛基因组。通过这一泛基因组,研究者鉴定了47,058个结构变异,包括37,304个插入/缺失、3,071个倒位和6,683个易位。这些变异中,有25,814个可能是影响基因表达的新变异,包括23,119个插入/缺失相关变异、719个倒位相关变异和1,976个易位相关变异。研究还发现了13个仅存在于“农大豆2号”中的特有结构变异,其中7个直接影响了植株高度、单株荚数、百粒重等产量性状,以及籽粒蛋白质、油分、异黄酮等品质性状。
为了深入理解结构变异如何影响大豆的重要性状,研究以“农大豆2号”为参考基因组,对来自黄淮海地区的547个代表性大豆品种进行了深度重测序,获取了749,714个结构变异和5,576,250个单核苷酸多态性(SNP)。结合3年内在7个不同地点收集的环境数据,对这547个品种的31个性状(包括6个产量性状、16个品质性状和9个生物学性状)进行了精确鉴定,最终确定了14,237个可能影响大豆重要性状的结构变异。这些变异中有1,043个与环境稳定的产量性状显著相关,4,970个与环境稳定的品质性状相关,其中约70%的变异与SNP-GWAS的结果相吻合,989个变异位于基因调控区域,772个位于基因内部,可以直接影响基因表达,从而调控大豆的重要性状。
在这些结构变异中,研究特别关注到了一些关键变异。例如,在6号染色体上发现了21个与单株荚数显著相关的结构变异,这些变异导致单株荚数最多相差8个。进一步的研究表明,这些变异可能通过调节阳离子/质子逆向转运蛋白基因GmPN的表达来影响单株荚数。此外,在5号染色体上的一个181 kb区间内,研究者发现了137个与大豆籽粒品质性状(如油分、异黄酮等)相关的结构变异,其中12个变异位于MFT蛋白编码基因GmMQT的调控区和基因内部,该基因在大豆种子中表现出较高的表达量,其优势单倍型的种子油分含量比非优势单倍型高出约两个百分点。通过转基因实验进一步证实,过表达GmMQT可以显著增加转基因拟南芥种子中的油分和生育酚含量,同时也提高了转基因大豆毛状根中的异黄酮含量;而使用CRISPR-Cas9技术敲除该基因,则会导致大豆种子中的异黄酮含量显著下降。另外,在11号染色体的一个1.04 Mb区间内,研究者还发现了363个与大豆种子中黄豆黄素含量相关的结构变异,该区间内的未知功能基因GmSGI被证实能够影响黄豆黄素的含量,过表达GmSGI可以使大豆毛状根中的黄豆黄素含量提高33%。这些发现为大豆重要性状的遗传改良提供了新的理论支持和资源。
河北农业大学张彩英研究员、邵振启博士、孔佑宾博士、杜汇副教授、李文龙副教授、杨占武副教授以及北京诺禾致源生物科技公司李祥孔为该论文的共同第一作者。河北农业大学张彩英研究员、李喜焕教授、马峙英教授以及北京诺禾致源生物科技公司田仕林研究员为该论文的通讯作者。该研究得到河北省现代农业科技奖励后补助资金项目以及河北省科技计划项目资助。