核心提示:中国农科院油料所和华中农大联合揭示基因组结构变异调控基因表达和性状变异机制,发现油菜硫苷合成和转运偶联“秘密”,创制出抗病虫油菜新种质。基因组变异包括小的单核苷酸变异(SNP)和大的结构变异(Structural variation,简称SV),如果将基因组比作一部长篇巨著的话,单核苷酸变异就好比文字或标点的微小差异,而结构变异则是句子、段落的变化(包括增加、删除、重复、错位等), 后者对于表型多样性和物种进化的贡献更加突出,育种意义更大。因此,揭示结构变异与农艺性状之间的关系,并运用此知识和技术进行作物改良,对于发掘和创制优异种质资源、提升作物产量、改善作物品质、增强作物抗性等方面具有重要意义。
2024年11月5日,中国农业科学院油料作物研究所刘胜毅研究员团队(油料作物基因组学与抗病性改良创新团队)和华中农业大学油菜团队杨庆勇教授课题组合作在国际权威学术期刊Nature Genetics在线发表了题为“Structural variation reshapes population gene expression and trait variation in 2,105 Brassica napus accessions”的研究论文。研究者基于16个甘蓝型油菜基因组和2,105份重测序的核心种质资源构建了油菜物种水平的Pan-SV genome,结合群体5个组织的转录组数据鉴定了基因表达调控的SV-eQTL,并总结归纳出八种关键的SV调控基因表达的分子机制,开发了高通量的GWAS+eQTL+TWAS+COLOC联合分析方法,鉴定获得了油菜54种重要农艺性状的726个“SV→Gene Expression→Trait Variation”因果关系及其调控网络。通过对复杂性状硫代葡萄糖苷(简称硫苷)合成和转运代谢途径的完整解析,获得了参与油菜中硫苷调控的436个基因及其单体型,基于此揭示硫苷合成和转运相偶联的机制,并通过基因编辑等技术成功创制出重大突破性的油菜优质抗病虫新种质。该研究不仅提供了一种高通量基因挖掘和功能解析的方法策略,而且为油菜基因组研究和生物育种产业提供了全面的基因资源和优异育种材料。
图1 本研究的主要技术路线和结果概括
过去的半个世纪全世界科学家们对模式植物拟南芥的基因功能研究极大促进了生命科学的进展,然而随着越来越多一因多效和复杂功能基因的挖掘,人们评估目前已研究清楚功能的拟南芥基因只占其总基因的一小部分,而作物基因就更少,因此急需研发高通量的筛选和鉴定性状控制基因的方法。单个基因组结构变异对基因表达和表型变异的影响及机制已有报道,人类和番茄等物种研究表明SV对于基因组进化和表型变异的影响远大于SNP。然而,在物种水平SV对基因表达和性状变异的影响程度和范围尚不清楚。由于多倍体作物基因组中重复序列多、变异丰富且复杂,很难直接通过二代短读长测序对结构变异进行高通量的精准鉴定,使得在群体水平上准确检测结构变异难度大且成本高,进而导致在物种水平缺乏结构变异对基因表达和性状形成调控规律的研究,严重制约了生物育种的进展。本研究首先基于16份油菜种质(两个亚种、三种生态型及人工合成油菜)从头组装的基因组,利用contig比对和long-read比对两种策鉴定、构建了包含334,461个SV的library(包含插入、缺失、倒位、易位),通过Hi-C互作图谱和PCR扩增验证了SV鉴定的准确性,并分析了全基因组SV的特征和分布及其与基因、转座子分布的相关性等。随后,基于此SV library中SV断点信息,用二代测序的短读长数据准确鉴定了2,105份油菜种质资源材料的全基因组SV。
图2 高通量整合分析鉴定“SV→Gene Expression→Trait Variation”的策略
为了全面阐述SV对基因表达的影响,研究者利用油菜的5个代表性组织的群体基因表达数据,对81,424个表达的基因(占全基因组总基因数的84%)进行SV-eQTL 定位,共鉴定到285,976 SV-eQTL,涉及到73,580个eGene(占总表达基因数的90%)和47,897 个lead-eSV。其中,8,631个lead-eSV同时调控了5个以上的eGene,10,217个eGene同时受到5个以上的lead-eSV调控,说明了SV调控基因表达的复杂性。研究者进一步归类和统计发现SV对基因的表达调控在四倍体油菜的两个亚基因组An和Cn之间不对称性分布,且大部分trans-eQTL hotspots位点所调控的下游eGene倾向于富集到某一代谢通路或功能上,预示着各SV调控着一组功能关联的基因。基于上述结果,结合群体多组学数据和信息对全基因组所有eSV调控基因表达的机制进行解析,研究者将SV介导的基因表达调控机制总结归纳为八种类别:1)改变了基因近端的表达调控序列/元件(如promoter等);2)通过影响转录因子进而调控下游基因表达;3)改变远端调控元件(如enhancer等);4)破坏了基因结构;5)通过TE介导的效应;6)通过影响组蛋白修饰介导;7)通过影响DNA甲基化介导;8)通过影响small RNA介导的转录后调控。这些结果揭示了大规模的SV调控基因表达的全景图,为SV调控基因表达和性状变异的复杂机制提供了更深入的认识。基于上述数据信息,研究者研发出群体遗传学的GWAS、TWAS、eQTL和GWAS-eQTL共定位的高通量联合分析方法,实现了从DNA变异到基因表达再到性状变异的高通量解析,鉴定出油菜54种农艺性状的726个“SV→Gene Expression→Trait Variation”的因果关联和调控网络,涉及到180个eSV和311个eGene。这一高通量的鉴定、解析SV对基因表达及其相关性状变异影响的方法和结果为作物尤其是多倍体作物复杂性状形成机制解析提供了新的策略和方法。进一步,研究者以油菜中具有抗癌、抗病虫作用的代谢物硫苷的合成和转运通路为例,全面阐述了上述类别SV介导的基因表达及其对性状(硫苷合成与转运)的调控机制。例如,在A03染色体上鉴定到一个新的调控硫苷侧链延伸的位点,进一步解析发现是一个1,454-bp的insertion插入到硫苷侧链延伸酶编码基因 BnaA03.MAMf的启动子区域造成了其表达的下调进而阻断了硫苷侧链的延长,将不含这个insertion材料(高表达)的启动子连接上含有这个insertion材料(低表达)的基因CDS序列转到含有这个insertion低表达的油菜中,发现BnaA03.MAMf基因的表达量和长链类硫苷的含量都显著上调,进而导致植株对蚜虫抗性显著下降。还例如,通过上述方法鉴定到一个7,365-bp的insertion影响其下游20 kb远的硫苷转运基因BnaC02.GTR2的表达,该insertion序列含有多个enhancer elements,进一步通过Hi-C、ATAC-Seq和组蛋白H3K27ac分析发现此insertion所携带的enhancer显著上调了周围基因的表达进而促进了硫苷的转运。
图3 SV调控硫苷合成和转运代谢及其育种应用
通过对硫苷合成和转运代谢途径的完整解析,获得了油菜中参与硫苷调控的436个基因及其单体型(包括76 个转录因子、324硫苷合成酶基因和36 个硫苷转运子基因),整合发现了调控硫苷代谢最重要的三个位点(A09、C02和C09染色体)上各自存在一个紧密连锁的强selective sweep区域,都包含三个关键基因(脂肪族硫苷转录因子MYB28+吲哚族硫苷转录因子MYB34+硫苷转运子GTR2),对应于拟南芥基因组祖先核型X Block,致使硫苷合成和转运偶联在一起。双低油菜的种子低硫苷主要是这三个位点中MYB28和MYB34的突变引起的,因此如果要创制叶片高硫苷(抗病虫)且种子低硫苷(高品质)的油菜种质必须打破这一连锁,形成有功能的MYB28/MYB34与无功能的GTR2组合。为此,研究者利用CRISPR/Cas9技术将油菜高硫苷品种ZY821中的BnaA09.GTR2敲除掉,结果叶片硫苷维持高含量的同时种子硫苷下降了约50%,进一步聚合作者前期鉴定到的油菜种质资源无变异的硫苷转运基因BnaA06.GTR2的基因敲除材料(He et al., PlantPhysiology,2022. https://doi.org/10.1093/plphys/kiac021),进而创制出目前缺乏的、育种急需的叶片高硫苷且种子低硫苷的高抗高品质油菜优异种质资源。中国农业科学院油料作物研究所张园园副研究员和华中农业大学信息学院青年教师杨植全博士(现崖州湾国家实验室青年科学家)为本论文的共同第一作者,中国农业科学院油料作物研究所基因组学与抗病性改良创新团队资深首席刘胜毅研究员和华中农业大学信息学院杨庆勇教授为本论文的共同通讯作者,两个团队的多名同事和研究生参与了本项目的研究,美国加州大学戴维斯分校Daniel J. Kliebenstein教授、澳大利亚沃加沃加农业研究所Harsh Raman教授、华中农业大学周永明教授、贵州省油菜研究所向阳研究员参加了研究设计或论文写作。该工作得到了国家重点研发计划、国家自然科学基金、中国农科院科技创新工程等项目的支持。
论文链接:
https://www.nature.com/articles/s41588-024-01957-7
中国农业科学院油料作物研究所刘胜毅研究员团队从事多倍体作物(甘蓝型油菜等)基因组进化、基因组设计育种、抗病性改良和油料作物绿色防控等方面的研究,主导和参与了十字花科著名禹氏三角作物甘蓝型油菜、甘蓝、白菜等基因组和泛基因组的研究,构建了迄今十字花科基因组学最大的数据库,提出了多倍体基因组不对称进化理论,创制出多个油菜稀缺的、育种急需的新种质,负责国家油莱产业技术体系植保功能研究室工作,团队以第一或通讯作者在Science、Nature Genetics、Nature Communications等期刊发表论文200多篇。团队网页https://www.ocri-genomics.net/
油菜多组学数据库https://bnaomics.ocri-genomics.net/
华中农业大学信息学院杨庆勇教授课题组长期致力于油菜生物信息与遗传育种研究,近年来完成了首个油菜高质量的泛基因组的构建,绘制了目前最为全面的油菜变异图谱;建立了适用于油菜等复杂基因组的变异鉴定和分析方法体系,挖掘到一系列与油菜产量、抗性及品质等重要性状相关的功能变异,并应用于育种实践;以“变异-表达-表型”为主线,建立BnPIR、BnTIR、BnVIR以及BnIR等一系列油菜多组学数据库,相关工作及成果支撑了多个高油酸、抗根肿病等油菜新品种的选育。课题组以第一或通讯作者在Nature Genetics、Nature Plants、Molecular Plant和Nucleic Acids Research等期刊发表论文50余篇。BnIR系列数据库链接:
http://yanglab.hzau.edu.cn/BnIR