顺式元件和自然变异介导的转录调控及其在主要作物基因编辑中的应用进展

2025-01-07 10:42   湖北  
摘要
转录调控对于控制基因表达至关重要。基因的时空表达模式和表达水平都由式作用元件和反式作用因子之间的相互作用决定。许多研究都集中在介导转录调控网络的反式作用因子上。然而,式作用元件,如增强子、沉默子、转座子和基因组中的自然变异,对基因表达调控也至关重要,并且可以被成簇的规则间隔短回文重复序列 (CRISPR)/CRISPR 相关蛋白 9 (Cas9) 介导的基因编辑利用,以提高作物质量和产量。在这篇综述中,我们讨论了目前对水稻 (Oryza sativa)、小麦 (Triticum aestivum) 和玉米 (Zea mays) 等主要作物中式元件介导的转录调控的理解,以及基因编辑技术的最新进展及其在作物中的应用,以突出作物育种的前瞻性策略。

介绍

转录调控是一个复杂而繁琐的生物过程,直接决定基因表达模式和水平,从而影响植物的表型、抗逆性/抗性以及生产力。式调节元件(CRE 或式作用元件)和自然变异在微调基因表达中起着至关重要的作用。CRE 包含在启动子、增强子和沉默子中发现的转录因子 (TF) 结合位点 (TFBS)。它们与基因组大小和基因间空间的扩展以及转座因子 (TE) 有关(L. Zhang et al., 2022)。此外,染色质状态(异染色质与常染色质)和基因组区域之间的相互作用也会影响基因表达。近年来,鉴定调控元件的技术发展迅速,导致通过组学和分子生物学分析在植物中发现了关键的 CRE 及其保守序列(Tian等人,2022 年)。位于基因编码区附近或启动子区内的近端 CRE 通常包含可影响基因表达水平和/或模式的保守基序。另一方面,远端 CRE 通常位于距离基因编码区数十甚至数百 kb 的地方,包括编码区内的内含子。尽管距离遥远,但远端 CRE 可以通过与 TF 和其他辅助因子的相互作用发挥与近端 CRE 相似的功能。此外,式调控区的自然变异,如单核苷酸多态性 (SNP) 和插入/缺失 (InDels),也可以改变基因表达(Zhu等人,2013 年;Y. Li et al., 2021)。

许多研究集中在 TF 介导的基因表达转录调控上。在这篇综述中,我们将注意力转移到不同 CRE 和主要作物的自然变异对基因表达的转录调控上,包括启动子、增强子、沉默子、SNP 和 TE。同时,基因编辑技术发展迅速,并已广泛用于作物育种,这些技术为传统育种方法提供了更快、更高效的替代方案。然而,基因编辑技术,尤其是碱基编辑技术,需要进一步探索它们对作物中 CREs 和自然变异介导的转录调控的影响。因此,我们讨论了不同的 CRE、自然变异以及当前对主要作物转录调控的理解。此外,我们重点介绍了基因编辑技术的最新进展及其在作物中的应用,旨在提出作物育种的前瞻性策略。

启动子、内含子和基因间区域中的式调节元件

基因表达在真核生物的生长和发育过程中受到精确调节。转录是基因表达的关键步骤,从基因侧翼区域开始,TF 和其他调节蛋白相互作用以执行其功能(Lambert等人,2018 年)。TF 和调节蛋白与启动子、增强子或其他调节序列中的 CRE 结合,以空间和/或时间控制的方式激活转录(Wittkopp 和 Kalay,2011)。

启动子区域中的式调节元件

启动子是植物基因工程和作物改良的重要靶标,因为它们提供多个 RNA 聚合酶结合位点和 TFBS(Andersson 和 Sandelin,2020 年)。根据植物启动子对基因表达的影响及其结合的元素,可分为三种主要类型:组成型、诱导型和组织特异性启动子。组织特异性启动子在特定组织或器官中诱导基因表达,并且通常包含相同或相似的 CRE,包括根特异性元件 W-box (CTCTT)、种子特异性元件 AAAG 基序、AGCT 基序和 RY 基序 (CATGCA) (Ezcurra et al., 1999)。

通常,启动子包含两种类型的元件:(i) RNA 聚合酶结合和定位所必需的基础元件,通常位于转录起始位点 (TSS) 的上端或下游 50 bp 处。这些元件包括“TATA-box”、“CAAT-box”、“TFIIB 重组元件 (BRE)”和“下游启动子元件 (DPE)”(Burley 和 Roeder,1998 年;Kadonaga, 2002;Frangeul et al., 2004;Kostrewa et al., 2009)(图 12);(ii) CRE,例如 G-box、E-box、特异性蛋白 1 (Sp1) 富含 CG 的共有序列 5ʹ-(G/T)GGGCGG(G/A)(G/A)(C/T)-3ʹ 和 RY 基序(Menkens 等人,1995 年;Ezcurra 等人,1999 年;Vizcaíno等人,2015 年;Song et al., 2018)。CRE 通常包含特定的短基序 (6-12 bp),例如位于启动子内的 TFBS(Lambert等人,2018 年)(图 12)。例如,拟南芥 (Arabidopsis thaliana) TF 脱落酸 INSENSITIVE3 (AtABI3) 直接与 MOTHER OF FT 和 TFL1 (AtMFT) 启动子中的 RY 基序 (CATGCATG) 结合。在水稻中,LEC2 和 FUSCA3 LIKE1 (OsLFL1) 与 AtABI3 同源。酵母单杂交测定和 EMSA 表明,OsLFL1 直接与 OsMFT1 启动子中最靠近 TSS 的 RY 基序结合以激活 OsMFT1 表达(Song等人,2018 年)。

图 1.

植物基因的一般结构图。植物基因结构一般分为编码区和非编码区。编码区通常包括外显子和内含子,而非编码区通常包括 5ʹ UTR、3ʹ UTR、启动子、增强子、沉默子和转座子。启动子通常位于 2ʹ UTR 上游 5 kb(在 TSS 处),并提供 RNA 聚合酶结合位点和多个 TFBS(CRE 中的特异性基序)。核心启动子包括 TATA-box、CAAT-box 等基础元件。增强子和沉默子通常位于基因编码区的上部或下游,也可能位于内含子区内。转座子可以插入基因的任何位置。每种不同的颜色表示基因的不同成分;相同的颜色表示相同的组件;该图未按比例绘制。


图 2.

顺式调节元件相互作用的示意图。基因表达是一个复杂的过程,需要基础元件和 CRE 的参与。基础元件和 CRE 提供 RNA 聚合酶结合位点和 TFBS。增强子/沉默剂通过与 TF 和/或其他辅因子相互作用来激活或沉默基因,即使它们远离基因编码区。TF 以各种形状和颜色表示,代表识别特定 DNA 序列(基序)的不同 TF。这个数字不是按比例绘制的;BRE、TFIIB 重组要素;DPE,下游启动子元件;RNAPII,RNA 聚合酶 II;辅因子,介导可能与 TFs 一起启动转录的蛋白质。


位于内含子和基因间区域的式调节元件

已知基因的内含子和基因间区域包含许多 CRE,包括增强子和沉默子,它们可以募集 TF 和其他调节蛋白来调节植物中的基因表达。虽然启动子传统上被认为是主要的 CRE,但最近的研究强调了增强子和沉默子在植物基因调控中的重要性。这些元件可以独立作用或与其他 CRE 合作来控制基因表达的时空模式(Ogbourne 和 Antalis,1998)。

增强子和沉默子是位于基因组非编码区域的 CRE。它们可以激活或抑制基因表达,并且它们的方向可以是靶基因的上游或下游(Liu et al., 1996;Jores等人,2020 年)(图 2)。这些 CRE 的活性受多种因素的影响,例如染色质状态、可及性和调节蛋白结合(Lu et al., 2019)。一般来说,它们通常位于远离靶基因的地方,有时位于内含子内。这些元件与其靶基因的平均距离取决于基因组的大小。

最早的植物增强子研究集中在编码豌豆 (Pisum sativum) 中叶绿素 a/b 结合多肽 AB80 的基因上(Simpson et al., 1985)。随后在拟南芥、玉米和其他作物中进行了增强子研究。染色质特征预测拟南芥中的 10 044 个基因间增强子 (Zhu et al., 2015)。消音器首先在酵母中被发现(Brand等人,1985;Doni Jayavelu等人,2020 年),其次是病毒、原核生物和真核生物,例如酵母隐藏交配区 E (HMR-E) 和分化簇 4 (CD4) 的人类沉默器 S4 (Kojo et al., 2018)。在 1990 年代,对玉米基因醇脱氢酶 1 (Adh1) 的研究为植物中存在消音器提供了进一步的证据。Adh1 基因在 TSS 上游位置 -72 和 -43 之间的启动子区域包含一个花粉特异性沉默器,可以抑制基因表达(Kyozuka等人,1994)。与动物相比,关于 CREs 对植物基因表达和功能影响的研究相对较少,尤其是在主要作物中。生物技术的最新进展促进了植物 CRE 的发现(Andersson et al., 2008;Ricci等人,2019 年;Song et al., 2022)。通过修饰 CRE 来改变基因表达比使用编码区的变异来改良作物更可取,尤其是对于多效性基因(Swinnen人,2016 年),因为 CRE 中的突变通常对整个生物体的有害影响较少或没有有害影响。因此,识别和修改 CRE 是提高作物产量、质量和适应性的有前途的策略。

式调控元件如何影响基因表达水平和时空表达

基因表达水平和时空表达模式的调节对于有机体的正常发育和功能至关重要。这种调节是通过与 TF 和其他调节蛋白相互作用的复杂 CRE 网络完成的

启动子是基因表达的主要顺式调控区域

启动子区域包含多个可被 TF 识别的 CRE。一些 CRE 允许 TF 与其他 TF 相互作用以控制组织身份、发育模式(Lee 和 Young,2013 年)以及光和温度反应等特定途径。例如,APETALA1 (AP1) 样 MADS-box TF VERNALIZATION1 (TaVRN1) 是小麦春化和开花的关键调节因子。开花时间 TF TaRF2b (一种碱性亮氨酸拉链 TF) 识别TaVRN1近端启动子区域内的 Sp1 基序。随着TaVRN1基因座在春化过程中被破坏,Sp1 基序逐渐暴露为环结构,使 TaRF2b 能够激活TaVRN1转录(Xu等人,2021年)。随后,TaVRN1 直接与小麦开花基因座 TTaWFT)启动子中的 CArG 盒结合,TaWFT 是春化、光周期和自主途径的整合者,上调叶片中的TaWFT并诱导开花(Tanaka等人,2018年)。TF 可以通过 CRE 中的模序相互交互,这可能导致它们各自功能的修改。例如,SHORT INTERNODES1 (OsSHI1) 通过含有 T/GCTCTAC 基序的 CRE 直接结合TEOSINTE BRANCHED1OsTB1) 和致密直立PANICLE1 (OsDEP1) 启动子,CRE 通过影响其 DNA 结合能力来抑制 IDEAL PLANT ARCHITECTURE1 (IPA1) 的转录激活活性,导致水稻分蘖数增加和穗尺寸减小(Duan et al., 2019年)。此外,IPA1 直接与OsTB1OsDEP1启动子中的“GTAC”基序结合,以调节水稻分蘖和穗形态(Lu等人,2013年;Wang et al., 2017)。

由于相同且保守的 DNA 结合结构域 (DBD),同一家族中的 TF 通常具有高度相似的蛋白质序列(Millard et al., 2019)。例如,WRKY 系列 TF 通常绑定到名为 W-box 元素的 WRKY 绑定域。小麦 TaWRKY19 直接与 TaNOX10 启动子的 W-box 元件结合,导致 TaNOX10 的转录抑制。当 W-box 被删除并在 TaWRKY19 过表达植物中瞬时表达时,这些植物的易感表型得到显著改善,表明改变 W-box 序列可以阻止 TaWRKY19 结合并改善活性氧 (ROS) 的产生和宿主对毒力 Puccinia striiformis f. sp. tritici (Pst) 的抗性(Wang等人,2022).脱水反应元件结合 (DREB)/C 重复结合因子 (CBF) TF 属于 AP2/ERF 家族,在许多植物物种中充当响应寒冷胁迫的调节网络的核心成员。CBF 通过与脱水反应性 C 重复序列 (DRE/CRT) 式作用元件 (A/GCCGAC) 结合来激活冷应激反应基因(Mizoi等人,2012 年;Hao等人,2017 年;Vergara等人,2021 年)。这种特异性在体外相对容易识别,但在体内很复杂,因为染色质状态和结构会影响 DBD 与其特定序列的相互作用。不同物种中旁系同源 TF 的 DNA 结合偏好不同,尽管 DBD 总是识别特定序列(Weirauch et al., 2014)。

基因启动子包含多个活性位点,可募集 RNA 聚合酶 II、TF 和其他辅因子来启动转录(图 2)。虽然同源基因的蛋白质产物序列在不同物种之间是保守的,但由于其启动子序列的变化,表达特异性、方式和水平通常不同。因此,确定启动子的关键调控区域非常重要。

增强子和沉默子在基因表达中的调节作用不容忽视

在植物中,增强子和沉默子都是远离它们调节的基因的远端调节元件。它们通过与 TFs 和 RNA 聚合酶相互作用来改变靶基因的表达,从而产生不同的发育表型。研究发现,玉米基因组包含许多调节重要基因的远端上游增强子。例如,距离玉米驯化基因 >41 kb 的增强子 teosinte branched1 (tb1) 修饰 tb1 转录,并对植物形态和花序结构产生多种影响(Clark et al., 2006)。玉米增强剂 1 (b1) 七重复序列增强子位于 b100 TSS 上游 ~1 kb 处(Louwers等人,2009 年)。此外,在数量性状位点 Kernel row number 4 (KRN4) 中,UNBRANCHED60 (UB3) 启动子的 ~3 kb 上游远端增强子与以 UB2 为中心的转录复合物相互作用并募集,以微调玉米花序分生组织中 UB3 的表达(Du等人,2020).远端上游增强子也有助于玉米的花序结构以及水稻的穗结构、籽粒大小和花发育(Ishii et al., 2013;Bai et al., 2017;J. Liu et al., 2017;Lou et al., 2017)。因此,这些远端增强子会影响基因表达,改变主要作物的农艺性状和产量。

与远端增强子相比,内含子增强子及其在植物中的功能在很大程度上尚未得到探索。最近,预测了全基因组内含子型增强子,转基因验证显示 169 bp 增强子 DHS7#1 与鳞状启动子结合蛋白样 9 (SPL9) TF 相互作用,以增强老叶中的三联体 (TRY) 和开花基因座 T (FT) 表达,以促进拟南芥开花(Zhu等人,2015).因此,植物内含子型增强子可以精确控制组织特异性基因的时空表达,并作为靶基因的调节因子。

增强子有时在调节基因表达方面发挥双重作用。特定生理途径中的增强子机制最近才出现。茉莉酸酯 (JA) 介导的转录重编程主要由核心 TF MYC2 控制,MYC2 的功能取决于其与介质亚基 MEDIATOR25 (MED25) 的相互作用。通过分析 MYC2 和 MED2 的全基因组靶序列,鉴定 JA 信号通路中 MYC25 的 JA 增强子。JA 以 MED25 依赖性方式调节 JA 增强子及其启动子之间的染色质环形成。此外,MYC2 通过多个 JA 增强子调节自身的基因表达。位于基因间区域的 MYC2 位点的 JA 增强子(名为 ME2)在 MYC2 转录中具有双重功能:它在短期 JA 反应中正向调节 MYC2 表达,但在持续 JA 反应下负向调节 MYC2 表达(H. Wang等人,2019 年)。

虽然单个增强子可以调节基因转录,但多个增强子一起具有更强的调节功能。超级增强子由一组规则增强子组成,首先在哺乳动物物种中被发现,在细胞类型特性和功能中起着重要作用(Pott 和 Lieb,2015)。在拟南芥中,通过调查包含由 DNase I 超敏位点标记的大簇可接近染色质区域的基因组区域,鉴定出一组推定的超级增强子。研究人员鉴定了一个 3578 bp 的超级增强子,并发现由 CRISPR/Cas131 [成簇的规则间隔短回文重复序列 (CRISPR)/CRISPR 相关蛋白 157] 产生的这个超级增强子区域中的 9-9 bp 缺失显着抑制了 thalianol 生物合成基因簇的五个基因,导致显着的根伸长(Zhao et al., 2022)。

植物中增强子的特征和机制逐渐被揭示,新的技术和实验方法已被应用于研究增强子(Sun等人,2019 年;Jores等人,2020 年;Tian et al., 2022)。然而,大多数成就是在酵母、果蝇和哺乳动物方面取得的(Arnold et al., 2013;S. Liu et al., 2017;Wang et al., 2018)。在植物中,尤其是在主要作物中,增强子如何通过与多种蛋白质和启动子相互作用来传递信息,需要进一步探索。

目前,与增强子相比,人们对消音器及其功能了解得少得多,尤其是关于消音器和表型之间的关系。在拟南芥中,CGTG 基序特异性结合转录阻遏物 BRASSINAZOLE-RESISTANT1 (AtBZR1) (He et al., 2005),水稻转录阻遏物 OsBZR1 结合一个 18 bp 基序 (CNV-18bp),包含三个串联重复的 CGTG,以负调控FRIZZY PANICLEFZP),表明 CNV-18bp 是FZP的上游沉默剂(Bai等人,2017年)。在小麦种类Triticum polonicum中,颖长由单个多效性基因座 P1(来自波兰小麦)控制。最近的研究表明,P560 候选基因小麦营养到生殖转变 1TaVRT-A2) 的第一个内含子中的 2 bp 序列是一种重要的负 CRE (起沉默器的作用),它募集 TF MULTI-FLORET SPIKELET1 (TaMFS1) 来抑制TaVRT-A2转录。TaVRT-A2的第一个内含子被重排的 157 bp 或 160 bp 序列取代,这导致TaVRT-A2的异位表达和四倍体和六倍体小麦种质中的长颖表型(Dixon 和 Boden,2021年;K. Li et al., 2021;J. Liu et al., 2021)。包含 RY 基序的 8 bp 内含子 CRE 通过募集反式作用阻遏复合物来抑制水稻中细长上层INTERNODE1Eui1) 的表达,从而起到沉默元件(命名为SE1)的作用。SE1的缺失导致Eui1表达的显着增加,导致赤霉酸 (GA) 缺陷和矮小表型 (Xie等人,2018 年)。

与其他生物体相比,关于主要作物中 CREs 调控机制的研究相对较少,尽管生物技术的最新发展加速了我们对植物中 CRE 的理解。为了在不影响产量的情况下优化农艺性状,或者反之亦然,有必要研究和利用调控区域来精确调节基因表达,而不会影响其他重要性状。

主要作物中 InDel、SNP 和转座因子在顺式调节元件中的自然变异的作用

主要作物的自然变异是指由于突变、基因重组和环境影响等因素而存在于作物物种内部的遗传多样性和差异。在基因组水平上,主要作物的自然变异可以根据其遗传基础分为不同的类型:SNP、InDel 和结构变异。

顺式监管区的 SNP

SNP 是 DNA 序列中单个核苷酸的替换,可以以两种形式发生:转换和反转。SNP 可以发生在基因组的任何位置(图 1)。位于编码区的称为编码 SNP,而位于非编码区的称为非编码 SNP(也称为调节 SNP)。对于单个基因,在不同品种中发现的非编码 SNP 可能与作物的表型密切相关,并且它们通常位于顺式调控区或内含子内。这些非编码 SNP 会影响 TF 或其他调节蛋白的结合,导致基因表达改变。

许多位于顺式调控区域的 SNP 可以改变转录活性和表达水平,并与重要的农艺性状密切相关。例如,一项关联分析表明,位于 TSS 上游 1 kb 的LIGULELESS1式调控区 (OsLG11) 中的 SNP 微调了OsLG1的空间表达,并导致水稻中形成紧凑的穗结构(Zhu等人,2013年)。GmGBP1基因启动子区的 SNP (编码 SKIP 蛋白的同源物并与 GAMYB 结合) 已被证明会影响大豆开花时间和成熟度的光周期控制 (Glycine max)。与编码序列相比,GmGBP1的启动子区域在不同大豆种质中具有高度差异。具体来说,位于GmGBP1启动子的 TCT 基序中的 SNP(A 到 G)会增加GmGBP1表达,可能导致生长期缩短(Zhao等人,2018年)。启动子区域的 SNP 也会影响植物对环境胁迫的反应。基因表达和单倍型分析表明,DROUGHT1DROT1) 启动子中的 SNP(C 到 T)显着增加了陆地稻中DROT1的表达和抗旱性(Sun等人,2022年)。除了顺式调控区外,其他调控区的 SNP 也会影响基因功能。例如,5ʹ-非翻译区 (UTR) 中的上游 ORF (uORF) 在调节蛋白质翻译水平中起着至关重要的作用 (Xue et al., 2023)。大豆磷酸盐转运蛋白转运转运蛋白 1GmPHF1) 的关联分析在 413ʹ UTR 中鉴定了一个名为 SNP5 的功能性 SNP。该 SNP (C 到 A) 引入了终止密码子 (TCA 到 TAA),导致 uORF 编码区过早终止,将其产物的长度从 39 个氨基酸减少到 27 个氨基酸,并导致蛋白质翻译增加。此外,当上游 uORF 的起始密码子被人工突变 (ATG 为 AAA) 时,无论 SNP1 的基因型如何,都无法检测到下游 GmPHF413 的翻译。这些发现表明,SNP413 通过 uORF 调节下游 GmPHF1 的翻译 (Guo等人,2022 年)。因此,调控区域中的 SNP 可以影响基因表达、功能,进而影响农艺性状。

启动子区域的不同 SNP 也会导致基因表达和作物产量性状的变异。测序和关联分析表明,WFZP-A 启动子区域的 SNP 区分了两种单倍型:WFZP-A-II,它促进每个刺突的小刺突数;和 WFZP-A-I,它增加了 1000 格令的重量;这一观察结果与 1000 粒重量与每个穗小穗数之间的负相关一致。基因表达分析表明,该 SNP 影响 WFZP-A 表达,并负责不同的产量性状 (Y. Liet al., 2021)。

顺式监管区域中的 InDel

InDels 是指在 DNA 序列中插入或缺失一个或多个核苷酸,可以发生在基因组的任何区域,包括编码区和非编码区。它们会对基因功能和表达产生各种影响。例如,位于启动子区域中糖转运蛋白 21 (STP1124) 基因起始密码子上游 1 bp 的 1 bp InDel 会改变其表达。与番茄 (Solanum lycopersicum) 中缺失 1 bp 的 STP21 种质相比,插入 1 bp 的 STP21 种质表现出更高的果溶性固形物含量(Wang等人,2023 年)。

位于启动子区域的 CREs 的 TFBS 募集不同的 TFs 到靶基因,导致诱导或组织特异性基因表达以调节植物生长发育。序列分析显示,在水稻 NUMBER of GRAINS12 (OsNOG1) 启动子中与单指 (DOF) TFBS (ATGGCAACTTTG) 结合的 DNA 内的 1 bp InDel 负责调节 OsNOG1 表达(Huo等人,2017 年)。此外,Sl-ALMT3 启动子区的 9 bp InDel 与苹果酸的高含量有关。进一步分析表明,该 InDel 破坏了 Sl-ALMT9 启动子中的 W 盒结合位点,从而阻止了 WRKY 转录抑制因子 Sl-WRKY42 的结合,从而减轻了 Sl-ALMT9 表达的抑制并促进了番茄中果实苹果酸的高积累(Ye等人,2017 年)。

在作物驯化和育种过程中,人类无意识或有意地选择了最佳基因型(有利的 SNP 和 InDels)。因此,识别有利的 SNP 和 InDel 将加速作物改良。

顺式调节区中的转座因子

TE 属于结构变异,涉及 DNA 序列的较大变化;它们可以通过 “剪切和粘贴 ”或 “复制和粘贴 ”机制,在基因组中从一个位置移动或“转置”到另一个位置。它们的活性是多方面的:它们可以通过插入启动子、内含子区域或增强子或附近来引起基因组大小变异和染色体重排、诱导基因突变并改变基因活性(Chuong等人,2017 年;Hayward 和 Gilbert,2022 年)。

考虑到启动子的关键和多重调节作用,识别插入启动子区域的 TE 对于理解性状多样性至关重要。TE 有时有助于植物的表型变异和作物驯化。一个例子是水稻 DEEPER ROOTING2OsDRO1) 启动子中的INDITTO1TE,它包含生长素反应元件并表现出生长素响应启动子活性。它还介导生长素诱导的对其邻近基因的调节。将INDITTO2转基因插入非适应性水稻品种 Nipponbare 的DRO1启动子中,通过促进更深的根系来提高耐旱性(Zhao et al., 2021)。此外,抗白粉病的重要基因Pm3的启动子和 41ʹ UTR 中存在 TE 插入,导致该基因沉默并增加对疾病的易感性。基因工程重新激活了Pm41并恢复了易感小麦品种的白粉病抗性(M. Li et al., 2022)。当插入基因时,TE 可能会产生新的剪接位点,这可能导致功能多样性或基因沉默 (Huang et al., 2008)。例如,在生菜GOLDEN7434 样LsGLK)终止密码子下游 10 bp 处插入一个 2 bp 的 CACTA 转座子,然后复制一个包含LsGLK外显子 1826-3 的 6 bp 片段。转座子插入未改变LsGLK表达。然而,它引起了选择性剪接,转座子插入变体产生的转录物中只有 6% 是野生型转录本,这导致了淡绿色的叶子(L. Zhang等人,2022 年)。

在拟南芥、玉米、小麦、甘蓝和其他植物中发现了许多 TE(Huang et al., 2008;Oki et al., 2008;Hirsch 和 Springer,2017 年;Guffanti等人,2019 年;Zhang et al., 2020;Cai et al., 2022;Gu et al., 2022),许多研究证明了 TE 在驯化和基因表达调控中的重要功能(Butelli et al., 2012;Hirsch 和 Springer,2017 年;Jung等人,2019 年;Alonge等人,2020 年)。例如,通过结合泛基因组和群体重测序数据鉴定转座子插入变异表明,TE 是 B. rapa 表型变异的主要来源,其中发生在遗传区域的 TE 插入与基因的表达水平、编码区长度和编码区数密切相关(Cai et al., 2022)。在 stiff27 基因的启动子中发现一个 2.1 kb 的 TE 插入,该基因编码 F-box 结构域蛋白。这种 TE 插入抑制了 stiff1 的转录,导致细胞壁中纤维素和木质素含量增加,从而增加茎强度(Zhang等人,2020 年)。同时,TE 是调控改变的重要驱动力,因为 TE 衍生的 TFBS 的扩展与小麦对环境刺激的特异性基因反应有关。此外,几乎所有的 TFBS 在进化过程中都至少经历了一次膨胀事件。调控图谱的进化分析表明,这些扩展与特定 TE 家族的扩展密切相关(Y. Zhang et al., 2022)。此外,通过 DNA 亲和纯化测序进行的 TE 分析显示,TE 提供了很大一部分 TFBS(Zhang等人,2021 年)。

总的来说,TE 在物种进化、植物染色体变异和稳定性以及全基因组转录调控中起着重要作用。TE 可以改变基因组的大小和复杂性,并极大地促进遗传多样性。它们不断为染色体提供新元素,并通过改变基因表达水平和表达模式来改变植物性状。因此,通过 TE 插入和重新激活 TE 沉默基因的基因敲低将为分子育种提供策略(Huang et al., 2008)。

最重要的是,自然变异是影响许多作物性状的关键因素,包括产量、质量、抗病性和对环境胁迫的耐受性。通过利用这种多样性,植物育种者可以创造出更能适应特定环境或具有改进特性的新作物品种。因此,研究和利用自然变异可以使植物育种者开发出更高产、更有弹性和更可持续的作物。

CRISPR/Cas9 基因编辑技术在主要作物中的应用

CRISPR/Cas9 系统是一种 II 型编辑系统,可以进行双链断裂 (DSB)(Jinek等人,2012 年;Cong et al., 2013)。它通过 DNA 非同源末端连接 (NHEJ) 和同源定向修复 (HDR) 修复途径来修饰切割位点,并且可以通过随机或模板引导的碱基修复来编辑单个靶基因或多个基因(Symington 和 Gautier,2011 年;Chen等人,2019 年)(图 3)。基因可以被 CRISPR/Cas 系统敲入或敲出、激活或沉默。重要的是,CRISPR 介导的 DNA 编辑器在下一代中稳定遗传,并最大限度地减少对基因组中其他基因和调节区域的意外影响(Zhang等人,2016 年;T. Li et al., 2021)。

图 3.

CRISPR/Cas9 系统的 NHEJ 和 HDR 修复途径模型。非同源末端连接 (NHEJ) 是一种修复 DNA 中 DSB 的途径,被称为“非同源”,因为断裂末端直接连接,不需要同源模板,而同源定向修复 (HDR) 需要同源序列来指导修复。NHEJ 通过形成突触复合物将断裂的 DNA 分子的末端聚集在一起,突触复合物由两个 DNA 末端、两个 Ku70/80 和两个 DNA-PKCS 分子组成。不相容的 DNA 末端被加工成可连接的末端,然后通过连接酶 IV 复合物修复断裂。Cas9 包含两个核酸酶结构域:一个 McrA 样 HNH 核酸酶结构域 (HNH) 和一个 RuvC 样核酸酶结构域 (RuvC)。Ku70/80 是一种与 DNA DSB 末端结合的二聚体蛋白复合物,是 DNA 修复的 NHEJ 通路所必需的。真核生物 Ku 是两种多肽 Ku70 和 Ku80 的异二聚体,因其分子量分别为 ~70 kDa 和 80 kDa 而得名。Ku 与 DNA 依赖性蛋白激酶催化亚基 (DNA-PKcs) 形成复合物,形成完整的 DNA 依赖性蛋白激酶 (DNA-PK)。DSB,双股断裂;sgRNA,单向导 RNA;PAM,原间隔区相邻基序。MRN 是一种复合物,可与断裂两侧的 DNA 结合。RAD51 是一种 DNA 修复蛋白,有助于修复 DNA DSB。


主要作物中顺式调控区靶向 CRISPR/Cas9 编辑系统

近年来,CRISPR/Cas9 编辑系统的快速发展极大地推动了基因功能解释和分子育种应用的研究。与传统的杂交育种和突变育种相比,CRISPR/Cas9 基因编辑系统加速了作物育种,并实现了无转基因基因工程。作为一种高效、精确的靶向基因修饰技术,它已被用于改善农艺性状,如产量、质量和抗病性(Wang等人,2014 年;Li et al., 2016;Zhang et al., 2016;J. Liu et al., 2017;Morineau等人,2017 年;R. Li et al., 2018;Sánchez-León et al., 2018;Zhang et al., 2018)。

然而,在植物基因组编辑中,大部分工作都集中在编码区,CRISPR/Cas9 的应用主要是敲除一个或多个基因。例如,小麦抗霉菌基因座 (TaMLO) 等位基因 TaMLO-A1 是使用 CRISPR/Cas9 在小麦中编辑的第一个基因,与野生型相比,所得的 TaMLO-A1 敲除植物显示出对白粉病的抗性增加(Wang等人,2020 年)。此外,使用 CRISPR/Cas9,水稻产量相关基因,如 GW2GW5 或粒长和宽 2 (GLW2),已被证明可以大大提高谷物产量(Xu et al., 2016;J. Liu et al., 2017),而调控序列的基因组编辑在植物中相对小众。

基因多效性是顺式调控区多样化的结果。式调节区包含各种类型的序列,为变异提供了充足的空间,从而在整个发育过程中定性和定量地影响不同组织中的基因表达,并导致表型变化。鉴于顺式调控区在基因表达中的调节作用,CRISPR/Cas9 系统可用于编辑启动子,通过产生小的 InDel 和大的缺失来微调基因表达(Rodríguez-Leal等人,2017年;L. Liu et al., 2021)。是使用 CRISPR/Cas 基因编辑系统进行基因多效性的主要贡献者(表 1)。例如,一项研究精确靶向SlWUS下游的推定SlWUSCArG 元件,并使用 CRISPR/Cas4 系统在 CArG 元件中产生 9 bp 缺失,这表明与野生型相比,来自编辑突变体的 10% 的果实发育出三个腔(Rodríguez-Leal et al., 2017).此外,为了评估通过使用 CRISPR/Cas9 多重诱变驱动系统靶向启动子区并产生一系列等位基因 (大缺失、倒位和小 InDel) 靶向启动子区导致的表型变化,设计了 2 个向导 RNA (gRNA) 靶向番茄中 M82SlCLV3编码序列上游的 3 kb 启动子区。来自成功编辑植物的花比野生型产生更多的器官,来自 T0植物的SlCLV9启动子等位基因表明,调节序列的 CRISPR/Cas2017 靶向可以产生新的遗传和表型变异(Rodríguez-Leal等人,3年)。由于许多植物中保守的 CLV-WUS 途径,改变该途径中基因的启动子,例如玉米CLAVATA7/胚胎周围区域RELATED7ZmCLE2) 和Zm FON1 样 CLE PROTEIN1ZmFCP2017),改善玉米分生组织的大小和许多与产量相关的性状(Rodríguez-Leal 等人,2021年;L. Liu et al., 9)。同样,通过 CRISPR/Cas2014 遗传驱动系统分析顺式调控序列对番茄干细胞回路数量性状的影响,揭示了式调控序列复杂性的基础(Brooks等人,2021年;Wang et al., 9)。另一项研究利用基于平铺缺失的 CRISPR/Cas1 筛选方法在水稻的IPA1非编码区产生缺失,其中顺式调控区的缺失以组织特异性方式改变了IPA1的表达,随后降低了IPA54的多效性效应,并在分蘖数和穗大小方面产生了广泛的表型。此外,删除IPA1中 2022 bp的顺式调控区解决了每穗粒数和分蘖数之间的权衡,从而显著提高了水稻每株的谷物产量(Song等人,<> 年)。

表 1.

CRISPR/Cas 基因组编辑系统在主要作物中靶向的 CRE 示例

基因位置目标
基因名称
编辑类型编辑方法编辑结果
促进理想工厂架构 1
IPA1
)
CRISPR/Cas9 抗体
基于 Tiling deletion 的 IPA1 启动子顺式调控区筛选。
解决每穗粒数和分蘖数之间的权衡导致水稻每株谷物产量的大幅增加(Song et al., 2022)。
Zm CLAVATA3/胚胎周围区域-RELATED7
ZmCLE7,CLV3 直系同源物);
Zm FON2-LIKE CLE PROTEIN1
ZmFCP1, CLV3 旁系同源物)
CRISPR/Cas9 抗体
在 ZmCLE7 和 ZmFCP1 启动子区域产生大的缺失和倒置。
增加多种与玉米籽粒产量相关的性状,如籽粒行数、穗直径、穗重,支持基因组编辑在作物改良方面的巨大潜力(L. Liu et al., 2021)。
Sl WUSCHEL HOMEOBOX9 (SlWOX9
)
CRISPR/Cas9 多重诱变驱动系统
在 SlWOX9 启动子的式调节区产生突变。
在番茄中发现保守的 WOX9 基因功能可以最大限度地减少对作物改良的不良影响(Hendelman et al., 2021)。
Sl WUSCHEL (SlWUS);
Sl CLAVATA3 (SlCLV3
)
CRISPR/Cas9 抗体
在 SlWUS 启动子的 CArG 阻遏蛋白基序中产生缺失;在 SlCLV3 启动子中生成 InDel。
证明启动子的 CRISPR/Cas9 基因组编辑产生多种式调节等位基因,为育种提供有益的定量变异(Rodríguez-Leal等人,2017 年)。
OsSWEET11,13,14
CRISPR/Cas9 抗体
在三个 SWEET 启动子的效应子结合元件中产生多个突变。
证明基因组编辑的 SWEET 基因启动子赋予水稻品系强大的广谱抗性、效应子结合元件(Oliva等人,2019 年)。
Os 原卟啉原 IX 氧化酶 1 (PPO1);
Os 卡尔文循环蛋白 12
CP12
)
CRISPR/Cas9 抗体
在 PPO1 和 CP12 启动子之间产生倒位。
证明倒位等位基因在田间条件下对 FCD 除草剂具有更强的耐受性(Lu et al., 2021)。
?
CBE / ABE /
DBE/PE


增强TRY
 的增强剂 DHS7#1 和 DHS7#2
基于 CRISPR/Cas 的基因组编辑系统
生成 TPY 的 DHS7#1 和 DHS7#2 增强子的单缺失系和双缺失系。
证明这两种增强子在微调其同源基因的组织特异性表达和发育特异性表达中很重要(Meng等人,2021 年)。
MYC2
 的茉莉酸酯增强子 (ME2)
CRISPR/Cas9 抗体
通过破坏 MYC2 的 ME2 增强子的 T/G-box 基序 (CACGTT) 产生 InDel 突变体。
证明 ME2 在 MYC2 转录中具有双重功能,新的基因编辑工具为阐明增强子的体内功能开辟了新的途径(H. Wang等人,2019 年)。
?
CBE / ABE /
DBE/PE


'?' 代表目前缺乏对使用 CBE/ABE/DBE/PE 和其他碱基编辑技术对 CRE 进行精确编辑的研究。


植物物种间有许多同源基因,基因家族具有高度保守的功能域,但一些同源基因在进化过程中发生了功能分化。确定功能分化的潜在机制是困难的,而且目前还不清楚物种之间的等位基因多样性是否隐藏了高度保守的多效性。CRISPR/Cas9 多重诱变驱动系统还用于在番茄 (S. lycopersicum) 中设计大量 SlWOX9 启动子,这揭示了 WOX 基因的多种多效性作用,这些作用以前被有限的等位基因多样性所隐藏,编辑 SlWOX9 启动子的不同功能特异性式调节区域可导致生殖和营养表型的差异, 分别(Hendelman等人,2021 年)。

在基因敲入方面,将天然玉米 GOS2 启动子插入到涉及器官大小的生长素调控基因 5 (ARGOS8) 的 8ʹ UTR 中或通过 HDR 替换天然 ARGOS8 启动子。这种操作增强了干旱胁迫下 ARGOS8 的表达和籽粒产量(Shi et al., 2017)。大片段的定点插入通常是基因敲入技术中的一个挑战。然而,在 CRISPR/Cas9 技术的成功应用中,合成的 5.2 kb 类胡萝卜素生物合成基因表达成分被精确地插入到水稻基因组的特定位点,从而产生类胡萝卜素产生增强的黄金水稻(Dong et al., 2020)。目前,与 Knockout 系统相比,敲入编辑系统的利用率相对较低。鉴于 TE 可以影响基因表达和植物表型,可以采用 CRISPR/Cas 介导的敲入编辑系统将 TE 特异性插入基因调控区域,从而能够研究它们对基因调控和表型变异的影响。例如,为了提高耐旱性,敲入编辑系统(包括将 INDITTO2 TE 插入不适应水稻品种的 DRO1 启动子)优于转基因插入方法(Zhao等人,2021 年)。

上述研究清楚地证明了式调控区,尤其是近端启动子区在基因表达和功能中的重要性。它还证明了 CRISPR/Cas 编辑系统的可行性和可靠性。因此,CRISPR/Cas 编辑系统技术可以进一步用于探索基因功能多效性的根本原因,并识别特定的 CRE 和功能自然变异。基因编辑基于最小或无负连锁,可用于编辑特定区域和调控基因表达水平,优化基因功能,这对作物遗传改良和特定农艺性状的优化和聚集具有重要意义。

精确的碱基编辑系统——等待进一步应用的 trenchant 剑

最近开发了几种用于高效作物育种的基因编辑技术,包括碱基编辑、双碱基编辑和引物编辑(Molla等人,2021 年)。诱导特异性碱基变化且不依赖于 HDR 或供体 DNA 且不需要 DSB 的碱基编辑系统为在目标位点进行工程核苷酸替换提供了一种高效、简单、通用的策略(M. Wang人,2019 年)。

碱基编辑系统,包括胞嘧啶碱基编辑 (CBE) 和腺嘌呤碱基编辑 (ABE) 系统,被广泛用于在植物中产生不可逆的核苷酸取代(图 4)。CBE 通过单向导 RNA (sgRNA) 直接进入目标 DNA 位点,产生 C:G 到 T:A 突变;它已在多种植物物种中得到优化和开发,其中水稻细胞分裂周期 48 (OsCDC48)、OsNRT1.1B 和 OsSPL14;小麦脂氧合酶 2 (TaLOX2);和玉米着丝粒特异性组蛋白 H3 (ZmCENH3) 已成功编辑(Shimatani等人,2017 年;Zong等人,2017 年,2018 年;Jin et al., 2019;J. Li et al., 2020)。此外,OsCDC48 在 pnCas9-PBE 系统中的单碱基突变率达到 43.48%,并且编辑的基因型不包含意外的 InDel 突变(Zong et al., 2017)。

图 4.

植物中精确的基因组编辑系统示意图。(A) 植物中的 CBE 技术。CBE 由携带 D9A 突变的 Cas9 切口酶 (nCas10) 与胞苷脱氨酶和尿嘧啶 DNA 糖基化酶抑制剂 (UGI) 合并组成,并通过单向导 RNA (sgRNA) 直接进入靶标 DNA 位点,产生 C:G 到 T:A 突变。(B) 植物中的 ABE 技术。ABE 使用腺苷脱氨酶作为与 nCas9 (D10A) 融合的效应子,将 A:T 替换为 G:C。(C) 植物中的 DBE 技术。DBE 涉及胞嘧啶脱氨酶和腺嘌呤脱氨酶的融合,并且可以使用 sgRNA 以及 UGI 和 nCas9 (D10A) 在植物中同时进行 C:G-to-T:A 和 A:T-to-G:C 编辑。(D) 植物中的 PE 技术。PE 由 CRISPR-nCas9 (His840Ala, H840A) 组成,这是一种用引物编辑向导 RNA(pegRNA,携带所需突变,红线)编程的莫洛尼鼠白血病病毒逆转录酶融合。引物结合位点与断裂的 DNA 链结合,从而引发模板的逆转录成所需的 DNA 序列。然后将编辑后的核苷酸以精确的方式插入目标位点。CBE,胞嘧啶碱基编辑;ABE,腺嘌呤碱基编辑;DBE,双碱基编辑;PE,主要编辑。


ABE 使用腺苷脱氨酶作为与 nCas9 (D10A) 融合的效应子替代 A:T 代替 G:C (Gaudelli et al., 2017),并且在植物生物学研究中也成功使用,但与 CBE 相比较少使用。植物 ABE 已应用于水稻、小麦、玉米、拟南芥和油菜籽(甘蓝型油菜)(C. Li et al., 2018;Negishi et al., 2019;等人,2020 年;J. Li et al., 2020;Wada et al., 2020;Yan et al., 2021)。ABE7.10 具有最高的碱基编辑频率,在拟南芥中高达 4.1%,在油菜籽中高达 8.8%(Kang等人,2018 年)。在水稻中,简化的编辑器 ABE-P1S 在 Nipponbare 靶向 OsSPL14 和 SLR1 时比以前的 ABE-P1 系统具有更高的效率(等人,2019,2020)。 为了提高编辑效率,已经从 TadA7.10 人工开发了几种新的 TadA 变体(Gaudelli等人,2020 年;Lapinaite等人,2020 年;Richter et al., 2020)。两种碱基编辑系统都可用于修饰 CRE 区域中的 SNP,从而改善作物的弱性状。例如,DROT1 启动子中的 C-to-T SNP 已被证明可显着增强陆地稻中 DROT1 的表达和抗旱性(Sun et al., 2022)。如果可行,研究人员随后可以考虑使用 CBE 来靶向这个特定的 SNP,并在不抗旱但高产的栽培稻品种中用 T 代替 C 碱基。

双碱基编辑涉及融合胞嘧啶脱氨酶和腺嘌呤脱氨酶,可以使用 sgRNA 以及尿嘧啶 DNA 糖基化酶抑制剂和 nCas9 (D10A) 在植物中同时进行 C:G 到 T:A 和 A:T 到 G:C 编辑,该系统称为饱和靶向内源性诱变编辑器 (STEME)(C. Li等人,2020 年)。与 CBE 和 ABE 类似,双碱基编辑器能够在其天然基因组环境中对内源性植物基因进行靶向诱变(Grünewald等人,2020 年;Huang et al., 2021)。它们可用于修饰位于启动子区域的沉默器或编辑 CRE 中的特定基序,从而改变基因表达模式并调节特定的农艺性状。

Prime 编辑是一种新开发的基因组编辑工具,可以同时进行多个碱基替换、插入和缺失,并已用于水稻、玉米和小麦(Zhang等人,2019 年;Lin et al., 2021;Molla等人,2021 年;S. Li et al., 2022;Zong等人,2022 年)。Prime 编辑可以在没有供体 DNA 或 DSB 的情况下编辑碱基。Plant Prime 编辑器已经过优化,以提高其编辑效率。另一项研究删除了 M-MLV 逆转录酶 RNase H 结构域并掺入了病毒核衣壳蛋白(工程植物引物编辑器),然后使用工程植物引物编辑器生成耐磺酰脲类和咪唑啉酮除草剂的水稻植物,编辑频率为 11.3%,而使用原始植物引物编辑器的编辑频率为 2.1%(Lin 等人, 2020 年;Xu et al., 2020)。由于 CRE 的基序通常由短序列组成,因此植物引物编辑器可以靶向替换、插入或删除对作物改良有利或不利的关键基序。

植物基因编辑平台的技术挑战与未来展望

基因编辑是现代农业快速发展的有力工具,与传统育种相比,它更精确、耗时更短、效率更高。此外,在作物中还发现了许多提高产量、优化质量和增强抗病性的关键基因。然而,与重要性状相关的基因通常是多效性的,并且由于 CREs 和相应的反式作用因子控制的时空特异性表达,可以同时对作物生产产生积极和消极影响。例如,增加粒数同时减少 1000 粒重量的突变基因可能不会显着提高作物产量(Bai et al., 2017;Y. Li et al., 2021)。同时,同源基因的时空特异性和表达水平在不同作物中不同(任 et al., 2018;Y. Li et al., 2021)。此外,基因通常参与多个生物过程,这使得阐明某个性状的调控网络变得具有挑战性。因此,基于基因功能的系统表征,精准基因编辑技术可以与多种组学方法相结合,预测和识别介导基因表达时空特异性和调控特定农业性状等的关键 CRE,对作物改良实践也将具有意义和可持续性(图 5).精确编辑技术存在一些挑战,需要深入探讨。针对这些技术的现状和特点,我们总结了以下几个方面。

图 5.

CRISPR/Cas 基因编辑系统应用示意图。靶向 CRE (A)、SNP 或其他变体 (B, C) 可能会改变基因的表达水平和/或模式,并提高主要作物的质量、产量和对环境的抵抗力。TSS,转录起始位点;CRE,式调节元件;SNP,单核苷酸多态性。


首先,碱基或双碱基编辑可用于编辑特定碱基以产生功能丧失或获得突变(Li et al., 2017),但它们的应用受到编辑窗口狭窄的限制,并且一些基因位点无法有效编辑,包括基因调控区和编码区。例如,如果有必要在特定 CRE 中编辑功能性 SNP 或 InDel,但 CRE 没有前间隔区相邻基序 (PAM),或者需要编辑的碱基不在 PAM 上游的编辑窗口中。因此,值得在高度特异性和有效的条件下进一步优化编辑窗口并扩大 PAM 位点的范围。此外,拓宽碱基编辑系统的编辑窗口可能有利于饱和突变研究,例如从头驯化或定向进化,以在植物中产生新的基因资源或种质(Li等人,2023 年)。此外,基础编辑只能创建 C:G 到 T:A (CBE) 或 A:T 到 G:C (ABE) 的变化,因此仍然需要开发其他类型的基础编辑系统来将 A:T 转换为 C:G 或 T:A 到 A:T。这肯定非常有利于在植物中感兴趣的靶基因的编辑窗口内将任何碱基对替换为所需的碱基对。Prime 编辑已被开发用于插入或替换精确的小 InDel,并在目标基因组位点实现单个或多个碱基替换。然而,由于其复杂的基因组和基因冗余,它不能有效地用于多倍体作物,如六倍体小麦,并且亚基因组中同源基因之间的序列相似性很高,因此很难编辑只有一个同源基因的特定序列。

其次,PAM 序列是基因编辑的一把双刃剑。PAM 限制可以减少脱靶效果并提高编辑准确性,但它们也会限制可编辑的序列类型,从而缩小应用程序范围,尤其是在许多 CRE 相对较短的情况下。没有 PAM 限制,可以扩大编辑范围,例如使用无 PAM 的编辑系统产生乙酰辅酶 A 羧化酶的近饱和诱变,这具有高通量编辑和全基因组筛选的潜力(Zhu等人,2020 年)。然而,如果靶向特定位点,脱靶效应的风险可能会显著增加,从而导致编辑后的后代出现一系列不必要的负面影响和干扰因素。因此,根据不同编辑器的用途,需要开发具有不同 PAM 序列的各种编辑器,以便选择合适的编辑器来编辑目标序列。例如,已知的自然变异资源可用于插入小的功能性 InDels、删除不利的 TE、用所需的 SNP 替换它们等等。

第三,目前的 CRISPR/Cas9 敲除技术多应用于基因的编码区,很少应用于含有 CRE 的调控区,这需要扩大敲除技术的应用范围。例如,随着对增强子和沉默子对基因表达调控的理解加深,CRISPR/Cas9 系统可以根据 DSB 后 NHEJ 修复概率较高的特点,利用 CRISPR/Cas2021 系统敲除或沉默相应的增强子和沉默子,从而影响靶基因的时空表达模式。最近关于启动子的研究主要涉及高级编辑事件,例如多位点协同编辑、多碱基删除和替换编辑以及大片段删除编辑(Hendelman等人,2021 年;Wang et al., 2022;Song et al., 12)。由于式调控区的开放性和可及性,以及组蛋白甲基化修饰,编辑的准确性和效率相对较低。因此,需要努力优化基因编辑系统,以识别和应用顺式调控区域的相应功能,例如基于多组学数据预测模型的 CRISPR/Cas1a 启动子编辑系统,该系统能够线性调节水稻颗粒结合淀粉合酶 1 (OsGBSS3,也称为 Waxy/Wx) 和粒度 3 (OsGS2023) 的表达水平)及其相应的农艺性状,并显著提高了启动子区域的编辑效率(周 et al., <>)。

植物基因组在基因调控区域包含丰富的自然变异,包括 SNP、InDel、TE,有时还有大缺失,这些都是作物育种的潜在资源。这些自然变异进化并随后被选为有利的基因型。重要的是,许多有利的单倍型编码功能性蛋白,例如酶和结构蛋白,而不是关键的调节蛋白,例如 TF。因此,基因表达或基因功能的微小变化可能会影响生化过程和农业性状的级联反应。不同作物的重测序和泛基因组项目已经确定了许多自然变异,这些变异有待通过精确的基因编辑技术进行表征和应用。

使用 CRISPR/Cas9 编辑系统进行无转基因基因基因工程的途径

CRISPR/Cas 系统可以通过诱导生物体自身的 DNA 修复机制来修饰生物体基因组中的特定基因,这类似于自然变异。然而,这项技术的广泛使用存在缺点,包括需要将 Cas9-sgRNA 成分引入受体植物以及脱靶效应和染色体损伤的风险。此外,外源 DNA 整合到植物基因组中导致这些植物被认为是转基因的,并受到严格的规定。虽然自交或回交可用于去除外来基因,但耗时且劳动密集。因此,开发高效的非转基因植物基因组编辑技术对于促进基因编辑作物的商业化具有重要意义。

近年来,人们通过不同的方法在植物中研究了无转基因基因组编辑系统。例如,在植物细胞递送中使用预组装的 Cas9 蛋白-gRNA 核糖核蛋白 (RNP) 可以消除重组 DNA 插入宿主基因组的过程(Liang et al., 2017)。此外,当使用仅蛋白质和 RNA 系统时,无需优化密码子使用或寻找合适的启动子来表达 Cas9 和 gRNA。这种方法可以将基因组编辑的适用性扩大到所有可转化的植物物种。一项研究通过将纯化的 Cas9 蛋白和 gRNA 的预组装复合物转染到植物原生质体中,在拟南芥、烟草、生菜和水稻的再生植物中实现了靶向诱变(Woo等人,2015 年)。然而,对于大多数草类作物来说,这种方法在操作和栽培方面造成了很大的困难,需要进一步开发和优化(Liang et al., 2017)。

随后,开发了一种简单高效的基因组编辑方法,该方法涉及瞬时表达 CRISPR/Cas9 DNA 或体外转录 Cas9 编码序列和 gRNA 到小麦愈伤组织细胞中,导致 T0 代无转基因和纯合小麦突变体的再生。该系统在编辑六倍体面包小麦和四倍体硬粒小麦中的基因方面非常有效和特异性,无需选择除草剂(Zhang等人,2016 年)。另一项研究设计了一种病毒诱导的无转基因编辑程序,通过将大麦条纹花叶病毒 (BSMV) 感染的 Cas9 转基因小麦花粉与野生型小麦杂交来生成无 Cas9 的小麦突变体。该程序可用于获得突变体 F1 后代,然后可以分离出 Cas9 转基因,从而有可能获得无 Cas9 的突变后代(T. Li等人,2021 年)。

为了节省获得无转基因编辑植物的时间,一项研究构建了一个带有 mCherry 荧光蛋白标签的 CRISPR/Cas9 载体,该载体允许在显微镜下直接目视识别和筛选 T1 种子。没有 CRISPR/Cas9 表达成分的种子不产生红色荧光,从而能够选择无 DNA 的编辑植物(He等人,2018 年)。最近,一项研究设计了 Cas9 和 gRNA 转录物与 tRNA 样序列基序的融合,将 RNA 从转基因砧木转移到嫁接野生型芽(接穗)并实现可遗传的基因编辑,如野生型 A. thaliana 和 B. rapa 所示。嫁接物移动基因编辑系统能够在一代中产生无转基因的后代,而无需转基因消除、培养恢复和选择或使用病毒编辑载体(Yang等人,2023 年)。

与基于转基因的基因组编辑相比,无转基因基因组编辑可以有效降低脱靶效应和细胞毒性,防止遗传研究中后代个体的再编辑,为基因组编辑植物避免转基因调控提供了新的途径。

Advances in cis-element- and natural variation-mediated transcriptional regulation and applications in gene editing of major crops

AIBioPioneer
分享人工智能,生物信息与植物生理的点点滴滴
 最新文章