摘要
基础研究为了解植物的遗传网络和调控层次结构提供了更好的理解。为了应对农业的挑战,我们必须能够迅速将这些知识转化为生产改良的植物。因此,在本综述中,我们讨论了目前可用于植物生物技术的先进工具,以在植物中生产新产品并生成具有新功能的植物。这些工具包括合成启动子、“可调”转录因子、基因组编辑工具和位点特异性重组酶。我们还回顾了一些有可能实现作物改良的工具,例如大 DNA 分子的组装和合成方法、具有连接多基因的植物转化和植物人工染色体。应整合这些基因技术,以实现其应用于紧迫的农业和环境问题的潜力。
主要
转化和应用植物生物学存在许多复杂的挑战,其中包括在保持环境质量的同时为快速增长的全球人口提供食物和衣服。一方面,需要改善现有植物特性以获得更好的作物性能,特别是在提高作物的产量和抗逆性以适应不断变化的环境方面1,2.另一方面,我们可能希望植物执行许多新功能和任务,例如生物传感和生产有价值的化合物。在这个连续体的中间是植物新陈代谢、发育和生长的改变,这可能会改善现有功能或制造新产品。需要生物技术来帮助满足植物科学和农业的这些需求和期望。
植物基因工程并不是一项新技术;它现在已经有 30 多年的历史了。将异源 DNA 引入植物的主要工具,根癌农杆菌介导的转化和生物列表学,是在 1980 年代发明的。目前商业种植的所有转基因作物都是使用这些方法生产的。基因工程通过引入一个或多个新基因和调节元件,或通过降低内源性基因的表达来直接操纵生物体的基因组。对于这些终点中的任何一个,DNA 构建体以随机方式插入到一条或多条染色体中,并插入到一个或多个基因座中。这种方法在植物中添加简单性状(如除草剂耐受性和抗虫性)的情况下非常有效。然而,基因插入的随机性可能会产生不良影响,并且这些方法不利于进行大规模的协同改变,例如将整个代谢途径添加到植物中3.
多基因转移、位点特异性整合和特异性调控基因表达是植物生物技术中至关重要的先进方法。在这篇综述中,我们首先讨论了允许更精确地调节植物基因表达的最新进展,包括合成启动子、转录激活剂和抑制因子。然后,我们讨论了用于大 DNA 插入片段和多基因工程的组装、合成和转化、靶向基因组修饰和转基因生物限制的遗传工具的进展。借助质体转化或工程化核酸酶进行精确的基因组编辑,可以实现多个或堆叠转基因的位点特异性整合。人工染色体也可能在下一代转基因技术中发挥关键作用。尽管这些遗传工具的进步也适用于植物生物学的基础研究,但我们综述的重点是这些工具在植物生物技术中的应用。
基因表达的调节
内源基因的转录调控和转基因表达的精确控制是植物生物技术的主要挑战。合成启动子、转录激活剂和抑制剂是在空间和时间上精确调控转基因表达的最重要工具。
合成促进剂。内源性植物启动子通常很长且较弱——它们的大小通常超过 1 kb,并且比植物生物技术中常用的基于病毒的组成型启动子弱得多。相比之下,合成启动子可以设计得短而强,它们可以用作组成型、诱导型、空间(组织特异性)或时间(发育阶段特异性)基因表达的调节装置4.合成启动子通常使用计算设计和经验测试的顺式调节元件(或基序),这些元件充当转录因子结合的位点。顺式调控结构(基序序列、位置、拷贝数和特异性组合)是合成启动子工程的主要靶标4.典型的合成启动子包含在天然植物启动子中发现的 DNA 序列,但这些序列通常以自然界中不存在的形式重排和浓缩。因此,可以使用不同的格式和序列设计合成嵌合启动子,以微调基因表达,并在植物被改造为表达多个配位转基因时避免同源依赖性基因沉默5、6、7.
在一个例子中,多聚化顺式调节元件和信号转导途径被用来制造检测植物病原菌的植物传感器8,9.编码荧光蛋白的报告基因由合成启动子驱动,这些启动子包含植物调节元件,这些元件可被植物信号防御化合物(即水杨酸、乙烯和茉莉酸)诱导。这些合成启动子可被转基因烟草和拟南芥中的不同细菌病原体特异性诱导(图 1)。这些早期研究说明了使用合成启动子开发一系列植物传感器的潜力,这些传感器将用于商业农业和其他应用。
植物中的合成启动子工程目前受到已知功能性顺式调节元件的可用性和计算建模软件的限制。纵观植物生物技术的历史,通过创建 5' 缺失的解构分析被用来推断启动子元件的功能。合成启动子设计更多地依赖于涉及添加顺式调节基序的重建分析,这些基序通常由数据库辅助基序分析来识别10.我们在组装不同单元以产生功能促进剂的设计策略方面的经验也很有限。植物中复杂顺式调控结构的准确解剖和功能解释在合成启动子设计中起着关键作用,并为合成启动子的“自下而上”和系统设计提供了有价值的资源。此类研究使用基于生物信息学的从头基序发现11,12和实验方法。
一项研究13集成生物信息学,使用五种生物信息学工具的结合位点估计工具套件 (BEST),并使用合成启动子在 A. thaliana 中发现新的激发子响应顺式调节元件。我们的实验室还应用了一组七种生物信息学工具,用于从头发现在大豆基因组中发现的 5-7 bp 长的大豆胞囊线虫 (SCN) 诱导基序。随后在转基因大豆毛状根系统中使用合成启动子进行功能分析(WL 和 C.N.S.JR,未发表的观察结果)。综上所述,这些方法允许发现和完善用于合成启动子设计的顺式调节结构,可用于显著优化转基因表达。此外,组合启动子文库的构建有可能极大地帮助合成启动子的工程设计14.
尽管已经产生了一些植物合成启动子(见补充信息 S1(表格)),但植物的合成启动子设计仍处于起步阶段。大多数所谓的合成启动子是通过将功能性启动子区域或基序插入天然植物启动子中而创建的,而无需计算建模。例如,合成组成型启动子 Pcec15和 Mac16是通过在天然组成型启动子的上游插入转录增强子结构域构建的,这在转基因植物中赋予的报告基因表达水平比天然启动子赋予的水平高得多。随着技术的发展,我们预计通过使用结合计算建模、大型“组学”数据集、增加的启动子-转录因子相互作用知识和改进的筛选技术的综合方法将获得更好的结果。这种整合将导致合成启动子与自然界中发现的启动子几乎没有相似之处。
合成转录激活剂和抑制剂。尽管合成启动子可能被认为是微调植物转基因表达的首要任务,但合成转录激活剂或抑制剂可用于调节植物基因组中内源基因或转基因的表达17.由工程化 DNA 结合结构域和催化效应结构域组成的融合蛋白在植物组成型启动子的控制下为靶向基因表达带来了巨大的前景18以及用于精确基因组编辑(图 2)(见下文)。
工程化锌指蛋白 (ZFP) 已分别通过将它们融合到转录激活或抑制结构域来用于植物的基因激活或抑制(图 2a)。ZFP 以单体形式与 DNA 靶标结合,每个单体由 3-6 个或更多 C2H2 指的串联阵列组成,并靶向 9-18 个碱基长的特异性 DNA 序列19.包含激活结构域的合成锌指转录因子 (ZF-TF) 已用于报告基因的靶向激活20,21和拟南芥的内源基因19,22,23,24,25 元和油菜26.它们还被用于转基因拟南芥中,通过与其他转录因子竞争水稻通酸杆菌状病毒启动子上的相同结合位点来下调基因表达27.
工程化转录激活因子样效应子 (TALE) 也可用于靶向基因表达(图 2a)。这些人工调节因子中的每一个都包含一个氨基末端易位结构域、一个中央 DNA 结合结构域和一个羧基末端结构域,其中包括核定位信号和一个激活结构域。合成 TALE 可能比 ZFP 更易于设计,因为它们不必根据表达式库进行筛选,而 ZFP 设计要求是28.黄单胞菌属 TALE 的 DNA 结合结构域由 1.5-33.5(主要是 15.5-19.5)串联重复序列组成,这些重复序列几乎相同。每个重复序列的长度为 30-42(通常为 34)个氨基酸29.单个重复序列的特异性编码在每个重复序列的 12 和 13 位置的重复-可变二残基中28,30.从 TALE-TFs 和 ZF-TFs 的转录起始位点到 DNA 结合位点的距离不是固定的,并且可能因不同的特异性而异。在一项研究中,包含自身激活结构域并由组成型 CaMV 35S 启动子驱动的黄单胞菌 TALE 用于特异性诱导番茄 Bs4 基因和拟南芥 EGL3 和 KNAT1 基因的表达31.这些 TALE 的靶位点位于转录起始位点上游 46-108 bp。这种诱导导致番茄毛状体数量的增加,并且 A. thaliana 的叶形态发生了很大变化。在另一项研究中,当 TALE DNA 结合结构域与 ERF 相关抑制结构域 SRDX 融合时,证实了冷、盐或脱落酸处理后拟南芥中转基因和内源性 RD29A 表达的靶向抑制32.
此外,植物中的转录激活、重组和其他遗传或表观遗传效应(如甲基化、乙酰化或脱乙酰化,以及转基因或内源基因的胺化或脱氨)有可能使用合成 TALE 实现。例如,具有嵌合激活结构域的合成 TALE-TF 已被设计为靶向 19S 启动子的各种 25-35 bp 序列,导致报告基因表达的 <> 到 <> 倍诱导(W.L.、C.N.S.JR、J. D. Chesnut、M. Mazarei、RJ Millwood、Y. Peng、MR Rudis、W. Xu 和 J.-P.Yang,未发表的观察结果)。
ZF-TFs 和 TALE-TFs 是在其天然环境中调节内源基因表达的有前途的工具,它们有可能应用于作物改良。它们可用于激活关键的调节蛋白,这些蛋白是整个代谢和发育途径的主开关26.然而,生成具有适当特异性和效率的 ZF-TF 和 TALE-TF 需要仔细设计和测试。重要的考虑因素包括靶启动子内 DNA 结合位点的位置、核苷酸序列和独特性;激活域的选择;和脱靶效果。合成诱导型启动子可以与合成转录因子配对,以实现在空间和时间上特异性和高水平的生物制品合成。
先进的 DNA 组装和合成
为更广泛的应用设计植物需要将多个基因或整个途径引入植物基因组。我们实现这一目标的能力受到依赖于多轮转化的传统方法、传统育种方法和位于多个基因座上的转基因的高度限制。到目前为止,通过多个连锁或非连锁基因的共转化,已在一些植物物种中成功实现了多基因转移。这种方法允许将 4-9 个基因整合到单个转基因系中,无论是否借助植物育种,用于代谢工程或多聚体蛋白复合物的生产3.
在单个转基因载体中组装和合成大 DNA 分子或多基因为多基因转移提供了一种替代方法。在这种情况下,高效构建需要无缝组装长 DNA 模块,无论是否从头合成较小片段的 DNA。~1–3 kb 长的 DNA 片段的商业合成是常规的。这些片段的无缝组装(见下文)已经可用于生成超过 10 kb 的分子,并且从理论上讲,可以产生的 DNA 构建体的大小没有限制。使用当前的 DNA 合成技术,整个植物基因组的从头合成是遥不可及的,但合成小的人工染色体并绕过克隆步骤是可行的。还有一些新工具可用于更高效的 DNA 组装,或同时用于 DNA 组装和转化(例如多轮体内定点特异性组装 (MISSA) 和二元细菌人工染色体 (BIBAC) 的使用(如下所述)。
最近开发的 DNA 组装方法已应用于细菌系统,未来可用于植物。这些方法依赖于标准化的限制性内切酶组装方法或不依赖于序列的重叠技术(表 1)。标准化的限制性内切酶组装方法使用 II 型限制性内切酶并产生一组可互换的 DNA 部分。在这些方法中,BioBrick33和 BglBrick34方法分别留下 6 bp 或 8 bp 长的“疤痕”,这在某些构建体中可能存在问题,因为它们可能导致框外翻译或添加不必要或不需要的氨基酸。相比之下,GoldenGate 组装方法使用归巢核酸内切酶生成相邻片段的无疤痕组装35.重叠组装技术使用特异性重组酶或“咀嚼退火”方法,该方法涉及将一条 DNA 链消化回去,在片段末端产生突出端,以便在不连接的情况下退火。此类方法包括 Gateway36、尿嘧啶特异性切除试剂 (USER)37输液38、序列和连接酶非依赖性克隆 (SLIC)39和 Gibson 组件40.在这些方法中,Gibson 组装方法显著提高了组装大 DNA 分子的效率,例如,用于组装 1.08 Mb 分枝杆菌 JCVI-syn1.0 基因组,该基因组从 ~5-7 kb 合成的重叠片段开始40.与限制性内切酶组装方法相比,这些重叠组装方法不适用于具有重复序列的 DNA 片段的组装,重复序列将成为重组的靶标,并可能导致缺失或重排。
除了这些组装方法外,还发布了几个自动化和组装软件包,极大地帮助了基因组装。例如,当给出初始序列列表时,j5(参考文献 41)软件对于使用 SLIC、Gibson 和 GoldenGate 方法设计装配策略非常有用。此外,最近还开发了一种标准化的组装系统 GoldenBraid,专门用于植物合成生物学42;它通过将一次性多部分组件转换为可重复使用的复合部件来扩展 GoldenGate 克隆系统的功能。
使用大型构造进行转换
多基因转移到植物中使研究人员能够导入整个代谢途径,表达多聚体蛋白质复合物,并设计遗传元件和调控层次结构3.大 DNA 构建体和多基因可以通过细胞器或细胞核转化整合到合适的植物宿主中。然而,在我们看来,人工染色体为将长外源 DNA 整合到植物中提供了最有前途的转基因技术,尽管该技术的拟议潜力尚未实现。
细胞器基因组转化。同源重组介导的细胞器转化使得将基因簇或未连接的基因转移到单个预选基因座中成为可能。在这种方法中,构建体的两侧是转化载体中的两个质体序列,这些序列可以通过生物列表学或通过原生质体的聚乙二醇处理递送到质体基因组中43.质体基因组中这种整合的“巨位点”允许非孟德尔(即大多数物种的母系)遗传共同递送的基因,防止花粉介导的转基因在大多数物种中的传播,并避免许多潜在的不需要的表观遗传效应44.由于植物细胞中存在大量质体拷贝(即转基因拷贝)并且由于没有基因沉默,转质体植物已被证明可以稳定地高水平表达转基因。质体转化已被推广为生产合成重组蛋白和药物以及代谢途径或害虫抗性工程的特别有效的方法45.然而,质体转化尚未实现其主要承诺之一——通过同源重组对代谢途径进行多基因工程。
此外,由于质体转化技术不适用于许多物种,因此这种方法仅成功应用于少数作物(如烟草)的农艺性状工程44,46黄豆47土豆48番茄49生菜50,51甜菜52茄子53胡萝卜54油菜55和卷心菜56.最近,这种方法的使用已经扩展到茄科之外,其中进行了最具开创性的质体转化。然而,质体转化的宿主特异性仍然是一个技术挑战,这种方法对于大型构建体的转移仍然不可行。
核基因组转化。核基因组转化现在在大多数经济上重要的植物物种中广泛进行。多个基因也通常通过迭代过程堆叠在转基因植物中;也就是说,具有额外基因的转基因植物的连续轮次杂交或连续转化。然而,这些迭代过程很费力,并且容易在后代中分离转基因4.在植物核基因组中,大插入片段转化和多基因转移到单个基因座的最新进展已在一些植物物种中成功实现。这些方法包括病毒介导的传输57,59、使用具有转化能力的人工染色体 (TAC)60,61和 BIBAC62、MISSA 辅助转移63和植物人工染色体辅助转化64,65,66,67,68,69,70 元(下文讨论)。
病毒自然侵入宿主并复制,它们可以在宿主中自然表达许多病毒基因。病毒载体可以在细胞之间传播,并且具有不整合到宿主植物基因组中的吸引人的特点。目前,大多数使用病毒载体的植物生物技术工作包括在烟草或牵牛花中非转基因过量生产一种或两种重组蛋白57,58.然而,使用 IL-60 平台在番茄中表达了整个细菌操纵子59.
每个 TAC 载体都包含一个噬菌体 P1 复制起点、一个 Cre-loxP 重组系统和两个稀有切割核酸内切酶,允许在细菌中进行多轮重组,以转移高达 80 kb 的 DNA61.当用于拟南芥时,每一轮重组都会导致供体载体的主骨架以及冗余的 loxP 位点的整合,这些位点必须通过用归巢核酸内切酶消化来去除,这使得该方法效率低下。BIBAC 载体结合了根癌不动杆菌二元质粒和包含组装 DNA 插入片段的细菌人工染色体 (BAC) 的特征,允许将 150 kb 的 DNA 转移到烟草中62.BIBAC 辅助转换通常会导致稳定继承和表达的单个副本插入事件71.BIBAC 的一个缺点是质粒骨架序列可能转移71.
MISSA 使用细菌偶联转移和两组体内位点特异性 λ 噬菌体重组事件进行多基因转移。该系统由细菌供体和受体菌株以及基于 TAC 或 BIBAC 载体的相应供体和受体载体组成。它允许在转化为水稻之前在供体菌株内进行完全体内多基因转移和组装61.一个缺点是根癌曲霉的质粒可能不稳定63.然而,这些方法(即 TAC、BIBAC 和 MISSA)尚未在植物生物技术中得到广泛应用;因此,我们目前无法解决有关其效率和与特定作物相关性的问题。
事实上,任何根癌曲霉介导的转化系统的缺点是随机插入的固有性质(插入位置效应),因此当转基因整合时,内源性宿主基因盒可能会被破坏。随机插入也可能导致转基因的变异甚至沉默,从而不太可能以协调的方式共同整合复杂性状。使用基因组编辑和人工染色体可能会克服上述许多问题。
植物人工染色体。人工染色体作为替代转化和表达载体可能在下一代转基因技术中发挥关键作用。使用微染色体进行遗传转化消除了位置效应、内源基因的破坏以及与不需要的基因座的联系的问题。因此,植物人工染色体有可能允许基因堆叠、将完整的代谢途径工程到植物中、复杂性状的协调转化以及用于作物性状工程和育种的多个位点特异性重组和整合。
功能性微染色体需要三种类型的元件:着丝粒、端粒和复制起点。其中,考虑到它的大尺寸(由于存在各种重复 DNA 序列)、复杂性和表观遗传成分,着丝粒是植物中最有趣但知之甚少的遗传元件。尽管如此,已经开发了两种方法——自下而上和“自上而下”的方法——用于生成微型染色体72 (图 3)。
自下而上的方法涉及克隆染色体成分的从头组装,例如着丝粒和端粒序列、选择性标记基因和包含复制起点的基因组 DNA。尽管自下而上的方法很有前途73,需要对植物中的从头微染色体组装进行广泛改进。这些研究包括定义功能性染色体所需的最小长度,了解表观遗传特征和着丝粒重复序列的倒置阵列对染色体功能的影响,以及能够预测合成小染色体的减数分裂传递74.
现有的染色体可以被修饰以产生基于染色体的基因转化和传递载体,这种修饰提供了另一种有前途的生成人工染色体的方法——自上而下的方法64,69,70,75 元.在一个例子中69,一组 2.6 kb 的 A. thaliana 型端粒重复序列允许玉米染色体臂截断,所得染色体转化为玉米胚胎(图 3)。转基因端粒序列可能通过募集端粒酶和端粒结合蛋白来介导染色体“愈合”。此外,端粒序列的两侧可以是未来位点特异性重组事件的位点,例如由 Cre-loxP 系统或 FLP-FRT 系统介导的位点66,68,70,76 元.
由于端粒介导的 A 染色体截短可能导致大量基因丢失和基因组不稳定,因此自然存在或新创建的多倍体可能通过 A 染色体的端粒截断为染色体工程和植物育种提供理想的平台68.或者,B 染色体可能成为端粒截断的有利靶标,因为它们是可有可无的。工程化的 mini-B 染色体已经忠实地代代相传,在玉米中的传播率为 12-39%70,必须提高这一速率才能使此方法在现场有用。因此,尽管微型染色体很有前途,但它们尚未在农业生物技术中产生相当大的影响。
精确的基因组编辑
在这里讨论的所有工具中,通过目标基因的位点特异性整合、缺失和/或突变进行基因组编辑可能对植物生物技术产生最大的影响。位点特异性重组酶和/或各种较新的工具可用于在植物基因组内创建 DNA 双链断裂 (DSB)。DSB 通过同源重组或易错非同源末端连接 (NHEJ) 进行修复。使用供体 DNA 可以突变目标基因组位点。工程化核酸酶,如锌指核酸酶 (ZFN)77,78,79,80 元或 TALE 核酸酶 (TALEN)81,82 (图 2b)可以设计并用于在几乎任何特定基因组位置生成 DSB,以促进基因组编辑。FokI 核酸内切酶的非特异性 DNA 切割结构域可以与两种核酸酶的 DNA 结合结构域融合。核酸酶对在 DNA 结合后必须二聚化,以允许 DNA 在两个结合位点之间的间隔区内切割。TALEN 和 ZFN 单体之间的间隔区长度分别为 6-40 bp 和 5-7 bp。
ZFN 已用于拟南芥中,通过靶向 ABI4 基因来制造对 ABA 和葡萄糖不敏感的植物83、烯丙醇抗性植物(通过靶向 ADH1 基因)和种皮中缺乏花青素的突变体(通过靶向 TT4 基因)84.在烟草中,ZFN 通过靶向乙酰乳酸合酶基因(ALS SuRA 和 SuRB )能够生产抗除草剂植物)85.通过使用 ZFN 插入破坏 IPK1 基因来改变玉米种子肌醇磷酸谱86.最后一个例子,大豆基因组也使用 ZFN 进行了编辑,以突变参与 RNA 沉默的 DCL 基因,这导致在后续一代中重复基因中发生高效、可遗传和靶向的诱变87.
TALEN 的发展落后于 ZFN 近十年,但 TALEN 已迅速证明在植物生物技术中有用。在模式植物中,TALEN 已被用于改变烟草中的报告基因表达88,89并在拟南芥的 ADH 基因中引入插入和缺失 (插入缺失)90.TALEN 还用于水稻中 4 个基因和 Brachypodium spp 中 8 个基因的多个基因敲除。91.水稻中另一个有趣的应用是通过在水稻 11N3 基因的启动子中设计插入缺失来产生抗病植物,其表达通常由细菌病原体利用92.
在供体质粒的帮助下,通过同源重组的靶向基因添加,在玉米中完成了基因靶向、基因校正甚至基因破坏86.定点诱变的效率通常为 ~0.26–3%83、88、93取决于质粒递送方法、基因组插入位点以及目标植物物种和组织。ZFN 和 TALEN 为植物基因靶向和基因组编辑提供了严格的特异性31、83、86.两种核酸酶都可以区分两个旁系同源基因的结合位点之间 2-3 个核苷酸的差异85、87、89.尽管我们现在拥有 10 多年的 ZFN 经验,但 TALEN 才刚刚开始对植物生物技术产生影响。
此外,归巢核酸内切酶(或巨核酸酶)为靶向基因组修饰的位点特异性识别和 DSB 生成提供了替代工具94.这种巨核酸酶是同型二聚体,但也可以发育成形成具有大识别位点(通常为 20-30 bp)的不同工程单体的异二聚体。到目前为止,工程化巨核酸酶 I-CreI 和 I-SceI 已成功用于玉米的靶向基因组修饰95、96、97.在这些研究中,分析的 F 的靶向诱变效率在 1% 到 3% 之间1植物95,97.与 ZFN 和 TALEN 的模块化结构不同,大多数巨核酸酶中的 DNA 结合结构域与其催化结构域没有明确分离,这对蛋白质工程来说是一个挑战98.此外,现有巨核酸酶的使用高度限于具有预工程识别位点的基因座。
这三种类型的核酸酶可用于靶向产生可赋予抗性状的突变85、92、96,或用于特异性和永久去除转基因植物中不需要的基因或选择性标记86、91、97.它们还可用于基因堆叠、基因替换,甚至恢复紧密连接基因的双突变体。在供体载体的帮助下,它们可用于在不久的将来将合成设备(例如,新型基因“电路”)靶向基因组整合到植物中。工程化巨核酸酶、ZFN 和 TALEN 是具有巨大潜力的基因组编辑和转化工具。
基因组编辑工具箱中的最新工具是规则间隔的短回文重复序列 (CRISPR) 成簇,这为基因组编辑提供了一种替代机制。CRISPR 是包含多个短直接重复序列的基因座,这些重复序列与某些细菌和古细菌中的外源 DNA 短片段(称为间隔区)结合。当间隔区表达为前体 RNA 并随后被截短为短 CRISPR RNA (crRNA) 时,它们会引导 CRISPR 相关 (Cas) 蛋白随后攻击入侵病毒或质粒的匹配原始间隔区序列。在三种类型的 CRISPR-Cas 系统中,Cas9 属于研究最充分的 II 型 CRISPR-Cas 系统。Cas9 被认为是负责 crRNA 引导的外源 DNA 沉默的唯一蛋白质,在与 pre-crRNA 中的重复序列互补的反式激活 crRNA (tracrRNA) 的帮助下99,100.tracrRNA 与 pre-crRNA(称为单向导 RNA (sgRNA))的融合已被证明足以指导 Cas9 对靶 DNA 进行体外序列特异性切割101.到目前为止,Cas9 和 sgRNA 的共表达已被用于使用农杆菌浸润来靶向拟南芥原生质体或叶片中的 PDS3、RACK1b 和 RACK1c 基因102,使用农浸润的 Nicotiana benthamiana 原生质体或叶中的 PDS 基因103以及水稻原生质体中的 PDS 和 MPK2 基因104.农杆菌浸润的靶向诱变率约为 2.1-4.8%,原生质体测定的靶向诱变率约为 5.6-38.5%102、103、104,这表明它可能是这里讨论的四个基因组编辑系统中最有效的。CRISPR-Cas9 被证明可以区分同源基因之间序列中两个核苷酸的差异,用于 pre-crRNA 识别102.
转基因去除和限制
由于潜在的环境和人类健康风险,政府监管机构担心通过花粉或种子介导的基因流将转基因转移到相关植物物种的可能性105.因此,已经提出了转基因生物限制策略,例如雄性或雌性不育、母系遗传、转基因缓解和切除、脱模、分离和基因组不相容性,以限制或消除转基因从目标田地和作物中逃逸105.可选择的标记基因(通常是抗生素或除草剂抗性基因)也可以从最终产品中去除,因为它们在植物转化后不需要,并且这种去除还允许使用相同的选择剂进行后续轮次的再转化106.
可以使用位点特异性巨核酸酶、ZFN 或重组酶实现转基因去除或选择性标记基因切除,这些酶在转基因两侧的两个直接定向的工程识别位点上破坏 DNA106.一些酪氨酸重组酶,如 Cre、FLP 和 R,使用催化酪氨酸残基来介导切割,并已广泛用于转基因去除107,108,109,110,111,112,113,114 元;它们是双向重组酶,loxP、FRT 和 RS 是它们各自相同的 DNA 识别位点(图 4a)。这些酪氨酸重组酶不需要修饰或宿主特异性因子即可在植物中发挥作用。此外,一些丝氨酸重组酶(CinH、ParA、Bxb1 和 PhiC31)在缺乏辅助蛋白切除酶的情况下可进行不可逆的切除。CinH 和 ParA 重组酶使用 RS2 和 MRS 作为它们各自的相同识别位点115,而 Bxb1 和 PhiC31 作用于序列不同的识别位点 attB 和 attP116,117 (图 4b,c)并在切除后产生杂交产物位点 attL 和 attR。这些丝氨酸重组酶的识别位点比其已知的酪氨酸对应物长得多,这大大降低了与宿主基因组脱靶重组的可能性。在转基因两侧包含两个特异性识别位点的转基因植物可以与相应的重组酶表达植物杂交,也可以与相应的重组酶构建体稳定或瞬时地重新转化(图 4d)。或者,可以通过在含有转基因的构建体中表达重组酶来实现转基因去除,该构建体的侧翼是两个特异性识别位点(图 4e)。
这些新开发的位点特异性重组系统用于转基因去除的最新应用已在植物中报道,例如在烟草中118,119番茄120、 拟南芥121,122,123,124 元和小麦125,126.DNA 去除效率取决于重组酶与识别位点的结合特异性、植物基因组中位点的独特性和切除效果。例如,CinH-RS2 重组酶系统因其高效和长 (119 bp) 识别位点而备受青睐118.如果转基因性状的切除可以以 ~100% 的效率进行,以生产无转基因的花粉和种子,那么转基因生物限制应该对作物改良有很大帮助127.
未来前景
植物生物技术的一个主要目标是继续人类驱动的作物进化,以实现更高和更可持续的粮食产量。基因工程使作物改良(包括抗虫害和其他输入性状)得以实现,从而改善农业并产生简单的产出性状,例如单一的药物蛋白。然而,植物生物技术的巨大进步将需要比迄今为止广泛使用的工具更精确的工具。如上所述,常规的转化方法受到随机转基因整合、拷贝数变异和基因表达不精确等问题的困扰。我们不确定可以整合到植物中的 DNA 长度上限,但鉴于它们的基因组很大,很明显植物可以耐受大量的 DNA 添加。尽管如此,当几个基因被引入植物基因组时,代谢负荷及其管理可能会成为一个问题。此外,靶向基因组修饰以及植物人工染色体和基因组仍远未在大多数学术或工业实验室中常规使用。对于植物生物技术面临的“简单”和“困难”问题,有很多理由相信科学障碍将得到清除。一些简单的问题包括“调整”转基因表达和基因组编辑,最近的各种突破性技术正在帮助解决这些问题。掺入大量 DNA 的难题可能需要时间来解决,但有各种基于仿生学的工具开始提供解决方案。如果大自然可以在一个“包裹”中移动数百个基因,那么也许科学家们也能够找到一种方法来做到这一点。
系统生物学的发展允许对生物系统和过程进行建模,并提供了这些过程的系统级视图。全基因组分析和计算研究的进步将使人们更好地了解复杂的调节和代谢途径。技术进步的下一次迭代将取决于我们如何利用系统生物学来发现和更好地了解可以使用新遗传工具进行修饰的基因和通路。
此外,我们正处于实现植物合成生物学的风口浪尖。合成生物学致力于使用合成工具替换或重新配置自然界中发现的遗传成分。其中一些合成工具是对旧工具的增量改进,例如在植物生物技术中取代天然启动子的合成启动子。其他工具,如合成 TALENs,对于植物生物技术来说是全新的,现在才开始实施。此外,其他合成生物学系统,如合成电路和合成基因组,已经在更简单的微生物系统中设计和实施,尚未应用于植物。然而,合成生物学的概念及其许多组成部分可以转移到任何生物体中。我们可以将用于设计和改变微生物的工程原理,以及用于构建表现出可预测行为的人工生物系统和设备的原理应用于植物128.事实上,这里回顾的许多高级工具可能应该被视为第一代植物合成生物学成分,例如用于靶向调节基因表达的合成启动子和合成转录因子。使用合成启动子的一种替代方法,例如上述植物感应示例,将涉及设计从头电路,然后将其设计到植物中——这比简单地实施合成诱导启动子要复杂得多。到目前为止,这种方法的最好例子是为炸药的植物感应开发的 designer 电路129.在该回路中,2,4,6-三硝基甲苯 (TNT) 分子形式的细胞外配体被周质结合蛋白感应,周质结合蛋白为此目的进行了计算重新设计,并通过转基因拟南芥中合成组氨酸激酶介导的信号转导途径与基因表达相连(图 5).我们现在正在实现用于基因组修饰和转基因生物限制的组件工具包的增加。目前应用于植物的一个例子是使用 CRISPR-Cas 系统进行 RNA 可编程基因组编辑103、104、105.第一个合成植物基因组的产生可能还需要几十年的时间,但植物人工染色体是朝着这个方向迈出的一步。
令人鼓舞的是,大量私人和公共资金正被用于推进植物合成生物学。例如,美国能源部高级研究计划署-能源 (ARPA-E) 最近为其工程植物替代石油 (PETRO) 计划资助了十个项目130.总共提供了 36 万美元用于改造生物能源原料以生产可用作即用型燃料的新型化合物的项目。一个例子是向伊利诺伊大学提供超过 3 万美元的赠款,用于改造甘蔗 (Saccharum spp.) 和高粱双色,以提高光合作用和石油生产效率。
然而,此类项目还提出了其他重要挑战,特别是在生物安全和政府监管方面。植物合成生物学和生物技术可能会解决一些生物安全问题,但它们也可能放大现有的担忧,因为作物中操纵的 DNA 和蛋白质越来越多。政府生物安全法规可能被一些人认为已经过时且过于繁重131需要现代化,以免压制先进工具和合成生物学可能为植物农业带来的创新。使用工程核酸酶结合生物限制技术的靶向基因组修饰有望逐渐缓解公众对外源 DNA 和作物随机整合的担忧,并促进转基因作物的放松管制。