nature genetics | 重新布线基因网络以实现植物改良

2025-01-04 17:51   湖北  

摘要

气候变化和新技术的有限采用对作物高生长和高产、营养质量和材料生物生产的期望受到了挑战。在这里,我们回顾了在特定细胞中发育和响应时间内分析和模拟基因调控活动的方法的最新进展,这揭示了植物表型变异的基础:将关键调节因子重新部署到新的环境中,以及它们重新利用以控制不同的基因。新的合成生物学工具允许对转基因进行可调谐的时空调控,而最近的基因编辑技术能够操纵天然基因的调控。最终,了解基因电路如何连接以控制不同植物物种的形式和功能,并结合重新连接该电路的先进技术,将为我们在农业、能源和环境方面面临的最大挑战提供解决方案。

主要

植物对地球上的人类生活至关重要。从全球范围到社会和文化实践,它们都发挥着重要作用。它们调节全球大气中的 CO2和氧气水平,为我们的城市降温并滋养我们的身体。与动物一样,植物天生就会对不同的环境线索做出反应,这使它们能够在不断变化的环境中茁壮成长。然而,植物在决策方面与动物在重要方面有所不同。首先,植物缺乏中枢神经系统来解释和响应刺激。其次,植物不断发育,维持称为分生组织的多能干细胞种群,这些细胞在植物的整个生命周期中分化并继续产生新的地上和地下器官,这与大多数动物不同,它们可能会继续扩大大小,但具有决定性的身体计划。这意味着植物可以通过改变其发育来响应环境线索或挑战。虽然动物可以通过影响行为的神经元网络对其环境做出反应,但植物的反应在其基因组中是硬编码的,并由基因网络组成,这些基因网络在特定环境中通过信号通路打开和关闭,以调整发育和生理学。

对这种可塑性背后的基因调控回路的深刻理解为应对我们这个时代的重大挑战提供了独特的机会。气候变化导致更多极端和频繁的天气事件,包括干旱、洪水和温度波动,这些事件已经降低了作物产量1,2,3.肥料的使用效率低下,对水生生态系统造成破坏,其生产不可持续,南半球的许多小农户负担不起肥料的使用费用4,5.值得注意的是,植物已经适应了在各种甚至极端的生态系统中茁壮成长。了解这种性状变异和可塑性的遗传、发育和生理机制,为作物改良策略提供了重要的见解3,6,7.

了解将环境线索整合到发育和生理决策中的基因调控回路只是操纵所需性状的第一步。众所周知,特定基因会随着时间的推移在特定细胞中被条件性编程。提供 DNA、RNA、蛋白质和代谢物读数的单细胞技术正在迅速放大这种理解,但转基因作物的广泛部署主要局限于传达除草剂耐受性或害虫抗性基因的组成型表达产生的性状。由 CRISPR-Cas 基因组编辑和合成转录电路实现的技术策略提供了一种以新方式和特定细胞操纵基因调控电路的途径,这可以跨物种移动弹性和生产力机制,或增强或以其他方式设计现有电路。在这里,我们回顾了定义和操纵基因调控回路的最新发现,这些回路可用于改善不利环境中的适应性或在生物经济中开发植物性解决方案。

定义植物基因调控网络

转录因子 (TFs) 是与特定 DNA 序列(TF 结合位点;TFBS) 在启动子或基因区域8,9以及促进、阻止或微调一个或多个基因的转录。许多植物 TFs 的 TFBS 因高通量测定而为人所知,包括蛋白质结合微阵列和 DNA 亲和纯化和测序 (DAP-seq)10,11.TF 的 DNA 结合结构域通常很保守;因此,跨物种保守的 TF 可以按同源性分组,并且可以推断出相关的 TFBS12.在最简单的层面上,转录的促进或预防主要是通过 TF 或相关蛋白的激活结构域或抑制结构域实现的,这些激活结构域募集或阻止转录机制募集到转录起始位点(图 D)。激活和抑制结构域更难识别,并且在蛋白质序列水平上不太保守,但最近的工作已经开始系统地表征植物 TF 中的这些结构域13.TF 本身由基因编码,因此受其他 TF 调节。这种基因调控逻辑可以在系统级别表示为基因调控网络 (GRN),其中节点代表基因,包括 TFs,它们由代表调控的边连接(图 D)。1a,b)。这种抽象需要简化其他级别的基因调控控制(转录后和翻译后),这些控制可以存在于 GRN 的节点内。这些转录后控制模式可以不成比例地影响 TFs,特别是通过 microRNA 介导的转录物降解14和上游开放阅读框的翻译控制15,16.


图 1:基因调控网络架构。

a,简单基因调控网络 (GRN) 模型。TF 以特定短序列 (TFBS) 结合靶标的 DNA,并通过激活结构域 (AD) 促进或通过抑制结构域 (RD) 阻止基因的转录,包括编码其他 TF 的基因。转录和加工的 mRNA 的编码序列 (CDS) 可以翻译成在细胞中具有功能作用的蛋白质。b,以 a 表示的网络的简化版本,形成非相干前馈循环的基序。c, GRN 随时间变化的理论活动,其中 TF A 由信号打开。这起到脉冲发生器的作用,因为基因 C 只有在被 B 抑制之前才活跃。d,一种理论上的分层网络,其中每个节点(圆圈)的大小使用 PageRank 算法通过其连接进行加权。对于 GRN,这将显示可能是上游组件的驱动程序或高级 TF 作为较大的节点。数据来自 ref.99.

全尺寸图像


从功能上讲,有两种主要模式用于推断 GRN。第一种方法是考虑转录组数据。TF 及其靶标通常是共表达的,并且 mRNA 丰度跨时间、组织、发育阶段或条件最能预测靶基因丰度的 TF 队列作为其调节因子17.单细胞和单核转录组数据为在精细尺度上绘制这些关系提供了机会,特别是当细胞身份在整个发育过程中发生变化时18.第二种方法是考虑蛋白质-DNA 相互作用数据,这些数据是通过 DAP-seq 的直接证据捕获的,染色质免疫纯化,然后是高通量测序 (ChIP–seq) 或酵母单杂交方法,或者通过搜索与已知 TFBS 的序列匹配来间接捕获11,19.其中,只有 TF ChIP-seq 评估天然染色质背景下的 TF 结合,尽管通量较低19.DAP-seq 具有捕获独立于染色质状态的潜在结合位置的优势,并且还可以通过更新的双 DAP-seq 方法表征多个 TF 的同时结合20.最终,通过考虑哪些 TF 既结合近端 DNA 又能预测其表达,结合这些方式可以更好地解析 GRN21,22,23.

其他全基因组表观基因组数据可以缩小 DNA 的调控区域,包括通过测序检测转座酶可及染色质 (ATAC–seq) 获得的区域24.这种方法可识别通常与功能性 TFBS 一致的开放染色质区域,并已在单细胞水平上广泛实施25.ChIP-seq 可识别基因区域核小体上的组蛋白修饰,还可以指示活性或抑制的转录状态26,27.一个前沿是识别启动染色质状态变化的先驱 TFs,以完善与染色质可及性和 TF 结合的因果关系。一个例子是 LEAFY,它通过与核小体 DNA 结合和募集染色质修饰物来控制拟南芥芽分生组织中的营养到生殖生长转变28,29.系统鉴定这类具有先锋活动的特殊 TFs,这已在哺乳动物系统中开始30,最终将增强对 GRN 的理解。

GRN 的架构

网络的固有结构可以揭示它们的功能(图 D)。1). 网络模体,节点子集之间的特定连接模式,可以在信息处理中发挥特定的作用。例如,前馈循环网络模体是可以在网络中连接三个节点的一种方式。正如在细菌和酵母中所表征的那样,由激活剂、阻遏剂和靶标组成的不相干前馈环(图 D)。1b) 可用作脉冲发生器;如果外部提示激活了 A,则 C 将被激活,直到 B 被转录并翻译成,然后按下 C31(图 .1c). 连贯的前馈环(蛋白 A 激活 B;A 和 B 激活 C)可以反过来充当“持久性检测器”,其中激活 A 的信号必须保持在或高于某个阈值,以确保 B 的合成足以激活 C。这种持久性现象在细胞命运承诺中可能很重要:前馈环在木质部发育的调节中很丰富,木质部是将水和养分从根系输送到植物身体的维管组织32.TF 血管相关 NAC 结构域 7 参与多个这些前馈环,并且足以激活拟南芥中细胞对木质部身份的双稳态开关行为33,与前馈循环的持久性检测器功能一致。在全球范围内,某些网络基序的富集或耗竭是生物网络的标志。事实上,人类细胞类型特异性 GRN 与绘制秀丽隐杆线虫神经元连接的网络具有相似的基序富集和耗竭模式34.

时间通常对 GRN 的功能至关重要。核心生物钟 GRN 是一个负反馈回路,由部分冗余的 MYB TFs 昼夜节律时钟相关 1 (CCA1) 和晚期细长下胚轴 (LHY) 组成,它们激活调节因子 CAB 表达 1 (TOC1) 的时间,随后抑制 CCA1 和 LHY35.该模块充当时间敏感型守门人,以允许或限制 GRN 在一天周期内的活动。对于许多基因,对热的反应大小随一天中的时间而变化36.在更精细的时间尺度上,GRN 中的级联反应(TFs 的连续激活)暂时调节拟南芥中对氮可用性的反应。在这里,通过精细的转录分析、TFBS 富集分析和 GRN 构建,可以建立在 2 小时内级联的转录调控层次结构37.瞬时性的另一个例子是 TF bZIP1,它对氮的调节基因比它稳定结合的基因多得多。它通过所谓的“打了就跑”工作,与 cis 元件瞬时相互作用以促进转录,同时许可启动子进行与共存 TFBS 结合的其他 TF 的活动38.瞬态响应网络对于调整对外部线索的响应可能是必不可少的。

通常,预测网络包含大量 TF,需要进一步分析以确定哪些是最关键的组成部分。在生物系统中富集的网络基序已被用于通过优先考虑更频繁参与具有功能重要性的基序的 TF 来识别植物中的重要调节因子39.可以实施其他网络科学方法来识别全球 GRN 的重要节点。例如,使用 PageRank 算法预测驱动程序 TF40在小鼠胚胎网络中41.这种方法是为了确定搜索引擎结果的优先级而开发的,涉及沿网络边缘的计算重新分配权重(在网站的情况下,是超链接;对于 GRN,则为 TF-目标基因相互作用)。通过使用表达值初始化网络,然后运行 PageRank 算法,与表达基因有更多连接的 TF 获得更高的 PageRank 分数,而这些 TF 上游的 TF 获得更高的 PageRank 分数41(图 .该方法用于预测水稻木质部发育的关键调节因子,从拟南芥中恢复与许多关键调节因子的直系同源物42.如果我们假设 GRNs 的结构使其能够在发育和反应调节中发挥作用,这可以指导表型调节因子的功能鉴定。此外,控制不同发展或反应程序的网络结构(模序)的类型可以指导以所需的方式重新连接和增强这些网络的努力。

植物界的 GRN 守恒和变异

虽然植物在形式和功能上表现出巨大的多样性,但编码这种变异的网络背后的基因调控语法通常是保守的。进化发育生物学的一个核心概念是,顺式元件(主要是 TFBS)的存在与否比基因本身更具可变性,并且 TF 是一个工具包,其时空部署有助于生物体之间的形态变化43,44.定义跨陆地植物物种的基因调控程序的研究强化了在动物中发现的与跨物种同源 TFs 的 TFBs 同源的原则往往是保守的12,并且部署在植物基因组中的 TFBS 库在很大程度上相似45.这些保守的部分可能部署在类似的环境中,特定陆地植物器官的转录组显示出保守的身份,尽管程度不同,具体取决于器官和物种46.这种保护可能会突出保护更深入的开发中的受限步骤,例如草花序的发育47和根分生组织48.保存的 GRN 部分工具包能够应用跨物种的通用方法来研究和比较 GRN,其广泛的多样性反映了植物形式的多样性。

关键调节 TF 部署的差异可以解释发育形式的差异(图 D)。TF 及其靶标可称为“调节子”。调节子可以部分或全部保守,但控制它的 TF 的表达和位置的差异可以驱动重大变化。虽然拟南芥的根部只发育出一层皮层细胞,但大多数草都发育出几层(图 D)。该过程的关键调节因子是 SHORTROOT (SHR),它是 GRAS TF 家族的成员49.在拟南芥中,SHR 将一个细胞层从其在柱中的合成位点向外移动到内胚层,以调节内胚层和皮层的分裂和身份。通过单细胞 RNA 测序以及使用转录和翻译报告基因来绘制玉米根中直系同源基因的活性,结果表明 SHR1 在根内皮中转录,然后蛋白质通过皮质细胞层向外移动至表皮50.玉米和禾本科 Setaria viridis 中这些基因的突变体的皮质细胞层比野生型少,这表明在这些植物中观察到的转录结构域和随后的 SHR 蛋白质定位的差异有助于在这些物种中观察到的形态差异50.


图 2:驱动发育和环境可塑性变化的 GRN 进化模式。

a,对 GRN 的更改可能会对上游产生影响,例如关键 TF 的监管机构 (b-d) 的重新部署,也可能对下游产生影响,例如,目标的式监管变化 (e-g)。b,TF SHR 在玉米中的重新部署有助于额外的根皮质细胞层的发育。c,MYB TFs 从西红柿根内皮到番茄外皮的重新部署有助于屏障层控制水和养分流入植物的功能。d,通过生长素反应因子 (ARF) 介导生长素信号传导调节和通过 NIN 共生的 TFs 的侧根转录编程收敛在 TF 外侧器官边界结构域 16 (LBD16) 上,该结构域被重新用于豆科植物的结瘤。e,高粱等 C4 物种在叶肉中表达不同的光合基因程序,在束鞘中表达卡尔文循环,而在 C3 植物中,所有光合作用程序都发生在叶肉中。保守的束鞘 TFs,例如单指 DNA 结合 (DOF),激活 C3 水稻中的一组基因(浅蓝色圆圈)和 C4 高粱中的另一组基因,从而促进不同的代谢程序(棕色圆圈)。f, 在 VII 组 ERF TFs 的控制下,跨物种因短期淹没而上调的基因网络,在适应洪水的水稻中具有更广泛的调控67.每个节点代表两个目标。g, ABA 反应因子 (ABF) TFs 在拟南芥和耐盐亲戚 Schrenkiella parvula 中是保守的。在拟南芥中,这些 TF 激活生长素生物合成基因(棕色圆圈),从而提高生长素水平并减慢生长,而在 S. parvula 中,ABF 不调节生长素生物合成,从而维持生长。

全尺寸图像


不同调节子部署的另一个例子是驱动软木脂蛋白生物合成的转录网络(图 D)。软木脂是一种沉积在细胞壁中的蜡状聚合物,可提供扩散屏障,并在植物-环境相互作用中起重要作用51,52.在拟南芥根中,木脂蛋白沉积在内胚层中,并受一组冗余的 MYB 家族 TF 的调节53.西红柿没有亚化的内皮层,而是形成亚化的外皮层,即亚特化的外皮层54.其软木脂蛋白生物合成基因在外皮中表达,而不是在内皮中表达,并且具有富含 MYB TFBS 的启动子,表明同源 MYB 也优先在外皮中表达,调节这种下层化4854 元.这提供了转录调节因子维持保守靶基因的一个例子。存在其他下层化模式,包括水稻,它具有下层化内皮和依赖于环境的下层外皮42,55,也可能是由于 MYB 调节因子的不同部署。事实上,调节因子重新部署到新的细胞类型可能是跨物种细胞分化的常见模式。使用单细胞和单核 RNA 测序,然后在禾本科玉米、S. viridis 和高粱中进行 GRN 推断,15 个调节子在所有三个物种中都显示出相同的细胞类型特异性,而 50 个调节子交换了细胞类型56.一个例子是粘液相关基因调节子,从皮层中的祖先表达重新用于在玉米小柱中表达。

调节剂重新部署的另一个例子发生在根瘤的发育中,根瘤是豆科植物的根器官,能够与固氮细菌共生。在蒺苜蓿和莲花中,共生信号通路收敛于侧根发育调节性外侧器官边界 (LOB) 结构域 TF LBD1657,58(图 .首先拟南芥中表征,生长素反应因子 TFs 促进 LBD2 表达以调节侧根形成59.在一项特定于结节形成的创新中,共生驱动的 TF 结节起始 (NIN) 也激活 LBD16,驱动促进细胞增殖的 GRN57,58.在这种情况下,调节器的重新部署可能是一种更可取的适应模式,因为将程序重新用于侧根启动会产生一个输出,只需要适度的调整即可产生结瘤,这表明这种重新布线可以被复制以在非豆科植物中设计这种共生关系。

变化不仅限于监管机构的重新部署。GRN 重新布线还涉及靶基因的式调控变化。例如,C4 光合作用在较低的大气 CO 下作为一种更高效的固碳模式反复进化2来自祖先 C3 光合作用物种的浓度60.在 C3 植物中,碳固定主要发生在叶肉细胞中;然而,含有 CO2,也与 O 反应2在光呼吸中,限制了固碳的能力60.在 C4 植物中,这种羧化反应位于相邻的束鞘细胞中,代谢“泵”浓缩 CO2在这些细胞中,减少光呼吸60.这种代谢区室需要光合作用基因表达的特定空间模式,这在祖先状态中是找不到的60(图 .虽然许多调节进化模式可能产生这种新的分配,但最近的证据表明,C2 草种中的靶基因获得或丢失了 TFBS,这使它们受到细胞类型特异性表达保守的 TFs 的调控。参与跨物种光合基因调控的一个关键 TF 家族是 GOLDEN4-LIKE (GLK) TFs61.最初,这些 MYB TF 的复制和亚功能化似乎有助于 C4 进化;然而,最近对 S. viridis 中的 glk 突变体和互补系的分析表明,GLK1 和 GLK2 都保留了祖先功能62.跨 2 种双子叶细胞和 3 种单子叶植物的 TF 结合表明,很少有 GLK 结合的靶标是高度保守的,这表明广泛的式调节重新布线63.最近的研究通过单核 ATAC-seq 和 RNA 测序解决了 C3 和 C4 草中的基因活性,为迄今为止 C4 进化中的式调节重新布线提供了最明确的证据64,65.两项研究都确定 DNA 与单指 (DOF) TFs 结合是束鞘表达的关键驱动因素;然而,C3 水稻和 C4 高粱的束鞘转录组是所有细胞类型中差异最大的65.这些数据表明,顺式调控区的重塑有助于 C4 光合作用的进化,这一关键理解可能使 C4 代谢更有效地融入包括水稻在内的 C3 作物。

式调节布线不仅有助于物种之间固有的生理差异,而且在环境反应的背景下也很重要。例如,由跨物种的保守 TF 集精心策划的短期早期淹没响应网络在从半水生祖先驯化的洪水适应水稻中是不同的。在水稻、苜蓿、驯化番茄和旱地适应的 Solanum pennellii 的保守反应网络中,水稻更多地依赖于结合缺氧反应性启动子元件 (HRPE) 的 VII 族乙烯反应因子 (ERF) TFs66,67(图 .稻中的响应基因显示,与不太适应洪水的苜蓿相比,TFBS 的可及性增加更大,同时转录诱导更强67.长期浸没在水稻根系中的一个后果是根分生组织细胞中的细胞分裂停止,直到脱离浸没42,但与控制中央碳和厌氧代谢相关的短期缺氧反应网络的任何联系尚未在 GRN 水平上定义。最终,在耐洪作物中扩大 HRPE 网络有助于减少洪水造成的产量损失。

渗透应力适应是式调节重新布线的另一个例子。纵观十字花科植物,耐盐极端微生物 Schrenkiella parvula 对脱落酸 (ABA) 做出反应,脱落酸 (ABA) 是对干燥或渗透胁迫的反应至关重要的激素,不是像拟南芥模型所预期的那样通过减少根生长,而是增加根生长68.DAP-seq 方法确定直接响应 ABA 信号传导的 ABA 反应元件 (ABRE) 结合因子 (ABF) TFs 及其靶标 TFBS 在所检查的物种中是保守的。值得注意的是,发现顺式调控区域的序列变化有助于物种间响应的差异(图 D)。拟南芥中,ABF 激活生长素生物合成和信号传导,从而抑制根生长。相比之下,小小链球菌在许多生长素基因的启动子中失去了 ABF 结合,导致生长素信号传导减少并维持根生长67.这表明式调节变异可以产生影响跨物种发育的相反结果,并表明顺式或反式中 TF 活性的靶向修饰可能有助于促进作物在极端环境中的生长。

用于植物 GRN 操作的合成生物学

随着农杆菌介导和组织轰炸方法的出现,植物生物技术在植物核基因组中随机插入工程基因,从而爆发了。这些技术足以操纵植物 GRN。嵌合启动子-编码序列融合可以在特定的细胞或条件调节下添加新节点。如果使用的编码序列对 TF 进行编码,则新节点可以针对网络的下游原生组件。TFs 的组成型过表达有助于作物改良69,70,71,但有时施加时空控制可能更可取。例如,用水果特异性启动子从金鱼草中驱动 MYB 和 bHLH TFs 激活了番茄果实中的花青素生物合成,使它们变成紫色并丰富其营养品质72.合成生物学的最新发展极大地扩展了生成由模块化部件制成的大型多基因盒的能力,使更复杂的基因组添加成为可能73.

将正交(不与天然成分反应)和合成(自然界新)部分引入植物中以形成 GRN 已经很成熟。最早的植物演示使用来自酵母的 GAL4 TF 及其相应的 TFBS(上游激活序列)74;通过在内源性细胞类型或条件特异性启动子下共表达 GAL4,可以在时空上控制具有上游激活序列式元件的第二个基因。目前的正交和合成 TF 和启动子组合包括可调表达75和合成抑制76.这些工具支持逻辑门的工程设计,即对多个输入的存在或不存在做出具体和可预测的响应的系统。通过使用基于重组酶或整合酶系统的逻辑门,输入可以激活体细胞内稳定的遗传变化77,78.此外,使用特定蛋白质-DNA 组合的 16 或 <> 输入逻辑门可以瞬时起作用。单输入 BUFFER 门启动子,其中包含对合成 TF AmtR-VP<> 具有不同亲和力的操作员(细菌 TFBS),用于驱动拟南芥侧根分生组织细胞中不同水平的孤立根 (slr) 转录79(图 .3). SLR 的功能获得性突变(如 slr-1)导致主根缺乏侧根,以及对主根生长、头发发育和向重力的多效性作用80.通过将 slr-1 转录限制在周周期和侧根分生组织来避免这些表型。以这种方式,SLR 的定量调整产生了侧根密度的表型变异79,优雅地设计基因调控回路以控制植物形态。


图 3:合成生物学和网络操作的基因编辑方法。

a, 合成基因电路产生数量性状变异。拟南芥 GATA23 启动子 (proGATA23) 指导编码合成 TF AmtR-VP16 的基因的转录,TF AmtR-VP16 是一种细菌 DNA 结合 TetR 家族蛋白,与来自单纯疱疹病毒的 VP1 反式激活结构域融合,位于侧根分生组织中。通过使用 BUFFER 门的变体(减少或放大输入信号的工具),具有一个 (2×) 或两个 (1×) 个 AmtR 操纵子序列拷贝或具有各种突变(M3 到 M1)的拷贝的启动子,诱导不同水平的 slr-9 转录,编码侧根出现的显性抑制因子。这些水平引起了侧根密度的数量变化。WT,野生型。b,使用基因组编辑进行网络操作,此处以使用 CRISPR-Cas9 产生顺式调节变异的一般策略为例。分布在启动子上的 gRNA 种类与 Cas9 一起递送到植物中进行基因编辑。在调控区插入、缺失或倒位的结果基因型可导致 TF 调控的增加或丧失,从而改变靶基因的转录。c, CRISPR-Cas3 介导的 SlCLV3 基因编辑导致番茄果实大小的变化,与 SlCLV1 水平的降低成正比。d,水稻中 IPA1 的基因编辑增加了穗的大小,而分蘖没有多效性减少。IPA10 在芽基部表达,在那里它抑制称为分蘖的新分支的形成。它也在年轻的圆锥中表达,在那里它促进增殖,从而促进产量。IPA-Pro1,CRISPR 突变体,IPA1 启动子缺失,包括 TF AN1 的结合位点。去除这个 GRN 边缘会促进圆锥花序中 IPA<> 表达升高,但在芽基部中不会升高。

全尺寸图像


CRISPR-Cas 系统还为在植物中制造合成 TF 提供了肥沃的机会。使用与激活或抑制结构域融合的失活 Cas9 (dCas9) 蛋白,可以通过靶向向导 RNA (gRNA) 来调节转录,将转录抑制或激活募集到特定的内源基因81.由于 gRNA 可以在阵列中转录,因此单个构建体可用于一组靶基因的 dCas9 激活81.

这些正交系统依赖于内源性启动子;然而,这些启动子中很少有得到很好的表征,而且它们都局限于现有的序列空间和时空模式。此外,启动子序列可能相当大 (>2 kb) 并且对于工程设计来说很麻烦。因此,募集内源性 TF 的合成启动子可以扩展工程师可用的启动子库。一种方法是利用已知最小启动子上游的已知式元件或 TFBS,这些元件或已知在特定条件下募集单个 TF 家族。这种方法使生长素响应 DR5 的设计成为可能82、ABA 响应 6xABRE83、缺氧反应性 3xHRPE66和一般应激反应型 4xRSRE84发起人。一种有效的方法可能是在合成启动子中加入更多不同的 TFBS,因为它们通过组合来自不同 TF 家族的 TFBS 来实现比来自单个家族的相同数量的 TFBS 更高的转录水平。这种组合 TFBS 的策略已经产生了具有可预测强度的组成型或接近组成型合成启动子85.

测量启动子活性的通量是评估启动子功能的限制因素。STARR-seq(自转录活性调节区测序)和类似的“大规模平行报告基因检测”86帮助为合成启动子设计生成信息数据。在将 STARR-seq 应用于植物中时,测量克隆到报告构建体启动子区域的片段库的 DNA 序列的增强子活性,转染到原生质体或本氏烟草叶中,然后通过转录条形码的 RNA 测序量化片段促进转录的能力87.通过这种方式,可以量化拟南芥和玉米基因的所有核心启动子的增强子活性,并使用随后的机器学习模型来设计具有可预测强度的合成最小启动子88.然而,迄今为止,这些方法测量的是大量转录而不是细胞特异性转录,需要更多的工作来设计具有可预测的时空活性和强度的启动子。例如,通过基于动物单细胞 ATAC-seq 数据的机器学习方法实现了细胞类型特异性增强子设计89,90.评估这些方法是否也对植物有效以微调有益表型具有价值。

通过基因编辑操纵 GRN

CRISPR-Cas 可用于通过基因体中的功能丧失突变或启动子中的突变来操纵 GRN。在 TF 基因编码区诱导的双链断裂和产生的插入缺失可以从网络中完全删除节点。目前,功能丧失诱变是一种不精确但有用的遗传研究工具,基因冗余和不希望的多效性后果使情况复杂化。因此,更可取的是调整 TF 或其他靶基因在 cis 中的表达(图 D)。番茄中,肽CLAVATA3 (SlCLV3) 提供了一个负反馈回路,以限制芽分生组织中促进细胞增殖的 TF WUSCHEL (WUS) 的结构域91.用平铺的 CRISPR-Cas3 gRNA 扫描 SlCLV9 启动子的诱变,产生具有可变大小缺失和倒位的等位基因。这些在花分生组织中赋予了 SlCLV3 的表达谱,减少允许更高的 WUS 表达和更多的分生组织细胞增殖,从而产生更大的果实和更多的腔室92,93(图 .虽然调节 SlCLV3 的全套 TFs 尚不清楚,但几乎可以肯定,一些缺失导致了特定 TFs 的调节丧失。

CRISPR-Cas介导的启动子编辑已被用于许多后续研究,其中一些研究利用了染色质可及性信息来选择启动子区域进行靶向。水稻中 IDEAL PLANT ARCHITECTURE 1 (IPA1) 启动子区域的靶向缺失最终表明,删除 GRN 的单个边缘可以提高作物生产力94.在这里,作者从以下知识开始:消除 microRNA 靶向并广泛增加 mRNA 水平的 IPA1 功能获得等位基因赋予大圆穗和更高的产量,但减少分蘖95,96.通过用 CRISPR-Cas1 gRNA 平铺 IPA9 启动子,确定了在幼穗中促进 mRNA 升高的缺失,但在分蘖起源的芽基部中不会促进 mRNA 升高94.这些赋予了有利的大圆锥花序,而没有减少分蘖的权衡。在缺失区域内鉴定 TF AWNLESS1 (AN1) 的结合位点促使反式激活测定证明 AN1 结合 IPA1 启动子的该区域以限制其转录94(图 .另一项针对谷物和植物结构性状相关基因的水稻研究使用基于序列内容、染色质状态和进化保守性的预测框架来磨练调控区域。然后,作者使用 Cas3a(它比 Cas12 更有可能产生大缺失)来产生农艺相关的数量性状变异97.

这些开创性研究筛选了针对广泛调控区域的缺失,而不是精确的 TFBS。编辑技术的改进、对时间和细胞类型特异性染色质可及性的更多了解以及结合组学数据类型的 GRN 建模应该可以增强对有助于转录的空间分布、时间和振幅的式元件的预测,从而促进它们的编辑。这些还有助于预测哪些 TFBS 可以插入,以及在哪些位置对转录产生影响。可能需要这种控制水平才能将数量性状变异扩大到现有种质或物种之外,这对于气候变化下的适应性至关重要,气候变化创造了物种适应范围极端的环境。

前进的道路

植物功能基因组学、单细胞生物学和建模方面的进步将继续定义和完善 GRN。随着这些技术变得越来越普遍,生物学家将能够绘制出整个植物界变异背后的基因和网络。研究不同物种如何在自然环境或多样化的农业生态系统中做出发育和生理决定,有助于为作物工程提供信息,以获得从生物量和产量到可持续性和营养等广泛理想性状的信息。

这里描述的开创性工作为重新连接遗传回路提供了路线图,并牢记特定目标。首先,确定感兴趣性状的物种间或物种内的表型变异。接下来,使用先进的组学技术,在利用网络成分的结构、变异和保守性来识别所需表型所需的变化之前,预测这些特征背后的 GRN。最后,利用合成生物学和基因编辑来实现基因电路的有效重新布线。

虽然这种方法现在完全有可能,但进步势在必行。首先,我们在 GRN 水平上对不同物种的植物表型多样性的理解是一个前沿。在这里,植物遗传工程师可以与植物学家、生理学家和生态学家合作,寻找机会进一步扩展我们对 GRN 布线的了解。这应该包括与土著科学家和本地物种、农作物和地方品种的管理者进行平等和公平的交流,这为探索适应性遗传策略以及应用工程工具提供了机会。

其次,尽管 GRN 建模取得了进展,但现有研究仅表征了潜在 GRN 空间的小子集或特定背景。需要进一步开发建模方法以生成 GRN 的综合模型,其中包括它们在日常昼夜节律周期中的活动以及植物在自然、通常是压力环境中的整个生命周期。未来,随着组学资源跨物种的扩展,基因组组织和功能的规则可能会被定义到这样一个程度,即仅从基因组序列就可以自信地预测 GRN。同时,以靶基因(而不是 TF)为重点的分子方法来查询调节目标基因的 TFs 和 TFBs 队列98可以为工程特性提供宝贵的信息。

最后,重新连接遗传回路的工具必须扩展,以允许精确和有针对性的变化,而无需繁琐的转化和选择方法。对于顺式调控区域,GRN 建模的改进可以指导 TFBS 的靶向插入或删除,对基因活性的影响是可预测的,编辑技术的改进可以同时在更多的遗传位点上部署广泛的 GRN 重新布线。对于可以通过额外进展设计的合成式调节序列,可以纯粹通过募集内源因子来激活具有可预测细胞类型、环境和强度特征的转基因;目前,可用的 Synthetic Tools 允许工程师通过 Synthetic Circuit 调制一个或多个 Input。最后,重要的是要承认转录调控并不是控制基因活性的唯一模式,更不用说表型了。控制 DNA 甲基化、染色质结构以及 RNA 生物学的所有共转录和转录后步骤的因子和特征,包括 mRNA 修饰、成熟、翻译、螯合、衰变和长链非编码和 microRNA 的调控,都很重要,并提供了额外的工程机会。

总之,植物功能基因组学在基因调控回路发现中的应用,以及基因工程和合成生物学的新发展,为植物科学家和工程师提供了宝贵的机会,让他们有意义地、迅速地为解决我们这个时代的重大挑战做出贡献。


AIBioPioneer
分享人工智能,生物信息与植物生理的点点滴滴
 最新文章