摘 要
放线菌因其丰富的次级代谢产物而成为候选药物发掘的宝贵资源库,其蕴含的活性化合物包含聚酮类、非核糖体肽类、氨基糖苷类、萜类等,其中聚酮类化合物占比最大。大环内酯是聚酮类化合物的典型,常常被用作抗生素、抗肿瘤剂、免疫抑制剂、抗寄生虫剂等,具有重要的生物学意义。本文立足聚酮类大环内酯的生物合成过程,提出了从基因组重塑、调控通路重组、组合代谢工程及聚酮类化合物结构的衍生与多样化等多角度,实现放线菌聚酮类生物合成体系的优化,为工业规模生产聚酮类药物及其新型衍生物提供技术支撑。通过这种多维度的方法,结合最新的合成生物学使能技术,遵循绿色、环保、高效和可持续的策略,可以更有效地优化和增强放线菌中聚酮类化合物的生产,为未来药物的开发和生产提供新的可能性。
全 文
自从20世纪40年代Waksman等首次在放线菌属的灰色链霉菌(Streptomyces griseus)中发现链霉素(streptomycin,继青霉素后第二个生产并用于临床的抗生素),尽管对链霉菌源药物的研究已过去了80年,但高GC含量的放线菌仍然是次级代谢物的最重要来源,譬如β-内酰胺类、四环素类、利福霉素类、大环内酯类、氨基糖苷类和糖肽类等抗菌药物。最初,科研人员主要是从不同的土壤样品中分离获得产生活性化合物的菌株,并利用其培养基滤液或细胞破碎液进行抗菌敏感实验(抑菌圈实验)。随着分子生物学、生物化学、遗传学、生物信息学的发展和大型测序仪器的开发普及,扩展了能够应用于分离和鉴定放线菌天然产物的方法。例如对尚未探索区域或极端环境(如深海、沙漠、火山、极地等)进行采样,利用下一代测序技术(next-generation sequencing,NGS)和基因组挖掘技术对放线菌基因组进行精准和成本可控的测定。至今,已有百余种放线菌的基因组及其代谢产物被解析,研究表明极大部分的生物合成基因簇(biosynthetic gene cluster,BGC)包含了聚酮合酶(polyketide synthases,PKS)和非核糖体肽合成酶(nonribosomal peptide synthetase,NRPS),而聚酮类、非核糖体肽类及两者的杂合产物是放线菌次级代谢的主要产物。
聚酮类化合物生物合成酶可以分为Ⅰ型PKS(迭代化PKS和模块化PKS组成)、Ⅱ型PKS(迭代类PKS,合成芳香族聚酮)和Ⅲ型PKS(合成类黄酮化合物)三大类,部分放线菌来源的代表性化合物如图1所示。大环内酯类属于聚酮类天然产物最典型的代表,具有抗生素或抗真菌活性并用作药物。大环内酯类化合物通常由有多种化学结构的核心内酯环及不同官能团修饰的侧链基团组成,最常见的修饰基团是脱氧糖和氨基糖。它们在临床的治疗中应用广泛,如抗生素(红霉素、乙酰螺旋霉素、非达霉素)、抗肿瘤剂(埃博霉素)、免疫抑制剂(雷帕霉素、他克莫司)和抗寄生虫剂(阿维菌素)等。根据内酯环中的碳原子数量将大环内酯类化合物分为不同的组,例如十四元环(红霉素、柔红霉素、克拉霉素)、十六元环(螺旋霉素、吉他霉素、罗他霉素)、十八元环(tedanolide C、非达霉素)等。它们通常是由Ⅰ型聚酮合酶(PKS)生物合成内酯环,并且在多种后修饰酶(如糖基转移酶、甲基转移酶、单加氧酶、细胞色素P450、氧化还原酶、卤化酶等)的作用下生成最终结构。虽然聚酮类化合物都是根据类似的生物合成原理组装的,却呈现出各式各样的化学结构,主要是通过PKS的特异性、聚酮生物合成构建单元的变化以及PKS后修饰的多样性实现的。
图1 不同聚酮类化合物的结构及其主要产生菌株和分子潜在用途
1 大环内酯类化合物生物合成概述
聚酮化合物是结构和功能多样化的天然产物,其合成包含酰基辅酶A活化羧酸的系列重复的醇醛缩合,形成聚酮链骨架,随后再经过环化、芳香化或脱氧糖基化等过程。根据化合物结构特征可分为芳香族聚酮化合物和复合聚酮化合物,前者有放线紫红素、柔红霉素、四环素等,后者有红霉素、纳他霉素、雷帕霉素等。聚酮化合物由PKS催化形成,其催化过程类似于FAS(fatty acid synthase)催化的脂肪酸生物合成,涉及通过酰基辅酶A活化的底物之间的脱羧缩合,但是PKS的起始单元和链延伸的底物选择更加广泛,其通过选择性还原和脱水形成终产物的酮基、羟基、双键或亚甲基等功能团,也决定了手性中心的立体化学构型。
在以PKS划分的三大类聚酮化合物中,Ⅰ型聚酮分布最广、数量最多,其中大环内酯类是最为典型的代表。本文便从聚酮类大环内酯的生物合成机制切入,以新型的大环内酯类药物非达霉素的生物合成过程为例,介绍了Ⅰ型聚酮合酶和多种后修饰酶的催化机制。随后基于合成生物学和系统生物学的理念,提出了多种构建聚酮类化合物优质高产稳产菌株的策略。
Ⅰ型PKS通常由多功能、多模块酶组成,负责活化的辅酶A(CoA)硫酯(最常见的是乙酰基、丙酰基、丙二酰基或甲基丙二酰基辅酶A)的连续缩合,实现了聚酮链的延伸。其中,每个模块中都包含了一组酰基载体蛋白(acyl carrier protein,ACP)、酰基转移酶(acyltransferase,AT)和β-酮酰基合酶(β-ketoacyl-CoA reductase,KS)的功能域,这些功能结构域对聚酮的延伸至关重要,非迭代地催化一个循环的聚酮链延伸。用作底物的酰基辅酶A被AT结构域选择和激活,并转移到ACP结构域。KS结构域催化底物与延伸中的聚酮发生脱羧类克莱森(Claisen-like)缩合反应,在填充单元的α碳和ACP结合酰基链的硫酯羰基之间形成C—C键。除了这些最小的结构域外,还有β-酮基修饰结构域、酮基还原酶(ketoreduetase,KR)、脱水酶(dehydratase,DH)和烯酰还原酶(enoyl-reductase,ER),它们依次发挥功能,将β-酮基团还原为完全饱和的酰基链。随后,合成的聚酮链通过硫酯酶(thioesterase,TE)结构域卸载下来。之后在甲基转移酶(methyltransferase,MT)、酰基转移酶(acyltransferase,AT)、P450羟化酶(cytochrome P450 hydroxylase,CYP)、卤化酶(halogenase)等多种后修饰酶的作用下生成最终产物。图2展示了以非达霉素(fidaxomicin)PKS为例的大环内酯聚酮的模块化合成过程。
图2 非达霉素生物合成基因簇的模块化组装
(图中展示了不同延长单元的缩合和修饰,形成了糖苷配体骨架,然后通过不同的后修饰酶进行催化进一步形成非达霉素)
非达霉素是一种新型的大环内酯类药物,2011年经FDA批准在美上市用于治疗艰难梭菌感染。Xiao等基于序列分析和基因敲除验证阐明了原始生产菌株橘橙指孢囊菌(Dactylosporangium aurantiacum subsp. hamdenensis NRRL 18085)中台勾霉素B(tiacumicin B,fidaxomicin)的生物合成。本文作者实验室研究的德干高原游动放线菌(Actinoplans deccanensis)中非达霉素的生物合成,主要包括聚酮酸骨架组装、糖生物合成、糖基化、卤化、甲基化、羟基化、环氧化等过程。fadA1~fadA4这四个基因编码多模块Ⅰ型PKS,负责组装中心糖苷配基;加载起始单元丙酸酯后,另外三个丙二酸酯、四个甲基丙二酸酯和一个乙基丙二酸酯被缩合到聚酮链中(图2);异丁酰辅酶A、丙酰辅酶A和酰基辅酶A的合成可由FadC和FadD催化;此外,fadL编码的丙酰辅酶A羧化酶可能催化丙酰辅酶A形成甲基丙二酰辅酶A(methyl-malonyl CoA,MMal-CoA),fadK编码的巴豆酰辅酶A羧化酶/还原酶(crotonyl-CoA carboxylase/reductase,CCR)可能负责提供乙基丙二酰辅酶A(ethyl-malonyl CoA,EMal-CoA)亚基;FadA4模块8中的TE结构域负责聚酮链被释放并环化,产生非达霉素内酯环。内酯环经历了多次修饰,包括:C18和C20位的羟基化,它们分别由两种细胞色素P450酶FadP1和FadP2催化;鼠李糖在C11和C20位的取代,由两种糖基转移酶FadG1和FadG2催化;随后是糖的进一步被修饰,首先为了在C11位产生最终的4-O-异丁酰基-5-甲基-β-鼠李糖,C-甲基转移酶FadS2和O-酰基转移酶FadS6分别掺入甲基和异丁酰基部分;C20的糖也经过多次修饰,这部分的合成被认为是由基于丙酰辅酶A起始单元和3个丙二酰辅酶A(malonyl-CoA,Mal-CoA)扩展单元的迭代Ⅰ型PKS FadB催化的;然后,由FadF编码的酰基转移酶可以促进芳香族部分向C20糖的转移。通过O-甲基转移酶FadS5的作用实现对糖的进一步修饰,最后是卤化酶FadM,它负责将两个氯原子加载到非达霉素的侧链上。基因簇内唯一的一个调控因子FadR1通过识别保守序列与fadM、fadS2-fadC、fadA1-fadP2、fadE-fadF的基因间隔区发生结合,进而直接或间接地正调控非达霉素合成基因簇中近30个基因的表达。
2 放线菌合成生物体系重构策略
2.1 放线菌基因组重塑
研究表明,放线菌基因组的平均碱基数为8.5 Mb,包含20~30个生物合成基因簇,最常见的BGC依次为非核糖体肽类、Ⅰ型聚酮类化合物、萜烯和羊毛硫肽。虽然大多数BGC在实验条件下处于痕量表达或沉默状态,但也不排除某些非目标基因簇竞争聚酮类化合物的前体物质,或在后续培养基优化和工业放大的条件下激活的可能性,从而对目标化合物的高效生产及分离纯化造成困扰。因此,大规模敲除非必需基因簇,可以有效简化放线菌的代谢背景,提高聚酮类化合物的产量和质量。例如,Myronovskyi等删除了白色链霉菌J1074中15个生物合成基因簇(500 kb,占基因组的7.3%),得到了一个精简底盘Del14。白色链霉菌Del14拥有更简化的代谢背景,并且增加了衣霉素B2(tunicamycin B2)、吡啶基吡喃酮A(pyridinopyrone A)、肉桂霉素(cinnamycin)等异源基因簇的表达及产量。研究人员基于优良的聚酮类化合物底盘天蓝色链霉菌M145,敲除了十一烷基灵菌红素(undecylprodigiosin,RED)、钙依赖抗生素(calcium-dependent antibiotic,CDA)、Ⅰ型聚酮(cryptic polyketide,CPK)、Ⅱ型聚酮放线紫红素(actinorhodin,ACT)共4种抗生素,得到了天蓝色链霉菌M1146,然后在RNA聚合酶β亚基RpoB和核糖体蛋白S12编码基因中引入点突变,分别得到了天蓝色链霉菌M1152和M1154。他克莫司(FK506)、Ⅰ型聚酮tautomycetin及茴香霉素、Ⅱ型聚酮streptoketides等化合物均在天蓝色链霉菌异源底盘中得到了高效生物合成。在灰色链霉菌中,Gren等利用CRISPR技术删除了两个内源质粒、一个戊霉素(pentamycin)基因簇和一个未知的NRPS基因簇,共500 kb占基因组的5.19%,构建了一个生长速度更快、蛋白表达能力更强的异源宿主DEL2。
由于放线菌的遗传操作困难和生长周期较长,敲除所有非靶标BGC是不现实的,所以antiSMASH预测和转录组学(或RT-qPCR)分析的结合是快速鉴定主要副产物BGC的常用策略。将放线菌基因组提交至antiSMASH网站,在线预测分析出所有假定的BGC,并结合转录组学或核心基因RT-qPCR数据,筛选出高活性BGC,然后大规模敲除非靶标活性BGC,从而达到精简基因组和消除副产物的目的,最大限度提高靶标生物合成途径的代谢通量。该策略也成功用于改善白色链霉菌中盐霉素的产生。
生产菌发酵性能下降甚至丧失是工业放线菌普遍存在的现象,如在链霉菌中常以大于0.1%的孢子量的频率出现自发突变,通过诱变(如物理诱变和化学诱变)和非诱变(冷藏)处理均可以使菌株发生插入、缺失、突变等现象,而且在连续传代培养后,发酵菌株会经历退行性过程,影响形态和生理特征,并产生发酵能力受损的突变体,这些所谓的退化现象严重阻碍了实验室研究和工业生产。例如,发现黑色素产生菌Streptomyces reticuli中的不产生黑色素的突变体,其基因组丢失了色氨酸合酶编码基因,并且还存在DNA序列的扩增现象。同样,与产泰乐菌素的弗氏链霉菌(S. fradiae)相比,不产泰乐菌素的突变体在基因组水平上存在差异,其中包括负责泰乐菌素生物合成和抗性基因的缺失、插入序列破坏泰乐菌素基因簇和DNA可扩增单元的高拷贝串联重复。Roth等在土霉素生产菌株S.hygroscopicus JA6599的连续培养过程中发现,生长速率、限制性底物及培养温度等生长参数的变化会影响菌株的遗传稳定,并进一步影响土霉素产量的稳定性。既往的研究表明,上述基因组变异可能由不稳定元件介导,如移动遗传元件、核酸内切酶、整合酶和内源性CRISPR/Cas系统等。因此,基因组中存在的不稳定元件被认为是遗传不稳定性的主要驱动力,许多研究人员试图通过去除不稳定的遗传元件来提高菌株的遗传稳定性。
最近,本文作者观察到在生产非达霉素的德干高原游动放线菌基因组中引入额外的非达霉素BGC拷贝时表现出极端的遗传不稳定性,其主要特征是在连续传代过程中非达霉素的产生减少。通过删除德干高原游动放线菌YP-1中6个最大的基因组岛、1个内源性CRISPR/Cas系统和1个非同源末端连接修复系统,构建了具有更高遗传稳定性的菌株YP-D8。上述不稳定元件的大规模缺失使YP-D8能够稳定维持多个非达霉素BGC的存在,从而实现非达霉素的稳定高产。同样,通过去除一个0.7 Mb大小的非必需基因组区域来构建基因组减少的恰塔努加链霉菌突变体L321(Streptomyces chattanoogensis L321),该突变株显示出更高的遗传稳定性,并且在连续10次传代培养后可以稳定产生外源化合物。研究表明,缺失的0.7 Mb片段包含15%的特定插入序列,这可能导致遗传稳定性的提高。以上研究证明,大规模消除不稳定元件是改善菌株遗传稳定性的有效策略。
性状优良的底盘细胞的选择是合成生物学改造的开端。基于以上基因组重塑的策略(图3),研究人员构建了系列基于天蓝色链霉菌、白色链霉菌、阿维链霉菌等模式或工业的底盘菌株,并成功用于外源生物合成基因簇的激活或增产。
图3 基于多组学和生物信息学方法的基因组分析工作流程
2.2 调控通路重构
放线菌次级代谢过程调控体系是药物生物合成的“管家系统”,其调控通路比较复杂,包含途径特异性调控子、多效调控子和全局调控子(图4)。比如途径特异性调控子直接作用于特定的代谢途径,调控特定次级代谢物的生物合成;多效调控子通过影响细胞的信号传导系统或全局代谢状态影响多个代谢途径;全局调控子,有时候与多效调控子并提,是调控网络中的关键组成部分,它们可以调节细胞内多个代谢途径的活性。
图4 放线菌体内影响次级代谢的各层级调控和修饰降解作用
放线菌生物合成基因簇往往存在一个或多个调控基因,而其中对基因簇内DNA序列存在直接识别并结合,从而影响转录的基因被称为途径特异性调控因子(pathway-specific regulator)或簇内调控因子(cluster-situated regulator,CSR)。根据其对次级代谢产物的调控作用,可以分为正向和负向调控因子两大类。截止到目前,过表达正向调控因子和敲除负调控因子的策略已被广泛用于激活或提高次级代谢产物的产量。一些通路相关的调控基因编码特殊类型的调控蛋白,最常见的如链霉菌抗生素调节蛋白(streptomyces antibiotic regulatory protein,SARP)和LuxR家族的大型ATP结合调节因子(large ATP-binding regulators of the LuxR family,LAL),通常与Ⅱ型芳香族聚酮和Ⅰ型大环内酯类聚酮类生物合成密切相关。其中SARP是链霉菌中最常遇到的CSR,例如弗氏链霉菌中Ⅰ型聚酮泰乐菌素合成簇内的TylR;安氏链霉菌(S. ambofaciens)中Ⅱ型聚酮醌那霉素(kinamycin)合成簇内的AlpV;土霉素生物合成基因簇中的OtcR调控因子通过与oxyA、oxyI、oxyJ、oxyR和oxyS的启动子区域结合,激活了龟裂链霉菌(S. rimosus)中的土霉素生物合成,后续Yin等使用强启动子SF14过表达两个串联的otcR,得到的高产菌株土霉素产量是出发菌株的6.49倍。
LAL调控因子在许多放线菌中也被鉴定为CSR。LAL的特征在于N端有ATP/GTP结合结构域和在C端的DNA结合结构域,具有LuxR样螺旋-转角-螺旋(helix-turn-helix,HTH)基序。在冰城链霉菌中途径特异性调控因子milR的过度表达使得milbemycin A3/A4(十六元大环内酯类药物,杀螨剂)的产量提高了38%;德干高原游动放线菌中正调控因子fadR1的过表达导致非达霉素的产量提升了约400%;Zhang等同时过表达途径特异性调控因子fkbN和tcs7,将筑波链霉菌L19(S. tsukubaensis L19)中他克莫司的产量提高了89.3%;还有纳塔尔链霉菌(S. natalensis)中纳他霉素生物合成的PimR、委内瑞拉链霉菌(S. venezuelae)中吡咯霉素生物合成的PikD、白链霉菌中盐霉素生物合成的SlnR以及吸水链霉菌(S. hygroscopicus)中雷帕霉素生物合成的RapH等。这些SARP和LAL基因的缺失会使产生菌基本丧失聚酮合成能力,而过表达会导致聚酮产量显著提高。
除此之外,BGC外部存在一些全局性或多效性调控因子(global or pleiotropic regulator),但是与特定次级代谢生物合成基因簇相关的簇外调控因子往往难以筛选。目前,除了对常见的多效调控因子(如BldD、GlnR、WblA、PhoR等)敲除、回补及过表达来研究对次级代谢产物的影响,比较常用的策略是体外DNA亲和色谱纯化技术。通用的步骤是,用生物素标记的引物克隆靶标BGC内部途径特异性调控因子的启动子(或核心酶基因如大型聚酮合酶基因的启动子,或多条启动子的混合)序列,与链霉亲和素琼脂糖进行孵育结合,得到生物素标记的启动子序列与链霉亲和素琼脂糖的复合体,随后与放线菌的全蛋白破碎液摇动孵育,经过过滤、洗涤、洗脱、富集、酶解、检测、分析等步骤,筛选出覆盖率(coverage)或得分(score)靠前的调控蛋白,进行凝胶阻滞实验(electrophoretic mobility shift assay,EMSA)及敲除再验证,排除假阳性蛋白从而定向得到与目标天然产物密切相关的高层级调控网络。例如,Mao等利用生物素化的dptE启动子从玫瑰孢链霉菌(S. roseosporus)蛋白质溶液中分离纯化出达托霉素的正调控因子AtrA,其中AdpA又通过与atrA启动子直接作用,介导A因子信号通路正调控atrA的表达。Yu等在恰塔努加链霉菌中过表达纳他霉素生物合成的关键多效调控因子WblACH,产量提高了30%。
当然,链霉菌中特定调控蛋白的一些修饰(如乙酰化、磷酸化、泛素化修饰等)和降解效应(蛋白酶体降解)也与聚酮类化合物的生产密切相关。Fu等通过研究BldD的乙酰化修饰调控机制,增加了BldD对DNA的结合能力,从而提高了红霉素的产量。磷酸化作为一种常见的蛋白后修饰形式,已被发现可以影响天蓝色链霉菌中的氮代谢,从而间接调控聚酮类化合物的生产。De Crécy-Lagard等发现ClpX(酪蛋白水解酶ClpP的激活剂)的过表达能够激活变铅青链霉菌(S. lividans)中放线菌素的产生,并增加天蓝色链霉菌中放线菌素的产量。此外,在天蓝色链霉菌的蛋白酶体缺失株中过表达两个途径特异性基因redD和actII-orf4后,与原始菌株相比,十一烷基灵菌红素产量增加了3~5倍,放线菌紫素产量增加了9~30倍,这也表明抗生素的产生与降解系统密切相关。
虽然操纵调控基因可以快速高效提高天然产物的产量,但该过程仍存在一些需要关注的问题。由于放线菌中的调控因子众多,对于特定BGC的调控机制通常比较错综复杂,特别是对于广泛存在的间接级联调控,人们知之甚少。有时候,对调控基因的操纵会扰乱调控网络的平衡,导致目标产物产量的减少或杂质的生成。此外,当采用启动子工程利用外源筛选的强的启动子替代原位的天然启动子来促进限速酶的表达时,调控因子的保守结合位点通常会受到干扰,这可能会破坏固有的调控通路和网络,破坏基因表达量的平衡,最终可能导致目标天然产物的减少和同系物等杂质的生成。因此,为了最大限度提高目标天然产物的产量,应该更精准地协调启动子工程和调控网络,在异源底盘表达生物合成基因簇时,还可以结合“调控因子工程”策略,构建调控因子库,以适配异源基因簇的生物合成,实现更精准和灵活的生物合成途径控制。
2.3 组合代谢工程
2.3.1 酶的功能改造
很多放线菌在发酵的过程中,容易产生一系列结构相似的同系物杂质,譬如FK506和FK520(子囊霉素)、非达霉素(亦称台勾霉素B)和台勾霉素E等(图5)。这些副产物常常是由于酶催化的底物特异性差、催化位点特异性差、代谢流通路不均衡、前体供应不足等原因导致的,相较于生物合成基因簇外的旁支代谢途径的简单敲除,这部分的副产品更难去除。常用的一些方法,如:定点饱和突变和定向进化以提高催化过程的特异性,消除不需要的同系物或同分异构体;通过发酵液物质分离结构鉴定结合生物合成途径分析,确定过表达关键限速酶基因,发酵过程流加关键前体,实现目标化合物精准高效转化。
图5 放线菌聚酮类化合物及同系物杂质
定点饱和突变用于通过用其他19种氨基酸替换关键活性位点来改善酶的功能。例如,在FK506的生物合成途径中,AT4FkbB是一个非常重要的结构域,它可以同时使用AM-CoA(烯丙基丙二酰辅酶A)和EM-CoA(乙基丙二酰辅酶A)来生成目标产物FK506及其类似物FK520。分子动力学模拟和饱和定点诱变表明,酰基转移酶V187K突变可以提高其底物特异性并减少副产物FK520的产生[54]。此外,定向进化技术是通过模拟自然进化而发展起来的。将理性或半理性诱变与靶标筛选技术相结合,可以对酶编码基因进行修饰,以产生性能更高的非天然酶。例如,AveC在调节阿维链霉菌(Streptomyces avermitilis)中CHC-B1(多拉菌素)和副产物CHC-B2的产率方面起着重要作用。首先用DNA Shuffling设计aveC,从而生成一个突变库。然后,通过高通量筛选鉴定出携带10个氨基酸突变的突变体。该突变体显著提高了CHC-B1的产生,CHC-B2∶CHC-B1比例从1∶1下降到0.07∶1。在结核分枝杆菌中,Grabowska等发现分枝菌酸(mycolic acids)合成过程的酰基转移酶L-AT-Mas双突变体(M624V/S726F)表现出原来的MMal-CoA到Mal-CoA几乎完全倒置的特异性,底物Mal-CoA与MMal-CoA的比例提高了近60倍。然而,如何在定向进化实验中快速确定有益突变仍然是一个亟待解决的问题。
最近,新一代的蛋白质预测平台AlphaFold3(又称AlphaFold-latest,代码尚未开源)和可从头设计非天然蛋白质的Chroma(代码已开源)横空出世,可预测几乎所有分子结构和运用生成式人工智能模型创造可编程特性的新型蛋白质,毫无疑问这些人工智能技术的面世无论对药物设计还是蛋白质定向进化都有巨大的推动。Boiko等基于GPT-4的人工智能系统开发出“Coscientist”,它能够调用4个命令(谷歌、Python、文档和实验)来规划实验,通过智能检索、机器学习、远程操控和迭代优化复现了阿司匹林、对乙酰氨基酚和布洛芬等药物分子合成实验。Berquez等利用人工智能药物靶点发现引擎PandaOmics确定了胱氨酸贮积症细胞内的致病通路、优先治疗靶点及候选药物,结果显示雷帕霉素是治疗胱氨酸贮积症的有希望候选药物。“自动化科研”和“AI辅助药物研发”(AI drug discovery & design,AIDD)的2.0时代正在悄然拉开帷幕,随着软件方面如人工智能蛋白质预测和设计平台的相继问世,硬件设施诸如自动化液体处理工作站及Qpix系列高通量微生物克隆筛选系统等辅助蛋白进化仪的普及应用,辅以荧光蛋白(如绿色荧光蛋白GFP)、显色基因(如β-葡萄糖醛酸酶编码基因gusA)或特定生物传感器(如大环内酯传感器MphR)的表征技术,在未来可以更好地理解放线菌聚酮类化合物生物合成体系的复杂性,大大减少定向筛选高性能元件或放线菌高产菌株的人力物力。
2.3.2 改变关键酶基因剂量
除了产生同系物杂质,在生物发酵过程中一些结构基因的表达量不足也是天然产物合成的限制因素,常用的方法有过表达限速酶基因或对相应的酶进行定向进化增强酶活,从而达到提高目标化合物产量的目的。例如,红霉素(erythromycins,Ers)是一类具有广谱抗菌活性的大环内酯类抗生素,其中红霉素A(Er-A)是使用最广泛、最有效的临床药物。在很多工业菌株的发酵过程中,易产生Er-A∶(Er-B&C)比例约为3∶1的红霉素混合物,其中红霉素B和C是中间体红霉素D转化为红霉素A的催化过程不完全导致的,红霉素B和C的生物活性远低于红霉素A,且根据欧美药典标准它们在红霉素商业产品的比例要控制在5%以内。Chen等过表达关键限速酶EryK(P450羟化酶)和EryG(O-甲基转移酶)且控制EryK/EryG拷贝数为3∶2时,红色糖多孢菌(Saccharopolyspora erythraea)几乎不产生红霉素B和C,红霉素A的产量提高了25%。在Streptomyces fungicidicus中,Zhang等通过转录组学数据发现endC基因在恩拉霉素的生产阶段表达水平明显低于基因簇内的其他基因,于是在endC基因后插入一个硫链丝菌素抗性基因作为报告系统进行后续的随机突变育种,最终筛选到了产量提高2.31倍的高产菌株。在筑波链霉菌中,Chen等通过代谢组学分析,定位到了MMal-CoA合成关键限速酶基因PCCB1,通过过表达该基因并辅以异亮氨酸的流加工艺,将FK506的产量提升了56.6%。
2.3.3 生物合成基因簇的多拷贝
目前,生物合成基因簇的多拷贝扩增策略已成为提高天然产物产量的常见方法,在菌种改良和工业生产中发挥重要作用。目前,实现基因簇的多拷贝已有的三种具体方法分别是:同源重组介导的基因簇串联扩增、噬菌体位点特异性重组系统介导的基因簇扩增、ZouA介导的DNA重组系统。Nah等运用同源重组介导的多拷贝策略在Streptomyces sp. CK4412中实现了灰霉素(tautomycetin)生物合成基因簇的多拷贝,产量较野生型提高了14倍。Li等开发了一个“多整合酶-多整合位点”即插即用的工具包,通过对5-氧代米尔贝霉素BGC(72 kb)的多位点特异性整合(4个拷贝),在吸水链霉菌中实现了5-氧代米尔贝霉素效价从2.23 g/L增加到6.37 g/L的提升。Murakami等通过ZouA介导的DNA重组系统,伴随抗性筛选,成功把4~12个ACT基因簇拷贝导入了天蓝色链霉菌基因组,使得ACT的产量提升了20倍。
2.3.4 增强产物转运或菌体耐受
由于聚酮化合物大多都具有一定生物活性,如果在胞内过量积累也会对其产生菌自身生长带来影响或者会对其合成途径造成反馈抑制,从而限制其产量提高。ABC(ATP-binding cassette)转运蛋白可以将次级代谢产物排到胞外,解除其细胞毒性及反馈抑制,有效提高次级代谢产物产量。Qiu等在阿维链霉菌中高表达ABC转运蛋白AvtAB,使得8种阿维菌素同系物的生产水平均增加,其中B1a同系物组分水平增加了2倍,且阿维菌素的胞内外比率有显著下降。在S. rimosus中,高表达转运蛋白基因otrB和上调ABC转运蛋白OtrC的表达水平,提高了土霉素的发酵水平。在冰城链霉菌中,Chu等通过评估14种不同的转运蛋白的过表达效果,发现MiltAB2蛋白的过表达显著提高了胞外米尔贝霉素A3/A4的含量,并增加了29.1%的总产量。
2.3.5 增加前体供应
菌体内前体的含量及转化效率是决定次级代谢产物产量的关键因素,例如糖酵解、三羧酸循环、磷酸戊糖途径、氨基酸/核酸代谢等初级代谢过程是细胞内前体的主要来源。目前,主要通过关键酶基因的过表达、竞争代谢途径的阻断或外源喂养前体的策略来提高目标化合物的产量。Michael等在变铅青链霉菌中,敲除了磷酸戊糖途径(pentose phosphate pathway,PPP)中葡萄糖-6-磷酸脱氢酶的编码基因(zwf1和zwf2)或敲除6-磷酸葡萄糖酸内酯的编码基因(devB),阻断了PPP途径,从而使前体更多地流向糖酵解途径(EMP),提高了ACT的产量。光神霉素(mithramycin)是一种抗肿瘤和具神经保护功能的抗生素,是由一个聚酮母核携带两个糖基和两个脂肪酸侧链组成,葡萄糖-1-磷酸(G1P)是光神霉素的合成前体。Zabala等将银链霉菌(S. argillaceus)中ADP-葡萄糖焦磷酸化酶失活,过表达天蓝色链霉菌来源的磷酸葡萄糖变位酶基因(pgm),使得胞内G1P浓度提高,进一步促进了光神霉素的生物合成。除此之外,前体的直接外源添加也是常用行之有效的策略之一,如在筑波链霉菌中添加重要前体L-异亮氨酸(终浓度6 g/L),他克莫司的产量由410.3 mg/L增加到603 mg/L。
此外,还有辅因子工程、核糖体工程,以及许多合成生物学元件库可供组合代谢工程改造的选择。例如,敲除磷酸果糖激酶导致磷酸戊糖途径通量上调,从而增加NADPH的量,用于提高吸水链霉菌中雷帕霉素的生产。Bai等建立了一种基于链霉菌单细胞(原生质体)分辨率流式细胞术的精确定量方法,表征了系列天然或合成的启动子和核糖体结合位点的强度,用于激活链霉菌内的隐性基因簇。Wang等将透明颤菌血红蛋白(Vitreoscilla hemoglobin,VHb,第一个在细菌中发现的血红蛋白)在链霉菌属FR-008中高表达,成功提高了菌体的生长状态和大环内酯类抗生素FR-008-Ⅲ(杀念菌素D)的产量。组合代谢工程,意在“组合”和“因地制宜”,根据放线菌从初级代谢到次级代谢等全生命周期的特征,组合利用生物界已有的或同源的元件库(biobricks)和改造策略,从而达到高效生产目标化合物的目的。
2.4 聚酮类化合物结构的衍生和多样化
如前所述,模块化聚酮合酶(PKS)是一组由多个催化模块组成的装配线酶。正是由于PKS的存在使得宿主能够以简单、常见且易获取的酰基辅酶A为前体进行逐步组装来形成形形色色、庞大且复杂的天然产物,譬如Sorangium cellulosum产的抗癌药物埃博霉素、Streptomyces erythreus产的抗菌药物红霉素、Streptomyces nodosus产的抗真菌药物两性霉素B等。本文以Ⅰ型PKS的改造为例进行介绍。Ⅰ型PKS的组装可分为三个部分:起始单元、延伸单元和释放单元(图6)。
图6 聚酮合酶的理性设计
研究人员最早则采用了替换策略,即用来自泰乐菌素的起始单元替换了小白菊内酯的起始单元,使得PKS装载丙酰辅酶A而非乙酰辅酶A,进而获得了16-甲基小白菊内酯。C13-甲基红霉素的获取中采用了替换起始单元策略。此外,由于起始单元自身的底物宽泛性能识别多种底物,因此,研究人员通过前体喂养的方式获得了阿维菌素类似物。同样的策略也用到了获取新的脂霉素中。尽管目前已有很多案例对聚酮的起始模块实现了成功替换,但仍没有普遍适用的方法将非天然起始单元整合入聚酮化合物中。这可能是因为AT结构域底物的选择不仅取决于其自身保守氨基酸残基,还受限于ACP结构域、下游延伸模块第一个KS结构域等的影响。因此,应当对起始单元的序列、结构、催化机制等进行深入的探索,对每个起始单元都应进行单独优化来实现对PKS的精准设计。
在延伸单元中,AT负责为装配线提供各种前体,相比于PKS中的其他结构域,AT结构域底物更具杂泛性,这也极大促进了这类化合物结构的多样性。目前,针对AT结构域进行理性设计的技术包括AT结构域的替换、trans-AT结构域互补和AT结构域点突变。研究人员通过替换6-脱氧赤酮内酯合酶(6-deoxyerythronolide synthase,DEBS)的AT结构域,获得了几种新型的红霉素类似物。此外,通过将DEBS中特异性识别甲基丙二酸单酰辅酶A的AT结构域替换为来自尼达霉素PKS模块特异性识别乙基丙二酸单酰辅酶A的AT结构域,得到了具生物活性的6-去甲基-6-乙基红霉素A。研究人员发现这种特定结构域的替换大部分是牺牲了主产物产量来得到少量的新颖聚酮化合物,这可能归因于杂合的PKS蛋白较野生蛋白的反应速率低、表达水平低、稳定性差等因素。同时结构域的替换非常困难,因为这不仅要考虑到结构域的边界,同时还需考虑替换后的结构域对其他结构域乃至整个蛋白结构的影响。此外,AT决定底物特异性的关键氨基酸残基也尚不明确,这也使trans-AT互补技术得以实现,即将trans-AT结构域整合进cis-AT结构域中,来弥补无活性AT的功能,进而得到新颖的聚酮化合物。改变AT结构域中识别底物的特异性氨基酸残基也能实现底物选择的改变,进而合成类似物。这种点突变的方式既保留了AT结构域自身的环境,同时对整个蛋白结构影响又最小。研究人员通过分析鉴定了接受其他延伸单元的AT结构域的特异性基序,譬如在合成埃博霉素的PKS中转运丙二酸单酰辅酶A和甲基丙二酸单酰辅酶A的AT结构域包含了HASH基序,在合成FK506的PKS中转运烯丙基丙二酸单酰辅酶A的AT结构域包含CPTH基序。值得一提的是,将这些特异性的氨基酸基序引入其他AT结构域中并不一定会赋予相应的底物识别及转运能力。但仍有研究表明,当突变DEBS中AT1、AT4和AT6中底物结合基序YASH为HAFH后,增加了这些AT结构域底物杂泛性。还有研究通过对DEBS中AT6量子力学/分子力学模拟分析,揭示了其中一个缬氨酸的突变可以使用2-丙二酸炔丙酯为延伸单元,进而将炔基引入到大环骨架中来产生2-丙基丙二酰基-2-炔丙基红霉素A。延伸单元除了AT结构域外,还有发挥还原、脱水功能的结构域,如酮基还原酶KR、脱水酶DH和烯酰还原酶ER。在完成缩合后,KR结构域能对β-酮基进行还原,倘若还原底物的α位有取代,则会形成差向异构体。无论是对DEBS中的KR进行交换,还是对与立体选择性相关的氨基酸残基进行饱和突变,均导致产物的立体构型发生改变。此外,DEBS模块6中KR结构域的点突变使得其功能失活进而产生新的化合物。DH结构域负责在β-酮基还原为羟基后,进行脱水,进而在聚酮骨架中引入烯烃。通过点突变策略将FR-008中的DH18进行失活,使得具C-9羟基的产物产生。同样的策略也应用到了制霉菌素的PKS。除了DH失活策略,还有替换策略。通过将阿维菌素合酶的模块2中DH结构域替换为DEBS中的DH结构域,产生了C22-23不饱和阿维菌素。ER结构域对碳碳双键进行NADPH依赖的还原,若α位有取代,和KR结构域一样会表现出差向异构酶样活性。比如将DEBS中ER结构域高度保守的酪氨酸突变为缬氨酸后,会使得产物中甲基部分由S构型变为R构型。而将合成雷帕霉素PKS的ER结构域中保守氨基酸残基由缬氨酸变为酪氨酸,并不能使产物的构型发生改变。这也表明ER结构域的立体控制并非仅一个氨基酸残基控制。除了单个结构域的替换,研究人员还通过将纳他霉素PKS的模块11中双结构域DH-KR替换了模块12中的DH-KR,显著消除了没有抗真菌活性的纳他霉素衍生物。同样的策略也应用到了伊维菌素的生产中。值得一提的是,研究人员通过对DEBS中的结构域进行替换和失活,共获得约50种6-脱氧赤酮内酯B类似物。
在聚酮合酶完成聚酮化合物的延伸后,则需要释放单元来释放ACP结构域结合的聚酮化合物中间体。这种反应通常由硫脂酶TE结构域或还原酶R结构域介导。TE结构域释放的产物通常是酸、内酯、内酰胺、硫代内酯和烯烃等产物,而R结构域通常释放的产物为醛或伯醇。通过将DEBS中TE结构域重新定位到ACP结构域的末端,使得聚酮化合物提前释放。这种TE结构域的重定位可以定向获取特定链长的聚酮化合物。
在过去的30年,人们通过利用替换、删除和插入新的结构域对PKS进行理性改造,一方面理解聚酮化合物产生的内在机制,另一方面获取结构多样性甚至更优生物活性的聚酮化合物,为人类应对微生物耐药性作出贡献。然而这些策略获得的嵌合PKS稳定性差,催化活性降低甚至丧失。最近,研究人员开发了一种蛋白溶解度的生物传感器来筛选鉴定具有野生型生产水平的AT结构域替换后的PKS。利用这种方法并结合体内溶解度数据、体外酶活性和AlphaFold2预测的结构来优化域交换之后的PKS,打造稳定性高且催化活性好的装配线。随着基因编辑、人工智能等前沿技术的发展,利用合成生物学、组合生物合成的优势,以PKS的理性设计拓展聚酮化合物结构多样性,并使其以经济、高效、环保的方式合成聚酮化合物,来满足人们需求,推进其在多领域的应用。
随着组成生物合成技术的发展,利用已有的聚酮骨架,通过引入后修饰酶,譬如羟化酶、糖基化酶、卤化酶等进行衍生化,进一步丰富聚酮化合物的结构多样性和生物活性。最简单便捷的方式便是利用酶底物的宽泛性,实现不同基团的引入。通过向Dactylosporangium aurantiacum 的培养基中加入无机溴,便可获得含溴取代的非达霉素。向Streptomyces cinnamonensis 培养基中添加丙二酸衍生物可获得莫能菌素类似物。对D. aurantiacum 后修饰酶的敲除,可分离到多种非达霉素类似物。向Streptomyces sp. CS149引入产脱氧糖基的基因,获得了6种新型糖基化的sipanmycin衍生物。此外,结合基因挖掘、数据分析和微生物工程策略,使得新颖的聚酮化合物被发现报道。研究人员利用四环素基因簇共有的抗性基因和骨架合成基因作为双探针,挖掘到了目前已知的具有最多糖基化修饰的新型四环素类hainancycline。这些种种策略无疑都是在丰富人们对天然产物的认识。因此,应充分发挥人工智能、合成生物学的优势来获取新型具活性、高价值的聚酮化合物。
展 望
放线菌被誉为“生产大环内酯类化合物及其新型衍生物最有前景的平台”,在过去的几十年里,许多聚酮类化合物被分离并被开发成高效的抗菌药物。近年来,随着下一代测序技术、多组学方法、蛋白晶体学、基因编辑技术、质谱和分子网络分析等合成生物学和系统生物学领域技术的普及和应用,越来越多放线菌来源的聚酮类化合物生物合成途径被挖掘和解析。虽然许多聚酮类药物已被广泛使用,但是全球原料药产业长期存在生产方式落后、生产效能低、环境污染严重等问题,比如微生物制药发酵水平低、同系物杂质多;化学制药合成步骤多、收率低;植物药原料生产周期长、生产效率低等。因此,原料药生产技术亟待变革。
后疫情时代,经济滞缓,美国于2022年9月签署《国家生物技术和生物制造计划》,投入20亿美元,力图撬动30万亿美元市场,强调在合成生物技术领域全面与中国竞争,特别提及减少美国在原料药领域对中国的依赖。我国“十三五”期间亦投入27亿设立了合成生物学重点专项,顺应原料药技术革新趋势,加快合成生物技术发展。放线菌是微生物药物的主要生产菌,聚酮类药物是其中占比最重的天然产物之一。因此,本文旨在综合放线菌领域已有的聚酮类化合物生物合成体系重构技术,综述了通过基因组重塑、调控通路重构、组合代谢工程以及聚酮类化合物结构的衍生与多样化4个方面,达到聚酮类化合物的精准、理性、高效生产。
目前,新药发现的黄金期已过,研发速度滞缓,现在一个新药创制平均耗时10年、耗费10亿美元。但是,多重耐药性细菌(或超级细菌)陆续在各地被发现,人类尚缺乏经济有效的治疗手段。近年来,合成生物学和生物信息学技术迅猛发展,逐渐加速了链霉菌基础研究和药物发现的进展,例如自动化高通量操作平台(Auto-HTP工作站)助力萜类产物批量挖掘及高效合成、高分辨率的Hi-C方法解析不同生长时期的链霉菌染色质三维结构、基于液滴微流控的链霉菌高通量筛选技术等,高通量、高精度、自动化的操作平台与大数据、理性的生物信息学设计结合必将是未来药物发现、药物设计及菌种改造的趋势。
如今,对放线菌生物合成体系的重构研究主要聚焦在DNA层面的可遗传操纵,随着合成生物学的迅猛发展和多学科的交汇,必然促成未来的研究朝着智能化、多维化的方向发展。例如,随着多组学技术的发展,DNA/RNA甲基化、组蛋白修饰、非编码RNA(如miRNA)调控和染色质三维结构重构等表观遗传修饰研究逐渐深入;链霉菌中的调控网络复杂,单纯筛选或过表达特定的调控因子已经不能满足进一步提升酶活和提高产量的需求,研究人员逐渐将目光更多聚焦在调控蛋白的后修饰和降解,拟开发新的方法来准确检测和操纵修饰;利用合成生物学平台,可编程化地设计和构建复杂的基因回路,实现对放线菌聚酮类化合物生物合成途径的精准调控等等。通过这种多维度的方法,遵循绿色、环保、高效和可持续的策略,可以更有效地优化和增强放线菌中聚酮类化合物的生产,为未来的药物开发和生产提供新的可能性。
通讯作者及团队介绍
李永泉博士,教授,博士生导师,浙江大学求是特聘教授,享受国务院政府特殊津贴,国家重点研发计划“合成生物学”重点专项首席科学家。现任浙江大学药物生物技术研究所所长、浙江省微生物学会理事长、中国微生物学会理事。
李永泉教授领衔的团队是我国合成生物学制药领域内的主要创新团队,长期从事微生物药物合成生物学研究,系统解析了放线菌调控网络的分子机制,开拓了放线菌表观遗传分子机制研究,建立了生产菌基因组重塑、生物合成途径重构、调控通路重组等合成生物学关键技术;注重基础与产业链接,通过产学研合作主导完成他克莫司、纳他霉素、达托霉素等微生物药物的研制或优质高产重构,支撑合作企业获多项新药证书。近年李永泉教授主持了国家合成生物学重点专项项目、国家自然科学基金重点项目、国家高技术研究发展计划合成生物技术重大专项课题、国家新药创制重大专项课题等项目,授权国内外发明专利30多项,获省部级科技奖一等奖4项。作为通讯作者在Nature Communications、Metabolic Engineering、ACS Synthetic Biology、Microbial Biotechnology、Journal of Biological Chemistry、Applied and Environmental Microbiology 等期刊发表SCI论文180余篇,出版著作一部。