摘 要
萜类化合物是自然界中广泛存在的一类具有重要生理功能和显著生物活性的天然产物,在食品、医疗及日化行业有着广泛的应用。在萜类化合物的生物合成途径中,萜类合酶往往决定了萜类碳骨架的种类和结构新颖性,细胞色素P450酶等后修饰酶则可对碳骨架进行多种修饰,最终形成结构和功能都具有丰富多样性的萜类化合物。近年来,随着基因测序技术与合成生物学的发展,大量植物和微生物来源的萜类生物合成酶被表征,令人兴奋的是,其中包含一些与经典萜类合酶不同的非常规萜类合酶,它们亦可催化生成独特的环化萜类骨架。与此同时,利用组合生物合成等策略,人们创造了许多新颖的非天然萜类化合物,进一步丰富了萜类资源库。本文综述了近5年在非常规萜类环化酶与组合生物合成途径等方面取得的最新研究进展,以期为未来新型萜类化合物的发现和生物合成提供启示。本文首先综述了新发现的具有萜类环化功能的新酶,包含Ⅰ型萜类合酶新亚族、非角鲨烯来源三萜合酶、UbiA型萜类环化酶、细胞色素P450氧化酶、甲基转移酶、钒依赖卤素过氧化物酶、卤代酸脱卤酶等,同时还对其序列、功能和可能的环化机制进行了介绍,有助于理解自然界中萜类生物合成酶的进化起源和发现新颖萜类化合物。然后,本文介绍了非常规萜类衍生物的组合生物合成,通过将萜类合酶与甲基转移酶、天然或人工细胞色素P450氧化酶进行组合,产生了一系列包含非常规C11、C16骨架以及具有不同氧化形式的非天然萜类化合物,可为往后萜类化合物的结构创新研究带来启发。这些新颖酶元件的挖掘与新型组合生物合成途径的构建,将进一步拓宽萜类化合物的结构多样性和化学空间,有望为临床萜类药物研发提供更多的潜在小分子。
全 文
萜类化合物是自然界中广泛存在的一类结构最多样化的天然产物,可以从植物、微生物以及海洋动物中获得,迄今已发现超过10万种萜类化合物。根据组成萜烯骨架的异戊二烯单元数量,萜类化合物可分为半萜、单萜、倍半萜、二萜、二倍半萜、三萜和多萜等。萜类化合物在生物体内发挥着至关重要的作用,包括参与细胞膜的组成、信息交流、抵御病虫害等,例如生育酚、脱落酸、印楝素等。同时,萜类化合物还具有重要的经济价值,被广泛地用于食品、医疗及日化等行业,例如薄荷醇、维生素A、诺卡酮等 。值得我们关注的是,萜类化合物还是重要的药物来源,具有抗疟疾、抗肿瘤、抗炎等作用,例如我国药学家屠呦呦发现的抗疟疾药物青蒿素,拯救了数百万人的生命,她因此而荣获2015年诺贝尔生理学或医学奖;此外,我们耳熟能详的抗癌药紫杉醇以及抗炎药甾体等化合物也属于萜类化合物。
萜类化合物丰富多样的功能主要是源自其复杂多样的结构,因此解析萜类化合物的生物合成途径对拓展其应用具有重要意义。尽管萜类化合物具有丰富的结构多样性,其生物合成都是起始于两个简单的异戊二烯前体:异戊烯基焦磷酸 (isopentenyl diphosphate,IPP)及其双键异构体二甲基烯丙基焦磷酸(dimethylallyl diphosphate,DMAPP)。生物体内的IPP和DMAPP主要由两种不同的途径生成,即甲羟戊酸(mevalonate,MVA)途径和2-C-甲基-D-赤藓糖醇-4-磷酸(2-C-methyl-D-erythritol-4-phosphate,MEP)途径。其中,原核生物主要通过MEP途径生成IPP和DMAPP,植物则同时含有MEP和MVA途径,而除植物以外的其他真核生物仅有MVA途径。在异戊烯转移酶(prenyltransferase,PT)的催化下,1分子的DMAPP和不同个数的IPP发生反应,形成不同链长的类异戊二烯焦磷酸前体,例如香叶基焦磷酸(GPP)、法尼基焦磷酸(FPP)、香叶基香叶基焦磷酸(GGPP)、香叶基法尼基焦磷酸(GFPP)等。这些前体经不同类型的萜类合酶(terpene synthase,TS)的催化,形成含有不同碳原子数的结构多样的萜类核心骨架。其中,单萜合酶可催化GPP形成含有10个碳原子的芳樟醇、薄荷醇等单萜(monoterpene,C10)骨架;倍半萜合酶可催化FPP形成含有15个碳原子的牛樟芝来源(-)-antrocin、红没药烯等倍半萜(sesquiterpene,C15)骨架;二萜合酶可催化GGPP形成含有20个碳原子的委内瑞拉醇A、雷公藤甲素等二萜(diterpene,C20)骨架;二倍半萜合酶可催化GFPP形成含有25个碳原子的二倍半萜(sesterterpene,C25)骨架;此外还有含有30个碳原子的三萜化合物(triterpene,C30),含有40个碳原子的四萜化合物(tetraterpene,C40),以及多萜化合物等。这些萜烯骨架再经细胞色素P450氧化酶(CYP)、糖基转移酶、酰基转移酶等一系列后修饰酶的作用,形成具有丰富结构多样性及多种生物学功能的萜类化合物(图1)。
图1 萜类化合物的生物合成途径
通常,萜烯骨架的形成可以经由两种不同的底物激活机制实现(图2):Ⅰ型TS通过与其保守基序结合的Mg2+促发焦磷酸基团的解离,从而形成碳正离子中间体并引发后续的系列反应;而Ⅱ型TS则通过其保守基序中的Asp残基诱导底物质子化,从而形成活性中间体起始环化反应。由于绝大多数已知的TS都可以归类到上述两种类型,因此Ⅰ型和Ⅱ型TS被称为经典的TS。令人振奋的是,随着研究的深入,人们逐渐发现了一些与经典TS截然不同的酶,它们也能通过诱发碳正离子的形成催化类异戊二烯焦磷酸的环化,进而形成结构新颖的萜类化合物。因此,我们称之为非常规的TS,它们在功能上催化类似于经典TS的环化反应,但在序列或结构上却与经典的TS迥然不同,其中包括异戊烯基转移酶、甲基转移酶、CYP和卤代酸脱卤酶等。近年来,得益于测序技术与合成生物技术的发展,我们进入了快速发现、表征TS和后修饰酶的时期,这些新酶、新元件、新途径的发现又进一步助力了萜类生物合成途径的创新。利用组合生物合成等方式,人们创新性地发现了多种非天然萜类化合物,显著地拓宽了萜类化合物的化学空间。本文综述了近五年在非常规TS和非天然萜类生物合成途径方面取得的最新进展,着重介绍了非常规TS的类型、序列、结构和催化机理(表1),同时也介绍了通过组合MT+TS、CYP+TS等方式合成非天然萜类化合物的研究进展。最后,对萜类生物合成研究的发展趋势进行了展望,以期为未来新型萜类化合物的发现和生物合成提供启示。
图2 Ⅰ型和Ⅱ型TS
表1 非常规萜类合酶
1 典型的TS
TS能够将线性类异戊二烯前体转化为成千上万种环化的萜类化合物。如前所述,典型的TS可以根据其形成碳正离子中间体机制的不同分为Ⅰ型和Ⅱ型(图2)。Ⅰ型TS具有高度保守的DDxxD和(N/D)xx(S/T)xxxE基序。Ⅰ型TS通过Mg2+与线性前体的焦磷酸基团结合并诱导其解离,形成高活性的碳正离子中间体,从而引发后续的环化级联反应。Ⅱ型TS通常仅含有DxDD保守基序,它通过基序中的Asp残基将类异戊二烯基焦磷酸前体中的双键质子化,进而形成碳正离子中间体引发后续反应,最后终止于质子的消除反应。Ⅰ型TS通常参与半萜、单萜、倍半萜以及部分二萜的生物合成,例如Taxus brevifolia来源的紫杉二烯合酶。Ⅱ型TS主要负责催化二萜和缺少焦磷酸基团的直链三萜前体角鲨烯或环氧角鲨烯的质子化和环化,例如人羊毛甾醇合酶(氧化角鲨烯环化酶,OSC)和来自Alicyclobacillus acidocaldarius的角鲨烯/霍烯环化酶(SHC)。Ⅰ型和Ⅱ型TS催化产物的不同,可能取决于它们的活性位点结构、底物折叠模式和关键残基作用。通常情况下,Ⅰ型和Ⅱ型TS和PT都是单独存在并行使其功能的,但在一些酶中同时存在两种(TS和PT/TS)活性结构域并具有双功能。目前发现的双功能萜类合酶有Ⅰ型TS+Ⅱ型TS、Ⅰ型TS+PT、Ⅱ型TS+PT,例如来自大冷杉的松香二烯合酶是一种双功能二萜环化酶,同时具有Ⅰ型和Ⅱ型TS酶的催化活性;双功能酶由于两个活性位点在空间位置上接近,往往具有更高的催化效率。
2 非常规的萜类环化酶
2.1 新颖的TS
2.1.1 Ⅰ型TS新亚族VenA
来自委内瑞拉链霉菌的新颖二萜合酶VenA具有天然的底物宽泛性,不仅可以催化GPP合成单一产物香叶醇以及催化FPP合成主产物hedycaryol,还能催化GGPP合成含5-5-6-7新骨架的委内瑞拉烯A(venezuelaene A)(图3)。不同于经典的Ⅰ型萜类合酶,VenA不含经典基序DDxxD/E,而是拥有非经典基序115DSFVSD120,因此VenA代表着Ⅰ型萜类合酶的新亚族[图3(a)]。最近,VenA的催化机制及其结构基础得到了阐明。通过解析VenA与三核镁团簇/焦磷酸基团形成复合体的晶体结构,结合底物对接分析、分子动力学MD模拟、QM/MM计算和定点突变实验,对 VenA的广泛底物谱和独特环化方式进行了机制性认识。VenA催化GGPP中PPi基团的离去形成碳正离子中间体A,其经1,10-环化形成中间体B,接着C1位氢负离子通过1,3-氢负离子形成中间体C,随后经1,14-环化形成中间体D,进而通过2,15-环化形成中间体E,然后经扩环及C6-C7双键进攻C2位形成中间体F,F重排后形成中间体G,并通过去质子化作用得到终产物委内瑞拉烯A[图3(b)]。针对115DSFVSD120基序的结构和功能研究表明,其缺失的第二个Asp可以被Ser116和Gln83功能性替代,它们可能通过与Arg344形成氢键网络来维持催化口袋的疏水性。通过进一步生物信息学分析,结果表明该微生物Ⅰ型TS亚族广泛存在于大自然中。值得一提的是,人们还通过对VenA进行半理性设计改造,首次将二萜合酶改造成可以催化GFPP的二倍半萜合酶,此外其他突变体还合成了12种野生型无法合成的倍半萜或二萜类化合物,其中4种为新型二萜化合物。该工作不仅拓展了我们对二萜合酶蛋白结构和催化机制的认识,也为挖掘新颖TS和研究结构基序的进化演变提供了借鉴和理论依据。
图3 二萜合酶VenA
2.1.2 首例非角鲨烯来源三萜合酶
三萜化合物是自然界中广泛存在的一类天然产物,先后发现了2万多种,其中有400多种已作为临床药物使用,包括众多重要的甾体激素类药物以及人参皂苷等天然产物,为保障人类健康和提高生活质量作出了巨大的贡献。几十年来,人们普遍认为三萜类化合物的生物合成始于角鲨烯合酶将FPP二聚生成角鲨烯,其经鲨烯环氧酶催化形成2,3-环氧角鲨烯,而后三萜合酶催化角鲨烯或环氧角鲨烯环化形成霍烯或羊毛甾醇等三萜骨架。由于三萜合酶具有不同的选择性,因此可产生已知的100 多种不同骨架的三萜化合物。最近,研究人员首次发现并揭示了非角鲨烯来源三萜的生物合成机制(图4)。该研究针对丝状真菌来源的Ⅰ型嵌合TS开展了基因挖掘,该类酶具有PT结构域和TS结构域,简称PTTS。通过在酿酒酵母萜类高产底盘中进行PTTS功能表征,发现其中两个PTTS(TvTS和MpMS)可以分别合成含有30个碳的新型三萜化合物talaropentaene和macrophomene,其中后者拥有一个3/22的独特环系,代表着迄今为止发现的最大环系的萜类产物。进一步结合体外酶反应实验,表明其PT结构域能够催化IPP和DMAPP生成六聚异戊烯基焦磷酸(HexPP),随后经TS结构域环化生成全新三萜骨架,该过程不经由角鲨烯,因此TvTS和MpMS被称为非角鲨烯来源三萜合酶。为了探究该类酶的环化机制,研究者进行了同位素标记实验,值得注意的是,MpMS催化的是前所未有的C1-Ⅵ环化,即HexPP的焦磷酸基团的离去引发C1和C22位的环化,紧接着C1位去质子化从而形成含三元环的终产物。为了揭示该类酶催化非角鲨烯来源三萜合成的结构基础,研究者解析了TvTS-TS结构域的蛋白晶体结构以及MpMS的冷冻电镜结构,结合突变实验结果,发现该类酶的TS结构域可以通过两种不同的方式来容纳HexPP并将其环化为三萜化合物:第一种方式以TvTS为代表,含有与二萜合酶相似大小的球状空腔,用于容纳HexPP的前四个异戊二烯单元参与环化,而尾部的两个异戊二烯单元则位于底物结合口袋底部凸出的空腔内,不参与产物环化过程;第二种方式则是以MpMS为代表,含有一个比二萜合酶更大的球状底物结合口袋,用来容纳并催化HexPP生成大环三萜产物。在上述结构信息的指导下,研究者开展了非角鲨烯来源三萜的靶向精准挖掘,利用AlphaFold2对潜在的三萜合酶蛋白结构进行了批量预测,结合底物分子对接结果,利用萜类底盘高效地从公共数据库中筛选获得另外两个三萜合酶CgCS和PTTC074,它们均能合成第三个新型三萜colleterpenol,进一步夯实了Ⅰ型嵌合三萜合酶催化HexPP环化生成三萜骨架的普遍性。这一发现颠覆了长期以来认为所有三萜类天然产物都是经由角鲨烯合成的固有认知,丰富了三萜化合物生物合成机制的多样性,也拓宽了新型萜类化合物的深度挖掘和精准发现的空间。
图4 非角鲨烯来源三萜的生物合成
2.2 UbiA型萜类环化酶
UbiA 家族PT参与月桂醌、血红素、叶绿素和脂质等化合物的生物合成,近年来,人们发现该家族酶还可以催化萜类环化反应,例如参与平板素合成的PtmT1/PtnT1、参与烟曲霉素合成的fma-TC、参与二倍半萜somaliensenes合成的StsC等。UbiA家族酶的反应活性依赖于Mg2+,通过催化焦磷酸基团的离去起始反应,类似于Ⅰ型TSs催化的反应。尽管如此,UbiA家族酶的整体氨基酸序列和蛋白结构与典型的Ⅰ型TS不同,它们大多具有富含Asp的金属结合基序(NDxxDxxxD和DxxxD),这些基序让人联想到Ⅰ型TS中的经典结构基序(NSE/DTE和DDxxD),但又不完全相同,这表明UbiA型TS是独立进化的。
Antrodia cinnamomea属于担子菌纲真菌,是中国台湾省土生土长的一种药用蘑菇,也是众所周知的生物活性萜类化合物的多产菌,但人们对其生物合成却知之甚少。近期人们针对A. cinnamomea进行了基因组挖掘,发现了两个非经典的UbiA型TS(Tps1A和Tps2A)[图5(a)]。通过在酿酒酵母Saccharomyces cerevisiae中异源表达tps1A和tps2A基因对其功能进行了探究,结果表明Tps1A和Tps2A都可以催化(+)-(S, Z)-α-红没药烯的合成。通过与其同源蛋白进行序列比对,发现Tps1A中潜在的基序Ⅰ为Nxxx(G/A)xxxD,Tps1A和Tps2A上的基序Ⅱ为QDxxDxxxD,这与 UbiA家族常见的DxxxD基序不一致[图5(b)]。进一步通过蛋白结构同源建模分析,发现结合Mg2+的三个Asp分别为Tps1A中的QD215xxD218xxxD222和Tps2A上的QD202xxD205xxxD209。此外,与Archaeoglobus fulgidus 来源的AfUbiA相比,Tps1A含有高度保守的Y155,它可能与维持烯丙基碳正离子的稳定和立体特异性去质子化有关。此外,研究者还通过同位素标记实验探究了Tps1A催化合成的(+)-(S, Z)-α-红没药烯的环化机制[图5(c)],结果表明,尽管Tps1A的蛋白质序列与典型的Ⅰ类TS不同,但它的环化机制却与之类似,也是通过脱去FPP焦磷酸形成碳正离子进而启动环化反应。
图5 (+)-(S, Z)-α-红没药烯
2.3 构建萜类骨架的CYP
CYP是一类以亚铁离子和血红素作为辅因子的蛋白超家族,通常具有单加氧酶功能,在天然产物生物合成过程中扮演着重要角色。有趣的是,CYP还具有底物多样性和催化反应类型多样性的特点。近年来,研究人员罕见地发现CYP可作为萜类环化酶,例如先前报道的PenM/PntM、TwCYP71BE86、VrtK等,近年来人们又发现了一些新成员,它们通过自由基介导碳正离子的形成,在萜类生物合成的后修饰阶段,甚至在骨架形成的早期阶段引发环化或者重排反应。
2.3.1 在后修饰阶段构建萜类骨架的CYP
索达啉类(sordaricins)二萜化合物具有较强的抗真菌活性以及新型的抗真菌作用靶点,近期人们完整地解析了真菌索达啉烷(sordarinane)的酶催化合成途径,其中一组CYP起到了关键作用。生物合成基因的异源表达和体外酶反应等结果表明,由四个CYP组成的多酶体系(SdnBHFE),精妙地连续协同催化了5/8/5三环二萜骨架cycloaraneosene氧化重排为5/6/5/5四环索达啉烷骨架(图6)。研究者首先通过异源表达手段明确了重构复杂索达啉烷骨架的三个关键CYP——SdnB、SdnH及SdnF,其中SdnB和SdnF为双功能CYP。首先SdnB催化cycloaraneosene惰性碳骨架的8,9碳碳单键进行环氧化形成产物1,紧接着SdnH催化产物1并发生脱氢氧化形成环戊双烯体中间体3。有趣的是,中间体3并不是接着被下游其他CYP转化,反而继续被上游的SdnB识别并对其环氧化基团以类似Baeyer-Villiger氧化的方式断裂8,9位碳碳单键,生成双醛基产物4。中间体4中亲双烯体与双烯体在空间上得以靠近,并使得后续的Diels-Alder环化成为可能。值得一提的是,SdnB是首例可以催化环氧基团中碳碳单键断裂并形成双醛的CYP。形成中间体4后,其结构中的一个醛基被SdnF氧化为羧基,该氧化使双烯体侧的电子云密度增大并促发后续的Diels-Alder环化自发反应,最终形成具有索达啉烷骨架的中间体6。随后,SdnE催化中间体6中19位末端甲基发生羟基化,紧接着被糖基转移酶SdnJ所识别,从而合成具有多样化的结构和生理活性的索达啉类。这项研究不仅揭示了真菌CYP多酶体系精妙的协同催化机制,也丰富了自然界中CYP家族氧化酶在萜类生物合成中的作用。
图6 索达啉类的生物合成途径
2.3.2 在早期阶段构建萜类骨架的CYP
在萜类化合物的生物合成途径中,通常萜类合酶参与早期碳骨架的构建,而CYP等后修饰酶主要参与后期碳骨架的结构修饰。因此,尽管CYP具有催化萜类环化反应的功能,但是它们基本都是作用在萜类合成的后修饰阶段,直到最近,人们才首次发现可以介导萜类碳骨架早期构建的CYP。研究人员从放线菌Amycolatoposis arida中挖掘了一个细菌萜类生物合成基因簇(BGC),其TS附近具有多个CYP。通过异源表达该BGC获得了三种高度氧化的尤尼斯烷衍生的二萜类化合物aridacins A~C,它们具有新颖的6/7/5三环骨架。结合体外酶反应,aridacins的生物合成途径得到了解析(图7):首先Ⅰ型TS(Ari E)将GGPP环化为6/10稠合的双环顺式-烯骨架,然后CYP(AriF)通过催化C2-C6键的形成将双环骨架环化为6/7/5三环骨架。因此,该研究首次报道了CYP在萜类碳骨架早期构建中的关键作用。此外,体外培养和酶反应结果表明,AriF不仅可以催化萜类环化反应,还可以催化羟基化和环氧化反应,是一个多功能的CYP。这些发现不仅扩展了CYP催化功能的多样性,也为研究萜类生物合成中P450催化环化反应的机制奠定了基础。
图7 Aridacins的生物合成途径
2.4 甲基转移酶
甲基转移酶(MT)在自然界中普遍存在,它可以催化甲基转移反应,调节多种生物过程,如信号转导、转录调控,以及初级和次级代谢物的生物合成。大多数MT将S-腺苷甲硫氨酸(S-adenosyl methionine,SAM)作为甲基供体,通过双分子亲核取代反应将缺电子的甲基转移到亲核原子上,这个过程在化学上类似于质子化,因此甲基化可以在功能上取代质子化引发的碳正离子形成,具有类似于Ⅱ型TS的功能。
2.4.1 参与C16萜类化合物合成的MT
萜类化合物的生物合成以C5异戊二烯结构单元为基础,迄今分离出的几乎所有萜类化合物碳原子数量都是5的倍数。然而,有研究报道在沙雷氏菌(Serratia plymuthica)中发现了一种名为索多芬(sodorifen)的独特C16萜类化合物。研究人员通过转录组、基因组分析以及敲除实验,找到了S. plymuthica PRI-2C中索多芬合成相关的BGC,有趣的是,索多芬的生物合成仅需要1个SAM依赖型MT(SodC/SpFFPMT)和1个TS(SodD)。对其生物合成的进一步研究表明, SodC/SpFFPMT不仅对FPP 进行甲基化,还表现出环化酶活性,产生单环化合物前索多芬焦磷酸盐(PSPP),SodD则进一步将PSPP环化形成索多芬(图8)。值得一提的是,SodC/SpFFPMT是第一个已知的不仅催化 FPP 的甲基化,而且还催化萜类环化反应的MT。为了进一步探究其催化机制,研究人员开展了体外酶反应和同位素标记实验。首先利用13C单标记FPP和(甲基-13C)SAM追踪索多芬上所有碳的来源,随后利用13C双/多标记FPP明确相连的碳。进一步,通过合成13C和氘标记底物追踪索多芬上所有氢的来源。结果表明,在酶催化后FPP C4位的pro-S H、C6位的H、C9位的pro-R H分别迁移到了索多芬的C1、C5和C8位,而在终产物索多芬上没有检测到FPP C10位的H。除了上述H,其他所有的H均保留在原位。基于上述同位素追踪结果,研究人员提出了索多芬的生物合成途径。通过TS的催化,PSPP在脱去二磷酸基团后,经历了不同类型的氢迁移、碎片化、[4+3]环加成、碳骨架重排和去质子化反应,最终形成索多芬。
图8 C16萜类化合物
为了进一步挖掘非典型的C16类萜类化合物,人们根据索多芬BGC的特征开展了批量基因挖掘,获得了大量C16类萜类化合物。通过分析NCBI数据库中已经测序的739个细菌基因组,找到了大量编码类似索多芬MT和TS的BGC。为了探究其功能,从中选择了40个BGC,并根据其中MT和TS的数量将其分为了四类,随后利用酵母合成生物学平台对其中的MT和TS进行了研究,结果发现所有有活性的MT都产生相同的萜烯前体PSPP,同时还发现18个具有活性的TS,能够将PSPP底物转化为47种不同的C16萜类化合物,它们大多含有罕见的高张力双环和三环结构。其中,第一类BGC中含有一个MT和一个TS,主要产生多环萜烯,例如heraclitene、anaximandren和aristotelen;第二类BGC中含有一个MT和多个潜在的TS,与第一类BGC中TS功能明显呈趋同进化,可以合成相同的C16萜类;第三类BGC中含有潜在的多个MT和多个TS,可以利用PSPP底物合成多种C16萜类化合物;第四类BGC中含与MT融合的TS,但是没有产生任何新化合物。系统进化分析表明,前三类BGC存在于所有细菌目中,而第四类BGC几乎只存在β变形菌门中。该研究表明,C16萜类广泛分布于细菌中,也为系统探索这一类尚待开发的化合物提供了基础。
2.4.2 参与C17萜类化合物合成的MT
最近,人们又发现了有前所未有的具有brexane型倍半萜骨架的C17萜类化合物chlororaphen,其生物合成也得到了解析。通过基因组挖掘在假单胞菌(Pseudomonas chlororaphis)O6中发现了类似索多芬合成的BGC,在对O6菌株的发酵产物进行GC-MS检测后,发现了多个C16烃类化合物以及分子式为C17H28的主要产物chlororaphen。为了探究其生物合成途径,将其BGC在大肠杆菌中进行了异源表达,生成了chlororaphen及其他异构体。进一步使用FPP和SAM进行体外酶功能表征,发现chlororaphen的生物合成只需要三个酶参与:PchlO6_6045(Pc-FPP-MT)、PchlO6_6042(Pc-γ-PSPP-MT)和PchlO6_6041(Pc-TS/ChloS)。根据不同酶组合的反应等结果,研究者推测了chlororaphen的生物合成途径(图9):首先Pc-FPP-MT对FPP进行甲基化产生γ-PSPP,其被Pc-γ-PSPP-MT进一步甲基化形成C17中间体α-PCPP,最后Pc-TS/ChloS催化α-PCPP合成chlororaphen。研究者还对贪噬菌Variovorax boronicumulans PHE5-4中chlororaphen的生物合成途径进行了表征。通过比对P. chlororaphis和V. boronicumulans 中FPP-MT、γ-PSPP-MT和TS的氨基酸序列,发现它们具有很高的相似性,这与它们具有相同的功能是一致的。进一步通过基因组挖掘,在70个不同的细菌基因组中发现了多个潜在的非常规FPP-MT和TS,这表明利用单环焦磷酸中间体进行非常规萜类合成在细菌中远比预期的更为广泛。
图9 chlororaphen的生物合成途径
2.5 其他类型的萜类环化酶
2.5.1 钒依赖卤素过氧化物酶(vanadium-dependent haloperoxidase, VHPO)
VHPO类酶不仅能将卤化物引入萜类底物,还能利用这种机制引发区域和立体选择性环化反应,类似于Ⅱ型TS,例如合成snyderols的钒依赖溴过氧化物酶(VBPO)、合成napyradiomycins 的钒依赖氯过氧化物酶NapH1和NapH4、合成merochlorins的Mcl24。红藻属Laurencia富含具有不同化学骨架的次级代谢产物,包括倍半萜、二萜、三萜,目前该属已发现 500多种倍半萜类化合物和 100多种结构各异的二萜类化合物,其中许多都是卤代萜类化合物。为了探究溴代萜类化合物的生物合成机制,人们研究了L. okamurae中的VBPO。以藻类中已知的VBPO序列作为探针,在L. okamurae中找到了4种编码类似的VBPO样蛋白LoVBPO1a、LoVBPO1b、LoVBPO2a和LoVBPO2b,它们均由643个氨基酸组成,序列相似度高达98%~100%,此外,与其他红藻 VBPO 的氨基酸序列进行了比对,同样显示出高度相似性。为了验证其功能,研究者在大肠杆菌中表达了LoVBPO2a重组蛋白,并利用其进行了体外反应,使用市售的顺式和反式橙花叔醇混合物作为该酶的天然底物,可以在反应体系中检测到snyderol 异构体,表明LoVBPO2a保留了从单一前体大量产生溴化化合物的活性,因此VBPO是Laurencia中催化萜类环化反应并产生溴化萜类化合物的关键酶之一(图10)。
图10 推测VBPO催化橙花醇合成橙花醇异构体的机理
2.5.2 卤代酸脱卤酶样萜环化酶
药用蘑菇A. cinnamomea中的萜类化合物具有多种重要生物活性,可治疗酒精中毒、癌症、肝病等,具有重要的药用价值。(-)-antrocin是A. cinnamomea产生的一种drimane型倍半萜,具有潜在抗肿瘤增殖的活性,已被用于癌症的治疗。由于获取(-)-antrocin的主要方式是从A. cinnamomea子实体中分离,其供应非常有限,因此人们一直在努力合成(-)-antrocin,然而其生物合成和酶学机制仍不清楚。最近,人们从A. cinnamomea中鉴定出了(-)-antrocin的BGC,有趣的是,该BGC包含两个卤代酸脱卤酶样萜烯环化酶(HAD-TC)(AncA和AncC)、两个CYP(AncB和AncD)和一个短链脱氢酶(AncE)。通过在酿酒酵母中进行异源表达,阐明了该BGC所编码酶的功能和反应顺序。值得关注的是,两个HAD-TC(AncA和AncC)都是双功能酶,它们首先将FPP环化成倍半萜焦磷酸中间体,然后再脱焦磷酸化分别得到drimane类型的产物和monocyclofarnesoid类型的产物。通过对AncB开展基因突变、体外酶学等研究,发现D285、D286和D288可能参与质子化引发的FPP环化,四个天冬氨酸(D26、D29、D179和D180)可能与镁离子结合和焦磷酸酶活性有关。因此,推测位于AncC碳端的Ⅱ型TS结构域首先通过催化FPP质子化引发环化反应。AncA由于其TS结构域的催化口袋中含有位阻较大的Y283和F375残基,不能形成drimane型骨架,最终催化FPP形成(R)-trans-γ-monocyclofarnesol(图11)。这项研究不仅破解了antrocin和monocyclofarnesol的生物合成途径,也为药用蘑菇天然产物的生物工程和药物应用奠定了基础。
图11 (-)-antrocin的生物合成途径(a)与AncC与AncA可能的环化机制(b)
3 组合生物合成
3.1 基于MT的组合生物合成
除了自然界中天然存在的C16萜类化合物,研究人员还利用工程改造的手段在酵母中成功地合成了C11非天然萜类分子。最近,借助相似的研究思路,又在酵母中成功合成了一系列C16非天然萜类分子。由于SpSodMT可以连续催化FPP的甲基化和环化反应,产生含16个碳的萜类前体PSPP,因此研究者根据SpSodMT的催化机理,借助同源建模得到SpSodMT的结构,利用点突变的方式对其进行了理性设计。通过与底物FPP进行分子对接,找到了催化活性口袋中可能影响反应进行的10个关键残基(图11)。对这些残基进行点突变后,其中5个突变体可以产生全新C16前体PPP、TPP、WPP、BPP、KPP和HPP。随后又对上述突变体开展了第二轮点突变,获得3个全新C16前体SPP、JPP和APP。为了找到能够催化上述C16前体的TS,研究者在酵母细胞中表达了上述SpSodMT突变体,用来评估倍半萜合酶和二萜合酶接受C16前体的能力,结果表明倍半萜合酶无法催化上述C16前体,而具有更大活性口袋的二萜合酶Cyc2和HaKS能接受不同的C16前体合成非常规的萜类化合物。在此基础上,研究者在途径中进一步引入了下游的CYP,获得了结构更为复杂的非典型萜类,极大地拓宽了我们对非常规C16萜类生物合成的认知,进一步增加了萜类化合物的可及性和结构多样性(图12)。
图12 由SpSodMT 及其变体合成的C16前体(a)与结合FPP和SAH的SpSodMT模型(b)
3.2 基于CYP组合生物合成萜类衍生物
3.2.1 组合TS和CYP合成萜类衍生物
在萜类的生物合成途径中TS构建萜类的碳骨架,随后被CYP、糖基转移酶、酰基转移酶等后修饰酶进一步进行氧化、糖基化和酰基化等修饰。在这些后修饰反应中,CYP催化的氧化后修饰反应往往可以引发萜类骨架的重排,不仅极大地提升了萜类天然产物的结构多样性,还对萜类化合物的生物活性至关重要。近年来,人们以烟曲霉素合成途径中的膜结合TS(Fma-TC)和CYP(Fma-P450)为探针,挖掘和鉴定了多种真菌来源的α/β-反式佛手柑烯(α/β-trans-bergamotene)TS和对应的多功能CYP,如Trichoderma virens来源的Tv86-P450与Tv86-TC,Botryotonia cinerea来源的BC-P450与BC-TC。通过在酿酒酵母中将上述TS和CYP进行混合配对表达,产生了9个不同的倍半萜化合物。近期,研究者在酵母中通过组合10个利用copalyl diphosphate(CPP)的二萜合酶和4种CYP,实现了130种不同二萜化合物的合成。首先从150种植物、细菌和真菌来源的二萜合酶中筛选出10个植物二萜合酶,包括4个双功能酶(AbCAS、SmCPSKSL1、GbLPS和PaLAS)和6个单功能Ⅰ型二萜合酶(OmTPS3、RoMiS、IrTPS2、IrKSL6、PbPIM和MsTPS1)。此外,还选取了4个远缘植物物种来源的CYP(RoCYP76AH22、SpCYP71BE52、PsCYP720B4和OsCYP76M8),用于二萜骨架的氧化修饰。通过在酵母菌株中共表达迷迭香来源的GGPPS和(+)-CPP合酶作为核心模块,同时表达拟南芥来源的CYP还原酶(ATR1),以及不同组合的二萜合酶和CYP,共获得40个酵母突变株,检测到了133种二萜类化合物,值得注意的是其中有80种二萜化合物尚未被报道。这些工作不仅展现了CYP对于非天然底物的巨大催化潜力,同时也显示了利用酵母平台产生新型萜类化合物的潜力,为利用基因组挖掘和合成生物学相结合的方法开发未知的萜类化合物提供了思路。
3.2.2 通过优化CYP的氧化还原电子传递体系助力萜烯化合物的合成
几乎97%的萜类化合物途径中至少有一种CYP ,而CYP的多样性使其底物难以被预测,此外还需要同时表达特定的电子传递蛋白才能使其发挥功能 ,因此如何在体内实现CYP的功能表达极具挑战。最近研究人员在大肠杆菌中通过引入MVA途径来增强萜类合成前体的供应,同时导入一系列氧化还原蛋白以适配不同CYP,实现了对多种不同来源的CYP的快速鉴定和萜类化合物的高通量筛选。该工作首先将12个诱导系统插入到大肠杆菌BL21(DE3)的基因组中,利用IPTG诱导表达MVA途径的酶和TS,由香草酸诱导表达氧化还原蛋白,其余10个调控元件负责控制其他后修饰酶,最终构建了携带31个重组基因的大肠杆菌MEV15(高产倍半萜)和MEV20(高产二萜),并用植物、真菌、细菌或珊瑚来源的20种萜类骨架合成酶评估了MEV15和MEV20菌株合成不同萜类化合物的能力。为了增强氧化还原蛋白对不同CYP的适配性,研究者将四个氧化还原途径在大肠杆菌中组合成一个氧化还原阵列,其中包含Fer1/Fenr、Pdx/Pdr、FdxD/FprD以及FldA/Fpr,结果表明包含该氧化还原蛋白阵列的菌株能够适配更为广泛的CYPs。随后,将28个已知的半日花烷型二萜(labdane-related diterpenoid,LDR)骨架中的环化酶基因导入上述菌株中,从中观察到了22个预期产物。因此,该系统被进一步用于挖掘数据库中696个LRD BGC编码的64种细菌CYP。将17个LRD骨架合成酶与64个CYP在大肠杆菌MEV20中进行组合表达,共构建了1088个菌株。检测结果表明,有203个菌株产生了新的LRD后修饰产物,共检测到228个新颖的氧化二萜,其中195个没有NIST质谱库与之匹配。该工作充分证明了具有强大氧化还原能力的大肠杆菌底盘能够快速筛选萜类化合物和CYP,通过重建和组合细菌中的萜类合成途径可以获得结构多样化的萜类化合物。
3.2.3 通过构建含铱CYP人工金属酶合成萜类化合物
除了利用天然存在的CYP来产生萜类化合物以外,通过结合过渡金属构建的人工CYP可以高选择性地催化一系列非天然反应。通过对P450酶CYP119进行改造,将其辅因子铁卟琳替换成了含过渡金属铱的Ir(Me)-mesoprophyrin IX[Ir-(Me)MPIX],成功实现了包括天然萜类骨架在内的一系列烯烃的立体选择环丙烷化反应。值得注意的是,该人工CYP拥有与天然酶CYP119类似的区域选择性,在存在反应性更强的端烯时优先催化反应性较弱的内部烯烃环丙烷化。尽管人工金属CYP可以催化丰富的非天然反应,如何在细胞内引入过渡金属辅因子来实现该类反应还相当困难。为了解决这一问题,研究人员通过在大肠杆菌中过表达脱卟啉Apo-CYP119和外膜受体ChuA,结合低温和低铁培养条件成功在体内实现了Ir-CYP119的组装。随后,通过在该工程菌内引入柠檬烯合成相关基因,实现了柠檬烯的立体选择性环丙烷化。该工作还将ChuA转运系统替换为了邻单胞菌来源的血红素转运系统HUG,显著提升了胞质中Ir-(Me)MPIX的浓度和Ir-CYP119的组装效率。最终,通过共表达HUG转运系统、柠檬烯合成相关基因、Apo-CYP119及Ir-(Me)MPIX,在诱导18 h后添加重氮乙酸乙酯,反应4.5 h后以43%的非对映体过剩率(1.0∶3.2∶1.8∶1.5)获得了250 μg/L的环丙基柠檬烯,展现了结合化学催化和生物催化以产生非天然萜类化合物的应用潜力。
展 望
在后基因组时代,我们具有快速获取大量基因组信息的能力,同时还拥有日新月异快速发展的合成生物学技术,这为我们发现萜类合成的新酶和新途径奠定了基础。TS是一个令人着迷的无处不在的酶家族,负责产生萜类天然产物的大部分化学多样性。它们具有复杂的结构、催化机理和功能丰富的产物。更令人兴奋的是,还有多种非常规的TS,例如本文介绍的Ⅰ型TS新亚族、非角鲨烯来源三萜合酶、具有新结构基序的UbiA型TS、构建萜类骨架的CYP、合成C16/C17非常规萜类的MT、合成萜类骨架的VHPO和HAD-TC,它们可以催化产生更丰富的化学和结构多样性,也暗示着大自然中还有大量隐藏的新型TS有待进一步挖掘和开发。近年来,人们不仅发现了多种非常规萜类生物合成的核心酶,还在萜类生物合成途径上进行了创新,分别利用TS与CYP/MT进行组合生物合成,进一步拓展了萜类化合物的结构多样性和资源库,为未来探索非天然萜类化合物的生物活性和功能打下了基础。
目前,萜类天然产物的发现进入了飞速发展的阶段,人们从植物、动物、细菌真菌甚至病毒中发现了萜类化合物。最近,人们在发现和研究萜类化合物的生物合成酶与途径方面取得了令人振奋的成果,例如成功鉴定了紫杉醇生物合成途径中缺失的关键酶,揭示了紫杉醇中氧杂环丁烷结构形成的机制,成功地建立了紫杉醇异源生物合成的最短路线等。尽管如此,萜类化合物的生物合成研究仍然还存在一些挑战:
①合成生物学的快速发展使人们能够在异源宿主中重构BGC,但仍然难以在短时间内完成大规模未知BGC的功能鉴定。自动化高通量平台(auto-HTP)能够高效地实现基因挖掘、BGC表征和产物检测,可大量节省时间和劳动力,是未来萜类等天然产物挖掘的新方法。刘天罡教授团队借助auto-HTP,在高效供应萜类合成前体的酿酒酵母底盘中批量完成了34个未知PTTS的功能鉴定,并且从中挖掘到2个结构新颖的二倍半萜化合物;之后,该团队进一步开发了萜类化合物的自动化生物铸造平台,在米曲霉底盘中批量鉴定了源自5株丝状真菌的39个萜类BGC,并筛选到1个抗炎效果优于市售药物吲哚美辛的萜类化合物。auto-HTP不仅促使我们发现了许多先前未知的萜类生物合成途径和新颖的酶,在未来它还将有助于我们实现特定萜类化合物的基因挖掘、生物合成途径解析以及组合生物合成,进而获得更多结构新颖的萜类化合物。
②萜类合成相关酶的活性是萜类化合物异源合成的关键,然而天然酶的催化潜力往往远远没有得到充分发掘,同时还可能存在一些缺陷,例如酶活低、产物种类繁杂、立体选择性差等,因此不能满足实际应用的需求。破译萜类生物合成酶的结构与功能之间的关系,有助于开发更多具有广泛应用价值的萜类化合物。近年来,得益于X射线晶体学、AlphaFold2、同位素标记技术以及大量计算工具的不断精进,我们在探索萜类合成相关酶的蛋白结构、催化机理和功能方面取得了很多研究进展,例如研究人员对GPP C6位甲基转移酶BezA进行酶工程改造,使其能够以FPP为底物生成C16萜类前体,为非天然C16萜烯化合物的合成提供了新思路;人们对cattleyene合酶(CyS)进行定点突变拓宽了其活性口袋的空腔,使原先的倍半萜合酶CyS能够容纳GGPP底物合成骨架新颖的二萜化合物;借助蛋白质工程对瓦伦烯合酶EgVS进行定点诱变,实现了酿酒酵母中瓦伦烯的高效合成。越来越多的关键酶的结构与功能关系得到解析,为改造萜类合成核心酶的结构提供了理论依据,也为提升相关酶的活性和选择性奠定了基础,还为创制结构新颖的萜类化合物提供了新手段。然而在定向改造萜类合成相关酶时,如何高效、快速地完成突变体文库的筛选,是未来我们仍然需要进一步加强的方面。
③尽管现有蛋白质序列的数量正呈指数级增长,但对其功能进行准确预测仍是一项尚未解决的挑战。得益于机器学习与人工智能的发展,人们正在为解决这一问题进行不断的努力。最近,研究人员收集了包含一千个表征TS反应的数据集,并开发了一种方法来设计高精度的机器学习模型,以便在数据量较低的条件下进行TS功能注释。该模型在TS检测和底物预测方面明显优于现有方法。通过将这些模型应用于大型蛋白质序列数据库,发现了此前未检测到的7种TS,并通过实验证实了它们的活性。在此过程中,还发现了一个新的TS结构域和以前已知结构域的不同亚型,展示了机器学习在加速发现和鉴定新型TS方面的潜力。
在获得了大量新颖的萜类合成相关酶和途径后,我们不仅可以开展组合生物合成,还可以将它们与化学合成相结合,开展化学-酶法合成,为获得具有重要价值的萜类化合物提供新的手段,例如研究人员借助CYP(PtmO5、PtmO3和PtmO6)成功地在甜菊醇和ent-kaurenoic acid的C7、C11位引入活性羟基,并借助化学合成实现了高度氧化的二萜化合物ent-kauranes、ent-atisanes和ent-trachylobanes的制备。化学-酶法兼具化学合成与酶催化的优势,利用该方式合成萜类天然产物不仅能改变化学合成的烦琐步骤,还可以打破天然酶催化的瓶颈,有望改变多数天然产物无法大量合成的困境。在组合生物合成和化学-酶法合成的帮助下,人们不再止步于自然界已有的萜类化合物,这些都极大地促进了萜类化合物的创造,为研究新颖萜类化合物的生物活性提供了宝贵资源,也为创制具有重要应用价值的萜类化合物奠定了基础。
通讯作者及团队介绍
陶慧博士,武汉大学药学院教授,课题组组长,博士生导师。于2018年获武汉大学生物化学与分子生物学博士学位,2018—2023年在日本东京大学进行博士后研究。2023年加入武汉大学药学院。主要从事微生物复杂天然产物的生物合成与合成生物学研究,取得了重要研究进展,以第一或通讯作者在Nature、Nat Commun、J Am Chem Soc、Angew Chem Int Ed等期刊发表论文20篇。入选国家海外高层次青年人才、湖北省百人计划,现主持国家重点研发计划“合成生物学”重点专项青年科学家项目。
刘天罡,上海交通大学生命科学技术学院特聘教授、武汉大学药学院教授,博士生导师,入选湖北省楚天学者特聘教授、武汉市优秀青年科技工作者、湖北省新世纪高层次人才、中组部万人计划科技创新领军人才等,荣获湖北省科学技术进步奖一等奖、武汉大学第七届“研究生教育杰出贡献校长奖”、武汉大学青年五四奖等。主要研究方向:(1)定量合成代谢理性指导天然产物高产;(2)天然产物的高效挖掘;(3)天然产物与人体互作关系研究。