自抗性基因导向的活性天然产物挖掘

2024-08-08 13:15   湖北  

摘 要

天然产物是医药与农药的重要来源。基因组测序和生物信息学分析技术的飞速发展,揭示了大量功能未知的天然产物生物合成基因簇,利用生物信息学工具,从这些庞大的基因簇数据中挖掘活性天然产物已经成为发现新型天然药物的重要途径。天然产物的生产者们利用自抗性基因所表达的自抗性酶来保护自身,这种自抗性酶是体内一些初级代谢途径中管家酶的变体,不但对于活性天然产物具有较好的耐受性,还可以在生产活性天然产物的同时确保宿主体内代谢的正常进行。因而,自抗性基因指导的天然产物研究有效地将活性导向和基因组导向的天然产物发掘策略桥连起来,为精准发掘具有目标活性的新型天然产物提供了有效策略。本文对利用自抗性基因作为探针进行天然产物发掘的代表性研究工作进行了整理和总结,并对研究趋势进行了展望,主要包括:①对于活性已知的天然产物,利用其自抗性基因来定位生物合成基因簇的研究;②以天然产物生物合成基因簇中的自抗性基因为线索,预测产物的作用靶点的研究;③利用天然产物自抗性机制,将具有已知作用机制的活性分子进行快速排重的研究;④利用自抗性基因与天然产物及其活性的内在联系,以目标靶点导向的活性天然产物基因组挖掘;⑤自抗性基因导向的基因组数据挖掘工具的发展情况。



全 文

天然产物(natural product,NP)是由包括微生物、植物与动物等生物体产生的小分子有机化合物(分子量通常小于1500 Da),这些小分子在人类的医疗健康以及动植物的疾病防治中发挥着不可替代的重要作用。在漫长的进化过程中,天然产物也随着生物体的进化而不断进行结构优化,可以精准高效地与生物大分子如核酸和蛋白质结合,进而调节生理代谢。这些化合物大多结构复杂,由多个手性中心和复杂的环系构成,同时有多种官能团作为药效基团,用来通过氢键、静电相互作用、疏水作用等与生物靶点进行精准结合。因此天然产物在为化学、生物学和药学等研究领域提供了研究灵感的同时,也是发现创新药物的源泉。据统计,1981—2019年间,美国食品药品监督管理局共批准1881个新型药物,其中天然产物来源的占比高达32%±9%。同时,天然产物及其衍生物在农药制剂的应用中也占有重要比例,仅1997—2010年间就达到36%。随着海洋微生物天然产物的发展,其在农业中的应用也越来越多,Song等2021年统计了海洋天然产物在杀虫活性方面的研究进展,在72个具有抗虫活性的化合物中有29个来自于海洋微生物,占比超40%。

基于生物学活性导向的天然产物发掘策略是将生物样本中的目标活性组分通过提取和多步的分离纯化来进行富集,结合生物活性测试进行活性成分跟踪,最终获得目标活性化合物的过程。在20世纪,基于生物活性分析与化学分离技术的飞速发展,科学家们发现了大量具有良好药效活性的天然产物。以著名抗生素药物青霉素的发现为代表,在近一个世纪的时间里,基于生物学活性导向的天然产物发掘策略是支撑天然产物研究发展并引领其进入黄金时期的根本策略(图1)。


图1  天然产物发掘的策略流程图


随着基因测序技术的飞速发展,人们发现在微生物中用来编码复杂天然产物生物合成酶的基因通常情况下在染色体上是连锁成簇存在的,这些基因的成簇分布有利于各个功能相关基因的同步调控、表达以及在不同物种间的横向转移。通过对已测序的微生物基因组中天然产物生物合成骨架基因如聚酮合酶、非核糖体聚肽合成酶和萜烯环化酶等的分析,揭示了成千上万的生物合成基因簇(biosynthetic gene cluster, BGC)。在这众多的生物合成基因簇中,据估计仅有不足10%的功能及其产物是已知的,多数生物合成基因簇的功能以及其所产生的“隐秘产物”仍然有待科学家们通过实验证实。导致这些基因簇功能未知的原因很多,例如:①许多天然产物的生物合成受到诸多未知环境因子的调控,而这些调控因子在实验室培养环境中很难进行模拟,导致大量的“隐秘产物”难以生产;②有些天然产物在极低的浓度下就可以发挥功效,因而产量很低,难以进行有效的分离和鉴定;③有些天然产物作用机制较为特殊,目前还没有建立有效的活性筛选方法,在通过活性导向的策略发掘的过程中被忽视等。因此,对于这些基因簇功能、隐秘活性产物发掘的需求,推动着天然产物研究方法的变革,将成为医药与农业制剂研发的潜在源泉。

自21世纪初至今的20多年间,基因组指导的天然产物发现策略成为探索大量的隐秘天然产物的有效途径。通过综合运用包括途径特异性转录因子的过表达或敲除、表观遗传调节染色质结构、在模式底盘细胞中的异源表达等合成生物学方法,越来越多结构新颖的隐秘天然产物被科学家们发现,大大拓宽了天然产物的化学空间(图1)。尽管基于基因组的挖掘策略指导科学家们发现了许多结构新颖的隐秘天然产物,由于基因组导向的挖掘是以发现含有特定药效基团或骨架的天然产物为目标,缺乏在基因组序列水平上对于产物活性的预测与筛选,最终导致难以有效地确定这些隐秘产物的生物学活性与分子靶点。随着基因组序列数据量的日趋庞大,科学家们面临的重要挑战之一是如何从庞杂的基因组数据中精准地挖掘到具有高活性和药用价值的天然产物。基因自抗性导向的活性天然产物挖掘,不仅可以利用基因组序列来预测天然产物的生物活性,还可以使天然产物挖掘更为精准有效,已逐步成为解决这一挑战的有效方法。本文将重点介绍利用自抗性基因指导天然产物研究的多种策略,以及运用这些研究策略所取得的研究进展。


1  自抗性基因指导的生物合成基因簇定位


活性天然产物通常可以作为 “小分子武器”被其生产者所利用,结合竞争者体内重要代谢途径中的靶标(酶、核酸等),从而抑制甚至杀死竞争者。与此同时,活性天然产物生产者需启用有效的自我保护机制以避免其产物伤及自身,如:通过外排泵将毒性分子转运到细胞外;依靠体内的抗性蛋白来对毒性分子进行捕捉或修饰,使之失去毒性;利用修饰酶将毒性分子的靶点进行化学修饰,使毒性分子无法与被修饰过的靶点进行结合等。

除此之外,另一种有趣的解毒机制是通过将天然产物所结合的靶点酶进行小幅度的突变成为自抗性酶,使突变体既保留原代谢酶的功能,又不会被有毒的化合物所结合,从而保护生产者不受活性天然产物的伤害[图2(a)]。为了在天然产物生物合成过程中时刻保护生产者,这种编码自抗性酶的基因通常在基因组中是与天然产物的生物合成基因连锁存在的,这样便于调控合成基因与抗性基因的同步转录,以确保当活性天然产物在细胞内积累时,自抗性酶可以同时表达,并发挥解毒作用。编码自抗性酶的基因通常在基因组中是以第二拷贝编码靶点蛋白管家基因(housekeeping gene)的形式存在,并且自抗性酶与管家酶(housekeeping enzyme)具有较高的同源性。例如土曲霉来源的降脂药物洛伐他汀(lovastatin)的作用靶点为3-羟基-3-甲基戊二酰辅酶A还原酶(3-hydroxy-3-methylglutaryl-coenzyme A reductase,HMGR),在其生物合成基因簇中具有一个负责编码HMGR的自抗性基因,用来在洛伐他汀产生时进行解毒[图2(b)]。这种利用自抗性基因进行解毒的自我保护策略在细菌和真菌中广泛存在,目前已证实的采用这种自抗性机制的天然产物解毒策略,其分子靶点涉及DNA复制、蛋白质合成与降解、脂类代谢、糖和能量代谢、氨基酸与核苷酸代谢、外毒素降解等多种细胞代谢途径。


图2  天然产物生物合成基因与自抗性基因的连锁

(a) 微生物通过产生活性天然产物(NP,黑色三角)来抑制竞争者体内的重要代谢酶(黄色圆),同时天然产物的产生者能够产生与产物靶点(黄色圆)同源的自抗性酶(红色圆),这个自抗性酶具有靶点蛋白的功能却不能够被天然产物抑制,在天然产物存在时保障生产者不受毒害;(b) 在洛伐他汀的生物合成基因簇(BGC)中天然产物生物合成的核心基因(蓝色)与自抗性基因lovR(红色)在产生者土曲霉基因组上的连锁现象


对于分子靶点已知的天然产物,自抗性机制对于基因组导向的天然产物基因簇检索具有重要的指导意义,可以利用自抗性基因作为探针,在基因组中准确定位天然产物的生物合成基因簇。例如,放线菌Streptomyces rishiriensis来源的DNA旋转酶(gyrase)抑制剂coumermycin A1的生物合成基因簇就是利用了结构基因dTDP-葡萄糖4,6-脱水酶和自抗性基因gyrB作为探针而准确定位的,这在一定程度上受到了其结构类似物novobiocin生物合成基因簇中存在自抗性基因现象的启发[图3(a)]。由真菌Penicillium brevicompactum产生的肌苷-5′-单磷酸脱氢酶(inosine 5′-monophosphate dehydrogenase,IMPDH)抑制剂霉酚酸(mycophenolic acid)作为主要的免疫抑制剂治疗移植器官引起的急性排异反应。由于在研究初期,其生物合成机制尚不明确,难以通过结构基因来定位生物合成基因簇。研究人员认为在霉酚酸的生物合成基因簇中可能包含着一个IMPDH同源基因作为自抗性基因用来防止霉酚酸对于产生菌体内IMPDH的抑制作用,于是通过利用这个自抗性基因为探针,成功发现了霉酚酸的生物合成基因簇[图3(b)]。此外,在定位2型甲硫氨酸氨基肽酶(MetAP2)抑制剂烟曲霉素(fumagillin)的过程中,研究人员通过定位烟曲霉(Aspergillus fumigatus)基因组中的第二拷贝甲硫氨酸氨基肽酶,成功揭示了烟曲霉素的生物合成基因簇[图3(c)]。对于分子靶点已知的天然产物,在生物合成结构基因难以确定时,利用这种自抗性基因可以在生产者基因组中有效地定位生物合成基因簇。


图3  自抗性基因指导的生物合成基因簇定位

(生物合成基因簇中的蓝色开放阅读框表示生物合成母核基因,红色开放阅读框表示与天然产物作用靶点同源的自抗性基因,灰色开放阅读框表示其他相关的生物合成基因)


此外,对于分子靶点已知的天然产物,寻找相应的基因簇还可以不依赖于原始文献报道中的目标天然产物的产生菌,通过直接在基因组数据库中挖掘含有所报道靶点同源基因的次级代谢产物基因簇就可以定位到目标化合物的基因簇。羊毛甾醇14α-去甲基化酶(CYP51)是开发抗真菌药物的重要靶点,真菌来源的天然产物restricticin及其衍生物是唯一已知靶向CYP51的天然产物抑制剂。Tang教授团队猜想在restricticin的生物合成基因簇中可能存在基因组中第二拷贝的CYP51作为自抗性基因。尽管restricticin及其衍生物的产生菌株尚未进行基因组测序,但是任何能够产生restricticin类天然产物的生物合成基因簇都有可能会具有与CYP51同源度较高的自抗性基因。因此通过在真菌基因组数据库中搜索含有CYP51同源基因的次级代谢产物生物合成基因簇,成功地在一株尚未报道能够产生restricticin及其类似物的曲霉Aspergillus nomius基因组中定位到了目标基因簇[图3(d)]。通过将该基因簇进行异源表达,成功得到了restricticin及一个相应的衍生物。这项研究证实了自抗性基因、生物合成基因簇和天然产物之间存在着紧密的内在联系,可以为新型天然产物的发掘提供有效的指导。


2  自抗性基因导向的天然产物靶点确认


除了定位分子靶点已知的天然产物生物合成基因簇外,对于作用机制未知的天然产物,在生物合成基因簇中出现的自抗性基因也可以为揭示天然产物的分子靶点提供重要线索。例如,假单胞菌(Pseudomonas fluorescens)来源的kalimantacin A对葡萄球菌具有高度的选择抑制活性,而作用机制尚不明确。在解析kalimantacin A生物合成基因簇中的基因功能过程中,研究人员发现,将基因簇中编码FabⅠ同源蛋白的batG基因敲除时,并未对kalimantacin A的产量造成影响,然而在敏感宿主中异源表达BatG却能够赋予宿主抵抗kalimantacin A的能力[图4(a)]。FabⅠ负责催化反式-2-烯酰基-载体蛋白的还原,是脂肪酸合成途径中的重要代谢酶。因此,这个自抗性基因揭示出kalimantacin A的作用靶点为FabⅠ,而同源蛋白BatG可以在毒性分子产生并抑制FabⅠ时弥补FabⅠ的生理功能,保障生产者体内的脂肪酸合成依然能够正常进行。这里出现了一个值得深入思考的现象:原始产生者假单胞菌在将batG基因敲除后,并没有受到产物kalimantacin A的生长抑制作用,这可能是生产者体内的FabⅠ管家酶在长期与kalimantacin A的共存过程中,逐渐进化成了具有自抗性的酶。因此,采用自抗性酶来解毒这种策略,并非一定需要除管家基因外的另外一个第二拷贝的自抗性基因来进行解毒,生产者仅需将管家基因进行一定程度的进化,就可以实现自抗性基因的功能。


图4  抗性基因导向的作用机制与分子靶点确定

(生物合成基因簇中的蓝色开放阅读框表示生物合成母核基因,红色开放阅读框表示与天然产物作用靶点同源的自抗性基因,灰色开放阅读框表示其他相关的生物合成基因)


来源于链霉菌的环肽分子浅灰霉素(griselimycin)具有广谱的抗菌活性,特别是对于结核杆菌具有良好的生长抑制活性,然而这个分子较差的药物代谢动力学严重阻碍了其进一步开发成为新型抗结核药物。尽管科学家们曾尝试合成多种浅灰霉素的类似物以提高其成药性,然而由于更为高效的新一代抗结核药物利福平(rifampin)的上市,基于浅灰霉素分子骨架的开发最终被终止了。这主要是因为在浅灰霉素分子靶点和作用机制未知的情况下,设计并通过化学合成来获得成药性更为优异的衍生物具有较大的挑战性。Müller教授研究团队确证了浅灰霉素生物合成基因簇中一个能够编码DNA聚合酶滑动夹DnaN蛋白的自抗性基因griR,从而揭示了浅灰霉素完全不同于已知抗结核药物的新型作用机制,具有开发成为新型抗结核药物的前景[图4(b)]。这些研究再次表明,天然产物的生物合成基因簇中不仅仅包含了生物合成途径信息,同时也能够为揭示天然产物的作用机制提供重要线索。

Tang教授团队在研究由植物益生菌哈茨木霉(Trichoderma afroharzianum)产生的具有促进植物生长和抑制真菌的天然产物哈茨酸(harzianic acid)的生物合成过程中,发现其生物合成基因簇在多个不同属来源的真菌中具有较高的保守性,并且在这些生物合成基因簇中,均含有一个能够编码支链氨基酸合成途径中的重要代谢酶乙酰羟酸合成酶(acetohydroxyacid synthase,AHAS)的开放阅读框AHASM[图4(c)]。由于AHASM与其他真菌中的AHAS管家基因的同源度接近73%,因此他们推测这个基因为哈茨酸的自抗性基因,而AHAS正是哈茨酸的分子靶点。随后的体外生化和体内异源表达实验均证实,管家酶AHAS对于哈茨酸比较敏感,而与之相反,AHASM完全不会受到哈茨酸的抑制。有趣的是,在哈茨木霉中,哈茨酸生物合成基因簇中的AHASM基因相比其他菌种来源的AHASM明显截短了,因而丧失了自抗性基因的功能,而其基因组中的管家基因却突变成了AHASM从而行使自抗性基因的功能。值得一提的是,尽管哈茨酸能够有效抑制真菌来源的AHAS,却不会影响植物来源AHAS的活性,这种天然的选择性使哈茨木霉在农业生产中能够专一性地抑制真菌而不伤害作物。

近期,胡教授研究团队在揭示真菌来源的聚酮化合物rumbrin和衍生物12E-rumbrin的生物合成途径时,发现在其生物合成基因簇中包含了一个能够编码人类硫酯酶Ⅱ(hTE)的基因[图4(d)]。据报道,这类人类硫酯酶Ⅱ可以和人类免疫缺陷性病毒HIV-Nef蛋白相互作用,从而降低CD4 T细胞的内吞作用,促进HIV病毒对人体细胞的侵染。由于在rumbrin的生物合成基因簇中存在人类硫酯酶Ⅱ的同源基因,因此作者推测这个基因可能发挥着自抗性基因的作用,而rumbrin能够通过与人类硫酯酶Ⅱ结合抑制其活性。随后对于化合物12E-rumbrin的生物学活性研究表明,它可以通过阻断病毒与细胞的结合,从而有效抑制HIV-1的复制。尽管Nef蛋白与人类硫酯酶间的作用机制较为复杂,可能影响多个生理途径,至今有待进一步的研究,生物合成基因簇中潜在的自抗性基因仍为揭示rumbrin抗HIV病毒活性提供了重要的启示。


3  基于自抗性基因的天然产物排重


天然产物发掘过程中经常遇到的问题是大量已知天然产物的重复分离,如何有效地在分离之前就能够对已知的天然产物进行识别和排重,然后针对新的化合物进行分离,是天然产物研究领域面临的主要挑战之一。为了避免对于已知化合物的重复分离,从生物样品提取物中排除已知天然产物的过程不仅需要烦琐的实验步骤(包括化合物分离、结构解析等)来进行排重,同时也耗费了大量的资源。为解决此问题,Wright教授团队挑选了100多个已知抗生素的自抗性基因,并在大肠杆菌底盘细胞中表达,构建了相应的100多个针对单一抗生素具有抗性的大肠杆菌菌株,组成了抗生素抗性筛选菌株平台,成功地用于对已知活性天然产物进行排重(图5)。不需要对生物样品提取物中的组分进行逐一分离和分析,每个携带不同抗性基因的大肠杆菌菌株就可以直接指示出样品中的已知活性化合物。通过快速地将生物样品中的已知化合物进行排重,可以排除50%以上的抗生素产生菌,从而筛选出新型抗生素的产生菌。在这些菌株中,相继发现了可以产生新型棘霉素衍生物以及具有新型作用机制的抗生素angucycline与mayamycin。


图5  基于自抗性基因的天然产物排重流程图

①构建表达已知抗生素抗性基因的载体;②将表达抗性基因的载体导入大肠杆菌中构建抗性基因指示菌株;③构建多种指示菌株,并组合成为指示菌株文库;④将提前准备好的含有目标菌株发酵产物的培养基进行指示菌株的接种;⑤培养指示菌株,通过指示菌株的生长状况来判断发酵产物的种类,并对已知的产物进行排重;⑥分离获得具有新型作用机制的天然产物


交叉抗性曾被有效地用于排除已知抗生素,随着科学家们对于抗生素自抗性机制的深入研究,这种基于自抗性基因异源表达的平台对于已知抗生素的排重能力将会得到进一步的提升。同时该平台还可以快速检测添加剂对于天然产物敏感性的增益效应,因而此平台也可以用于高效筛选和评价天然产物对于已知抗生素的辅助效应,从而获得高效助剂。这种抗生素抗性筛选菌株平台虽然可以有效地用来筛选生物样品中的天然产物,但这种方法依然依赖于菌种的生长以及其中天然产物生物合成基因的高效表达,对于不可培养菌种、沉默和隐秘天然产物仍然难以进行有效的发掘。


4  目标靶点(自抗性基因)导向的活性天然产物挖掘


虽然自抗性基因可以有效地关联天然产物与生物活性,然而面临大数据的挑战,自抗性基因更为重要的意义是在基因组导向的天然产物挖掘中,可以精准关联天然产物的生物合成基因与分子靶点。这种基因组挖掘策略的研究理念在于,运用自抗性基因作为预测产物活性的窗口,来对大量功能未知的基因簇进行辨认和评估,可以给以活性为导向的发现策略和以基因为导向的基因组挖掘策略二者之间有效地搭建桥梁。目标靶点(自抗性基因)导向的基因组挖掘策略可以大致总结如下:①选择一个在微生物中具有较高保守程度的管家代谢酶作为基因组挖掘的抓手(医药或农药靶点);②在基因组数据库中搜索同时包含靶点基因和目标产物骨架合成基因(聚酮、聚肽、萜烯等)的次级代谢基因簇;③使用合成生物学工具将目标基因簇表达,获得产物;④运用分析化学方法分离和鉴定所激活产物的结构;⑤通过体外酶学反应比较产物对于靶点代谢酶和自抗性酶的抑制活性,或者通过在对产物敏感的底盘细胞中异源表达管家基因和自抗性基因的方法,检测表达宿主对于产物的敏感性。这是利用基因组学数据库开展自抗性基因导向的基因组挖掘的一种具有普适性的实验方案。

首次详细阐述自抗性基因导向的标志性挖掘研究工作是由Moore教授团队在2015年报道的。该团队以第二拷贝的脂肪酸酶为自抗性基因,成功地发掘了一系列的脂肪酸合酶Ⅱ(fatty acid synthase Ⅱ,FASII)的抑制剂。他们首先在86个盐孢菌基因组中基于同源基因的组群分析得到12 372个孤儿基因,其中2707个在所有盐孢菌种基因组中保守。接下来根据保守孤儿基因进行功能分类,并且筛选具有双拷贝的孤儿基因,作者在脂肪酸合成途径相关的孤儿基因中发现一个FASⅡ,它与一个功能未知的基因簇PKS44相连锁。将PKS44在天蓝色链霉菌底盘细胞中异源表达后,产生了一系列FASⅡ天然产物抑制剂thiolactomycins,随后作者也证实了自抗性基因确实可以帮助敏感宿主在thiolactomycins存在的条件下生存[图6(a)]。这项研究工作首次系统而且详细地证实了自抗性基因导向的挖掘研究方法对于发掘目标活性天然产物具有较好的实用性。


图6  目标靶点导向的活性天然产物挖掘

(生物合成基因簇中的蓝色开放阅读框表示生物合成母核基因,红色开放阅读框表示与天然产物作用靶点同源的自抗性基因,灰色开放阅读框表示其他相关的生物合成基因)


在另一项天然产物基因组挖掘研究工作中,Oakley教授团队在对构巢曲霉进行新型天然产物的基因组挖掘过程中,发现在一个非核糖体聚肽的生物合成基因簇中包含了一个负责编码蛋白酶体C5亚基的基因inpE,因此他们推测这个基因簇产生的产物可能是蛋白酶体的抑制剂[图6(b)]。随后,通过一系列启动子的替换将这个基因簇激活,获得了脂肽化合物fellutamide B,而这个化合物恰好是个已知的蛋白酶体抑制剂。最后他们通过将自抗性基因inpE 进行异源表达证实了它的确可以帮助宿主抵抗化合物fellutamide B的毒性。

尽管在上述研究工作中提出并运用了自抗性基因导向的策略进行新型化合物的发掘,然而最终得到的都是分子靶点已知的天然产物。随着该策略在天然产物研究领域的普及,近年也涌现出对于未知分子靶点天然产物挖掘的研究工作,从实践上证实了自抗性基因导向基因组挖掘策略对于新型天然产物发掘具有巨大应用潜力。例如,基于在天然产物DNA旋转酶抑制剂albicidin和cystobactamid的生物合成基因簇中存在编码靶向拓扑异构酶的五肽重复序列蛋白(topoisomerase-targeting pentapeptide repeat protein,TTPRP)的自抗性基因,这个五肽重复序列蛋白可以通过结合拓扑异构酶而避免被活性天然产物抑制。Müller教授团队利用这种五肽重复序列蛋白作为自抗性基因探针进行基因组挖掘,筛选新型拓扑异构酶抑制剂。他们在黏菌(Pyxidicoccus fallax)基因组中发现一个能够编码聚酮类天然产物的生物合成基因簇中含有编码五肽重复序列蛋白的基因[图6(c)]。通过将聚酮合酶基因的启动子突变而将这个基因簇激活,他们获得了两个新型天然产物pyxidicycline A和pyxidicycline B。随后的生物学活性研究确证了这两个化合物具有选择性地抑制拓扑异构酶的活性。虽然在这项研究中所利用的自抗性基因并非一个天然产物分子靶点蛋白的突变体,但这项研究再次证实了利用自抗性基因发掘新型天然产物具有巨大的潜力。

除利用医药靶点为探针进行基因组挖掘外,农药靶点也可以作为探针来进行自抗性基因导向的活性天然产物的挖掘。支链氨基酸(branched chain amino acid,BCAA)如亮氨酸、异亮氨酸、缬氨酸是植物生长必需的营养成分,其生物合成途径由三个酶组成:乙酰乳酸合酶、乙酰羟酸异构还原酶和二羟酸脱水酶(dihydroxyacid dehydratase,DHAD)。其中,DHAD在支链氨基酸合成途径中催化α,β-二羟酸脱水反应生成亮氨酸、异亮氨酸、缬氨酸的前体α-酮酸。这个参与植物必需氨基酸合成的酶DHAD在不同的植物物种中高度保守,即使在进化远端的植物中依然有80%的同源性。哺乳动物体内不存在支链氨基酸生物合成途径,它们依靠食物摄取这些三种必需氨基酸,因此DHAD被认为是理想广谱除草剂的靶点。早在20年前科学家们就曾成功地设计出了针对DHAD的小分子抑制剂,并试图用它们来开发新型除草剂。这些人为设计的化学合成抑制剂虽然能够抑制DHAD的活性,然而当将其施用在植物体时,这些抑制剂却无法抑制植物的生长。

天然产物与生物体在自然界中共同进化而产生具有能够干预特定细胞代谢途径的生物学活性,因此在自然界中有可能存在抑制这个生物体必需氨基酸合成途径上DHAD的天然抑制剂。基于这一假设,Tang教授团队推测这样的天然抑制剂生物合成基因簇必然包含一个编码DHAD同源蛋白的基因。通过筛查已公开的所有真菌的基因组,他们找到了一个与DHAD同源基因和天然产物合成基因连锁的保守基因簇。该基因簇有四个基因,分别编码倍半萜环化酶同源蛋白AstA、两个细胞色素P450氧化酶AstB和AstC、DHAD的同源蛋白AstD[图6(d)]。通过异源表达astAastBastC基因,产生了生物学活性未知的aspterric acid。随后,经过对于包括模式植物拟南芥、代表性的单子叶植物玉米和双子叶植物番茄的抑制实验,他们证实了aspterric acid对于植物生长具有广谱的抑制活性,同时也证明了AstD虽具有DHAD的功能却对aspterric acid具有极高的耐受性。随后,他们通过对于DHAD全酶结构的解析,结合计算化学手段,阐明了aspterric acid与酶活性中心的结合机制,以及AstD具有aspterric acid耐受性的分子机制。为进一步使aspterric acid在除草的同时不影响作物的生长,Tang教授团队将抗性基因AstD在模式植物拟南芥中表达,并成功获得可以耐受高浓度aspterric acid的转基因植株,证明了人们可以利用AstD抗性基因来开发具有aspterric acid耐受性作物,从而实现利用aspterric acid进行专一性除草,而不伤害作物的功效。该研究不仅为人们挖掘基因组寻找天然产物提供了新的方法和启示,同时也为探索农业生产中开发新型除草剂提供了范例。


5  自抗性基因导向的基因组挖掘工具


为了高效发现包含自抗性基因的天然产物生物合成基因簇,根据自抗性基因导向的挖掘理念开发出的生物信息学分析工具实现了生物信息学分析过程的自动化。例如,Ziemert团队在2017年开发了一个在线分析平台Antibiotic Resistant Target Seeker(ARTS)。用户只要输入基因组序列,分析平台就可以将可能产生抑制特定分子靶点的天然产物基因簇作为输出,以动态图表的形式显示出来。ARTS分析基因组数据的步骤如下:①利用antiSMASH (antibiotics and secondary metabolite analysis shell)自动分析骨架合成基因;②显示出基于管家基因拷贝数和进化树推测的自抗性基因;③以可视化的表格输出结果,总结出所有含有自抗性基因的天然产物基因簇。ARTS目前已经升级到2.0版本,可以对多个基因组序列或宏基因组序列进行分析,但是基因序列的来源仍然仅限于细菌,相信在不久的将来,ARTS的性能将进一步升级以兼容更多的真核物种。

另一个可以挖掘含有自抗性基因的天然产物生物合成基因簇的软件是由Challis教授团队开发的clusterTools。这款基因组挖掘软件可以通过特殊基因元件如天然产物骨架合成基因、后修饰基因、抗性基因和调控基因等的隐马尔可夫模型(hidden Markov models)来挖掘生物合成基因簇。与ARTS相比,这个软件可以对目标骨架和活性的天然产物生物合成基因组实现更为精确的挖掘。



未来研究趋势与展望

基因组测序技术的飞速发展为天然产物的基因组挖掘研究带来了契机。基因组的天然产物自抗性基因与生物合成基因的连锁现象是它们之间共同进化的结果。自抗性基因可以指导科学家们利用基因序列来预测天然产物的生物学活性,深入地研究自抗性酶产生耐受性的分子机制,将揭示自然界是如何对于高活性分子进化出相应的耐受性机制的。然而,目前我们对于自抗性机制认识的局限性,仍然有可能会导致自抗性基因及天然产物活性的错误预测。例如pyranonigrin A的生物合成基因簇中存在一个编码IMPDH的基因,同时这个基因在基因组中也是第二拷贝,这些表面上都预示着这个基因是pyranonigrin A生物合成基因组中的自抗性基因,而进一步的验证表明pyranonigrin A并没有抑制IMPDH的活性[图7(a)]。因此,一个第二拷贝的管家基因有可能会恰巧在天然产物的生物合成基因簇中出现,但它的功能却不是自抗性基因。


图7  天然产物生物合成基因簇中“假”的自抗性基因

(生物合成基因簇中的蓝色开放阅读框表示生物合成母核基因,红色开放阅读框表示与天然产物作用靶点同源的自抗性基因,灰色开放阅读框表示其他相关的生物合成基因)

(a) Pyranonigrin A的生物合成基因簇中存在一个编码IMPDH的基因,然而pyranonigrin A无IMPDH抑制活性(紫色);(b) 丝氨酸氨酰tRNA合成酶抑制剂分子albomycin δ2的生物合成基因簇,丝氨酸氨酰tRNA合成酶抑制剂分子SB-203208的生物合成基因簇,其中的“假”自抗性基因紫色标注


除此之外,一个管家基因的同源基因可能会出现在天然产物的生物合成基因簇中,但其功能有可能不是产生抗性,而是负责天然产物的生物合成。例如,albomycin δ2的作用分子靶点为丝氨酸氨酰tRNA合成酶,在albomycin δ2的生物合成基因簇中的一个基因负责编码微生物染色体上的第二拷贝丝氨酸氨酰tRNA合成酶来为微生物提供自抗性[图7(b)]。与之相类似,在valanimycin的生物合成基因簇中也含有一个编码丝氨酸氨酰tRNA合成酶(seryl-tRNA synthase)的基因,然而进一步的研究证明,这个丝氨酸氨酰tRNA合成酶实际上负责催化valanimycin合成途径中一步丝氨酰转移反应。这可能是由于valanimycin并不具有丝氨酸氨酰tRNA合成酶的抑制活性,因而不需要基因簇中存在另一拷贝的丝氨酸氨酰tRNA合成酶作为自抗性基因。而在另外一项研究中,Abe教授团队在研究异亮氨酸氨酰tRNA合成酶抑制剂SB-203208时,通过自抗性基因异亮氨酸氨酰tRNA合成酶(SbzA)成功地定位到了抑制剂的生物合成基因簇,然而意料之外的是实验数据表明这个被他们所认为的自抗性基因sbzA,其真正的功能却是用来催化SB-203208的生物合成[图7(b)]。

由于自抗性机制与天然产物的内在联系在新型天然产物的进化中也起着重要的作用,基于自抗性基因进化树分析的挖掘策略,也因此成为发掘新活性天然产物的一条有效路线。Wright教授研究团队通过这种策略高效地发现了新型糖肽抗生素。该团队通过筛选环境中对于万古霉素不敏感的菌株,将能够产生糖肽类抗生素的微生物进行富集。随后对于这些菌株中的糖肽类抗生素生物合成核心基因进行进化树分析,结果表明多数的生物合成基因簇是合成万古霉素(vancomycin)和替考拉宁(teicoplanin)类天然产物的。而通过对于进化树上其他分支中少数不属于这两类的新型糖肽类抗生素生物合成基因簇的进一步研究,Wright教授研究团队成功发现了新型糖肽类抗生素pekiskomycin,虽然这个化合物与万古霉素的作用靶点相同,这种研究策略却为具有已知作用机制的新型类似物的发掘提供了有效方法。与之相反,Wright教授研究团队利用自抗性基因的进化树分析,通过发现与不同于已知自抗性特征的抗性基因,成功挖掘到了作用机制新颖的糖肽类抗生素。他们在71个具有多样化非核糖体聚肽合成酶中的缩合结构域的糖肽类生物合成基因簇中,基于对各个基因簇中自抗性基因vanHAXvanY的进化树分析,筛选到两种可能具有不同于已知自抗性基因特征的生物合成基因簇分支。对于含有新型自抗性基因的天然产物基因簇进行异源表达,得到了两个通过结合肽聚糖而抑制细菌生长过程的肽聚糖重塑,从而抑制革兰氏阳性菌的新糖肽抗生素corbomycin和complestatin(图8)。证明了自抗性机制与天然产物内在的紧密联系不仅可以帮助新型天然产物的发掘,而且推动着天然产物研究思路和策略的进步。


图8  自抗性基因与进化树分析相结合的基因组挖掘

(在71个具有多样化的糖肽类生物合成基因簇中,corbomycin与complestatin的生物合成基因簇中的自抗性基因特征与已知的抗性基因vanY和vanHAX处于不同的进化树分支)


综上,目前虽然对于自抗性基因的准确预测仍然具有很大的挑战性,特别是如何区分生物合成基因与自抗性基因,但相信随着科学家们对越来越多新型自抗性机制的发现和天然产物生物合成酶学机制研究的深入,将会有更多基于自抗性机制的天然产物挖掘新策略被科学家们揭示。同时,随着AI技术的发展,在新一代自动化生物信息学分析工具的协助下,自抗性基因导向的天然产物发掘策略可以将传统的以活性为导向的策略和基因组指导的天然产物发掘策略进行有效的桥联,弥补两种方法各自的局限性,以更高效地挖掘新型天然产物,从而为天然药物的研发提供助力。



通讯作者及团队介绍


通讯作者:闫岩博士,中国科学院南海海洋研究所研究员,广东省海洋药物重点实验室主任。加州大学洛杉矶分校博士、博士后,先后入选国家高层次海外引进人才、中国科学院高层次海外引进人才。担任中国药学会海洋药物专业委员会“海洋药物博士论坛”青年委员会委员;《中国天然药物》青年编委等。团队研究方向为海洋活性天然产物的挖掘与合成生物学智造,包括:1)研究已知海洋真菌来源活性天然产物的生物合成机制并进一步通过“基因组挖掘”策略发掘新型天然产物;2)探索海洋动植物不可分离培养共生真菌活性天然产物的研究方法,揭示活性天然产物的环境生态学效应;3)通过基因工程和代谢工程策略,实现海洋来源高价值活性天然产物的大规模绿色生产。研究成果先后发表在NatureNature Chem. Biol.Angew. Chem. Int. Ed.J. Am. Chem. SocChem. SciNat. Prod. Rep. 等国际一流期刊。

E-mail: yyan@scsio.ac.cn


第一作者: 宋永相博士,中国科学院南海海洋研究所副研究员。2011年毕业于中山大学化学与化学工程学院生物有机化学专业获得博士学位。2011年至今,任职于中国科学院南海海洋研究所海洋生物资源与生态重点实验室,2017年4月至2018年4月,在加州大学洛杉矶分校化学与生物分子工程系和化学与生物化学系访学。研究方向为海洋微生物活性物质的发掘与应用,目前主要研究工作包括:1)从海洋微生物中发掘具有抗菌、抗虫等活性的先导化合物;2)对潜力活性化合物的生物合成机制和关键基因的功能进行研究,为先导化合物的成药性研究奠定基础。先后发表科研论文60余篇,授权专利16项。

E-mail: songx@scsio.ac.cn



代谢主义
生命在于代谢 人生在于折腾
 最新文章