逆合成(Retrosynthesis)是通过最终产物推导设计合成化合物途径的方法,类似地,逆向生物合成在此基础上增加了酶促化学反应。I型聚酮合成酶(PKS)一直被视为逆向生物合成的基础,由PKS产生的聚酮类化合物是一类多样化的天然产物,如红霉素、两性霉素B、依泊妥尔等,广泛应用于农业和医药领域。这些化合物复杂的结构为化学合成带来了极大的挑战。因此,PKS产物的化学结构可以直接由途径中酶的顺序和类型推断。
PKS由多个模块组成,PKS基因簇DNA序列与生成的分子结构之间存在直接关系。许多工程化PKS表现出较低的催化活性,主要由于PKS内部的蛋白质-蛋白质相互作用和底物-蛋白质相互作用尚未得到充分表征。最近的研究表明,传统用于模块间连接的边界可能并不是最佳的,替代性边界可能会提高成功率。蛋白质结构预测的AlphaFold2和RoseTTAFold等模型催生出许多新研究,作者在现代结构建模背景下重新审视以往的PKS模块化工程,并且探讨这些研究结果如何促成新一代的PKS设计原则。
模块化聚酮合成酶工程
PKS“乐高化”(lego-ization)意味着将PKS部件进行组合表达以合成新型产物(见图1A)。研究发现,下游模块KS域在嵌合模块间起关键作用,交换KS域在某些情况下可以恢复非活性相互作用;KS域与上游域之间的协同进化更为紧密,即PKS交换单元(XU)。这种KS把关活性在trans-AT PKS装配线中比在cis-AT PKS系统中更为普遍,并且已被用来识别此类系统的可推广设计原则。
KS域在同一PKS内彼此之间的亲缘关系比其他宿主生物的KS域更为密切,PKS的进化主要通过水平基因/BGC转移、重组、基因转换以及遗传漂变来实现,而非通过基因复制。此外,该模型暗示了通过趋同进化来缓解模块边界活性降低的多种进化途径。考虑到这些因素,一些基于进化的PKS工程策略得以提出(图1B、C)。Tylosin和Rapamycin PKS进化实验生成了多个截短装配线,当从天然PKS中删除模块时,重组位置通常分布在KS、AT域及ACP上游的跨域连接区域内,KS中部更是一个重组热点,利用了KS域间的高序列同源性。Pikromycin PKS系统,支持XU模块边界的使用可以改善嵌合PKS的活性。此外,体内同源重组工程策略也被应用于Pikromycin PKS。Aureothin和Neoaureothin PKS是两个同源BGC,通过利用XU模块边界成功工程出非天然产物。Stambomycin PKS则是对模块边界进行最系统研究的对象之一,研究人员采用了六种不同方法来生成截短版本的装配线,并将这些方法进行了比较。
图1 基于模块的PKS工程
在三种主要交替边界(图2)中不同工程系统中取得了一定成功。然而,若不在多个系统中系统性地研究模块边界,很难找到可推广的设计原则。最近报道了一种被应用于优化AT交换交替边界的方法,它可以通过寡核苷酸库生成交替库、高通量筛选高表达变体的溶解度传感器、以及对库中多样性子集的动力学分析,系统化地分析模块-模块交互作用。
图2 模块结的选择对工程PKSs的溶解度和活性至关重要
聚酮合成酶的动力学
PKS是一种非常大且高度动态的同源二聚体蛋白,这使得PKS装配线的结构表征在很长一段时间内仅限于单个域或双域。例如,已对对接域、AT域、KS-AT双域、DH域、KR-ER双域、TE域和KR域进行了单独表征。然而,PKS装配线的活性高度依赖于域之间的相互作用,而这些相互作用无法通过孤立域的结构完全描述。特别是对于基于模块的PKS工程,有一些关键的结构特征决定了催化活性,包括:(i)ACP域将聚酮链转移到下游KS域的能力;(ii)KS域催化聚酮链与扩展单元的缩合的能力;(iii)ACP域将酮单元扩展单元与上游KS域连接的能力。
最近有多个涉及多域结构表征的报告揭示了如何可能改进基于模块的工程。第一个关于模块-模块相互作用的直接描述利用了小角X射线散射(SAXS)在不需要结晶的情况下捕获蛋白质的低分辨率结构,显示了活性PKS模块的构象。然而,由于分辨率的限制,许多关键的模块间通信细节尚未得到解析。低温电子显微镜(cryo-EM)也被用来捕捉全长PKS模块的构象数据,并提出KS域内有两个不同的活性位点,用于模块内和模块间的ACP相互作用。尽管这种系统表现出拱形结构与先前的延伸结构模型不同,但最近的结构数据也在进一步反驳这一观点。
同时,cryo-EM与第一个全长PKS模块的高分辨率X射线晶体结构一起被用于揭示模块内转酰化和链延伸的许多动态事件。分子动力学模拟还用于可视化AT域接受扩展底物时小亚基的结构变化。高分辨率cryo-EM结构进一步揭示了AT域相对于其特异性KS域的位置如何实现转酰化。在II型脂肪酸合成酶中,ACP和KS域之间的相互作用界面已发现几个关键残基,它们改变了KS活性位点内底物的行为,并阐明了KS催化活性的详细机制。尽管II型脂肪酸合成酶和I型PKS的KS-ACP界面并不完全相同,观察到的ACP域与其对应AT和KS域之间的关键相互作用仍然支持ACP域的相容性相互作用对于PKS活性的关键性。这种ACP与下游模块KS域的兼容性在多个报道中得到了证实。最近cryo-EM分辨率的提升提供了对PKS酶结构动态的关键视角,并应继续被应用,以进一步阐明催化活性的轨迹,正如在NRPS领域所做的那样。
聚酮合成酶的蛋白建模
基于深度学习模型的高精度蛋白质结构预测算法AlphaFold2和RoseTTAFold的发布,使得诸多蛋白质工程成就成为可能,包括从头设计蛋白质和蛋白质组水平的蛋白质相互作用筛选。类似的深度学习模型也被用于开发MutCompute,这是一种通用的蛋白质设计算法。此外,大型语言模型的进步促成了ESMFold等程序的发展,这是一种快速的蛋白质结构预测算法;以及ProGen,这是一种能够“构想”具有自定义特性的蛋白质序列生成算法。其他工具也增加了AlphaFold2的可及性,包括ColabFold和Foldy。尽管这些现代蛋白质建模算法实现了许多突破性成果,但在大蛋白质(>3000个氨基酸)的建模和高精度蛋白质复合物建模方面仍存在挑战。
在此作者发现AlphaFold2能够合理建模整个PKS模块,并在某些情况下显示出不对称的反应腔。每个由AlphaFold2生成的PKS模型均呈现延展型构象,未观察到拱形构象模型。这可能是由于AlphaFold2所训练数据集中包含的KS-AT结构域的大多数实验衍生结构为延展型构象。另一个有吸引力的功能是能够同时建模多个模块。然而作者无法同时获得包含两个全长模块的AlphaFold2模型,主要有两个原因:(i)所需的GPU内存随蛋白质长度呈平方级增长,导致过大的蛋白质复合物发生内存不足错误;(ii)通过减少输入到AlphaFold2的多重序列比对大小来降低内存使用会导致生成的结构中出现伪影,例如链重叠。作者成功地展示了截断上游模块以便与下游模块建模的方法,从而能够可视化ACP与下游KS-AT及上游KS-AT的相互作用。
这些功能引发了一个问题:结构建模是否可以用来预测某个ACP是否能成功与某个KS结构域相互作用。因此作者使用AlphaFold对Menzella等人实验表征的144个亚基间ACP和KS-AT相互作用进行了建模,并应用Humphreys等人描述的最先进的蛋白质复合物预测算法,计算上游ACP成功与下游KS发生相互作用的概率。本地相互作用模块之间的预测相互作用概率将高于非本地相互作用模块,并且与整体产量水平相关。然而,作者观察到预测的相互作用概率与Menzella等人观察到的产量数据之间的相关性有限。该结果并不令人意外,因为显然产物产量依赖于多种因素,包括非本地底物耐受性和嵌合蛋白的稳定性。此外,尽管最初假设本地相互作用结构域之间的预测相互作用概率会高于非本地相互作用结构域之间,但看到ACP与KS之间的预测相互作用概率与是否为本地相互作用的相关性有限。可能的原因包括模型中包含的对接结构域在每种组合中都是非本地的(除eryM2 ACP和eryM3 KS-AT外),导致预测结果不一致,或者AlphaFold2缺乏区分PKS模块间高度同源结构域的精度和分辨率。最终,KS和ACP结构域间的成功相互作用可能是必要条件但不足以确保产量,需要对蛋白质-蛋白质和底物-蛋白质的相互作用进行更全面的分析。改进共进化信号的计算方法,适用于PKS这种线性多结构域和多亚基酶装配线,例如使用antiSMASH注释来更新多重序列比对,预计将提高这些算法的准确性。此外,能够处理底物-蛋白质相互作用的深度学习工具(如DiffDock)的进步与整合,应该能够实现PKS行为的更全面建模。最后,AlphaFold2能够生成PKS的独特稳定构象,为PKS动态的详细可视化提供了可能。目前,这些工具已达到能够获得独特且新颖见解的阶段,进一步的改进将加速PKS工程中的潜在应用。
图3 应用于PKSs的现代深度学习蛋白质模型
原文链接:
https://pubs.acs.org/doi/10.1021/acssynbio.3c00282
免责声明:本文旨在分享生物合成与未来食品领域科研动态,不代表平台立场,不构成任何投资意见和建议,以官方/公司公告为准。本文也不是治疗方案推荐,如需获得治疗方案指导,请前往正规医院就诊。
版权声明:标注‘原创’仅代表原创编译,本平台不主张对原文的版权。中文内容仅供参考,一切内容以期刊官网为准。
本平台转载仅仅是出于学术交流和传播信息的需要,并不意味着代表本平台观点或证实其内容的真实性;转载文章版权归原作者所有,作者如果不希望被转载或有侵权行为,请联系本平台删除。
摘译 | 王咏桐
编辑 | 王咏桐
左莎莎
陈嘉序
审核 | 刘 娟