NatChem最新| RiPPs的从头设计

文摘   2025-01-09 08:36   江苏  

研究目标和意义

本论文的研究目标是开发一种生物物理模型,用于组合来自不同细菌 RiPP (核糖体合成和翻译后修饰肽) 基因簇的酶,从而设计新颖的 RiPP 结构。正如作者所指出的挑战:

De novo peptide structures could be built by combining enzymes from different pathways, but determining the rules of their use is difficult.

将不同通路中的酶组合起来构建全新的肽结构是可能的,但确定它们的使用规则很困难。论文想要解决的实际问题是,如何从海量的天然 RiPP 酶中,挖掘出能在非天然底物上协同工作的酶组合,并用于创造具有新化学性质和功能的 RiPP 分子。

该问题对 RiPP 药物和材料的开发有重要意义。天然 RiPP 具有抗菌、抗肿瘤等生物活性,是重要的药物先导化合物。但野生型 RiPP 通常难以直接用于临床,需要对其结构和性质进行优化。传统的化学半合成方法耗时费力,而利用酶实现翻译后修饰(PTMs)则更加灵活高效。如果能建立一套"引擎",帮助我们设计、预测酶促 PTMs 的产物,就能极大拓展 RiPP 分子多样性,加速药物发现和开发。

此外,一些 RiPP 还能作为核酸无机材料的模板。工程化的 RiPP 肽链能与金属离子配位、成核和组装,形成纳米线、量子点等新颖结构。因此,论文所构建的生物信息学工具,也有望用于指导仿生无机材料的精准合成。


新方法与特点

论文提出了一种计算机辅助的 RiPP 酶"配对"模型,主要由以下几个部分组成:

  1. 定义酶的底物特异性规则。论文考察了4类前导肽依赖型酶(graspetide、spliceotide、pantocin、cyanobactin)和5类前导肽非依赖型酶(glycocin、lasso peptide、lanthipeptide),通过突变前导肽/核心序列并测试酶活性,提取每类酶的最小规则集(recognition sequence , RS),包括:
  • 识别序列
    :酶结合前导肽所需的最短序列
  • RS-修饰位点距离约束
    :RS 与被修饰氨基酸之间的距离要求
  • 核心序列容限
    :对核心序列变化的容忍程度

The minimal rule set needed to use an enzyme is (1) core tolerance, (2) the RS and (3) RS distance constraints (Fig. 1a).

  1. 构建生物物理学模型。使用 Michaelis-Menten 动力学,计算酶与前导肽结合引起的自由能变化(ΔG),包含三项贡献:
  • RS 结合自由能(ΔΔGRS)
    : 与前导肽 RS 结合引起的自由能变化
  • RS-修饰位点距离相关自由能(ΔΔGdist)
    : RS 与修饰位点距离偏离最优值所引入的自由能惩罚
  • 核心序列结合自由能(ΔΔGcore)
    : 与核心肽结合引起的自由能变化
  1. 开发计算机辅助设计流程。用户输入目标 RiPP 长度和修饰模式,该流程可自动设计出最优前导肽序列(同时满足所有酶的 RS 和距离约束),以及预测可被修饰的核心序列空间(同时满足所有酶的底物容限)。

与文献中现有的酶组合策略相比,本研究的特点和优势在于:

  • 实验数据驱动的建模。不是简单地将天然前导肽片段拼接,而是通过大量突变和酶活实验,定量刻画每类酶的底物特异性。这使得计算模型能外推至非天然底物,极大拓宽了 RiPP 设计空间。
  • 同时优化前导肽和核心肽。现有研究往往只关注核心肽的容限,而本研究通过生物物理模型,将前导肽的 RS、距离约束与核心肽容限统一考虑,实现两者的协同优化。而且利用分子力学,将序列变化定量为自由能,使得优化目标更加明确。
  • 模块化和可扩展。本方法对不同类型的 RiPP 酶采用统一的建模范式,通过提取少数关键参数(RS、距离、容限),就能刻画它们的底物特异性。这种模块化使得模型可以灵活添加新的酶类,具备很好的可扩展性。


关键结果

本文通过系统的实验探索,在RiPP合成生物学领域取得了一系列重要突破:

1. 提取了10种RiPP酶的底物特异性"最小规则集"

作者考察了4类前导肽依赖型酶(graspetide、spliceotide、pantocin、cyanobactin)和5类非依赖型酶(glycocin、lasso peptide、lanthipeptide),通过突变前导肽/核心肽并测活,定义了每类酶的识别序列(RS)、RS-修饰位点距离约束和核心序列容限(图1):

The minimal rule set needed to use an enzyme is (1) core tolerance, (2) the RS and (3) RS distance constraints (Fig. 1a).

这一规则集最小化地刻画了RiPP酶的底物特异性,为后续计算机辅助设计奠定了数据基础。之前的研究往往局限于个别酶,规则零散且不成体系,本文则在统一条件下测试了10种酶,规则简洁且具普适性,是对RiPP酶底物特异性认知的系统性突破。

图1

2. 建立了基于生物物理学的RiPP酶底物结合计算模型

作者利用热力学和分子力学,构建了描述RiPP酶-底物结合自由能的数学模型。该模型包含RS结合能(ΔΔGRS)、RS-修饰位点距离罚分(ΔΔGdist)和核心序列结合能(ΔΔGcore)三项(公式2),以及相应的计算方法(公式1,3-4,图1e-f):

The free energy contributions of the enzyme binding to the leader and core are given by ΔΔG = ΔΔG leader + ΔΔG core = (ΔΔG RS + ΔΔG dist ) + ΔΔG core (2)

该模型定量揭示了酶-底物识别的分子机制,使得计算设计成为可能。与经验性的酶组合方法相比,这种定量模型能更精准地预测复合修饰产物,并指导非天然RiPP的从头设计。

3. 开发了计算机辅助RiPP设计流程并实验验证其有效性

基于上述模型,作者开发了计算机辅助设计程序。用户只需输入目标RiPP长度和修饰模式,程序即可优化出前导肽序列和预测可修饰的核心肽空间(图3a-b)。

图3

在双酶组合实验中,该程序预测了4个有效组合,合成了含噻唾环/内酯/β-氨基酸等修饰的 RiPP分子,修饰效率7~67%(图3c-d):

Of those attempted, the number of core peptides that were expressed ranged from two to twelve for the various combinations of enzymes (Supplementary Figs. 15–20). Four of six enzyme combinations led to at least one correctly modified peptide (Fig. 4c).

在三酶实验中,EngG1-8PP含三种修饰(噻唾环、β-氨基酸、磷酸化)的肽占15%(图4d-g),EngH1-8LL含三种修饰(噻唾环、双内酯、β-氨基酸)的肽占7%(图4k-n):

We identified EngG1-8 PP , which constituted 7% of the purified peptide, as having all modifications (Fig. 4k, Supplementary Fig. 38 and Supplementary Table 2), and TEV proteolysis followed by LC–HRMS confirmed its mass with 2.3-ppm mass error (Fig. 4k).

这是首次在大肠杆菌中实现整合三个RiPP酶,极大拓展了RiPP合成的化学空间。与从头化学合成相比,该方法操作简单、产量高,为创制结构新颖的非天然RiPP提供了有力工具。

图4

4. 揭示了酶底物耦合的内在规律,为多元RiPP通路设计提供理论指导

作者通过系统考察不同酶组合的底物耦合模式和效率(图1-4),发现了以下规律:

(1) 多数RiPP酶对前导肽RS的突变容忍度高,而对核心序列的特异性强,如PaaA、PlpXY等(图2b-c)。这意味着前导肽的可塑性高于核心肽,可用于拓展酶的底物适用范围。

图2

Leader-independent enzyme specificity can vary, with some being sensitive to sequence or peptide conformation and others being tolerant.

(2) 部分RiPP酶对RS的空间位置十分敏感,如PaaA需RS紧邻核心序列,而LynD、TgnB相对不受RS-核心肽距离的影响(图1f)。这反映了酶构象塑造核心肽结合方式的差异,在多元RiPP设计中需"因酶制宜"。

For PlpA2, reducing d led to rapid loss of modification, but insertions were tolerated. The PaaP RS has rigid requirements; even a small GGG insertion between the leader and core disrupted modification (with the follower unchanged). LynD was the most tolerant, with insertions having minimal effect.

(3) 个别酶如LynD在非天然底物上易引入非预期修饰。这可能源于局部序列微环境的扰动,在多元RiPP设计时应尽量选择底物专一性高的酶,避免"脱靶效应"。

Unexpectedly, we observed that several cores modified by LynD contained an extra modification (one more −18-Da mass shift than expected). This modification was only observed when cysteine was preceded by a serine or threonine, and was not counted as being correctly modified.

(4) 同时整合3种及以上RiPP酶具有一定挑战性,产量往往低于双酶体系,如EngH1-8LL仅占7%(图4k)。这提示代谢负荷、酶间干扰等因素可能制约了多元RiPP通路的效率,需要系统优化以提升产量。

For each enzyme combination, one modified peptide was selected for structural analysis by LC–MS/MS and alanine scans: EngA1-4 LL (LynD/TgnB), EngB1-4 LL (PlpXY/TgnB), EngC2-4 (LynD/PlpXY) and EngD8-4 (PaaA/LynD) (Fig. 4d and Supplementary Figs. 21–31). Because each enzyme converts a fraction of its peptide substrate, we observed a mixture of products, including unmodified, modified by either one of the enzymes and modified by both enzymes.

综上,作者以大量实验数据为依托,揭示了RiPP酶底物耦合的内在规律。这些规律从酶学和结构生物学角度,理性阐释了RiPP酶组装的succeed模式,对于多元RiPP合成通路的定向设计具有重要的理论指导意义。未来如何提高复杂RiPP通路的催化效率,并释放其在药物先导发现中的应用潜力,将是一个值得深入研究的方向。


影响与应用

本论文建立的计算工具将加速新型 RiPP 分子的生物合成。它使我们能系统探索天然 RiPP 酶的组合空间,发现协同效应好、底物容限广的酶组合,用于创制具有药用或材料价值的新 RiPP。一些可能的应用场景包括:

  • RiPP 药物先导化合物的优化。可利用本方法引入新的修饰基团,改善天然 RiPP 药物的药代、药动学性质,提高其成药性。
  • 非天然氨基酸的位点特异性引入。一些 RiPP 酶能引入 β-氨基酸等非典型单体,利用本方法实现精准引入,可赋予肽特殊的化学性质和功能。
  • 无机纳米材料的仿生合成。含有噻唑啉、吲哚、内酯等环状结构的 RiPP 肽可作为无机材料的成核模板,利用本方法进行定向进化,有望实现纳米颗粒、纳米线等结构的可控组装。

作为科研人员,后续可着重关注以下几点:

  • 扩大酶库和多样性。将更多不同来源、催化不同 PTMs 的 RiPP 酶纳入该模型,并系统测试它们的底物耦合能力,为人工 RiPP 的合成提供更丰富的"工具箱"。
  • 优化前导肽-核心肽界面。RS 与核心序列的界面在一定程度上影响酶与底物结合,后续可进一步优化此界面,提高修饰效率和专一性。
  • 耦合机器学习和实验筛选。机器学习可用于加速前导肽和核心肽序列的设计和优化,但仍需要合理的实验筛选策略(如定向进化),二者结合有望极大提升 RiPP 工程的成功率。


未来在 RiPP 工程领域,还有几个方向值得进一步探索:

  • 开发更高通量和更精准的表型筛选方法。目前的 LC-MS 方法通量较低,光谱解析也有一定挑战。发展基于荧光、化学反应、核酸适配体等的高通量检测手段,将加速 RiPP 酶及其底物的进化。
  • 整合不同类 RiPP 通路。不同家族的 RiPP 酶在序列和结构上差异较大,整合它们具有挑战性,但若能实现,将极大拓宽组合化学空间,获得更多新颖结构。
  • 开发 RiPP 合成生物学的工程化工具。针对 RiPP 通路开发一套标准化的遗传元件(启动子、RBS等),实现元件化的通路设计和优化,提高 RiPP 合成的稳健性和可预测性。
  • 耦合生物信息挖掘与实验验证。从基因组数据库中挖掘新的RiPP酶,并将其纳入机器学习模型和实验流程,不断完善和扩充 RiPP 工程的方法库。

这些科学问题的解决将催生出一系列新技术:

  • 超高通量 RiPP 分子筛选和定向进化平台
  • 整合多种非天然氨基酸和修饰的 RiPP 合成工具
  • 基于机器学习的 RiPP 序列-结构-功能预测算法
  • 用于 RiPP 先导化合物优化的自动化设计流程



Biosyn导师:Christopher A. Voigt

https://en.wikipedia.org/wiki/Christopher_Voigt

Christopher Voigt是合成生物学领域的领军人物之一,目前担任麻省理工学院(MIT)生物工程系Daniel I.C. Wang高级生物技术讲席教授。他的研究兴趣集中在细胞程序设计,旨在赋予细胞协同完成复杂任务的能力,并将其应用于医学、农业和工业领域。以下是他的部分代表性工作:

  1. 在细菌、酵母和哺乳动物细胞中设计基因线路。这些编码于DNA中的线路可在细胞内实现计算操作。
  2. 开发用于细胞程序设计的Cello软件,该软件基于电子设计自动化(EDA)原理和Verilog语言。
  3. 开发基因编码传感器,使细胞能够响应化学物质、环境信号和彩色光。
  4. 开发基于生物物理学、生物信息学和机器学习的精准基因元件计算设计工具。
  5. 设计治疗用细菌,使其能在人体内导航,识别并纠正疾病状态。
  6. 重新设计固氮基因簇,以促进其在生物间转移,并用合成传感器和线路控制。
  7. 从大规模DNA序列数据库(如人肠道微生物组)中发现新药,利用高通量途径重编码和DNA合成技术。
  8. 利用细胞生产蜘蛛丝、尼龙-6和DNA纳米材料等新型材料。

此外,Voigt教授还是以下机构和项目的核心成员:

  • 国家科学基金会资助的合成生物学工程研究中心(SynBERC,现更名为EBRC)的创始成员
  • 《ACS Synthetic Biology》杂志主编
  • Asimov(细胞编程)和Pivot Biotechnologies(农业)公司联合创始人
  • 合成生物学:工程进化与设计(SEED)系列会议联合创始人
  • 荷兰皇家帝斯曼集团(DSM)科学顾问委员会主席



Biosyn世纪
施一公:“我相信,21世纪是生命科学的世纪,而华人生物学家将在其中发挥极为重要的作用。”
 最新文章