前言
天然蛋白常常表现出同源多聚的倾向,今年年初的一篇Cell文章就通过结构预测的方式对古细菌、细菌和真核细胞的整个蛋白组进行了同源多聚倾向的预测(详见:跨生物域的蛋白质同源寡聚化图谱)。正如这篇预测文章,目前对蛋白多聚的研究和讨论均在“对称性多聚”的语境下展开。
近日,德国马克斯·普朗克陆地微生物研究所的Hochberg课题组在nature杂志发表了一篇题为“Emergence of fractal geometries in the evolution of a metabolic enzyme”的研究文章[1]。文章报道了一种来源于细长聚球藻的柠檬酸合酶,它能够在体外自组装成“谢尔宾斯基三角形”的形状,展示了蛋白多聚神奇的分形特性。
背景——什么是分形
分形是指在多个尺度上自相似的模式。在自然界中,宏观尺度上的分形现象也比较常见,如植物叶片、河流分支、海岸线等。但这些自然分形都是不规则的,即不同尺度的结构并不完全匹配。不过,自然界也有极少数规则分形的例子,如俗称“宝塔菜花”的罗马花椰菜中的重复结构。
图1. 自然界中的分形结构[2]。
尽管自然界中所有已知的规则分形都是由生物体创造,但这些规则分形仅存在于宏观尺度上。科学研究中已经发现分子尺度的生物分子组装体的组装形式极具多样性,但目前尚未发现自然界中有任何生物分子组装体表现出分形的组装形式。这可能是因为分形构造算法很难转化为生物大分子自组装。例如,谢尔宾斯基三角形(最著名的规则分形之一)可以通过三角形细分等规则来创建。而生物分子的自组装则是通过亚基的顺序添加来进行的,并且依赖于单体之间的局部接触来协调组装。所以,尽管目前人工合成的系统已经能够克服这种限制合成特定的分形图案,但在细胞中仍未发现类似的现象。
图2. 由人工合成的联苯分子组装形成的谢尔宾斯基三角形[3]。
而要介绍的这篇研究中,作者报道了一种能够在室温下的稀溶液中形成谢尔宾斯基三角形的天然代谢酶。他们在体外确定了其结构、组装机制及其对酶活性的调节,最后确定了它是如何从非分形前体进化而来的。
1. 形成谢尔宾斯基三角形的蛋白质
细菌的柠檬酸合酶 (CS) 是一种具有同源多聚特性的酶。它可以组装成二聚体和六聚体。作者发现来源于细长聚球藻(S. elongatus)PCC 7942的CS(SeCS)形成了一种特殊的组装。作者将纯化的CS在纳摩尔浓度下进行质量光度法(MP)分析,发现SeCS形成了包含18个CS亚基的复合物(图3a、b)。
图3. 来源于细长聚球藻的柠檬酸合酶组装形成谢尔宾斯基三角形。
作者通过负染电镜研究了这些组装体的结构,观察到SeCS组装成不同尺寸的规则三角形复合物(图3c、d)。18聚体包含9个可辨别的电子密度,每个电子密度对应一个二聚体。三个二聚体首先排列成六聚体环,然后三个六聚体连接成三角形。18聚体代表了50 nM浓度下的主要多聚体类型,作者还在更高的浓度(450 nM)下观察到了包含36或54个CS亚基的更大复合物。54聚体由三个18聚体组成,排列成一个更大的三角形,其中心有一个大空隙(图3c)。6聚体、18聚体和54聚体分别代表零阶、一阶和二阶的谢尔宾斯基三角形。36聚体代表了另一种三角形,但共享了6聚体构建块和整体的三角形形状。
2. “谢尔宾斯基”组装的结构基础
为了将六聚体构建块组装成谢尔宾斯基分形,需要在二聚体之间引入新的界面。该界面必须满足两个条件。首先,它必须沿着120°外角连接六聚体以形成三角形。其次,界面必须仅在两个二聚体之间形成,这样才能保证没有更多的亚基连接到三角形的边缘(图4a)。这些要求很难通过同源聚合物中常见的蛋白质-蛋白质界面来满足。
图4. 分形组装的层次。
为了了解分形形式如何组装,作者通过冷冻电镜解析了蛋白质谢尔宾斯基三角形的零阶(6聚体,3.1 Å)、一阶(18聚体,3.9 Å)和二阶(54聚体,5.9 Å)结构(图4b)。在18聚体中,CS二聚体通过类似于已知六聚体 CS 蛋白的异源界面组装成六聚体。然后通过相邻六聚体的两个二聚体之间的额外接触形成18 聚体。
该界面具有不寻常的几何形状,每个二聚体中只有一个单体参与相互作用。两个参与互作的单体分别通过自己的N端/C端和对方的C端/N端之间形成界面(图5a)。其中,一个单体的谷氨酸(E6)与另一个单体的组氨酸(H369)之间的相互作用非常重要。将E6或H369突变为丙氨酸或删除氨基酸 2-6 (Δ2-6 SeCS) 会消除分形的形成。在18聚体中,链之间的非等价性使得分子间能够以正确的角度形成相互作用,并确保没有更多的二聚体可以与其结合。这种几何结构进一步证明18聚体不仅仅是普通三角晶格的子结构,而是代表了一阶的谢尔宾斯基三角形。
图5. 分形组装的分子基础。
为了理解这个界面是如何形成的,作者将只能组装成六聚体的变体(Δ2-6 SeCS;图5b)的几何形状与18聚体内的六聚体的几何形状进行了比较。比较发现,参与分形连接的两个二聚体相对于自由六聚体构象经历了小的顺时针旋转,这巧妙地打破了分形内六聚体构建块的D3对称性(图5b)。
接下来作者试图了解18聚体如何组装成54聚体。结构比较发现,18聚体组装为54聚体与将6聚体组装为18聚体使用相同的互作界面。然而,在这两类互作中,参与互作的二聚体之间的二面角是不同的(图5c)。6聚体之间的相互作用的二面角是60°,这与游离的18聚体中的角度相同。而54 聚体内的18 聚体之间的角度为34°。这种不同的角度是必要的,因为六聚体之间相互作用的二面角在 18 聚体的长度上太大,无法闭合 54 聚体中的三角形。对于更大的组件,该角度必须进一步缩小,因为它在更大的距离上会被放大。然而,它们在能量上可能不太有利,这可以解释为什么一阶分形在低纳摩尔浓度下容易形成,而较大的组装体仅在微摩尔浓度下发生。
这些观察结果共同揭示了谢尔宾斯基三角形产生的原理。在可以构建谢尔宾斯基三角形的化学计量(18、54、162等)中,仅在三角形的角上留下3个待互作的二聚体始终是实现这一目标的最有效方法。值得注意的是,SeCS 无需金属配位或对称表面的帮助即可实现这些组装,而合成的谢尔宾斯基三角形通常需要这些。
3. “谢尔宾斯基”组装的功能
接下来作者研究了组装成18 聚体(生理蛋白质浓度下的主要寡聚体)是否对酶功能有影响。CS催化乙酰辅酶A和草酰乙酸缩合生成柠檬酸,是三羧酸循环的第一步。添加底物或产物都会导致结构分解成六聚体(图6a),这意味着六聚体是一个催化活性单位。作者通过两种方式进行了确认。首先,作者测量了野生型和无法形成分形的变体(SeCS L18Q)的酶动力学。在底物饱和的条件下,两种变体的动力学参数几乎相同(图 6b)。在非饱和条件下,部分18聚体保留,野生型的活性仅为六聚体变体的一半(图4b)。其次,作者构建了一个突变体(cys4),它通过二硫桥共价稳定分形界面。这种变体形成的分形复合物在底物浓度饱和的条件下仍能部分存在。与野生型SeCS相比,cys4的kcat降低。添加还原剂后,这种活性下降可以被恢复。这些结果说明组装成分形复合物会显著降低催化活性。
图6. 分形形成对催化功能的影响。
为了解 18 聚体活性较低的原因,作者解析了2.7 Å的结合柠檬酸盐的六聚体的晶体结构。此结构与游离六聚体(Δ2-6 SeCS)结构的比较表明,六聚体内的CS二聚体在与柠檬酸盐结合后经历逆时针旋转(图6c)。这种刚体旋转在其他CS 酶中已被发现。旋转发生在底物结合之后,并将CS从开放构象推入发生催化作用的封闭构象。这种旋转与二聚体结合成分形所经历的顺时针旋转方向相反。这说明分形复合物必须进行更大的构象运动才能诱导底物结合或催化,这可能会产生更高的能量屏障,这也解释了为什么酶活性会下降。
接下来作者探究了这种特殊组装是否在细长聚球藻中发挥作用,特别是作为调节酶活性的一种手段。作者之所以向这个方向探究,是因为这个分形复合体对pH值敏感。事实上,pH值从7.5增加到9会导致SeCS结构完全分解成六聚体(图6d)。这种行为是由分形界面中的残基 H369 驱动的,将其更改为精氨酸能够消除 pH 敏感性,而不会影响其组装成分形(图 6d)。
值得注意的是,细长聚球藻的细胞内pH值经历了昼夜变化,几乎与分形界面的pKa相匹配。白天,其碳浓缩机制通过碳酸氢盐的导入将pH值推至8.4。晚上,pH 值恢复到7.3左右。由于分形组装会降低活性,昼夜节律的pH值变化可能会抑制夜间 SeCS 活性。这种情况似乎是合理的,原因有二:一是作者观察到的细胞内底物和产物水平大大低于破坏18聚体所需的水平。因此,当pH值足够低时,组装可以在夜间合理地形成。二是CS 正在生成 2-酮戊二酸,这是细长聚球藻中氮同化为谷氨酰胺和谷氨酸的唯一已知前体,并且已知该途径中的其他几种酶在夜间被关闭。
为了测试以上想法,作者创建了携带野生型 CS 或突变型 CS 的转基因菌株,这些菌株无法在细长聚球藻的天然基因座上形成分形。在连续光照和12小时昼夜循环下量化菌株的生长,发现没有差异(图 6e)。此外,作者还测试了两种转基因细长聚球藻菌株从氮饥饿中的恢复情况。结果显示也没有差异(图6f)。尽管该组装具有许多调控特征(化学计量之间的催化差异、对生理条件的响应性),但它在实验条件下未显示出特定的适应性。然而,作者认为目前的结果仍不能排除它可能在自然条件下具有其他功能。
4. “谢尔宾斯基”组装的进化
基于以上的观察,作者想知道这样的组装是否只是历史上的一个偶然事件,在功能上无关紧要。因此,作者试图了解柠檬酸合酶的进化历史。为此,作者首先构建了细长聚球藻CS蛋白的系统发育树,其中来自海洋γ-变形菌的CS蛋白作为外群(图7a)。基于这棵树,作者对来自细长聚球藻的几个近缘种的 CS 蛋白进行了表征。除了P. mougeotii之外,作者没有在这些近缘种的CS蛋白中发现 18聚体。在P. mougeotii中,作者观察到丰度非常低的 18聚体,这些18聚体可以通过类似SeCS的删除N端残基来消除(图7b)。这一结果表明,18聚体以及扩展的分形必定是沿着细长聚球藻的谱系进化的,可能是P. mougeotii 和细长聚球藻的最后共同祖先,然后沿着蓝菌属/原绿球藻的谱系很快再次消失。
图7. SeCS分形的演化。
为了检验这一理论,作者使用祖先序列重建在从SeCS通向根的连续节点处复活祖先CS蛋白,并通过MP表征它们的组装(图7c)。最近的祖先 (ancA) 也以纳摩尔浓度和类似于SeCS的丰度形成18聚体。ancB是ancA的前身,也形成了18聚体,但丰度较低,这表明分形界面较弱。SAXS分析的结果还证实ancB可以在较高浓度下形成更大的组装体。所有后续祖先(ancC-ancE)仅形成六聚体。总之,这些数据表明相对较弱的分形从ancC 和ancB之间的六聚体演化而来,然后在ancB和ancA之间变得更强。
作者的实验结果表明,构建稳定的分形需要明显少量的替换,并且分形界面中没有新的强接触。这种简单的起源使得非适应性起源至少是合理的。此外,一旦组装出现,新界面的pKa就已经准备好匹配生理pH波动。这种蛋白质可以构建的大型组件更明显是一种进化事故,它们只出现在非生理浓度下,并且它们的大小很难融入细长聚球藻的细胞质中。即使18聚体实现了有用的功能,该蛋白质制造更大组装体的能力几乎肯定是其偶然进化出的不寻常对称性的意外副产品。
作者认为,根据他们的发现,有理由怀疑自组装的进化转变可能比结构数据库看起来更常见。随着表征蛋白质复合物的技术不断改进,可能会发现随着蛋白质进化而出现和消失的一系列组装类型。也许只有一小部分对其有机体变得重要并持续存在,其他许多则会像出现时一样迅速消失。
小结
综上,作者通过结构解析、进化树构建等手段,展示了一种新的蛋白多聚形式,并对其潜在的生理功能进行了探究。希望如作者所言,随着蛋白复合物表征技术的发展和宏基因组文库的不断丰富,能够观察到随着蛋白质进化而出现和消失的一系列组装类型,丰富对蛋白组装形式的认知。
[1] Sendker, F.L., Lo, Y.K., Heimerl, T. et al. Emergence of fractal geometries in the evolution of a metabolic enzyme. Nature (2024). https://doi.org/10.1038/s41586-024-07287-2
[2] mpi-marburg.mpg.de/1382259/2024-04-b
[3] Shang, J., Wang, Y., Chen, M. et al. Assembling molecular Sierpiński triangle fractals. Nature Chem 7, 389–393 (2015). https://doi.org/10.1038/nchem.2211