目前,检测和量化这些蛋白质和修饰依赖于能与蛋白质分子中特定结构高亲和力结合的生物分子,或是通过切割纯化后的蛋白质小片段来进行表征。然而,这些方法都无法提供足够的灵敏度,来绘制蛋白质的类型及其丰度。Motone等人在《Nature》上撰文,他们报道了一种方法,可以通过将蛋白质链依次穿过膜中的小孔来直接读取蛋白质序列信息。
1996年,有报道指出,当通过膜中生物通道(即纳米孔)的离子流被测量时,如果一个长长的生物聚合物分子被电场单向拉入通道中,所产生的电流会发生变化,取决于生物聚合物上的化学基团对离子流的阻挡程度。这一发现促成了纳米孔DNA测序技术的发展,其中通过测量离子电流的变化来确定DNA分子的碱基序列。
纳米孔DNA测序的开发得益于DNA分子骨架具有均匀的电荷。此外,四种DNA核苷酸的化学结构相似,酶也能控制DNA通过通道的运动。然而,将纳米孔测序的原理应用于蛋白质会更加困难,并面临诸多挑战。这些挑战包括找到方法使蛋白质展开以便进行测序,克服蛋白质链不均匀的电荷从而能够单向穿过纳米孔,以及仅通过离子电流区分20种常见的化学多样的氨基酸侧链。
为解决单向运动的问题,Motone等人使用了两步法。首先,他们为目标蛋白质附加了一个带负电的“尾巴”,使得该分子能够通过电场并快速穿过纳米孔。同时,他们也附加了一个体积大的“塞子”,以防止已穿过纳米孔的蛋白质完全通过纳米孔。接下来,研究人员使用一种名为ClpX的酶(在细胞中作为蛋白质降解过程的一部分,能酶解蛋白质)将蛋白质分子重新拉回纳米孔,以一种逐渐将蛋白质链的部分递送至纳米孔收缩区域的方式完成测序。在第二步中,纳米孔的离子电流随时间的变化明显依赖于蛋白质的序列,其中两种体积较大的氨基酸残基产生了特别显著的电流阻断。
图1 | 读取蛋白质分子氨基酸序列的策略
a,目标蛋白质通过附加一个带负电荷的氨基酸序列进行修饰。在施加电场时,这会导致蛋白质通过脂质膜中的生物通道。
b,一个稳定折叠的“塞子”结构域阻止蛋白质完全穿过通道。塞子被一个蛋白质序列封顶,作为马达蛋白的结合位点。
c,结合的马达将穿入通道的蛋白质重新拉出通道。通道内离子流产生的电流幅度(未显示)会随着通道中存在的氨基酸残基而变化。通过这些测量数据,有可能确定蛋白质的氨基酸序列。
研究人员观察到这些体积较大的氨基酸残基通过纳米孔时的现象,进而得出一个重要发现:ClpX每次以两个氨基酸残基的步进拉动蛋白质链。酶的这一未知特性将极大地帮助在蛋白质测序实验中通过离子电流数据解析氨基酸序列。然而,ClpX的动作并非完美无缺,当它遇到某些特定氨基酸残基时会失去对蛋白质的控制。然而,Motone等人通过巧妙地将这些“滑脱”序列沿着蛋白质链放置,实现了对目标序列的多次重读和回放,从而显著提高了序列测定的准确性。
为了系统研究不同氨基酸侧链对离子电流的影响,研究人员合成了含有多个序列的定制蛋白,这些序列仅在一个残基上有所不同。通过对这些蛋白质的测量,研究人员发现电流阻断的幅度主要与氨基酸残基的体积相关,但带电残基表现出不同的行为。
Motone等人通过简单的物理模型补充了这些实验数据,开发了一种人工神经网络,称为aminocaller,它能够根据离子电流数据准确识别特定残基。研究人员通过定量蛋白质链在环境应激下自发获得的损伤,展示了该测序方法的潜力。他们还展示了该方法的超高灵敏度,能够在一次实验中检测到100多种蛋白质。
纳米孔系统此前已被用于检测和识别20种常见的氨基酸残基、重读蛋白质序列、以及揭示酶引发的蛋白质修饰模式。也有研究表明该系统可以与ClpX酶一起工作。因此,当前工作的最具创新性的特征在于开发了可附加到任何蛋白质上的“适配器”序列(如尾巴和塞子),使蛋白质能够在一个纳米孔系统中加载、读取和回放。尽管将这种方法应用于未测序蛋白质时,添加这些适配器序列的实用性可能会使其难以转化为一种高通量、商业化的技术,但研究人员的原理验证展示了该方法可以应用于天然存在的折叠蛋白质,表明这些实际挑战可以通过努力克服。
Motone及其合作者的发现为开发能够识别单个蛋白质及其修饰、损伤和变体的仪器铺平了道路,但蛋白质从头测序仍不太容易实现。一个困难是,目前的设置中,许多残基同时通过阻断离子流来影响测量的电流。可以通过缩短纳米孔收缩长度,或通过增加蛋白质的拉伸力,减少阻断电流的残基数量。
另一个重要挑战是找到通过离子电流测量识别任意蛋白质序列的方法。一个简单的理论模型或许能够预测已知序列中单个氨基酸替换的特征,但对复杂未知序列的理论分析可能需要对蛋白质分子进行原子水平的计算机模拟,因为残基与纳米孔壁之间的相互作用极其复杂。公开的商业化纳米孔结构,或者将开发工作转向非专有结构的纳米孔,有助于加速纳米孔蛋白质从头测序平台的研制。
doi: https://doi.org/10.1038/d41586-024-02664-3