蛋白拆分和模块化重组的生物学应用

学术   2024-05-19 10:36   北京  

拆分系统(split system)在生物学研究中有着广泛的应用,为PPI分析和药物筛选、生物逻辑门构建、光遗传学、基因组编辑、以及定向进化等提供了有力的工具。近日,ChemBioChem杂志刊发了一篇题为“Split Proteins and Reassembly Modules for Biological Applications “的综述文章,总结了目前蛋白拆分系统的最新进展。本文节选了其中对拆分系统和模块化重组部分的介绍,希望大家在进行相关实验时能够有更多的选择。

1. 拆分重组的策略

蛋白拆分系统可以作为一种控制蛋白质和细胞活性的工具,它通过将蛋白质拆分成两个或多个片段,这些片段之后再被重组。该系统可以根据蛋白的活性恢复机制进行分类,可以分为条件激活系统和自发重组系统(图1)。


图1. 蛋白拆分系统概览。

在自发重组系统中,蛋白片段本身具有自组装的能力,不需要额外的模块或外部触发。具有这类特点的代表性蛋白包括荧光蛋白和内含肽类。在条件激活系统中,每个片段都与一个促进重组的模块耦合。这些拆分的片段被设计成只有在特定的诱导条件下才会重新结合并变得有活性,这些诱导条件包括光、化学物质或由重组模块引入的温度变化。

2. 蛋白拆分面面观

2.1 荧光蛋白

遗传编码荧光蛋白的发展已经成为分子和细胞生物学的基石,它使得对活细胞内生物现象的非侵入性观察成为可能。GFP及其衍生物,与mCherry和黄素单核苷酸结合荧光蛋白(FbFPs)一起,已被重新设计成拆分系统,进一步扩大了它们在生物学研究中的应用范围。

分裂GFP技术的起源可以追溯到21世纪初Ghosh等人的开创性工作,该技术引入了一种通过在特定位点拆分GFP来观察活细胞内PPI的方法。这种方法实现了蛋白质动力学的直接可视化,成为了细胞生物学的基础工具。这个双组分系统包括一个大的传感器片段(GFP1-10)和一个小的GFP11 β-折叠股,这样的设计尽可能地降低了片段对于被标记蛋白的潜在破坏,为研究细胞环境中蛋白相互作用提供了不错的方法。

分裂sfCherry系统扩展了荧光蛋白工具箱。Kamiyama等人通过采用串联标记策略解决了分裂sfCherry的初始荧光信号弱的问题,增强了其在活细胞成像中的实用性,并减少了光漂白。黄素单核苷酸结合荧光蛋白(FbFP),来源于光氧电压(LOV)结构域,利用黄素单核苷酸(FMN)进行荧光,独立于氧发挥作用,使其非常适合厌氧研究。

2.2 荧光素酶

分裂荧光素酶系统,如从萤火虫荧光素酶(Fluc, 61 kDa)衍生的,其拆分位点为2-416/398-550,已经实现了植物和哺乳动物模型的详细PPI成像,展示了它们的广泛用途。海肾荧光素酶(Rluc,36 kDa)也有类似的应用,拆分位点为229/230和110/111,促进了植物和活细菌中PPIs研究。高斯荧光素酶(Gluc,20 kDa)在93/94处拆分,已被用于体内配体-受体结合研究。最小的NanoLuc (Nluc)是由Oplophorus gracilirostris的荧光素酶衍生而来。它利用N端159个氨基酸片段与C端11个氨基酸片段结合形成NanoBiT互补报告基因,从而为哺乳动物细胞的PPI研究提供了优越的灵敏度。

2.3 辣根过氧化物酶

辣根过氧化物酶(HRP)转化为分裂形式(sHRP)标志着分子生物学的重大进展。由于酶的活性依赖于血红素辅助因子、二硫键、N-糖基化和Ca2+离子,因此构建HRP拆分蛋白系统面临挑战。尽管如此,Ting团队通过筛选17个不同的溶剂暴露环区,并选择213号位切割,成功地设计了sHRP。这项创新使酶片段能够通过蛋白质相互作用重新激活,为可视化复杂的生物过程(如突触连接)提供了一种新工具。

2.4 RNA聚合酶和阻遏子

通过拆分系统来调节T7 RNA 聚合酶(T7RNAP)能够实现在转录水平对基因表达的控制。在179/180位点的拆分可以作为“与”逻辑门实现体内基因调控。另一种拆分是在563/564位,由此发展出了mOptoT7系统,能够在哺乳动物细胞内实现蓝光诱导的mRNA表达的调控。类似的还有热抑制的T7拆分系统,实现温度依赖的基因表达。而且,T7RNAP还可以被拆分成四个部分(67&179&601),实现更多逻辑门的构建。类似T7RNAP,四环素阻遏子也可以被拆分,以构建四环素调控的基因表达系统。

2.5 Cas蛋白

Cas蛋白是CRISPR-Cas系统的核心,它们通过gRNA来识别特定的基因。而拆分Cas蛋白的方法能够有效地解决AAV病毒载体容量限制的问题,帮助全长Cas蛋白的递送。而且拆分系统不仅能帮助递送,同时也能实现对Cas蛋白时间和空间上的控制,这其中包括了Cas9,Cas12a,Cas13b等Cas蛋白。

Cas9是一种来自化脓性链球菌的160 kDa的酶,以其诱导DNA双链断裂的能力而闻名。它为引入遗传修饰(如插入、缺失或突变)铺平了道路。相较Cas9,Cas12a对更短的gRNA的兼容性更好。在34个对毛螺菌科来源的Cas12a的候选拆分位点中,730/731位点被选中用于诱导型基因组编辑应用。

属于Cas13家族的Cas13b由于其靶向单链RNA的特性为RNA编辑提供了工具。其相对Cas9和Cas12a更小的分子量使得其更易以向哺乳动物细胞中递送。

2.6 碱基编辑器

在碱基编辑领域,确保精度对于尽可能减少脱靶突变至关重要。碱基编辑器的拆分作为一种加强控制、实现可诱导和可时空调控基因组编辑的方法而出现。这种方法通过实现精确的基因修饰,为治疗研究,特别是癌症等疾病的治疗研究带来了巨大的希望。碱基编辑器主要分为两类:腺苷碱基编辑器(ABE)和胞嘧啶碱基编辑器(CBE)。

ABE能够通过中间体肌苷(inosine,I)将A-T碱基对转化为GC-碱基对。大肠杆菌来源的TadA已经实现了通过其loop区76/77位点的拆分实现更特异的靶向性。之后的研究发现,对于人源的ADAR2-DD,468/469位点适合被用于拆分。

CBE作为熟知的胞嘧啶脱氨酶,能够将G-C碱基对中的C催化脱氨变成U,最终被突变为T实现转化。人载脂蛋白B mRNA编辑酶催化亚基3A(A3A)的ssDNA结合界面所对的loop上的85/86位点的拆分能够增强其特异性。另外,人激活诱导胞苷脱氨酶(AID)72/73位的拆分也有望实现更精准的基因组编辑。

2.7 Cre重组酶

来源于P1噬菌体的酪氨酸重组酶Cre以其能够对位于34bp的LoxP位点中间的DNA序列进行剪切和重组而知名。由于这些能力,Cre重组酶常被应用于基因操纵研究,特别是基因敲除研究。已有许多位点如43/44,59/60,153/154等被证实拆分后重组的Cre具有活性。

2.8 氨酰-tRNA合成酶

氨基酰基tRNA合成酶(aaRSs)是一种利用ATP将特定氨基酸与其相应的tRNA分子连接起来的酶。为了寻找能整合除了20种天然氨基酸之外的非天然氨基酸,研究者已经开发出多种不与天然翻译系统相互作用的正交的aaRS/tRNA对。这些正交的aaRSs,特别是它们的拆分形式,可以作为发展非天然氨基酸激活的逻辑门的工具。现在已经验证的可以拆分的aaRS包括吡咯赖氨酸-tRNA合成酶和酪氨酰-tRNA合成酶。

2.9 生物素连接酶

生物素连接酶能够催化生物素受体蛋白和avi-tag的赖氨酸残基连接生物素。这个过程对研究细胞内蛋白定位和蛋白互作的临近标记技术非常重要。现在已有对大肠杆菌来源的生物素连接酶BirA变体——TurboID的拆分研究。SPELL算法找到73/74是一个理想的拆分位点,可以应用于PPI的检测。

2.10 蛋白酶

近来的研究显示拆分的蛋白酶能够实现可控的条件激活,其中以烟草花叶病毒(TEV)蛋白酶和人鼻病毒3C(HRV 3C)蛋白酶最受关注。

TEV 蛋白酶是一种27kD的半胱氨酸蛋白酶,它不需要额外的辅因子就可以在哺乳动物的细胞质中有效地发挥功能。它有着高度的序列特异性,能够识别“ENLYFQS”序列,因此能在哺乳动物细胞中最小化脱靶效应。其工程化变种uTEV3,在117/118间有个拆分位点,已经被应用于检测PPI的化学依赖的逻辑门的构建。

HRV 3C 蛋白酶是另一种20kD的半胱氨酸蛋白酶,靶向“LEVLFQGP”序列。它以能够在低温和多种不同缓冲液条件下保持活性著称。Wang等人鉴定出它随机卷曲区的82/83可以作为拆分位点,应用于大肠杆菌的PPI检测。

2.11 β-内酰胺酶

β-内酰胺酶是一种至关重要的酶,它通过水解抗生素中的β-内酰胺环,使细菌对青霉素和头孢菌素等药物产生耐药性。根据它们序列的同源性,β-内酰胺酶可以分为A-D四类。

值得注意的是,在革兰氏阴性细菌(如大肠杆菌)中发现的A类β-内酰胺酶TEM-1利用丝氨酸残基破坏β-内酰胺键。Michnick组最先探索了TEM-1拆分的应用,他们通过196/198位点的拆分构建了一个 PPI检测器。在此基础上,Nervieg等人进行了进一步尝试。他们采用分裂的TEM-1以高精度高特异性地激活前药。拆分的β-内酰胺酶选择性分解含有β-内酰胺的化合物的能力为通过特定底物的设计和基因环路的构建提供了条件。

2.12 蛋白酪氨酸磷酸酶1B

PTP1B通过去磷酸化酪氨酸残基在细胞信号传导中起着至关重要的作用,其失调与各种疾病有关。因此它也是糖尿病和肥胖症的治疗靶点。最近的进展包括使用SPELL算法确定PTP1B的最佳拆分位点为205/206,使研究人员能够通过光来控制其在细胞中的活性。

2.13 卤代甲基转移酶

卤代甲基转移酶(MHT)是一种催化S-腺苷甲硫氨酸和卤素离子共价结合的酶。Fulk等人在他们的拆分策略中利用了来自植物肉穗果的MHT,选择了远离保守区域的拆分位点。通过对83个MHT家族成员的序列比对,他们确定了三个潜在的非保守拆分位点,其中113/114位点是最适合拆分MHT的位点。他们的结果显示了构建拆分系统在改善用于环境监测的生物技术的潜力。

2.14 HaloTag

HaloTag是一种33 kDa的工程化卤代烷烃脱卤酶,可以与其配体(如氯代烷烃)形成共价结合。HaloTags拆分位点的选择以结构为指导,主要在高溶剂暴露区,特别是139/140、155/156、194/195和212/213位点。这些挑选的位点已经通过GFP扫描的方法进行了验证。最近,HaloTag在155/156位点被一分为二用于发展标签辅助的酶互补。这种方法包括用相对较小的标签标记感兴趣的蛋白质,例如GFP11(16个氨基酸)和SpyTag002(13个氨基酸),分别招募GFP1-10和SpyCatcher。与这些标签结合的HaloTag允许随后使用荧光HaloTag配体进行可视化。

2.15 腺苷酸环化酶

腺苷酸环化酶催化ATP转化为环状AMP(cAMP)。它的拆分位点于1988年首次被鉴定,是在通过胰蛋白酶水解钙调蛋白结合的腺苷酸环化酶的过程中发现的。之后Karimova等人利用腺苷酸环化酶催化cAMP生成的能力构建了基于腺苷酸环化酶的双杂系统(BACTH)。该系统通过cAMP-CAP调控的启动子,如lac启动子,在cAMP产生时激活感兴趣的基因。BACTH系统已应用于PPI的研究和大肠杆菌的药物筛选工作。

2.16 内含肽

Synechocystis PCC6803 DNA聚合酶III基因(SspDnaE)来源的内含肽显示出自然状态下的组装能力。另外,从Nostoc punctiformme PCC73102 (NpuDnaE)中分离出的内含肽表现出明显的快速剪接动力学,剪接时间为60秒。

为了使内含肽片段能够更适用于合成生物学,人们努力减小内含肽片段的大小。Sun等人在loop区筛选了13个位点,得到了一个11个氨基酸长的SspDnaB mini-inteinN端片段。在同一研究中,还发展一个三片段的分裂内含肽。通过融合NpuDnaE内含肽片段和随后筛选新的拆分位点,还得到了一个15个氨基酸的长的C端片段。

为了提高催化效率,人们通过105条DnaE内含肽的的序列比对,研究得到了一种快速的DnaE内含肽变体(CfaDnaE),实现了相比NpuDnaE催化速率2.5倍的提升。最快的分裂内含肽被称为gp41-1,是2012年从宏基因组中发现的,它在37℃时表现出比NpuDnaE蛋白快10倍的动力学。

传统上,对分裂内含肽自发重组的控制是通过环路设计操纵的基因表达水平实现的。为了扩大这种有限的拼接控制,2002年,Muir的团队将低亲和力的酿酒酵母BMA (SceVMA)的分裂内含肽融合了FKBP/FRB重组模块,实现了小分子对分裂内含肽的条件性调控。随后,利用温度和光调控的方法也被开发出来。

图2. 蛋白中已经过验证的拆分位点。

3. 重组模块

重组模块能感受包括光、化学物质或温度的变化进而实现重组。将重组模块和拆分蛋白系统耦合就得到了只有在特定的诱导条件下才会重新结合并变得有活性的条件激活系统。


图3. 重组模块概览

3.1 化学诱导邻近系统

化学诱导临近(CIP)系统使用小分子实现对分子相互作用的精准调控,为分子生物学和生物技术提供了宝贵的工具。本文将深入探讨两种重要的CIP系统:FRB/FKBP系统和PYL/ABI系统。

FK506结合蛋白(FKBP)和FKBP-雷帕霉素结合(FRB)结构域相互作用是分裂蛋白重组领域的重要组成部分。FKBP是一种在真核生物中发现的脯氨酸异构酶,在雷帕霉素(RAP)治疗后,它不在自然二聚化,而是与FRB形成异源二聚体,FRB是雷帕霉素(mTOR)哺乳动物靶点的一部分。在FKBP的存在下,RAP与FRB的结合亲和力显著增强,FKBP与RAP的Kd为0.2 nM,FRB与RAP的Kd从26 uM 提高2000倍到 12 nM。FKBP/FRB系统持续有效地应用于各种研究工作,例如用于开发精确控制细胞过程的笼型雷帕霉素类似物和扩大操纵活细胞能力的化学诱导三聚体化系统等。

PYL调控组分是植物中一种参与信号转导的受体蛋白,在脱落酸(ABA)存在的情况下,与被称为ABI1 (ABI)的蛋白磷酸酶2s型(pp2s)结合。脱落酸(ABA)是一种在植物生长和胁迫反应中起关键作用的激素。这种相互作用导致了PYL和ABI的异二聚化,ABA与PYL结合的Kd在52~340 μM之间,而ABA与ABI的结合更紧密,Kd为35 nM。2011年,Crabtree小组报道了一种ABA诱导的CIP系统,实现了PYL/ABI系统在植物生物学之外的开创性应用。

3.2 光诱导组装模块

光遗传学利用光和光感受器蛋白对细胞活动进行精确控制,由于其非侵入性、正交性和时空精度,在PPI调节和基因调控方面被证明是极为重要的。最近的进展已经扩大了光诱导分裂蛋白系统的应用范围,包括通过光氧电压对蓝光做出反应(LOV)的光感受器如VIVID (VVD)和Magnet,以及近红外(NIR)光激活的MagRed。

VVD是一种来自粗神经孢子虫(Neurospora crassa)的21 kDa光受体,它的LOV结构域会在450nM蓝光的照射下快速发生同源二聚化。这使得利用VVD对各种PPI进行可逆调节成为可能。VVD作为分裂蛋白重组工具的实用性已经在光诱导重组酶的构建中得到证实,特别是分裂Cre重组酶。然而,在光遗传控制中使用VVD的一个限制是其缓慢的关闭动力学,在黑暗状态下的半衰期约为2-3小时。

2015年,Sato组报道了VVD的变体磁铁(Magnet),目标是解决VVD使用的局限。磁体包括正磁体(pMag)和负磁体(nMag),即引入了I52R/M55R和I52D/M55G突变。这些突变使暴露在450nm蓝光下的正磁体和负磁体能够通过静电相互作用实现异源二聚化。其显示出与VVD相似的关闭动力学,半衰期为1.8小时。他们又继续优化得到了解离速率更快的突变体MagFast和二聚化效率更高的MagHigh。Magnet的这一进步使得利用蓝光对分裂蛋白组装进行正交和精确控制成为可能。

为了解决在深层组织中使用蓝光的挑战,Sato组开发了一种近红外光诱导开关MagRed。它是基于耐辐射球菌的胆汁素结合光感受器DrBphP。当暴露在660nM的近红外光下时,DrBphP会被激活并特异性地结合亲和体(affibody)aff6_V18FΔN。它们在NIR条件下的Kd为3.1x10^(-7),而在黑暗环境下的Kd仅为1.5x10^(-5)。Kuwasaki等人在同一项研究中证实了MagRed的有效性,证明其能够在近红外光下激活荧光素酶活性,促进DNA重组,并增强转录。

3.3 特定结合对

在分裂蛋白重组中,特定的结合对是必不可少的元件,使分裂蛋白组分能够精确和自发地重组。如SpyTag/SpyCatcher和亮氨酸拉链(ZIP)序在促进分裂蛋白重组过程中发挥了核心作用,最终促进了功能性生物分子组装的形成。

SpyTag/SpyCatcher是一种人工拆分的系统,源于化脓性链球菌的纤维连接蛋白FbaB的免疫球蛋白样胶原粘连蛋白结构域,是一种强大的蛋白质连接工具。SpyCatcher源自该结构域的n端区域,包括形成异肽键的关键残基K31和催化残基E77。SpyTag由c端13个氨基酸序列组成,其中D117为关键残基。SpyCatcher中的K31与SpyTag中的D117相互作用实现了两残基侧链间异肽键的形成。SpyTag融合蛋白与SpyCatcher结合的Kd为0.2 μM,T1/2为74秒,二级速率常数为1.4 × 10^3 M-1ꞏs-1。

ZIP基序,主要在bZIP类真核转录因子中观察到,它通过在α螺旋内每隔7个位置周期性出现亮氨酸残基来促进二聚化。这些亮氨酸与配对α螺旋的相应残基进行疏水相互作用,从而促进二聚体的形成。为了增强ZIP在开发关联驱动的细胞回路中的通用性,有研究者通过多肽芯片对能形成异源二聚体的合成多肽(SYNZIPs)进行了开发。某些组合,如SYNZIP17/SYNZIP18,实现了10 nM的Kd值。由于这些合成变异体对宿主蛋白功能的干扰最小,并且能够形成稳定的、特异性的非共价相互作用,因此它们在分裂蛋白重组应用中特别有价值。

3.4 RNA结合蛋白

RNA结合蛋白通过RNA结合结构域与特定的RNA相互作用,它在各种生物体中广泛存在。其中,来自噬菌体的MS2外壳蛋白(MCP)和λN肽已被用于RNA-蛋白相互作用的绘制和靶向特定RNA的酶的设计。MCP对MS2茎环具有很强的亲和力,结合Kd约为10 nM,而λN肽与Boxb茎环的结合Kd约为5 nM。MCP/MS2和λN肽/Boxb对的强大结合能力最近被用于创建具有最小脱靶效应的RNA碱基编辑器。

3.5 温度敏感的结合对

鼠伤寒沙门氏菌的蛋白TlpA具有371个氨基酸和α-螺旋结构,是一种温度敏感的二聚体抑制因子。当温度超过42°C时,这种蛋白质从低于37°C的二聚体结构转变为单体形式,表明其对热变化的响应性。利用这种热敏性,研究人员开发了一种温度敏感的可逆分裂蛋白重组系统,从而创建了热调节基因表达系统。具体来说,Chee等人通过融合split-T7RNAP和TlpA,展示了其温度依赖特性的实际应用。

综上,蛋白拆分和模块化重组在各种生物学研究中都有重要的应用,包括PPI分析和药物筛选、生物逻辑门构建、光遗传学、基因组编辑、蛋白质修饰和生物成像、诊断和治疗以及定向进化等。希望对蛋白拆分的了解能够帮助大家选择合适的系统用于自己的实验当中。

参考文献:

[1] Jieun Bae et al. Split Proteins and Reassembly Modules for Biological Applications. ChemBioChem, 2024, 25, 10, e202400123. https://doi.org/10.1002/cbic.202400123




作者: 郭 政 
审稿:程北溟
编辑:林康杰

GoDesign
ID:Molecular_Design_Lab
( 扫描下方二维码可以订阅哦!)

GoDesign
关注化学、生命科学和药物研发等领域的科研进展,提供“原创、专业、接地气”的文献解读。
 最新文章