摘 要
糖基化修饰在各类生理活动中起着非常关键的作用。然而,天然糖蛋白中糖型结构的微观异质性,严重阻碍了糖型结构与糖蛋白功能之间构效关系的研究。因此,从分子层面精确控制糖蛋白结构的化学合成方法是解决这一难题的重要手段。随着蛋白质合成和糖工程技术的不断进步,研究者们发展多种蛋白质连接策略和糖苷键构建策略来精确合成均质糖蛋白。本综述将从化学、酶法构建糖苷键的角度梳理现有的糖蛋白全合成以及结合生物表达方法的半合成策略,分别介绍这些策略在合成带有N-糖基化、O-糖基化修饰等不同糖基化类型的复杂均质糖蛋白时所取得的成果,例如带有多个复杂N-糖基化修饰的HSV gD和含有长疏水片段的IL-2;以及运用这些合成的复杂糖蛋白了解糖基化修饰在各项生理过程中的构效关系所作出的突破,例如抗原糖蛋白中糖链长短与免疫原性的关系、O-GlcNAc调节神经元突触功能的机制等。最后总结了现有合成策略在糖苷键构建、纯化策略、蛋白溶解度等方面取得的进展,并指出选择性和合成产率的进一步优化仍是糖蛋白合成领域亟待解决的问题,而糖蛋白合成技术在开发免疫疗法以及理解各种疾病分子机理等方面的广泛应用,从理解原理到开发产品方面拓展了合成科学在生命健康领域的发展方向。
全 文
蛋白质是构成生命体的最基本单元之一,是承载生命活动的基石,在生命体内具有多种功能,包括催化体内生化反应、维持组织结构稳定、参与免疫防御机制、调节细胞生命周期、促进生长和分化等。这些功能不仅取决于特定氨基酸序列组成的三维结构,同时受其复杂翻译后修饰(post-translational modification,PTM)的影响。翻译后修饰是蛋白质在翻译过程中,通过一系列酶的作用使氨基酸侧链或主链共价连接上各种修饰基团,以调控蛋白质的功能。真核细胞中几乎所有蛋白质都带有一种或多种翻译后修饰,如甲基化(methylation)、磷酸化(phosphorylation)、乙酰化(acetylation)、糖基化(glycosylation)等。蛋白质的翻译后修饰使得其多样性和复杂性都远超基因组中蛋白质编码序列的数量,导致其结构、活性、相互作用的变化,影响了蛋白质的生物学功能。
在蛋白质的翻译后修饰中,糖基化是最常见、最复杂的一种。人体内50%以上的蛋白质都带有糖基化修饰,如膜蛋白、组蛋白和分泌蛋白等。糖基化位点、糖基结构和糖苷键的多样性,导致糖基化修饰非常复杂。因此,形式多样和存在广泛的糖基化修饰在许多生理过程(如细胞识别与黏附、信号转导、免疫逃逸等)中发挥着非常重要的作用。例如,癌胚抗原相关细胞黏附分子6(carcinoembryonic antigen-related cell adhesion molecule 6,CEACAM6),有或无复杂N-糖基化修饰决定其是否能够促进口腔鳞状细胞癌的转移;利妥昔(Rituximab,RTX)单抗Fc区域上的糖基化修饰的糖型是高甘露糖型或唾液酸化的复合型决定了树突状细胞对它的摄取是增加还是减少,从而可以通过调节糖型来影响抗体的抗原识别和免疫原性,对于减轻临床免疫原性反应具有重要意义。因此,研究蛋白聚糖结构与功能的关系,阐明聚糖如何调控糖蛋白的功能,对于理解生理机制、疾病诊断和治疗有重大意义。
然而,在研究聚糖结构与糖蛋白功能的构效关系中,仍然面临诸多挑战。一方面,与依赖模板翻译的氨基酸序列不同,糖基化修饰不受“中心法则”调控。天然蛋白质的糖基化过程通常由酶介导,这一过程需要约200种糖基转移酶,糖基转移酶的类型分布和糖底物的浓度以及修饰位点的结构特征共同决定最终的糖基化修饰形式。此外,细胞还可以通过不同糖基转移酶同工酶的表达来对聚糖修饰的初始附着进行调节,根据细胞功能需要动态调整糖蛋白的形式和数量。因此,蛋白质的糖基化形式通常难以预测,只能利用质谱解析用酶裂解后的糖肽片段来判断糖基化修饰的类型。另一方面,由于糖基化修饰会随着细胞功能需要动态变化,所以从生物体中分离得到的糖蛋白的糖型结构都是非均质的。从这非均质的糖蛋白中分离出某种特定糖型的蛋白难以实现。原因主要有:①不同糖型的糖蛋白之间的物理化学性质差别小,而且相比于氨基酸残基之间的非共价相互作用,碳水化合物的非共价相互作用强度和类型非常有限,难以通过某种能够特异性识别特定糖型的材料分离糖蛋白混合物。②多数糖蛋白都拥有不止一个糖基化修饰位点,即便某种材料能够特异性识别某一种糖型,对于含有多个糖基化位点的糖蛋白采用此方法亦难以分离得到具有特定糖型结构的均质糖蛋白。
因此,如何精准高效获取均质糖蛋白,是系统探究聚糖结构与糖蛋白功能之间的构效关系的关键问题。与生物重组表达相比,全合成或半合成在分子层面上更加精确可控,已成为获取复杂均质糖蛋白的重要方法之一。在糖蛋白的合成中,合成糖和蛋白质的每种成分以及构建二者间的糖苷键仍是一个复杂的问题。近年来,随着蛋白质合成化学的蓬勃发展,涌现出诸如自然化学连接-脱硫(native chemical ligation-desulfurization,NCL-desulfurization)、丝氨酸/苏氨酸连接(Ser/Thr ligation,STL)和表达蛋白连接(expressed protein ligation,EPL)等蛋白连接策略,极大扩展了原本仅能合成30~50个氨基酸残基片段的固相多肽合成(solid phase peptide synthesis,SPPS)方法的应用范围,从而为合成各种天然蛋白质提供了技术基础。同时,这些策略也被广泛用于糖蛋白的合成中,实现了促红细胞生成素(erythropoietin,EPO)、核糖核酸酶(ribonuclease,RNase)、白细胞介素(interleukins,IL)、SARS-CoV-2刺突蛋白受体结合域(spike glycoprotein RBD)和干扰素(interferon,IFN)等多种复杂均质糖蛋白的化学合成与半合成,推动了糖蛋白合成的发展。
本综述旨在对合成均质糖蛋白的方法进行分类阐述,介绍化学法与酶法现有的主要合成策略的原理与特点。同时,总结了这些方法近年来在复杂均质糖蛋白合成上的实际应用,进一步为多种具有重要生理、病理意义的糖蛋白的构效关系研究提供新的见解,最后对复杂均质糖蛋白合成未来可能的研究方向与面临的挑战进行展望。
1 均质糖蛋白的化学法合成
化学合成是获得均质糖蛋白最常见的方法之一。与重组表达异质糖蛋白再用酶进行糖重塑相比,化学合成对目标蛋白的结构更加精确可控。同时,化学合成还可以根据构建糖苷键顺序分为线性法(linear approach)和汇聚法(convergent Approach)(图1)。线性法是将聚糖预先连接到单独的氨基酸上,形成糖基氨基酸砌块,然后使用固相多肽合成仪将这些砌块整合到目标序列中,组装成糖肽。这种方法能够较好地控制糖基修饰的立体选择性和位点选择性,只需将预先合成好的砌块加入固相多肽合成中,就能够精准地将聚糖修饰到任意想要的位置,但缺点是糖基氨基酸砌块的合成较为烦琐,涉及多步保护-脱保护过程,难以构建诸如复合型双天线(complex-type biantennary)聚糖等复杂糖型的糖基氨基酸砌块。汇聚法则首先完成多肽片段的合成,通过正交保护基策略选择性地将需要糖基修饰的氨基酸侧链裸露,再把目标糖型的糖供体通过缩合试剂连接到肽段上,随后脱除其他氨基酸的保护基从而得到目标糖肽。该方法优点在于反应步骤较少、糖型选择灵活,能够以较高产率一步获得各种复杂糖型修饰的糖肽;但由于形成糖苷键时糖与多肽底物的结构都很复杂,缩合过程中存在副反应和立体选择性的问题,导致其应用具有一定局限性。
图1 N-连接糖基化修饰的特点与N-连接糖肽主要的化学合成方法
在具体合成中,采用何种方法与糖苷键的类型有关。天然糖蛋白主要存在两种糖苷键:与天冬酰胺侧链酰胺氮原子相连接的N-糖基化,以及与丝氨酸/苏氨酸/酪氨酸(Ser/Thr/Tyr)侧链羟基氧原子相连的O-糖基化。迄今为止,仍没有一种通用、高效的方法可以合成所有类型的糖蛋白,不同类型的糖苷键适用的方法各不相同,下面将分类进行介绍。
1.1 化学法合成N-连接糖蛋白
N-糖基化是一种广泛存在的翻译后修饰,在已知的特征明显的糖蛋白中,90%左右的糖蛋白都存在N-糖基化修饰。通常情况,N-糖基化修饰的天冬酰胺会几乎固定不变地出现在NXS/T的共识基序中,其中X是除脯氨酸(Pro)以外的任意天然氨基酸。构成N-聚糖的糖基通常包括N-乙酰氨基葡萄糖、甘露糖、岩藻糖、唾液酸等,根据糖链结构不同,可分为复合型、杂合型以及高甘露糖型。这三组糖型的共同点在于均拥有一个核心五糖结构(图1),区别在于分支的衍生。由于其糖型通常都较为复杂,仅通过保护-脱保护策略全合成这些聚糖和糖基氨基酸砌块相对困难,因此合成含有复杂糖型的N-糖蛋白时通常采用汇聚法直接得到糖肽,再通过自然化学连接等策略依次连接多肽片段得到全长肽段,最后经过折叠复性完成目标糖蛋白的合成。糖基底物通常可以从天然资源中分离得到,例如复合型的双天线唾液酸寡糖可以从蛋黄粉中提取,高甘露糖型则可以从大豆面粉中获得;再加上各种糖苷内切酶和糖基转移酶,就可以在这两种天然糖型的基础上获得各种各样的聚糖前体。最后将聚糖前体转换为糖胺,与目标肽段上引入的正交保护的天冬氨酸(Asp)进行氨解,就能完成N-连接糖肽的合成。
在Lansbury等提出汇聚法合成N-连接糖肽时,发现了糖胺与活化的天冬氨酸缩合时容易生成天冬酰亚胺的环化副产物,严重阻碍了该方法的应用(图2)。2012年,Unverzagt课题组和Danishefsky课题组各自独立地发现通过在共有的N-X-S/T基序中使用假脯氨酸二肽,增加位阻以阻止五元环的形成,完全抑制了该副产物的生成,并在完成糖肽后通过酸处理就可以恢复正常结构(图2)。为了验证该方法的普适性,一些极具挑战性的糖蛋白,如N-连接的E-Cadherin糖肽、RBD、EPO和HSV gD,通过该方法均被成功合成。该方法的发现使得汇聚法在N-连接糖肽的合成中大获成功,已成为化学合成复杂N-连接糖蛋白的主要方法。
图2 假脯氨酸二肽策略解决汇聚法的天冬酰胺环化问题
郭军课题组引入了一种使用天冬氨酰活性酯的方案(图3)。与硫代或氧代酯相比,天冬氨酸硒酯表现出更高的反应活性,其中硒苯基酯在高反应活性和稳定性之间取得了很好的平衡。硒酯的引入可以直接在树脂上进行;此外,与肽段C端游离的羧酸以及复合型的双天线唾液酸寡糖中的多个官能团兼容,最终以60%~70%的产率合成了含有单糖、双糖和复合型十一糖的N-连接糖肽片段。此外,这种高活性的硒酯也可以替代硫酯,发展出了二硒化物硒酯连接策略(diselenide selenoester ligation,DSL)。这种策略具有多种优点,主要包括反应效率高(10 min以内)、pH范围广(3~7)、底物浓度低以及可以一锅法脱硒等优点,已被运用于多种复杂糖蛋白的合成,包括INF-γ和hGM-CSF。
图3 硒酯天冬氨酸活性酯改良方案
Hutton课题组从肽段的骨架上入手,开发了一种使用硫代酰胺定向激活天冬氨酸策略(图4)。该策略将与天冬氨酸氨基端形成的酰胺转化为硫代酰胺,在糖胺存在下,经Ag(Ⅰ)的催化脱硫形成𫫇嗪酮亚胺中间体,发生氨解后转化为相应的N-糖基化天冬酰胺残基。当使用1.2倍当量的Ag2CO3和适度过量(4倍当量)的糖胺时,可获得最佳产率;并且在有多个未保护的天冬酰胺侧链时,能够特异性地选择有硫代酰胺引发反应的位点,具有很高的化学选择性。但此方法仅在单糖修饰的肽段上进行了验证,对于带有复杂糖链的糖胺底物反应性如何还有待后续研究。
图4 硫代酰胺定向激活天冬氨酸策略
除了化学全合成外,利用表达蛋白连接(EPL)策略的半合成也成为了获取糖蛋白的一种常用方法。该策略通过重组表达的方法大量合成未修饰的肽段序列,并将其与化学法合成的带修饰肽段连接,RBD [图5(a)]。其中N331和N343处的N-糖基化是采用之前开发的假脯氨酸二肽介导的N型糖肽合成策略从而高效获得大量带特殊修饰的完整蛋白。因此,在糖蛋白的合成中可以使用该方法大量获得未糖基化的片段,且有助于解决化学合成中遇到的某些肽段溶解性不好的问题,快速高效完成复杂糖蛋白的合成。例如Kajihara课题组利用该方法成功合成了具有特定错误折叠模式的糖基化白细胞介素-8(interleukin-8,IL-8),为研究蛋白质错误折叠机制提供了新的见解。王平课题组则采用了基于EPL的半合成策略,首次合成了含有219个氨基酸、两个N-糖基化和一个O-糖基化修饰的SARS-CoV-2 Spike RBD[图5(a)]。其中N331和N343处的N-糖基化修饰采用假脯氨酸二肽介导的N型糖肽合成策略引入;而T323处的O-连接糖基化则是通过使用GalNAcα-Thr砌块并通过SPPS引入到糖肽片段R319-L335中完成。最后使用二次自然化学连接,将化学合成的糖肽片段R319-L335、C336-N360与重组表达的片段C361-K537连接起来。通过使用圆二色谱(circular dichroism,CD)和表面等离子体共振(surface plasmon resonance,SPR)等表征技术,研究团队证明合成的6种不同糖型的均质RBD保持了其完整的三维结构和功能,建立了一种高效大量制备均一复杂聚糖修饰RBD的平台。随后,为了更加深入地探究不同糖型的均质糖基化RBD的功能,利用该平台合成了包括Omicron突变体在内的5种复杂糖基化修饰RBD,并且其中3组是带有破伤风类毒素(Tpep)序列的嵌合体,用于增强免疫原性。SPR与活体动物免疫实验均表明去掉N-聚糖末端的唾液酸对RBD的配体(ACE2)结合能力与免疫原性均有所增强,并且与接种人源细胞表达的含有三天线、四天线复杂糖型RBD的小鼠相比,接种去除末端唾液酸且含有Tpep的嵌合RBD的小鼠对病毒的抑制能力提高了1万倍。这一研究证明了去唾液酸化能够增强抗原的免疫原性,提示在针对SARS-CoV-2相关疫苗开发时截短或者删除部分糖链的减糖策略是一种提高疫苗效价的可行方案。
图5 基于表达蛋白连接(EPL)的半合成策略在复杂糖蛋白合成中的应用
由于自然化学连接需要在有半胱氨酸的位点才能进行,受限于半胱氨酸在蛋白质中的丰度较低,许多序列较长的蛋白质无法找到合适的连接位点而难以合成。2001年,Dawson课题组提出了自然化学连接-脱硫策略从而将连接位点从半胱氨酸拓展到了丙氨酸,随后受到这项工作的启发,连接位点陆续扩展到了其他β-硫代氨基酸或者γ-硫代氨基酸,但由于传统的硫代氨基酸合成路线存在手性控制低效和路线冗长的问题,这一策略的广泛应用受到限制。
2020年,王平课题组利用光催化不对称Giese反应高效合成了一系列β-硫代氨基酸。从4-噻唑啉中间体出发,仅需2~3步,就可以合成11种天然氨基酸的β-硫代物,极大提高了硫代氨基酸的合成效率。利用这一策略,结合之前组内发展的喹啉类光保护基[7-(piperazin-1-yl)-2-(methyl) quinolinyl,PPZQ]正交保护巯基方法,首次实现了5种不同糖型的Ⅰ型单纯疱疹病毒型糖蛋白D(herpes simplex virus-Ⅰglycoprotein D,HSV-1 gD)的半合成,是迄今为止最大的复杂均质N-连接糖蛋白的合成[图5(b)]。该蛋白需要合成的胞外区有315个氨基酸,拥有3个N-糖基化修饰(N94、N121、N262)和3对二硫键(C66-C189、C106-C202、C118-C127)。不仅序列较长,且形成二硫键的巯基集中在前半部分,仅靠传统的自然化学连接-脱硫策略无法合成。该研究通过将HSV-1 gD分为6段,在L44和A161处使用β-硫代亮氨酸和半胱氨酸作为连接位点,并用喹啉保护基PPZQ保护C127、C189与C202,以便于连接肽段C127-M315后的选择性脱硫,再顺次连接各个片段并完成折叠复性后得到了5种带有不同天然糖型的均质gD糖蛋白。随后不仅通过CD和SPR证明了合成产物与天然糖蛋白的结构和功能一致,还进行了活体动物免疫实验,发现在合成的4组均质糖基化gD蛋白中单糖基化修饰的gD蛋白具有最好的免疫原性,再一次揭示了针对抗原的减糖策略在疫苗开发中的潜在价值。
受到Danishefsky课题组发展的硫代酸介导的多肽连接研究和硫代天冬氨酸与无保护糖胺偶联研究的启发,Kajihara课题组开发了一种新型的双功能硫代酸介导策略,用于糖蛋白的半合成(图6)。该研究首先将双功能的糖基天冬酰胺硫代酸砌块与含有α-硫代酸的肽段发生二酰基二硫偶联(diacyl disulfide coupling,DDC),得到在C端带有硫代酸形式的糖肽,再与N端带有二硫功能基团的另一条肽段进行硫代酸捕获连接(thioacid capture liagtion,TCL),从而得到全长糖蛋白骨架。由于聚糖的立体阻碍作用减缓了硫代酸分子的竞争性聚合,DDC过程无需任何缩合试剂即可高选择性地完成原生酰胺键的生成。最后通过广泛的核磁共振和反相高效液相色谱分析,证实了每一个DDC和TCL反应都不会有异构体副产物生成,说明该策略具有很好的立体专一性。为了验证该方法的实用性,采用该策略成功地半合成得到了CC趋化因子配体1 [Chemokine (C—C motif) ligand 1,CCL1] 和IL-3,扩展了表达蛋白连接的应用场景。
图6 双功能硫代酸介导策略在白细胞介素-3(IL-3)全合成中的应用
1.2 化学法合成O-连接糖蛋白
与N-糖基化不同,O-连接糖基化没有共识基序。虽然存在8种核心糖型,但仅为二糖或三糖(图7)。因为许多糖基转移酶都可以将GalNAc与丝氨酸和苏氨酸残基相连接。此外,其核心GalNAc在丝氨酸/苏氨酸或酪氨酸上的添加是在高尔基体内进行的,无法像在内质网中添加N-糖基化一样进行糖链的整体迁移,而是按顺序逐个添加。因此,O-糖基化修饰的糖链一般较短,不会有复合型双天线和高甘露糖型等复杂糖链,意味着一般的O-连接糖型的合成相对较容易;加之在化学合成O-连接糖蛋白时,汇聚法容易出现立体选择性问题,所以在实际应用中合成糖基氨基酸砌块的线性法通常是最常用的方法。
图7 O-糖基化的存在形式和化学合成策略
白介素-2(IL-2)作为一种在免疫调节中发挥关键作用的细胞因子,其表面的聚糖如何影响它的生理功能引起了研究人员的广泛关注,如何精准合成均质的白介素-2成为了研究其生理功能与聚糖结构构效关系的关键。天然IL-2由133个氨基酸和1个O-连接聚糖(T3)组成,其合成的难点在于V91-T133片段非常疏水,溶解性极差。虽然Bode课题组和Hojo课题组分别使用反极性保护策略与α-酮酸羟胺连接策略完成了具有单糖修饰和非糖基化修饰的IL-2全合成,但由于步骤烦琐、切分片段多且产率低,难以进行后续的构效关系研究[图8(a)]。为了解决这一问题,王平课题组使用重组表达的方法,以10 mg/L的产量获得了肽段S6-T133,解决了该片段溶解性差、难合成的问题;再使用3种糖基苏氨酸砌块,包括GalNAcα-Thr、Galβ1-3GalNAcα-Thr和Neu5Acα2-3Galβ1-3GalNAcα-Thr,采用线性法构建了糖肽片段A1-S5 [图8(b)]。最后采用在有机相中进行的丝氨酸/苏氨酸连接策略,将糖肽片段与疏水肽段成功连接起来,以平均30%的分离产率半合成了具有单糖、二糖和三糖修饰的IL-2。生物学研究结果表明,在T细胞分化过程中,聚糖在调节IL-2活性方面起着重要作用。
图8 白细胞介素-2(IL-2)的全合成与半合成策略
虽然采用O-连接糖氨基酸砌块是在肽段上引入O-糖基化修饰的通用方法,但利用路易酸催化糖供体转化为氧羰基𬭩离子再被受体捕获的传统O-糖苷化方法在控制立体选择性方面仍非易事,并且当供体稳定性差且活化条件苛刻时反应条件的设计会进一步复杂化。钮大文课题组受到Pd催化交叉偶联反应的启发,提出一种基于Pd催化的SN2糖基化方法,成功应用于苯酚的O-糖苷化构建(图9)。通常情况下Pd催化剂形成的是sp2杂化碳中心,与需要建立sp3杂化C—O连接的糖苷化并不兼容。但以Pd为中心的氧化加成中间体可以使原来的邻碘联苯S-糖苷从C-sp2亲电子体转变为C-sp3亲电子体,形成具有高立体选择性的SN2糖基供体。随后作者在标准反应条件下测试了24种糖供体和21种酚类亲核受体的不同立体构型,均能以超过50%的产率得到目标构型的糖苷化产物,证明该方法的实用性和高立体选择性,提供了一种高效构建酚羟基与脱氧糖之间O-糖苷键的新方法。
图9 钯催化交叉偶联的SN2-糖基化策略
除了需要高效的连接策略和糖基引入方法,找到一种更简便的合成后纯化策略也同样重要。李铁海课题组开发了一种在C端引入疏水标签的液相多肽合成方法,简化了复杂糖肽的合成与纯化[图10(a)]。首先在C端引入疏水标签,然后进行与固相多肽合成一样的肽链组装;需要糖基化的位点使用单糖基氨基酸砌块(GalNAcα-Thr/Ser-Fmoc)引入可被糖苷转移酶识别的糖肽片段底物,且在肽链延伸过程中,每步反应均可利用疏水标签简单离心完成纯化;肽链组装结束后,脱除所有保护基与疏水标签即可得到单糖修饰的糖肽。复杂糖型的糖肽则使用各种糖苷转移酶在温和条件下高效合成,最后通过C18滤芯的快速固相萃取(solid phase extraction,SPE)即可完成分离。这一策略相比于使用线性法的固相多肽合成,均相反应具有更高的效率,并且弥补了均相反应需要烦琐的硅胶柱色谱纯化步骤的缺点,提高了最终的分离产率。采用这一策略,成功获得了一系列含有不同糖链的O型糖肽,包括SARS-CoV-2糖肽、20-mer MUC1糖肽和31-mer糖基化胰高血糖素样肽-1(glucagon-like peptide-1,GLP-1),证明了这种方法的普适性。
图10 O-糖基化的存在形式和化学合成策略
而王平课题组则通过在N端引入一个兼具保护/纯化的双功能手柄(protection/purification handle,PPH),同样简化了多肽片段的纯化过程[图10(b)]。该手柄由两部分构成:与N端Cys相连的光敏连接剂和在外侧的His6标签,其中光敏剂一端起到临时保护N端Cys巯基的作用,His6标签则可以通过固定金属亲和色谱介质(例如Ni-NTA珠)快速纯化多肽片段。这种保护/纯化处理策略通过几个连续的化学连接和亲和纯化循环,成功地构建了具有串联重复序列的糖蛋白。例如含有4个以20个氨基酸为重复单元的黏蛋白1(mucin 1,MUC 1)和含有80个重复三肽序列(ATA)共240个氨基酸的抗冻糖蛋白AFGP。其中后者的每个苏氨酸残基上都含有一个α连接的O-GalNAc,并且验证了合成的抗冻蛋白的抗冻能力,证明了该方法能够适用于复杂糖蛋白的合成。
董甦伟课题组与刘聪课题组合作利用4-羟甲基苯甲酸(HMBA)连接剂和聚赖氨酸标签,简化了纯化过程,合成了一系列与阿尔兹海默病相关的淀粉样β42(Aβ42)糖肽[图10(c)]。这些糖肽在Tyr10处有明确的O-连接聚糖,包括单糖GalNAc、二糖Galβ1-3GalNAc和唾液酸三糖Neu5Acα2-3Galβ1-3GalNAc。通过化学方法合成这三种糖型的糖-酪氨酸砌块,再使用SPPS将砌块加入肽链,完成3种不同糖型Aβ42的合成。为了探究糖基化对蛋白质稳定性的影响,通过酶解实验发现蛋白质的稳定性随着糖型变大而逐渐下降,三糖修饰的稳定性降低得尤为显著。随后,通过冷冻电镜技术解析了二糖修饰的Aβ42蛋白结构,表明Tyr10糖基化会诱导Aβ42形成独特且不太稳定的纤维结构,揭示了随着糖链增大而抑制Aβ肽聚集的机理,为研究其他神经退行性病变(neurodegenerative disease,NDD)相关的易聚集蛋白的糖基化奠定了研究基础。
除了常规的糖基化研究外,人们对一些特殊的糖基化修饰也产生了兴趣。O-GlcNAc修饰是O-连接糖基化的一种,与常见的GalNAc连接的O-GalNAc糖型不同,丝氨酸/苏氨酸侧链连接的糖基为GlcNAc。这种修饰通常在细胞质、细胞核和线粒体中发现,并因其在防止蛋白聚集和调控细胞内过程时空方面的作用而占有重要地位。陈兴课题组与董甦伟课题组合作,利用半合成策略合成了对神经元突触功能至关重要的突触蛋白SynGAP(synaptic ras-GTPase activating protein,SynGAP)的CC-PBM(coiled-coil PDZ-binding motif,CC-PBM)结构域,研究了其与突触后密度(postsynaptic density,PSD)的配体蛋白PSD-95之间的相互作用。SynGAP的CC-PBM结构域分别在T1306和S1159上有O-GlcNAc修饰[图11(a)],因此采用O-连接糖基化泛用的线性法来完成糖肽段的合成。由于SynGAP的CC-PBM结构域缺少原生的Cys残基作为连接位点,因此采用了γ-硫代的Val来作为自然化学连接的位点,在连接完成后使用无金属的自由基脱硫方法即可得到原生结构。随后通过等温滴定量热法、分子模拟等方法从实验和理论上证明了T1306处的O-GlcNAc会破坏SynGAP与PSD-95之间的关键氢键,阻碍了二者的相互作用,从而抑制了液-液相分离过程。即使是亚计量水平的O-GlcNAc也能有效调节SynGAP/PSD-95复合物的形成,成为调节神经元突触功能的有效调节剂。Pratt课题组根据序列使用不同的半合成策略先后合成了拥有O-GlcNAc修饰的α-突触核蛋白(α-synuclein)、高迁移率族蛋白B1(high mobility group box-1 protein,HMGB1)和小型热休克蛋白(small heat shock protein,sHSP)[图11(b)],以此研究O-GlcNAc对于蛋白功能的意义。通过研究合成的拥有不同位点和数量的α-突触核蛋白,证明了T75处和T72&T81处的O-GlcNAc可以降低α-突触核蛋白纤维的毒性,提出了治疗帕金森病的潜在方案;HMGB1是一种参与DNA结合和损伤处理的蛋白质,并用合成的HMGB1探讨了O-GlcNAc修饰如何影响HMGB1的功能,为DNA损伤反应的调控以及蛋白质修饰在细胞过程中的广泛影响提供了见解;而3种HSP的合成则发现了O-GlcNAc修饰在细胞应激反应中发挥关键作用,展示了均质糖蛋白的合成对糖基化功能研究的指导意义。
图11 各种合成策略在O-GlcNAc修饰糖蛋白构效关系研究中的应用
存在于脂肪细胞的脂肪粘连素上有一种特殊类型的糖基化修饰,其胶原结构域通过羟基赖氨酸Hyl65、Hyl68、Hyl77和Hyl101上的羟基与葡萄糖和半乳糖组成的二聚糖(2-O-α-D-glucopyranosyl-D-galactos)相连。这种存在于血液循环中的糖蛋白,作为外周器官脂质代谢和葡萄糖水平的基本调节因子发挥着重要作用。为了研究这种糖蛋白及其作用,李学臣课题组采用化学方法合成了15种糖基化脂肪连蛋白胶原结构域(glycosylated adiponectin collagenous domains,glyACD)(图12)。在合成过程中通过使用手性翻转策略和烯烃复分解反应,高效地得到了羟基赖氨酸砌块,成功将合成规模扩大到10 g;随后,在引入糖基时由于半乳糖C2处的乙酰保护基会与异头位形成内酯副产物,转而采用先做好二糖砌块再与羟基赖氨酸缩合的策略,顺利得到了目标糖基氨基酸砌块。因为有4个糖基化位点,最后使用该砌块合成了15种不同特定位点修饰的糖肽片段Adn,涵盖了所有可行的糖基化形式,再使用丝氨酸/苏氨酸连接构建全长蛋白。生物活性结果表明,聚糖在抑制癌细胞增殖和调节系统能量代谢方面发挥着重要作用,显示了糖基化在脂肪粘连素功能中的重要性及其与一系列健康状况的潜在相关性。
图12 使用丝氨酸/苏氨酸连接策略全合成糖基化脂肪连蛋白胶原结构域(GlyACD)
(表格及糖基化羟基赖氨酸结构摘自文献[84])
除了最为常见的N-糖基化和O-糖基化以外,还存在一些罕见的糖基化修饰,例如C-甘露糖基化、S-糖基化等。其中,C-甘露糖基化修饰主要以蛋白质共翻译的方式发生在内质网中。这种糖基化修饰首先在人类RNase 2中发现,后来又在IL-12、MUC5AC/B和EPO受体等多种糖蛋白中发现。由于C-甘露糖基化是修饰在几乎没有亲核能力的吲哚环C2原子上,常规的取代和缩合策略无法适用,因此基于金属催化的C—H键活化策略被扩展到了C-甘露糖基色氨酸及其糖肽的制备上。例如陈弓课题组使用Pd催化C—H键活化,并在N端安装异喹啉酸辅基控制立体选择性的策略,成功在色氨酸吲哚环C2处构建α-糖苷键,首次合成了来自黏虫的C-甘露糖基糖肽激素Cam-HrTH-I;而Goddard-Borger课题组则通过色氨酸溴代衍生物,在Hantzsch酯(光还原剂)和近紫外LED光照的条件下,实现基于Ni催化的甘露糖基卤化物和卤代烯烃还原偶联,同样合成了Cam-HrTH-I,展示了该方法在糖肽中的应用。此外,俞飙课题组开发了一种基于Ni催化的炔烃还原水解糖基化方法,在温和的反应条件下即可高效完成溴代糖供体与多种乙炔基氨基酸和肽偶联,为糖肽/蛋白质药物引入稳定的糖基化修饰提供了新方法。
在半胱氨酸的巯基上进行修饰的S-糖基化则更为少见,目前仅在枯草芽孢杆菌和植物乳杆菌中发现过带有这种糖基化修饰的天然糖肽;并且由于S-聚糖对化学水解和酶降解的抵抗力要强得多,以及与O-聚糖有着相似的结构特征和生物活性,使得寻找高效构建S-糖苷键的方法受到广泛关注。钮大文课题组通过使用稳定的烯丙基糖基砜作为糖基供体,与采用2-巯基吡啶衍生物保护的半胱氨酸发生反应后得到S-糖基修饰的半胱氨酸,开发了一种基于自由基的选择性光解产生α-S-糖苷键,并通过合成细胞穿透肽R8、淀粉样β/A4蛋白前体770和一系列带有S链Tn(GalNAc-Ser/Thr)抗原模拟物的MUC1肽,证明了这种方法的实用性;此外,叶新山课题组还利用糖基Bunte盐开发了一种选择性标记半胱氨酸残基的方法,可以在温和条件下使糖供体与半胱氨酸反应生成带有二硫键的糖偶联物,并用该方法成功合成4种不同糖型的GLP-1变体,研究了糖基化修饰对GLP-1生理功能的影响:与天然GLP-1相比,通过新形成的二硫键添加GlcNAc可提高降糖活性和酶稳定性。
2 均质糖蛋白的酶法合成
糖基化修饰作为一种生物体内广泛存在的翻译后修饰,天然的糖蛋白本就是使用各种酶来完成聚糖的修饰。因此,在体外利用同样的酶进行糖蛋白的仿生合成也是极具吸引力的合成策略。参与糖基化修饰的酶主要有两种,分别是内切糖苷酶和糖基转移酶(图13)。前者主要是利用该酶的逆反应特性,将糖基从糖苷供体转移到蛋白质或肽上;后者则是专门将糖基从例如二磷酸尿苷糖(UDP-saccharide)的糖供体转移到作为受体蛋白或肽上的酶。这类方法相比于化学法能够以更温和的条件实现高度特异性的糖基化修饰,并保持糖链的自然构型,对于构建具有复杂糖型的糖蛋白是有力的合成工具,但也存在酶的获取成本较高、部分酶促反应效率有限的问题。下面将分别介绍内切糖苷酶和糖基转移酶的具体应用。
图13 酶法合成糖蛋白概览
2.1 内切糖苷酶法的应用
天然状态下,内切糖苷酶的主要功能是特异性地水解糖蛋白或多糖中特定位置的糖苷键,在糖蛋白中根据识别的糖型和糖苷键不同,可分为endo-β-N-乙酰氨基葡萄糖苷酶(endo-β-N-acetylglucosaminidase,ENGase)、endo-β-甘露糖苷酶、endo-α-N-乙酰氨基半乳糖苷酶和endo-β-半乳糖苷酶。然而,在Trimble等对属于ENGase的Endo F研究中,发现其除了具有水解糖苷键的活性外,还能通过转糖基化作用有效地将寡糖转移到相应的含羟基底物上。除了Endo F,被发现具有这种性质的ENGase还有Endo D、Endo H、Endo M等,它们在识别糖链类型上有所区别。这种双重能力使得ENGase无论是运用在通过从头开始的化学合成,还是天然异质结构的酶解过程,只要底物含有一个GlcNAc修饰,就能很容易完成糖基转移从而获得各种复杂聚糖结构,是合成复杂寡糖和糖偶联物的重要工具。由于所有糖基数大于5的N-连接糖蛋白都拥有相同的核心五糖结构,ENGase催化的活化糖基供体的整体转移是聚糖重塑的理想选择,使N-聚糖的糖构型更具多样性。1995年,Takegawa等通过Endo A的转糖基化作用将牛核糖核酸酶B中N34处的N-聚糖进行了重塑,首次证明基于ENGase的糖基重塑方法可以运用于制备特定糖型的糖蛋白。随后,一系列复杂的糖肽均运用该种方法成功合成,包括糖基化修饰的降钙素、HIV-1包膜糖蛋白片段、CD52抗原等。尽管ENGase催化的转糖基化方法有一些有价值的实际应用,但在实际应用中仍然有一定局限性:主要包括酶对产物也有水解活性、转糖基化催化转换率不高等因素导致的产率低下,以及糖供体底物仅能使用纯化困难的天然N-糖肽。
其中,对于转移产物也会被糖苷酶水解而导致产率低下的问题,传统解决方法是使用过量的易合成的糖基供体来从动力学上控制反应正向进行,但这种方法显然难以适用于合成烦琐的复杂糖基供体,原子经济性也较低。为解决这一问题,研究人员根据ENGase的催化中心结构和机理(图14),构造出只具有转糖基化作用的ENGase突变体,也被称为“糖合成酶”。另一方面,在糖基供体的来源方面,受到ENGase转糖基化的底物辅助机制中会有糖基𫫇唑啉中间体产生的现象启发,因此使用N-聚糖𫫇唑啉作为糖基供体的策略也被运用于内切糖苷酶法,拓宽了糖基供体底物的选择范围。综合上述两种策略,同时使用N-聚糖𫫇唑啉糖基供体与仅有转糖基化活性的糖合成酶(ENGase突变体)的糖重塑策略成功克服了产物水解的问题,并逐渐成为内切糖苷酶法合成糖蛋白中的主流方案。
图14 ENGase及其突变体催化糖苷键水解和转糖基化的作用机理
随后,这种改进的糖重塑策略被应用到了多种糖蛋白的合成与糖基化抗体的糖重塑中。王来曦课题组以曲妥珠单抗和西妥昔单抗为模型抗体,发现野生型Endo-S可以高效地进行抗体脱糖,并同时将合成的6-磷酸甘露糖(mannose-6-phosphate,M6P)聚糖𫫇唑啉糖供体转移到脱糖后的抗体上,从而得到结构明确的抗体-M6P聚糖偶联物[图15(a)]。此外,还尝试使用了野生型Endo-S2进行脱糖基化,然后用Endo-S2突变体(D184M)进行转糖基化的两步法,同样也能有效合成抗体-M6P聚糖偶联物。根据先前的研究表明,细胞表面和溶酶体上会表达一种阳离子依赖的甘露糖-6-磷酸受体(cation-independent mannose-6-phosphate receptor,CI-MPR),能够特异性识别M6P。因此带有6-磷酸甘露糖修饰的抗体就可以靶向该靶点,降解相关膜蛋白。SPR结合分析表明,抗体-M6P偶联物与阳离子依赖性甘露糖-6-磷酸受体(CI-MPR)的结合亲和力在纳摩尔范围内。初步的细胞试验表明,M6P-曲妥珠单抗(Trastuzumab)和M6P-西妥昔单抗(Cetuximab)共轭物能分别选择性地降解膜结合的人表皮生长因子受体-2(human epidermal growth factor receptor 2,HER2)和表皮生长因子受体(epidermal growth factor receptor,EGFR)。这一结果展示了该模块化聚糖重塑策略的实用性,有望广泛应用于基于抗体的细胞外蛋白和膜蛋白的溶酶体靶向降解。
图15 内切糖苷酶在抗体修饰和功能化中的应用
黄蔚课题组则进一步将这种基于ENGase酶的糖重塑策略应用到了抗体修饰和功能衍生方面,发展出了基于抗体表面聚糖的糖链定点策略,用于相关抗体偶联药物(antibody-drug conjugates,ADC)的开发[图15(b)]。第一代“OligosacLink”策略首先是使用Endo酶把抗体表面不均一的糖链修剪为Fucoseα6-GlcNAcβ,再利用只有转糖基化活性的Endo酶突变体将带有叠氮修饰的寡糖链转移到抗体上,最后通过Click反应将小分子药物偶联到抗体上,完成ADC药物的构建。但这种基于寡糖的定点策略由于糖链较长,不能很好地嵌合隐藏在抗体Fc结构域的内部,需要在小分子药物与糖链之间带上聚乙二醇(polyethylene glycol,PEG)连接体以增强ADC药物的稳定性。因此该课题组发展出了第二代“DisacLink”策略,相比第一代在糖链上转而使用带有连接标签或者小分子药物的二糖Galβ4GlcNAcβ,在使用Endo-S2酶的情况下可以一步完成糖链修剪和转移的过程,简单快速地完成ADC的合成。这种策略由于糖链长度缩短,能够很好地使小分子药物嵌合在Fc结构域内部,反而不带PEG连接体时拥有更好的活性,稳定性更好的同时极大简化了合成步骤(一种酶,一步反应),为ADC药物的研发提供了一种极具吸引力的方案。此外,为了提高Endo酶的转糖基化效率,他们还通过将Endo-F3 D165A突变体与特异性结合抗体Fc域的结合肽(Fc binding peptide,FcBP)偶联,得到了一种能够以更低的底物和酶用量、更短反应时间得到更高转换率的增强型ENGase。这一结果表明配体引导的酶定位策略可以有效提高酶对目标底物的活性。
而董甦伟课题组则将这种糖重塑方法进一步应用在了化学法合成的单糖修饰的糖蛋白中,简化了复杂糖蛋白的合成。通过使用特异性识别复合型糖链的糖苷酶Endo M,成功合成了在N45处具有复合型双天线唾液酸十一糖修饰的IL-17A二联体(图16)。随后,通过正常人表皮成纤维细胞实验,测试不同糖型的IL-17A对IL-6诱导效应激活效果的影响,发现随着糖链增长,激活效应减弱。同时SPR测试的结果发现其与受体IL-17RA的结合能力也会随着糖链增长而减弱,也佐证了细胞实验的结果。最后使用X射线衍射(X-ray diffraction,XRD)解析了单糖修饰的IL-17A的晶体结构,发现糖基化修饰位点正好处在受体-配体结合位点的中间,糖链长也就自然阻碍了蛋白间相互作用。
图16 内切糖苷酶快速构建含有复杂糖型的糖蛋白
2.2 糖基转移酶法的应用
由内切糖苷酶催化的转糖基化作用发展而来的糖重塑策略为合成均质糖肽和糖蛋白提供了一种极具吸引力的方法,其优势在于可以整体转移寡聚糖、建立原生构型的糖苷键以及分别独立准备和组合蛋白质与寡聚糖供体的灵活性,但使用这种方法的前提是需要在多肽或蛋白质中安装一个单糖才可以作为酶促转糖基化受体。然而,糖基转移酶法可以在预组装聚糖与游离多肽或蛋白质之间直接构建原生糖苷键连接,不仅拓展了需要单糖预修饰的内切糖苷酶法的应用场景,还可以作为一种独立的糖基化方法构建一些没有相应ENGase或难以从天然糖蛋白中提取的糖型。此外,糖基转移酶相比于内切糖苷酶还存在“一酶一键”规则,即一种酶在一种特定的键连方式中只能添加一种糖;并且不仅对于糖型存在特异性识别,对于转移受体糖基的上级键连方式也有特异性:例如对于经典的复合型双天线寡糖,在两个不同分支、与主干甘露糖有不同键连方式(α1-6,α1-3)的甘露糖上添加GlcNAc时就需要两种不同的GlcNAc转移酶。严格的专一性与聚糖多样的连接方式使得糖基转移酶种类繁多,在构建特定糖型和糖苷键时存在丰富的酶学工具,并在与糖苷酶联合使用时也可以实现“修剪”聚糖的糖重塑策略,在重组表达的异质糖蛋白的糖型重塑中应用广泛。
对已被广泛应用于糖蛋白合成和半合成的糖基转移酶,可以根据其识别的转糖基化受体类型进行分类,分为识别糖基与识别氨基酸残基两大类,并且一种酶只能识别一种类型的底物。例如核心1-β-乙酰半乳糖基转移酶1(core 1 synthase, glycoprotein-N-acetylgalactosamine 3-β-galactosyltransferase 1,C1GalT1)、ST3 β-半乳糖苷α-2,3-唾液酸转移酶1(ST3 β-galactoside α-2,3-sialyltransferase 1,ST3Gal1)、ST6 N-乙酰氨基半乳糖苷α-2,6-唾液酸转移酶1(ST6 N-acetylgalactosaminide α-2,6-Sialyltransferase 1,ST6GalNAc1)等识别糖基的转移酶只能用于延长糖链,而O-GlcNAc转移酶(O-GlcNAc transferase,OGT)、寡聚糖基转移酶(oligosaccharyltransferase,OST)、GalNAc转移酶11(GalNAc transferase 11,GALNT11)等识别氨基酸残基的转移酶只能将糖转移到没有糖基修饰的天冬酰胺或者丝氨酸/苏氨酸残基上,不能用于糖链的延长。
对于延长糖链的转移酶,已有许多课题组使用这一策略来完成糖链的延长和复杂糖型构建。1990年,Unverzagt等报道了先后使用β-1,4-半乳糖基转移酶1(β-1,4-galactosyltransferase 1,β4GalT1)和美人鱼发光杆菌的α-2,6-唾液酸转移酶(Photobacterium damselae α-2,6-sialyltransferase,Pd2,6ST)高效构建了Neu5Acα2-6Galβ1-4GlcNAcβ三糖肽,首次将转移酶应用于单糖肽的糖链延长,从而高效合成含有唾液酸化的糖肽。这种策略在随后被广泛应用,例如李铁海课题组在使用标签辅助纯化合成糖肽的同时,还使用了多种糖基转移酶(C1GalT1、Pd2,6ST、ST3Gal1、ST6GalNAc1、β4GalT1等)和糖供体(UDP-Gal、CMP-Neu5Ac)来延长带有GalNAc单糖肽段的糖链,以构建复杂糖型。并通过分别在SARS-CoV-2 O-糖肽、MUC1糖肽和GLP-1糖肽上完成了16种不同O-连接糖型的合成,证明了该方法的实用性。此外,王来曦课题组使用了重组的GlcNAc-6-O-磺基转移酶1(GlcNAc-6-O-sulfotransferase 1,CHST2)首次在体外完成了复合型双天线N-聚糖的硫酸化修饰。该磺基转移酶对双天线N-聚糖表现出高度偏好,并且可选择性地硫酸化位于N-聚糖的Manα1-3Man臂上的GlcNAc分子。随后再使用β4GALT4则可以进一步增长糖链,从而形成不同的硫酸化N-聚糖。最后以利妥昔单抗作为IgG抗体模型,证明硫酸化的N-聚糖可以通过内切糖苷酶Endo-S2有效完整转移到的抗体Fc段的GlcNAc上,从而提供同质的硫酸化抗体糖型(图17)。
图17 糖基转移酶构建带有硫酸化修饰的复杂N-糖基化抗体
此外,由于每种糖基转移酶对供体和受体都具有严格的专一性,一种酶在一种特定的键连方式中只能添加一种糖,因此只使用一种糖基转移酶难以构建复杂糖型。为了开发应用范围更广的酶工具,人们开始尝试使用混合糖基转移酶的方法,一锅合法完成多个糖残基的连接。黄雪飞课题组利用人类木糖基转移酶Ⅰ(xylosyltransferase Ⅰ,XT-Ⅰ)可以在蛋白质骨架上安装初始木糖苷的性质来进行蛋白多糖的合成,这种酶无需糖基氨基酸识别标签即可实现木糖的转移连接。虽然对于氨基酸序列没有要求,但肽链越长时,修饰的丝氨酸附近氨基酸侧链酸性基团越多,就越容易实现木糖转移。例如Syndecan-1和Syndecan-4的转换率因为后者肽段中的酸性侧链多,在后者肽链更长的情况下其转换率从68.6%上升到了73.8%。此外,XT-Ⅰ还可以与β4GalT7联用,一锅法合成含有半乳糖-木糖二糖的糖肽,为快速化学合成蛋白聚糖型糖肽和糖蛋白发展了新方案(图18)。王宁课题组则通过使用酵母孢子作为天然载体,在其表面包裹β4GALT4、多杀性巴氏杆菌的α2-3唾液酸转移酶1(Pasteurella multocida α-2,3-sialyltransferase 1,Pm2,3ST1)和Pd2,6ST,用于连续组装多种天然存在的唾液酸-半乳糖修饰的聚糖。
图18 一锅两酶法(OP2E)快速构建二糖肽
对于直接将糖基转移到氨基酸上残基的转移酶,N-连接聚糖的转移酶主要有OST和N-糖基转移酶(N-glycosyltransferase,NGT),O-连接聚糖则主要有OGT和GALNT这两类。其中,OST在真核生物中是一种由9个亚基组成的蛋白复合物,且所有亚基都是跨膜蛋白,可以将N-聚糖的核心Man3GlcNAc2从糖基磷酸二醇转移到含有NXS/T共识基序的肽段上。但由于其复杂的膜结合多蛋白亚基结构、只将寡糖转移到未折叠的肽段上以及作为糖供体的糖脂底物难以获得等特性,这种酶难以实际用于合成。而原核生物中的OST,例如空肠球菌(C. jejuni)中属于Pgl基因簇的PglB,作为一种单亚基结构的酶,在非细胞环境和原核细胞系统中均能合成均质糖蛋白;另外,其相较于真核细胞OST具有更具体的共识基序(D/EZNX-S/T,其中Z和X为除脯氨酸外的任意天然氨基酸)。因此使用原核生物的OST进行均质糖蛋白的合成是一种可行的策略。
而NGT虽然很早就被发现,但一直到2000年才从糖丝菌属的Saccharothrix aerocolonigenes中分离纯化出第一种能够将葡萄糖(glucose,Glc)转移到吲哚咔唑衍生物上形成N-连接糖苷键的NGT。随后多种相关的糖基转移酶被报道并应用于均质糖蛋白的合成,例如与高分子量黏附蛋白1(high-molecular-weight adhesin 1,HMW1)糖基化修饰相关的酶HMW1C,可以将Glc或Gal转移到含有共识基序NXS/T肽段的天冬酰胺上;在胸膜肺炎放线杆菌(Actinobacillus pleuropneumoniae)中发现的与HMW1C高度同源且具有相似功能的N-糖基转移酶ApHMW1C;以及成功从胸膜肺炎放线杆菌转移到大肠杆菌表达系统中得到的酶ApNGT。其中ApNGT可以直接通过共表达的方式在大肠杆菌细胞质中合成内源性的均质N-连接糖蛋白,但受限于ApNGT的糖供体底物只能是Glc或Gal,无法直接应用于复杂糖型的合成。为了在Glc的基础上衍生出更复杂的糖型,王来曦课题组通过酶工程改造了内切糖苷酶Endo M,得到的突变体Endo M N175A可以将复合型和高甘露糖型的糖𫫇唑啉供体转移到Glc-Asn上,运用此策略合成了一系列HIV-1 gp41糖蛋白,并且发现这种核心糖为Glc的聚糖对PNGase F和Endo M都有水解抗性,为得到更稳定的糖肽类似物提供了新的策略。
除了上述两种N-聚糖的糖基转移酶,O-聚糖也有负责在丝氨酸/苏氨酸侧链上添加GlcNAc的OGT和添加GalNAc的GALNT,其中后者有多达20种变体,根据作为糖基接受体的肽段是否已有糖基化修饰而分为两个亚家族(subfamily):偏好将糖肽作为糖基接受体的GALNT4、7、10、12和17属于亚家族Ⅱ,其余的则属于亚家族Ⅰ。因此在合成含有O-GalNAc的糖肽时,可以根据肽段的糖基化状态选择不同的GALNT,从而在特定位点上构建糖基化修饰。例如在合成由3个二十肽重复单元组成的黏蛋白MUC1的过程中,为了在MUC1上构建Tn(GalNAc-Ser/Thr)和Sn(NeuAcα2-6GalNAcα1O-Ser/Thr)抗原单元,就通过交叉使用有不同的底物偏好的GALNT完成了GalNAc的引入,在只使用酶的情况下合成了带有Tn与Sn抗原的60-mer MUC1,并且发现由抗原糖肽做成的疫苗能够诱发对癌细胞有显著特异性的免疫反应,提供了一种癌症检测与疫苗开发的思路(图19)。
图19 带有Tn、T、Sn糖型的MUC1糖蛋白的化学酶法合成
尽管O-GlcNAc修饰在天然情况下不能像O-GalNAc一样可以延长糖链,但可以使用Endo系列的内切糖苷酶延长其糖链,在丝氨酸/苏氨酸上构建N-聚糖糖型。另外,O-GlcNAc在O-糖基化修饰中也是一种高丰度的糖基化形式,可调节从转录和翻译到信号转导和新陈代谢的细胞过程,并且还能起到防止蛋白质聚集和降解,以及促进蛋白质重新进行折叠的关键作用。其中,在细胞中辅助蛋白质折叠的功能主要是在高尔基体和内质网上通过OGT在新生多肽上安装O-GlcNAc以提升其折叠中间体的稳定性来实现,从而辅助其成为具有正确三维结构的蛋白质。随后这种辅助折叠的O-GlcNAc则会被O-GlcNAc水解酶(O-GlcNAcase,OGA)去除,恢复蛋白质的原生结构。受到这一生理过程的启发,刘磊课题组利用该特性建立了一种可去除的糖基化修饰(removable glycosylation modification,RGM)策略,用于帮助富含二硫键的蛋白质的化学合成和折叠。根据O-GlcNAc有助于维持蛋白质正确的几何形状和防止聚沉的特点,在Ser/Thr位点连接简单的O-GlcNAc分子就可以通过稳定其折叠中间体来有效促进蛋白质的折叠过程。折叠成功后,再使用OGA清除人为添加的O-GlcNAc修饰,从而得到具有多个二硫键的正确折叠蛋白质。利用这种策略,实现了原生白细胞介素-5(IL-5)的首次全合成。而在未使用这种策略的情况下,由于很容易形成错误折叠的IL-5异构体,几乎无法得到正确折叠的产物(图20)。而郑基深课题组继续将该策略用于镜像蛋白的合成,成功高效合成了TNF-α和Omicron RBD这两种含有丰富二硫键且难以折叠的镜像D-型蛋白,证明了含有O-GlcNAc的D-蛋白可以成为天然存在的O-GlcNAc酶的底物同时也再次验证了RGM策略在辅助蛋白质折叠复性方面的实用价值。
图20 O-GlcNAcylation辅助白介素-5(IL-5)折叠复性策略
总结与展望
糖基化是蛋白质翻译后修饰中最重要、最复杂的修饰之一,广泛参与各种生理活动。然而,传统蛋白质重组表达技术获得的糖蛋白,其糖型结构高度异质,导致糖蛋白功能与糖型结构之间的构效关系难以明确。为了探明糖型结构与糖蛋白生物学功能之间的构效关系,获得具有特定糖型的均质糖蛋白至关重要。然而,糖蛋白的尺寸、物理特性、结构多样性和复杂性为其合成带来了巨大挑战,因此,开发精准且高效的均质糖蛋白合成策略非常关键。近年来,随着合成化学与合成生物技术的快速发展,研究者们发展了各种各样的新型合成策略和酶的定向改造技术,解决了在合成各种均质糖蛋白中所遇到的糖苷键构建、纯化策略、蛋白溶解度、复杂聚糖修饰等方面的问题。
在糖苷键构建方面,基于假脯氨酸二肽的N型糖肽合成策略解决了Lansbury天冬氨酸酰化法会生成天冬酰亚胺副产物的问题,让该方法成为构建复杂N-连接糖蛋白的主要化学策略,采用该方法,能够以较高的转化率合成带有复杂N-连接糖基化的SARS-CoV-2 RBD和HSV-1 gD蛋白;而采用糖𫫇唑啉作为糖供体和仅有转糖基化活性的Endo系列酶突变体的改进糖重塑策略,提供了一种在原生糖蛋白上快速重构均质复杂糖型的有效方法,合成了一系列含有均质复杂糖型的糖肽、糖蛋白,并且还能在保持抗体活性的前提下重塑其糖基化修饰以调整对不同抗原的识别能力。
反应流程越长,纯化次数越多,最终的产率就越低。为了方便糖蛋白的纯化,通过加入各种各样纯化标签是解决这一问题的思路。例如,在C端加入聚赖氨酸标签的策略可以方便地通过亲和色谱法纯化得到糖肽;在N端加入双功能的光敏纯化/保护手柄利用Ni-NTA快速纯化;或是在C端直接加入疏水标签的液相多肽合成策略,能够便捷地通过亲水溶剂沉淀-离心纯化,兼具高反应效率和快速纯化的优点,很好地提升了糖肽与糖蛋白的合成效率。
溶解度差也是困扰蛋白质合成的一大问题。人们通过使用保护基增强溶解度和在有机相中的连接策略虽然成功合成了IL-2,但产率极低。而结合EPL和在有机相中进行的丝氨酸/苏氨酸连接策略既解决了产率低下问题,又解决了溶解性问题,高效大批量地合成了IL-2。而对于复杂聚糖的合成与修饰,酶具有天然的优势。成熟的定向改造技术和丰富的天然糖苷酶与糖基转移酶,使得用于糖修饰的酶工具越来越多样。例如通过突变ENGase催化水解中心的关键残基使其只有转糖基化功能而失去水解功能,得到高效的“糖合成酶”;也可以结合基因编辑技术,将多种糖基转移酶负载到细胞等载体上,从而实现可控的糖链连续延长。
这些丰富的合成工具让许多原生糖蛋白的合成成为可能,正如前文所讨论的成功案例所示。但这并不意味着这一领域已经是完备的,各个聚糖单元之间以及聚糖链与蛋白质骨架之间构建多种形式的糖苷键时的立体选择性和区域选择性仍然有待改进,现有的合成策略仍然只能取得毫克级的产物。这些成功案例的意义不仅在于合成策略方面的突破,更在于使用合成得到的糖蛋白探索糖与生理过程的构效关系。例如IL-17A的合成就发现了随着糖基化修饰的糖型越大,糖蛋白与其受体的结合能力就越差,说明了糖基化在其受体-配体相互作用中起到阻碍作用。而这种阻碍作用在亚单位疫苗的开发中也有所展现,例如翁启惠课题组在研究针对SARS-CoV-2的mRNA疫苗时发现:通过突变去掉SARS-CoV-2刺突蛋白S2亚基上的糖基化修饰后,刺突蛋白作为抗原在暴露高度保守表位的同时也能够增强免疫原性,表明S2亚基上的糖基化修饰对于免疫识别过程也存在显著的阻碍作用,删除这些糖基化修饰反而能够增强免疫原与反应原性。然而,在最近的多项研究中发现,截短糖链可能是发展更高效疫苗的有效策略。王平课题组在合成多种带有不同糖型的RBD和HSV gD时发现,只在N331和N343带有去掉唾液酸的复合型双天线糖型的RBD和仅带有单糖的HSV gD反而具有更强的免疫原性与反应原性,表明通过对N-聚糖的修剪是提高抗原免疫原性的潜在策略。与此同时,朱江课题组在研究HIV疫苗时发现通过对Env糖蛋白组成的纳米颗粒表面的聚糖进行修剪可以获得更好的免疫原性,并且接种该纳米颗粒的小鼠会诱发更加强烈的病毒中和抗体反应,而直接删除聚糖和不对聚糖进行修剪的对照组则不如前者,表明在以HIV Env糖蛋白为抗原的疫苗开发中修剪聚糖比起直接删除聚糖是更有效的策略。以上种种现象表明,这种适当的删除或是修剪聚糖的减糖策略在提升抗原活性方面具有巨大潜力,可以使得抗原上的保守表位更容易被抗体所接触,产生广泛且持久的免疫反应,从而有效地提高疫苗的效价,为研究糖基化修饰与疫苗效价的关系提供了新的研究思路。
这些构效关系的研究不仅在亚单位疫苗的开发中可以发挥关键作用,也会进一步开拓更广泛的健康应用前景,例如在免疫疗法领域,就有包括治疗性抗体开发、细胞免疫疗法(CAR-T)和基于MUC1糖肽的合成抗肿瘤疫苗等应用需求。而实际应用的需求又将反过来促进开发更高效的合成策略,进一步让更多具有生理意义的均质糖蛋白被合成,使合成化学与生物大分子功能的研究相互促进,不断在新的交叉领域焕发生机。
通讯作者及团队介绍
王平博士,上海交通大学化学化工学院教授,海外高层次青年人才,主持国家杰出青年科学基金、国家自然科学基金重大研究计划培育项目、国家自然科学基金面上项目等。研究方向为糖化学生物学,从事糖蛋白、糖肽合成以及多肽合成方法学研究,作为通讯作者和第一作者在Science、Journal of American Chemical Society、Angewandte Chemie、Nature Communication等期刊发表论文四十余篇,授权专利2项。