2022 年 3 月,来自Cruces University Hospital的Beatriz Trastoy等人在Nature Communications上发表了一篇题为Mechanism of cooperative N-glycan processing by the multi-modular endoglycosidase EndoE 的研究性论文。
Abstract
细菌产生各种各样的糖苷水解酶,代谢环境中的聚糖作为主要营养来源,并促进宿主的定植和感染。在这里,重点介绍EndoE,这是一种由粪肠球菌分泌的多模块糖苷水解酶,是医疗相关感染的主要原因之一。研究人员提供了EndoE的X射线晶体结构,其显示了由四个结构域组成的结构,包括由两个连续的三个α-螺旋束连接的GH18和GH20糖苷水解酶。确定GH20结构域是一个外切的β - 1,2 - N乙酰氨基葡萄糖苷酶,而GH18结构域是一个内切的β - 1,4 - N-乙酰氨基葡萄糖苷酶,它专注于处理复杂型或高甘露糖型N -聚糖的中心核心。这两个糖苷水解酶结构域以协同的方式作用于糖蛋白上的各种N -聚糖,包括治疗性IgG抗体。Endo E结合两个具有不同功能和糖特异性的酶结构域,在糖代谢和免疫逃逸中发挥双重作用。
01
简介
聚糖在细菌的生理和致病过程中起着核心作用。它们主要用作细菌细胞包膜的结构成分以及允许能量储存的代谢中间体和分子。以胞外多糖形式存在的聚糖被认为是决定细菌生物被膜结构完整性的基本成分。此外,蛋白质和脂质的糖基化修饰在细菌中产生了丰富的结构多样性。这些结构在分子识别事件中起着至关重要的作用,包括逃避免疫反应和宿主-病原体相互作用。
在糖苷水解酶类( GHs )酶的作用下,糖类被分解并从碳水化合物和非糖类物质部分释放到其组成的单糖中。GH的多样性是令人惊讶的,超过一百个GH家族的成员水解不同的聚糖键,产生它们的生物的多样性也是如此。目前已知的生长激素大部分来源于细菌,细菌主要利用这些酶将聚糖从其环境中解放出来,作为食物来源并重塑其细胞包膜。一些细菌还利用生长激素调节宿主聚糖作为免疫逃逸机制。
大多数细菌来源的生长激素包含一个负责聚糖水解的单一结构域。许多GH确实含有一个额外的非GH结构域,称为碳水化合物结合模块( CBM ),其预测的功能是定位底物,而更少的含有额外的结构域,可以将酶导向特定的糖蛋白靶标。虽然更罕见,但一些GH含有多个GH结构域,具有不同的聚糖特异性。这类多结构域酶很可能进化出增强机体糖代谢活性的功能。在Caldicellulosiruptor bescii中发现了这种多结构域GH酶的一个例子,该酶同时含有GH10和GH48结构域,分别加工木聚糖和纤维素。
来自粪肠球菌的EndoE还含有2个预测的GH,分别属于内切 - β - N-乙酰氨基葡萄糖苷酶( ENGase ) GH18和氨基己糖苷酶GH20家族。与植物中多结构域GHs的发育一样,细菌中的这类碳水化合物修饰酶(碳水化合物酶类),包括Endo E,很可能是进化的功能获得性途径的结果,其中也可能涉及转导,以增强生物体的聚糖加工能力。具有不同糖链特异性的两个GH结构域是否以协同的方式参与单个多肽的功能或独立地执行它们的糖基水解反应,但仍不清楚通过在同一时间和地点这样做赋予生物体进化优势。
粪肠球菌( E. faecalis )是一种条件致病菌,尤其是在医院环境中,可引起多种人类疾病,包括咽炎,皮肤感染,更严重的感染,如中毒性休克综合症,以及非感染性后遗症急性风湿热和风湿性心脏病,每年导致全球超过50万人死亡。肠球菌感染的治疗因抗生素耐药性的潜在发展而变得复杂。EndoE除了具有营养获取作用外,还被认为可以逆转乳铁蛋白的生物被膜抑制作用,还可能通过去除人免疫球蛋白G ( Immunoglobulin G,IgG )抗体上的聚糖参与免疫逃逸,从而阻止IgG抗体与Fc γ受体的结合来抵抗感染。
多结构域GHs,如EndoE,其假定的多结构域协同性也可能在化学酶法合成中具有应用,通过这种方法可以重塑糖蛋白上的聚糖,如IgG抗体。Asn297糖基化位点上的N -连接聚糖通常对应于双线的复合物型( CT ),但IgG抗体,包括临床使用的IgG抗体,显示出相当大程度的结构异质性,以几种糖型的混合物存在。这种异质性对它们的疗效和效应功能有显著影响。一种生产定制糖型的技术是在宿主表达系统中表达IgG抗体,并通过糖生物合成途径进行改造,从而生产一种主要类型的糖型。然而,由于N -连接聚糖生物合成途径的复杂性,这种方法产生的糖型的质量和多样性受到限制。化学酶法聚糖重塑代表了一种替代方法来规避这些困难,并通过使用ENGases产生均一糖基化IgG抗体的高产率。如果存在两个反应产物(也就是说,含有GlcNAc残基的蛋白质和水解的N -聚糖),ENGases可以催化逆反应,恢复糖苷键。使用具有糖苷合成酶活性的ENGase突变体和作为活化糖基供体底物的N -聚糖恶唑啉可以进一步增强逆反应(图1 )。Endo E可促进Ig G和乳铁蛋白的RNAe B和CT N -糖链释放高甘露糖型( HM型) N -糖链,并对工程菌产生的含Man5 HM型N -糖链的重组曲妥珠单抗表现出显著的去糖基化活性,显示了其在单克隆Ig G抗体糖基化改造中的潜在用途。具有2个或2个以上GH结构域的酶通过氨基酸接头融合在一起,如在Endo E中,可以扩大糖苷水解酶和/或糖苷合成酶的组合,用于一锅法反应,产生具有定制糖型的糖蛋白。
在本工作中,研究人员提供了( i ) EndoE的N端GH18结构域的非配体形式和与Man5产物复合物的高分辨晶体结构,( ii )两个3 α -螺旋束连接区,( iii ) C端GH20结构域的非配体形式的高分辨晶体结构。结合定点突变,n糖蛋白化学,酶活性和动力学,小角X射线散射( SAXS )和计算模拟,揭示了两个EndoE GH结构域中不同底物特异性的分子基础,并确定了这两个GH结构域协同作用于任何一个单独的GH结构域都不能独立水解的N -聚糖的机制。
图1.ENGases可用于改造IgG抗体的糖基化模式。第一步,使用ENGase切割Ig G抗体中存在的多种糖型。在第二步中,可以使用额外的酶,如α -岩藻糖苷酶,去除未被ENGase切割的特定聚糖部分。在第三步中,糖链-恶唑啉供体与ENGase糖苷合成酶突变体一起用于转移特定的糖链,以获得均一的N -糖基化IgG抗体。
02
结果与讨论
1.Endo E的GH18结构域的结构
Endo E是一个多模块的酶,包含从N端到C端的蛋白区域,分别为:( i )一个GH18结构域,( ii )一个富含预测α螺旋的' linker区域',( iii )一个GH20结构域。因此,研究人员构建了4个含有糖苷水解酶结构域的Endo E ( EndoE ; 3 .残基56 ~ 837 ;残基1 ~ 55对应信号肽)全长截短体:Endo E-GH18 (残留物56 - 370 ; GH18结构域),Endo E-GH18L (残基56 ~ 486 ; GH18结构域和" linker区"),Endo E-LGH20 (残基371 ~ 837 ; ' linker region '和GH20结构域),EndoE-GH20 (残基487 ~ 837 ; GH20结构域)。研究人员对Endo E - GH18L和Endo E - GH20结构进行了结晶。通过分子置换法( PDB代码7PUJ ;图2 )解析了EndoE - GH18L的晶体结构。EndoE - GH18L结晶于P65空间群,不对称单元中含有1个分子,衍射最大分辨率为1.7 Å。高质量的电子密度图可以追踪到残基61 - 482。GH18结构域(残基61 ~ 349)采用保守的(β/α)8-管拓扑结构,整体大小为45 × 46 × 38 Å (图2a , d)。一个大的凹槽包含活性位点(图2c , f)。该凹槽位于(β/α)8-管的中心,被连接β1-α1(环1;残基70-90,粉红色)、β2-α2(环2;残基105-111,棕色)、β3-α3(环3;残基143-157,橙色)、β4-α4(环4;残基185-190,浅绿色)、β5-α5(环5;残基223-227,蓝色)、β6-α6(环6;残基244-248,绿色)、8(环8;残基314-335,红色)(图2a,d)。该槽底由一组芳香族残基组成,包括Y67、W71、F104、Y245和Y313。研究人员建议EndoE GH18遵循两步底物辅助催化机制,如之前对其他GH18家族成员所述。第一步,N-连接的聚糖底物与活性位点结合,诱导GlcNAc(-1)变形。在这一步中,E186残基(环4)质子化糖苷键,充当酸,而D184残基(β4)使GlcNAc(-1)的C2乙酰胺基团的氧定向,从而攻击GlcNAb(-1)中的异头碳,导致形成恶唑啉离子中间体。在第二步中,E186充当碱,使水分子脱质子化,水分子进行第二次亲核攻击并破坏恶唑啉环,再生保留异头构型的半缩醛糖。
使用DALI 服务器搜索结构同源物,发现糖苷水解酶与EndoE的GH18结构域具有显著的结构相似性,包括:( i )来自蛹虫草( PDB代码6KPO ; Z - score为32.7 ; 262个比对残基的r . m . s . d .值为2.0 Å ; 32 %的一致性)的Endo - CoM,该酶仅对α ( 1、3)岩藻糖基化的双线的CT N -聚糖具有活性,( ii )来自S . pyogenes的( PDB代码4NUY ; Z - score为30.6 ; 268个对齐残基的r . m . s . d .值为2.5 Å ,一致性为26 %)的EndoS,和( iii )来自S . pyogenes的( PDB代码6E58 ; Z - score为30.5 ; 269个比对残基的r . m . s . d .值为2.6 Å ,一致性为26 %)EndoS2。图2. EndoE的GH18结构域的整体结构。a显示EndoE-GH18L的一般折叠和二级结构组织的两个卡通表示,包括GH18结构域(黄色)、3HB-1(深橙色)和3HB-2(浅灰色)结构域以及α12连接子(浅蓝色)。b EndoE-GH18L的两个静电表面表示,显示了推定的N-聚糖结合位点和催化位点的位置。c EndoE的GH18结构域的两种表面表示,带有注释的结构域和环。d EndoE GH18结构域活性位点的特写视图,显示为卡通/棒状表示(黄色)。e EndoE GH18结构域活性位点的特写视图,显示为静电表面表示。f EndoE GH18结构域活性位点的特写视图,显示有带注释的环。
2.EndoE连接区的结构
EndoE-GH18L构建体的晶体结构显示,连接体区域折叠成两个由额外α-螺旋连接的三α-螺旋束(3HB)结构域。第一个3HB结构域包含螺旋α9、α10和α11(3HB-1;残基350-395),而第二个3HB域涵盖螺旋α13、α14和α15(3HB-2;残基421-482)。3HB-1和3HB-2结构域均由短α-螺旋α12连接(残基409-417)。α12螺旋参与GH18、3HB-1和3HB-2之间的相互作用。GH18和3HB-1结构域通过约972Å2的广泛接触面积相互作用,占孤立结构域总可接触表面的7%。界面主要由以下因素介导:(i)GH18结构域的α7、α8、环7和8;以及(ii)3HB-1的α11,支持两个结构域之间稳定关联的概念。3HB-1的Y388与GH18结构域的Y290和W337的侧链形成疏水相互作用,而短α-螺旋α12的D398和3HB-1的K392分别与GH18域的R320和E288形成盐桥,α-螺旋γ12的Y399与3HB-1的P332建立疏水相互作用。此外,3HB-1和3HB-2结构域主要分别通过C末端和N末端相互作用。界面主要由以下因素介导:(i)GH18结构域的α7、α8、环7和8;以及(ii)3HB-1的α11,支持两个结构域之间稳定关联的概念。3HB-1的Y388与GH18结构域的Y290和W337的侧链形成疏水相互作用,而短α-螺旋α12的D398和3HB-1的K392分别与GH18域的R320和E288形成盐桥,α-螺旋γ12的Y399与3HB-1的P332建立疏水相互作用。此外,3HB-1和3HB-2结构域主要分别通过C末端和N末端相互作用。3HB-1的H359和Y366分别与3HB-2的Y464和D428的侧链形成氢键。来自3HB-1的R363也与来自3HB-2的G461的主链建立氢键。3HB-2的Y424通过氢键与R363的主链相互作用,并通过疏水相互作用与3HB-1的K362的侧链相互作用。
3HB-2结构域与以下结构域显示出较低的结构同源性:(i)化脓性链球菌EndoS的C末端3HB结构域(PDB代码4NUZ;Z评分10.4;83个对齐残基的r.m.s.d值为3.2Å,11%同一性),没有报道其功能,对酶活性来说是必不可少的4;以及(ii)产气荚膜梭菌NagH的FIVAR(存在于各种结构中)模块(PDB代码2OZN;Z评分9.5;64个对齐残基的r.m.s.d值为1.6Å;13%同一性;NagH是一种具有透明质酸酶活性的碳水化合物活性μ毒素,含有GH84结构域,以及几个CBM和FIVAR模块50);以及(iii)无乳链球菌α C蛋白的三螺旋束基序(PDB代码1YWM;Z评分为9.3;80个对齐残基的r.m.s.d值为4Å;15%同一性)。αC蛋白是一种侵袭蛋白,参与B组链球菌在人类上皮细胞中的易位。它包含一个参与潜在肝素结合位点形成的三螺旋束。
3.EndoE的GH20结构域的结构
通过分子置换方法解决了EndoE-GH20的晶体结构(PDB代码7PUL;图3)。EndoE-GH20在P 1 2 1 1空间群中结晶,不对称单元中有一个分子,衍射的最大分辨率为1.4Å(补充表1)。电子密度图的质量能够追踪残基489-835。GH20结构域采用保守的(β/α)-8管拓扑,总大小为55×50×39Å(图3a,d)。一个长而开放的凹槽,包括一个深口袋,平行于蛋白质表面延伸,包含活性位点(图3b,c)。该凹槽位于(β/α)8-barrel的中心,被连接β1-α1(环1;残基499-505,粉红色)、β2-β3(环2;残基530-541,棕色)、β5-α4(环3;残基598-603,橙色)、β6-α6(环4;残基660-670,浅绿色)、β7-β8(环5;残基706-724,蓝色)、β8α7(环6;残基729-740,绿色)、α9-α8(环7;残基754-771,浅蓝色)和β10的环包围。-α9(环8;残基804-813,红色;图3c)。深口袋主要由一组芳香残基组成,包括H602、F705、W729和W804。使用DALI服务器进行的结构同源性搜索仅显示了一种与EndoE的GH20结构域具有高度结构相似性的蛋白质,即肺炎链球菌的StrH。巧合的是,StrH包含两个属于GH20家族的催化结构域,GH20A(PDB代码2YL8;Z分数为57.0;346个对齐残基的r.m.s.d.值为0.8Å;53%同一性)和GH20B(PDB代码3YLA;Z分数56.3;345个对齐残基的r.m.s.d.值为0.9Å;49%同一性。StrH能够水解CT N-聚糖中非还原性末端GlcNAc与Man残基之间的β(1,2)键。高结构相似性表明EndoE的GH20结构域也具有外切-β-N-乙酰氨基葡萄糖苷酶活性。此外,StrH的GH20A和GH20B结构域与EndoE的GH20结构域的结构比较揭示了环4中两个催化残基的保守性,它们介导了类似于GH18结构域所述的底物辅助机制。在第一步中,D661稳定反应中间体,并使乙酰氨基氧定向,对异头碳进行亲核攻击,形成恶唑鎓离子中间体。此外,E662充当使糖苷键质子化的酸。相比之下,在第二步中,E662充当碱,使水解恶唑鎓离子中间体的水分子脱质子化,得到与底物具有相同异头中心的产物。
另外两种GH20酶与EndoE的GH20结构域显示出较低的结构同源性:(i)来自放线综合放线杆菌的分散蛋白B(PDB代码1YHT;Z评分31.8;298个对齐残基的.m.s.d值为2.8Å;20%同一性);和(ii)来自双歧杆菌的乳-N-糖苷酶(LNBase)(PDB代码5BXR;Z评分31.0;290个对齐残基的r.m.s.d值为2.5Å;22%同一性)。Dispersin B是一种可溶性外切β-N-乙酰氨基葡萄糖苷酶,可降解聚β-1,6-N-乙酰-D-葡糖胺(PNAG),PNAG是构成许多细菌形成的生物膜的多糖基质的主要成分。EndoE的GH20结构域与分散蛋白B的结构比较表明,环4和6采用了一种独特的构象,可以解释这些酶所接受的不同底物连接。双歧杆菌的LNBase是一种关键酶,可以水解母乳寡糖的主要成分乳糖-N-四糖(Galβ1-3GlcNAcβ1-3Galβ1-4Glc),从而产生乳糖-N-二糖I(Galβ1-3GlcNA cβ1)和乳糖(3Galβ1-4Glc)。EndoE的GH20结构域与LNBase的结构比较表明,EndoE-GH20中环1和8的构象和长度可以阻断与GlcNAc(-1)连接的额外碳水化合物部分的进入,证实了该结构域的外切活性。
图3. EndoE的GH20结构域的整体结构。a显示EndoE-GH20(橙色)的一般折叠和二级结构组织的两个卡通表示。b EndoE-GH20的两个静电表面表示,显示了推定的N-聚糖结合位点和催化位点的位置。c EndoE的GH20结构域的两种表面表示,带有注释的结构域和环。d EndoE GH20结构域活性位点的特写视图,显示为卡通/棒状表示(橙色)。e EndoE GH20结构域活性位点的特写视图,显示为静电表面表示。f EndoE GH20结构域活性位点的特写视图,显示有带注释的环。4.全长Endoe结构
为了研究溶液中EndoE的整体结构和每个结构域的排列,进行了在线尺寸排阻色谱SAXS(SECSAXS;图4)。SAXS是一种强大的技术,能够提供溶液中柔性和动态蛋白质的结构信息。EndoE作为平均分子量为90 kDa的单体从凝胶过滤柱中洗脱出来(88.3 kDa是EndoE序列的预期分子量;补充图1),回转半径Rg为46.5Å,即分子中由散射长度密度加权的平方质心距离的平均值(图4c)。原子间分布函数P(r)是蛋白质分子内原子间矢量长度频率的度量,它提供了有关散射粒子形状的信息。所得的P(r)函数分布呈现出实空间距离的双峰分布,表明粒子是细长的。最大直径Dmax约为140Å,最大峰值在r=30Å,次峰值在90Å(图4b)。
研究人员使用GASBOR重建了EndoE的从头计算低分辨率包络。如图4d-f所示,EndoE的包膜呈“豆”形,有两个不对称的裂片。EndoE的尺寸约为141×48×42Å,而单个大裂片和小裂片的尺寸分别约为68×48×42Å和约61×43×42Å了(图4e)。对EndoEGH18L和EndoE-GH20构建体的晶体结构清楚地表明,EndoE从N端到C端包含四个结构域:(i)GH18结构域(残基61-349)。因此,研究人员将EndoE拟合到从头计算低分辨率包络中,EndoE-GH18L和GH20结构分别占据大瓣和小瓣(图4d)。支持这一模型的是,GH18结构域与“连接区”紧密结合,包括3HB-1和3HB2结构域,而GH20结构域通过一个小环(残基485-491)与“连接区域”连接,这表明该结构域可能具有灵活性,有助于接近底物。因此,GH18(D184和E186)和GH20(D661和E662)结构域的催化残基彼此相距98.6Å,位于全长酶的两侧。EndoE催化域的结构排列可能有助于获得多种底物。
5.EndoE及其组成型GH18和GH20结构域的底物特异性
为了进一步研究两个糖苷水解酶结构域中的每一个在EndoE底物特异性机制中的作用,用EndoE和单个GH18和GH20结构域对以下物质进行了酶活性测定:(i)利妥昔单抗,一种嵌合治疗性单克隆抗体,带有人IgG1 Fc区,主要含有连接到两条重链N297的CT N-聚糖;(ii)RNAse B,一种内核糖核酸酶,在N34处显示一个带有HM型N-聚糖的N-连接糖基化位点;(iii)RNAse A,即RNAse B的非糖基化版本,作为阴性对照和(iv)转铁蛋白,一种含有唾液酸化的双天线和三天线CT N-聚糖的蛋白质。具体而言,利妥昔单抗、RNAse B、RNAse A和转铁蛋白在纯化的EndoE、EndoE-GH18L、EndoEGH20或EndoE-GH18/EndoE-GH20构建体的混合物存在下孵育。EndoE能够处理利妥昔单抗。然而,EndoE-GH18L和EndoE-GH20构建体均未水解利妥昔单抗的N-聚糖。研究人员发现,当将EndoE-GH18L和EndoE-GH20与利妥昔单抗的混合物孵育时,EndoE对利妥昔玛的活性得到了恢复。Endo E能够加工RNAe B的N -聚糖。这种活性是由于Endo E - GH18L的存在,因为Endo E - GH20对RNAe B 没有活性。综上所述,这些数据表明EndoE能够分别水解来自利妥昔单抗和RNAse B的CT型和HM型N -聚糖。EndoE的GH18结构域是两种ENGase活性所必需的。然而,为了处理CT N-聚糖,GH18结构域首先需要GH20结构域(可能是外-β-N-乙酰氨基葡萄糖苷酶)的作用来修饰N-聚糖。
研究人员进行了LC-MS分析,以进一步研究EndoE及其各个结构域的活性。具体而言,利妥昔单抗和RNAse B与活性或非活性形式的EndoE、EndoE-GH18L或EndoE-GH20结构域一起孵育(图5)。在非活性形式与利妥昔单抗或RNAse B一起孵育的情况下,还进行了类似的实验,其中原始非活性酶的活性形式也包含在反应混合物中。EndoE处理利妥昔单抗的LC-MS分析结果如图5所示。EndoE-GH18L无法处理利妥昔单抗上的任何聚糖(图5b),而EndoE-GH20结构域仅去除末端GlcNAc部分(图5e),例如存在于任何天线(G0)中没有末端Gal的糖型上的糖型,以及α(1,3)或α(1,6)天线(G1)中只有一个末端Gal,导致形成4种糖型(6、7、8和9),其中含有一个或两个末端半乳糖,没有末端GlcNAc。正如预期的那样,分别在GH18和GH20结构域中通过谷氨酰胺、E186Q和E662Q水解糖苷键的酸/碱残基突变产生的EndoE非活性结构域对利妥昔单抗没有水解活性(图5c,f)。EndoE能够水解利妥昔单抗的一些聚糖(图5i),用单独的结构域GH18和GH20治疗利妥昔单抗后发现了相同的糖型(图5j)。糖型(11)和(12)的存在表明,GH18结构域既不能从利妥昔单抗释放某些G1聚糖,也不能释放G2聚糖。与单独使用EndoE-GH20处理相比,EndoEE186Q与利妥昔单抗孵育(图5k)导致形成额外的糖型(13、14、15、16和17)。这些糖型含有末端GlcNAc部分,表明连接的GH18结构域的存在会减弱其活性。然而,EndoEE186Q、GH18结构域和利妥昔单抗的孵育产生了与EndoE相同的糖型,表明GH18结构体可能作用于Man3GlcNAc2(Man3),以及具有末端GlcNAc的CT糖型,如(13)(图5l)。为了进一步研究这一点,还将用BgaA半乳糖苷酶处理的利妥昔单抗(仅产生G0/G0糖型的利妥西单抗(1))与活性形式的EndoE、EndoE-GH18L或EndoE-GH20一起孵育。结果表明,GH20和GH18结构域协同工作,通过分别去除末端GlcNAc糖和Man3聚糖,产生完全去糖基化的利妥昔单抗。
DOI: https://doi.org/10.1038/s41467-022-28722-w
END
前期回顾