罗汉果苷是一种天然的葫芦烷型三萜苷类化合物,具有多种药理活性,主要从(Siraitia grosvenorii)中提取,被广泛用作天然零卡路里甜味剂。然而,由于罗汉果的种植区域有限、成熟周期较长、提取工艺低效、生产成本高昂,导致市场上甜味罗汉果苷的供应短缺。基于大肠杆菌工程的可控程序,开发了一种人工多酶系统以提高UDP糖基转移酶(UGTs)的催化活性和区域选择性,缩短了苦味罗汉果苷转化为甜味罗汉果苷的合成周期,为罗汉果苷的高效生产和农业废弃物的高价值利用提供了新思路。
UGT基因的克隆及UGT30033基因开放阅读框区域中的SNP鉴定
基于罗汉果基因组和转录组数据,筛选并鉴定了两个与已知UGT基因同源性较高的基因UGT153033和UGT30033。通过对RT-PCR产物的开放阅读框(ORF)序列进行比对,揭示了UGT30033基因中7个单核苷酸多态性位点,并通过氨基酸序列变化鉴定出三个UGT30033突变体(M1-1、M1-2和M1-3)。
UGTs的体外酶活测定
UGT153033和UGT30033基因被亚克隆到pET-32a载体中,并转化到E. coli Rosetta (DE3)菌株中。体外催化活性测定结果表明,UGT153033能够高效地将罗汉果苷IA1转化为罗汉果苷IIE(图1A和B)。UGT30033及其突变体M1-1和M1-2能够催化罗汉果苷IIE生成罗汉果苷III(图1A和C)。此外,UGTyojK1能够特异性地将罗汉果苷III转化为含有四个葡萄糖基的新型罗汉果苷,并能够在Sia I上进行分支糖基化(图1A和D)。
图1 UGTs对罗汉果苷的催化活性
UGT30033的催化机制与M1-1糖基化活性的分子基础
为研究UGT30033的三维结构和糖基化机制,通过分子对接和同源建模揭示了UGT30033的典型GT-B折叠结构与糖基转移酶基序结构(Trp334-Gln377)共同参与其对UDPG的识别和结合(图2A)。在催化过程中,His21从罗汉果苷IIE的C24-O-葡萄糖基团中获得质子,产生的亲核体“进攻”UDPG葡萄糖的C1原子,导致糖基化反应的发生。Asp123则在反应过程中平衡电荷并稳定催化构象(图2B)。通过分子对接模拟显示,在M1-1·UDPG·IIE复合物中,葡萄糖C24位的O6原子与His21残基N22原子之间的距离为2.9 Å,而野生型中该距离为3.6 Å,因此M1-1突变体中质子更易转移(图2C),具有更高的催化效率。
图2 UGT30033的分子对接和UGT30033与M1-1之间的结构比较
结构引导的工程改造以提高UGT30033 M1-1的催化活性
为优化UGT30033的突变体M1-1以扩展其底物范围并提高催化活性,通过通过分析底物结合口袋中的关键氨基酸残基,发现His21、Thr181、Ile194和Asp376在底物结合和催化中起关键作用(图3A)。通过对残基Ile194和Thr181的定向突变分别减少空间位阻和增强底物亲和力,得到新的突变体M3,进一步提高了酶的催化效率(图3B)。在M1-1·UDPG·IIIE复合物中,His21与罗汉果苷IIIE的C24 6-羟基之间的距离较大,影响了质子转移的效率(图3C)。相比之下,在M3·UDPG·IIIE复合物中,该距离缩短,表明质子转移更加顺畅,从而显著提高了催化效率(图3D)。
图3 M1-1和M3之间的结构比较
进一步评估了M3对其他罗汉果苷(罗汉果苷IIA、11-O-罗汉果苷IIA、11-O-罗汉果苷IIE、罗汉果苷IIIE、11-O-罗汉果苷IIIE和罗汉果苷IVE)的催化特性。HPLC和LC-MS检测结果表明,M3突变体能够通过β-(1,6)-糖苷键特异性地将葡萄糖基转移到这些罗汉果苷的Glc-O-C24(图4)。
图4 M1-1/M3与8种罗汉果苷和UDP-Glc通过体外验证实验进行糖基化反应的HPLC分析
多酶催化优化罗汉果提取物的成分
为优化罗汉果在不同发育阶段的成分,采用了由UGT153033、M3和yojK1组成的多酶催化系统将苦味罗汉果苷转化为甜味罗汉果苷。引入了由拟南芥蔗糖合酶(AtSusy)构建的UDPG再生系统,有效降低了对外源UDPG供体的需求(图5A)。通过LC-QQQ-MS分析了多酶催化系统对罗汉果苷的影响,发现各发育阶段的苦味罗汉果苷显著减少,甜味罗汉果苷显著增加,尤其是在授粉后15-30天的未成熟果实中,苦味罗汉果苷减少了68-83%,甜味罗汉果苷增加了30-40%(图5B)。
图5 UGTs催化苦味罗汉果苷产生甜味罗汉果苷的方案