近日,中国疾病预防控制中心病毒病预防控制所冯霞课题组在 Research Square 上传预印本文章:Optimization of the 5ʹ untranslated region of mRNA vaccines. 这项工作本身并无新颖之处,采用的也是常规方法,设计 5 种不同的 5'UTR 序列分别驱动报告基因和 HIV gp145 基因表达,依据蛋白表达效率和水平,从中筛选出表达最佳的 5'UTR 序列。值得关注的是,他们发现了两个非常有趣的现象:
相同的 5'UTR 在质粒和 mRNA 上驱动相同基因表达时,检测到的细胞内蛋白表达水平是完全不相同的。也就是说,你利用质粒作为表达载体筛选出的最佳 UTR 不一定适用于 mRNA。 证实 5' UTR 二级结构与帽结构(cap)之间的距离极大地影响 mRNA 的蛋白表达效率。
确定候选 5'UTR 序列
这项工作总共挑选了 5 种候选 5'UTR 序列:
α-globin-5'UTR 和β-globin-5'UTR 选自人体细胞中高表达基因的天然 UTR。辉瑞/BioNTech 的 BNT162b2 疫苗使用的就是α-globin-5'UTR。
minimal 5'UTR 选自文章:Maximizing the Translational Yield of mRNA Therapeutics by Minimizing 5′-UTRs,其表达水平与α-globin-5'UTR 相比类似或者甚至更强。
CYBA-5'UTR选自文章:Human cellular CYBA UTR sequences increase mRNA translation without affecting the half-life of recombinant RNA transcripts,该 UTR 序列能够增强 mRNA 翻译水平而不影响其半衰期。
alumin-5'UTR 选自白蛋白基因,白蛋白是一类水溶性球状蛋白,是血浆中最丰富的蛋白质。
此图很重要,点开看看
确定候选 5'UTR 序列后,研究人员还利用百度开发的生物信息学平台 Paddlehelix,预测了不同 mRNA 构建体中 5'UTR 区和编码序列前 30 个氨基酸的二级结构,第一个发夹结构的热力学稳定性和距离帽结构的位置。
构建质粒表达载体
确定 5 种不同的 5'UTR 候选序列以后,要确保启动子、靶标基因、3'UTR、PolyA 是完全相同的。至于将 5'UTR 候选序列与靶标基因、质粒载体连接起来,可以采用常规的酶切连接或者直接合成序列。质粒构建完成以后,我们就可以通过体外转录反应来合成出携带不同 5'UTR 序列的 mRNA。
检测 5'UTR 驱动的蛋白表达
研究人员将具有各种 5'UTR 的重组报告基因质粒转染至 BHK-T7 细胞中,在转染后不同时间点检测绿色荧光蛋白的表达,并对荧光阳性细胞进行定量。结果发现,CYBA-5'UTR 和 Albumin-5'UTR 报告基因表达水平较高,而含α-globin-5'UTR、β-globin-5'UTR、minimal-5'UTR 报告基因表达水平较低。
携带不同 5'UTR 的报告基因质粒表达载体转染 BHK-T7 细胞
有意思的是,当研究人员将具有各种 5'UTR 的 mRNA 转染 HEK293T 细胞后,β-globin-5'UTR 报告基因表达水是最高的,CYBA 5'UTR 的报告基因表达水平最低。
携带不同 5'UTR 的报告基因 mRNA 转染 HEK293T 细胞
HIV gp145 是一种有前途的基于 Env(包膜糖到那边) 的 HIV 候选疫苗,是一种由 gp120 和 gp41 亚基组成的三聚体蛋白,模仿 HIV 病毒颗粒表面的天然 Env 刺突。HIV gp145 分子量约为 145 kDa,包含受体结合 (gp120) 和膜融合 (gp41) 结构域。动物模型的临床前研究表明,gp145 可以引发针对 HIV 包膜的强烈抗体反应。
含有不同 5'UTR 的 gp145-mRNA 转染 HEK293T 细胞中 HIV-1 包膜蛋白的表达如图 5 所示。结果显示,β-globin-5'UTR 表达量最高,其次是 albumin-5'UTR 和α-globin-5'UTR。
携带不同 5'UTR 的 gp145-mRNA 转染 HEK293T 细胞
讨论
质粒驱动的蛋白表达和 mRNA 驱动的蛋白表达不具有相关性。质粒进入细胞后,需要入核转录为 mRNA,然后出核至细胞质中发生翻译,此过程涉及非常复杂的机制,包括众多的 RNA/蛋白互作、RNA 编辑、RNA 修饰等。外源合成 mRNA 进入细胞后,便可直接在细胞质中启动翻译。所以,我们在筛选 5'UTR 序列最好是直接在 RNA 水平展开。
旧文改变5'UTR结构,控制翻译效率我们曾提到过 5'UTR 序列长度、二级结构稳定性及位置会对蛋白翻译效率产生非常显著的影响。一般来说。非结构化 5'UTR 通常有利于较高的翻译起始率 ,而紧邻帽的茎环结构则显着抑制起始。根据钱永健的研究结果:当发夹结构的稳定性小于−35 kcal/mol 时,翻译效率与其距帽子的距离显著相关:当发夹结构距帽子 0 到+10 时,翻译效率线性增加,并且,当发夹结构距离帽子超过+10,翻译效率开始下降。研究人员采用 Paddlehelix 预测了不同 5'UTR 序列的二级结构和发夹结构稳定性。五个 5'UTR 发夹结构的预测热力学稳定性均小于 − 30 kcal/mol。其中,α-globin-5'UTR 和 CYBA 5'UTR 的茎环结构位于帽的起始位置,albumin-5'UTR 的茎环结构与帽的距离为+30,minimol-5'UTR 和帽距离为+1,β-globin-5'UTR 和帽的距离为+9。这项研究在 mRNA 水平,筛选出的最佳 5'UTR 为β-globin-5'UTR,再次证实发卡结构与帽结构之间的距离影响 mRNA 表达效率。
我们总是期望能够找到表达效率足够高且兼容性足够广的 UTR 序列,但是,同一个 UTR 序列,在面对不同的靶标基因,不同的转染细胞时可能表现出完全不一样的蛋白表达效率,这使得 UTR 序列筛选成为一个费力不讨好的浩渺工程。随着 AI 技术的迅猛发展,未来我们或许只需填入靶标基因序列,AI 序列优化平台就会从海量数据库中抓取到最佳的候选 UTR 序列。我们在细胞水平稍加验证,便可直接投入使用。
相关文章阅读:
理性设计UTR,高效表达SARS-CoV-2抗原 改变5'UTR结构,控制翻译效率 Moderna公司CSO谈治疗性mRNA序列设计艺术之理论篇 高通量“干湿”试验探寻mRNA序列优化设计原则 序列优化|Moderna公司AI团队开发新算法挖掘mRNA优化序列 mRNA序列设计|如何进行密码子优化