导读
蛋白质表达在不同的生物系统中是一个关键过程。大肠杆菌作为在工业催化和医疗保健领域广泛应用的微生物宿主,研究人员在构建重组表达系统时经常面临重大挑战。为了最大限度地发挥大肠杆菌表达系统的潜力,解决某些目标蛋白产量低或不产生的问题至关重要。2024年10月,清华大学的研究人员在Biotechnology Advances(JCR分区Q1,IF:12.13)发表题目为《Strategies to overcome the challenges of low or no expression of heterologous proteins in Escherichia coli》的文章,针对大肠杆菌中异源蛋白表达面临挑战的主要因素,即蛋白质毒性、基因序列的内在影响和 mRNA 结构,提出了可行的解决方案。
一、大肠杆菌重组蛋白表达的核心地位与挑战
蛋白质表达在分子生物学和生物技术中至关重要,大肠杆菌作为常用宿主,自 20 世纪 70 年代起就广泛应用于重组蛋白表达,目前有超过 100 种在大肠杆菌中表达的蛋白质产品已成功实现商业应用(图1)。大肠杆菌具有生长迅速、培养条件易控以及拥有丰富分子工具等优势,然而在实际应用中,大肠杆菌表达系统面临着诸多挑战,其中异源蛋白的低表达或无表达问题尤为突出。研究表明,在大肠杆菌中许多异源重组蛋白存在表达缺失或表达水平极低的现象。为了提高重组蛋白的表达开发了各种质粒载体和大肠杆菌菌株,包括采用 T7 表达系统的 pET 系列质粒和大肠杆菌菌株 BL21 (DE3)(图2)。
图1大肠杆菌重组蛋白表达系统的应用
图2大肠杆菌BL21 (DE3)-T7表达系统
二、蛋白毒性及应对策略
在使用大肠杆菌表达重组蛋白时,蛋白质毒性是最常见的挑战。常见的毒性蛋白包括核糖核酸酶、人类雌激素受体α(hERα)。本文列举了常见的毒性蛋白应对策略。细胞内合成调控通过特定菌株(如 BL21 (DE3) pLysS和pLysE)携带的T7 RNAP抑制剂,或者采用阿拉伯糖诱导型启动子(pBAD),在诱导后实现较高水平的表达;另外向低碳源培养基(如 LB或TB)中引入1%葡萄糖可将 BL21 (DE3) 中目标蛋白的泄漏表达水平降低到与 BL21 (DE3) pLysS 相似的水平;而对于特定的有毒蛋白可以开发新型宿主菌株。对于仅在过表达时才表现出毒性的蛋白质,调节表达速率是一种可行的策略,常用于表达有毒蛋白的大肠杆菌菌株见表1。而另一种策略是表达毒性蛋白并将其引导分泌到细胞外空间,以避免破坏细胞内生长。例如将信号肽融合到目标蛋白的N端从而避免对细胞内环境造成破坏。II 型分泌途径被广泛用于将目标蛋白分泌到周质空间,包括Sec依赖途径、SRP途径和TAT途径等(图3),不同途径适用于不同类型的蛋白质分泌。
表1常用于表达有毒蛋白质的大肠杆菌菌株
图3大肠杆菌中的Ⅱ型分泌途径
三、基因序列相关的解决方案
导致重组蛋白不表达的主要因素源于基因序列的差异,包括 mRNA 与核糖体结合、翻译起始和肽链延伸。密码子偏好被认为是影响蛋白质表达的最关键因素之一,极低的解码率和缺乏带电荷的 tRNA 可能导致翻译中断,从而引起蛋白质表达问题。研究表明密码子在生物体中的出现频率与能够解码这些特定密码子的 tRNA 的丰度之间存在正相关(图4a),高频密码子能够解码tRNA浓度可能更高,但存在与相同密码子对tRNA的竞争(图4b)。另外密码子的解码速率影响因素包括tRNA的修饰和激活过程、tRNA的扩散动力学以及密码子与反密码子之间的亲和力(图4c-e),同时特定密码子的上下游序列也会影响解码速率(图4f),因为tRNA在离开E位点后仍靠近核糖体,易于与下一个密码子结合,而核糖体可能在特定位置减慢或暂停(图4g)。
图4 密码子偏好对翻译效率的影响
mRNA结构
在研究异源基因序列对大肠杆菌中蛋白质表达的影响时,单链 mRNA 结构的动态性质给准确的结构研究带来了挑战。因此本文列举了5种mRNA 结构预测和绘图方法。自由能最小化作为目前最常用的mRNA结构预测方法,它通过动态规划算法来确定最稳定的二级结构(图5a);次优结构预测能识别那些接近最优结构但并非最佳的结构(图5b);碱基配对概率预测可用于注释通过自由能最小化预测的结构中每个碱基对的准确性(图5c);并行分析 RNA 结构(Parallel Analysis of RNA Structure,PARS)映射使用单链或双链特异性核糖核酸酶消化从细胞中提取的总mRNA,将片段与大规模并行测序结合(图5d);化学修饰探测利用化学试剂与RNA的反应性差异来映射 RNA 结构,其中SHAPE-MaP 方法是目前应用最为广泛的RNA结构映射技术之一(图5e)。
图5 mRNA 结构预测和映射方法的比较
多参数共同影响
密码子使用和 mRNA 结构之间存在相互影响的关系,共同调节蛋白质表达。基因起始密码子关于密码子使用和结构受到“斜坡序列”(图6a)和“结构假设”两种理论的解释。其中“斜坡序列” 表明密码子是为了减慢翻译延伸速率,降低核糖体在mRNA上的堵塞并防止脱落(图6b),相反“结构假设”提出密码子旨在减少起始位点处的 mRNA 结构折叠。研究表明当起始位点处的总体密码子不变时,改变 mRNA自由能会显著影响翻译效率图(图6c)。但mRNA 结构对蛋白质表达的影响可能被高估,密码子使用对蛋白质表达的影响比 mRNA 折叠因素的影响更为显著。而密码子使用和 mRNA 结构的相互作用通过改变细胞资源的比例来影响蛋白质表达和宿主生长(图7)。
图6 Ramp序列以及两种解释其
异常密码子使用的假说
图7 mRNA 结构和密码子使用共同影响蛋白质表达过程
四、解决方案和综合优化方法
密码子使用的优化
早期主要利用密码子频率和密码子适应指数(CAI)进行优化,随着研究的深入,逐渐综合考虑 tRNA 适应指数(tAI)和标准化翻译效率(nTE)等更为全面的参数。同时出现了如 OPTIMIZER、DNA Chisel 等实用工具用于基因序列的优化。最新的工具 DNA Chisel 允许用户在这三种优化策略中进行选择,提供了一种定制的基因序列优化方法。有几种方法在密码子优化过程中还考虑了诸如 GC 含量、5' mRNA 二级结构和类似 Shine-Dalgarno 的序列等因素。
融合标签的利用
使用融合标签/短肽在调整核苷酸序列以及引入外源功能标签方面起着至关重要的作用。常用的融合标签包括麦芽糖结合蛋白(Maltose-Binding Protein,MBP)、小分子泛素样修饰蛋白(Small Ubiquitin-Likemodifier,SUMO)和大肠杆菌硫氧还蛋白TrxA等。融合标签技术在提高大肠杆菌中可溶性蛋白质表达方面显示出巨大潜力。然而几种广泛使用的融合标签的作用机制仍不清楚。
基于大规模数据和深度学习的综合优化方法
利用大规模和深度学习技术,为蛋白质表达提供更准确的指导(表2)。例如一项研究分析了6348种蛋白质在大肠杆菌中的表达数据,称为“六个氨基酸”(6AA)和“31个密码子折叠优化”(31C-FO)。这些方法同时考虑密码子偏好和 mRNA 折叠,从而提高蛋白质表达。SoluProt工具利用TargetTrack 数据库和梯度提升机技术预测蛋白质溶解性。此外,还可利用深度学习构建翻译延伸短斜坡序列(TESR),如DeepTESR框架。
表2 用于预测蛋白质表达或优化基因
序列以实现重组蛋白表达的最新方法
在生物制药和蛋白质工程领域,以大肠杆菌作为模式微生物构建细胞工厂对于重组蛋白的生产具有重要意义。在未来的研究中,在理解与核糖体解码速率和细胞内带电荷tRNA浓度缺乏精确测量方法相关的问题方面仍存在持续的挑战,基于核酸为目标蛋白质设计基因序列也将成为可能(图8)。随着新技术的不断涌现,我们期待更有效地解决当前问题,提高重组蛋白的表达效率,从而为制药和科学研究领域做出更大的贡献。
图8 大肠杆菌中蛋白质表达的优化和
增强方法的发展及未来前景
耀海生物,作为一家专业领先的微生物表达体系合同研发与生产组织(CRDMO)服务提供商,致力于为广大客户提供专业、高效的生物技术服务。公司专注于以大肠杆菌和酵母菌表达体系,开展一系列生物制药的发酵、纯化、制剂工艺开发和生产的一站式外包服务。我们的服务范围涵盖了多肽药物、重组蛋白药物、病毒样颗粒(VLP)、质粒DNA、纳米抗体等多种生物药的开发与生产。
此外,耀海生物还提供科研级别的mRNA、CircRNA和SaRNA等前沿技术的定制服务,以满足不断发展的生物科研和制药需求。我们以严格的质量管理体系、先进的实验设施和丰富的行业经验,确保为客户提供高品质的产品和一站式解决方案,助力客户在生物医药领域的创新与发展。
(如需相关CRDMO服务,请随时联系199 5298 1076)