1.质粒
质粒是生物细胞内固有的、能独立于寄主染色体而自主复制、并被稳定遗传的一类核酸分子。质粒常见于原核细菌和真菌中,绝大多数的质粒是DNA型的,少部分为RNA型。天然DNA质粒大都具有共价、封闭、环状的分子结构,其分子量范围为1-300 kb。
天然存在的野生型质粒由于分子量大、拷贝数低、单一酶切位点少、遗传标记不理想等缺陷,不能满足基因工程载体的要求,因此往往需要以多种野生型质粒为基础进行人工构建。
2.质粒特点
1)自主复制:独立存在于细胞内的复制子。一般质粒 DNA复制的质粒可随宿主细胞分裂而传给后代,按质粒复制的调控及其拷贝数可分两类:严紧控制(stringent control)型质粒的复制常与宿主的繁殖偶联,拷贝数较少,每个细胞中只有1 个到十几个拷贝;
另一类是松弛控制(relaxed control)型质粒,其复制宿主不偶联,每个细胞中有几十到几百个拷贝。每个质粒 DNA 上都有复制的起点,只有 ori能被宿主细胞复制蛋白质识别的质粒才能在该种细胞中复制,不同质粒复制控制状况主要与复制起点的序列结构相关。
3.理想的质粒应具备以下特性:
1)强大的复制能力:确保其在细胞内能够自主复制并大量繁殖,从而有效实现目的基因的扩增;
2)高效的表达能力:作为表达载体,应充分利用宿主细胞的酶系统,实现目的基因的有效表达;
3)高度的稳定性:确保质粒在细胞内能够持续稳定地复制和表达;
4)适宜的酶切位点:即应含有合适的限制性核酸内切酶识别和切割位点,以便于外源基因的插入;
5)明确的遗传标记:以便于对重组体进行筛选和鉴定;
6)较小的分子量:以便能够容纳较大的外源基因,提升质粒的实用性和应用范围。
4.按受体细胞的类型分类:原核载体、真核载体和穿梭载体。
1)原核载体(prokaryotic vector):即能在原核细胞中复制和表达的载体。
2)真核载体(eukaryotic vector):即能在真核细胞中复制和表达的载体。
3)穿梭载体(eukaryotic vector):也叫转移载体(transfer vector),兼具原核载体和真核载体的双重特性,同时包含原核复制起点和真核复制起点,既能在原核生物中高效复制和表达,又能在真核生物中稳定遗传并调控基因表达。如用于枯草杆菌的 pBE2、酵母菌的 pPIC9K、哺乳动物表达载体pMT2 和用于植物细胞的 Ti 质粒,这些穿梭载体不仅可以在大肠杆菌中复制扩增,也可以在相应的枯草、酵母、动物或植物细胞中扩增和表达。
5.按功能与应用分类
1)克隆载体(cloning vector):此类载体具备携带外源基因的能力,可在宿主细胞内进行复制扩增。主要用于克隆和扩增DNA片段(基因),但不包含启动转录、翻译等功能的元件。
2)表达载体(expression vector):除包含克隆载体的基本构成元素(如ori、Ampr、MCS等)外,还具备转录和翻译所必需的DNA序列,即插入的目标基因,。
3)干扰基因表达载体:该载体主要用于干扰特定内源性基因的表达,其上含有针对目标基因mRNA的shRNA,从而发挥沉默基因表达的作用。
4)病毒载体:此类载体基于病毒基因组改造而成,通过去除其致病性并保留其感染性等特性,可进一步包装成病毒颗粒。这为功能基因进入靶细胞或整合至基因组提供了极为便利的手段。
6.根据质粒拷贝数分为松弛型质粒和严谨型质粒
1) 松弛型质粒:复制子决定了质粒的拷贝数,调节pMB1质粒复制子的是一种RNA分子,通常具有比较高的拷贝数,其复制的时候不需要自身合成蛋白,并且完全依赖宿主细菌或细胞提供的蛋白质,这一类就是松弛型复制,即使宿主挨饿受冻,它依然不停复制。使用松弛型质粒在细菌里扩增不受约束,一般10个以上的拷贝。
2) 严谨型质粒:严谨型质粒拷贝<10 个,像pSC101这一类的质粒需要自身合成RepA蛋白,一旦细胞蛋白质合成受阻,拷贝数就不能增加。
拷贝数是指每个细菌/细胞内质粒的个数,决定了最终所能获得质粒的量。质粒的复制子决定了质粒的拷贝数。质粒的拷贝数与正调控与负调控的相对强度相关,也可通过对复制子进行突变而改变。例如,pMB1的复制子能达到的拷贝数为15-20。pMB1的复制子经过改造,得到的pUC质粒拷贝数能够达到500-700。确实,低拷贝数的质粒用途不是十分广阔,主要用于以下两点:
(1)扩增大片段或者在高拷贝数质粒扩增时具有致死的基因克隆。
(2)质粒的扩增会占用大量资源,当载体用于表达或者其他用途时,也会使用上低拷贝质粒。
7.质粒的命名
如pUC19、pEGFP-N3,小写字母p代表质粒“plasmid”,2-4个大写字母代表发明者、实验室名称或者其他表型性状(CMV是启动子,EGFP是增强型绿色荧光蛋白)。
二、质粒的基本元件
1.复制起点(Origin of replication,ori)
DNA复制起始位点ori负责控制质粒复制的起始,原核生物DNA分子中只有一个复制起始位点;而真核生物DNA分子有多个复制起始位点。若质粒图谱上只有一个ori,表示质粒是原核克隆及表达质粒;而图谱上有两个ori,则表示该质粒是穿梭质粒,既可以在原核也可以在真核中复制。
2.启动子(promoter, P)
与RNA聚合酶特异性结合,促进基因转录的DNA序列。含有RNA 聚合酶特异性结合和转录起始所需的保守序列。
真核细胞含有三类RNA聚合酶,因此真核启动子还分为I、II、III类启动。常见表达或者过表达都是II类启动子,而III类启动子如U6、H1,启动小片段如miRNA、shRNA、sgRNA等,其用于构建shRNA和sgRNA载体进行敲低或敲除操作。
Ⅱ型启动子在使用特点上又可分为三大类:组成型启动子(广泛性启动子)、组织特异性启动子、诱导型启动子。
此外,不同物种的表达体系具有不同的启动子,启动子启动基因表达也有强弱之分,因此我们需要根据自己的需求选择含有相应启动子的质粒。关于启动子的详细介绍见往期推文。
3.增强子(enhancer):增强目的基因转录
4.筛选标记(selectable markers)
多为抗生素抗性基因,方便后续筛选阳性克隆。原核细胞筛选标记常用的是氨苄青霉素/氨苄西林Amp、氯霉素Cam、卡那霉素Kan、四环素Tet等;真核细胞筛选标记用的是嘌呤霉素Puro,新霉素neo/G418,潮霉素Hyg或Hygro等。质粒图谱中用抗生素缩写+R表示,R代表resistance,如AmpR和PuroR等。
抗生素作用机制及用途见下表
5. 多克隆位点(multiple cloning sites,MCS)
6.转录终止信号(polyA signal)
转录到AAUAAA(AATAAA)之后,mRNA会接上polyA并转录终止。常见的转录终止信号位SV40 polyA,简写为SV40 pA
可以用激光激发产生荧光的蛋白,一般会独立表达或和目的基因融合表达的方式被设计在质粒上,起到示踪、阳性检测、成像的作用。如RFP、mCherry、GFP和EGFP等。
8.蛋白标签
蛋白标签大多为较短的短肽,一般融合表达在目的基因的3’端或5'端,如flag、HA、myc和his等。有了标签,在缺乏针对目的蛋白的抗体时就可以很方便的对目的蛋白做检测了
9.其他调控元件
WPRE:来自土拨鼠肝炎病毒的转录后调节元件,放置在目的基因的上游,能加强目的基因的表达。
cPPT:来自HIV-1整合酶基因,增加慢病毒在宿主基因组的拷贝数,提高病毒滴度。
三、如何阅读质粒图谱
以pLKO.1-Puro质粒(常用于构建shRNA载体)为例,对质粒图谱进行解读
1.首先看箭头方向
质粒图谱上都会存在箭头,箭头方向可以代表转录方向如图中U6、hPGK、AmpR等启动子(白色箭头)的方向,也可以代表复制方向,即 ori(黄色箭头)的箭头方向。设计引物及插入目的基因的方向是根据转录方向(启动子方向)来定的。由于质粒是环状双链DNA,箭头可有顺时针和逆时针方向,代表两条DNA链,它的启动子在其中一条链上,而它的某些基因在另一条链上。
2.看ori鉴别质粒类型
质粒复制起点是质粒DNA分子上启动复制的特定区域,负责精准调控复制的起始,对于质粒的稳定复制至关重要,决定了质粒的宿主和拷贝数。它包含能被复制酶识别的特定序列,确保质粒在宿主细胞内的稳定高效复制,实现目的基因的高效表达。原核生物DNA分子中,仅存在一个复制起始位点,而真核生物DNA分子则具备多个复制起始位点。若质粒图谱中仅展示一个ori,则表示该质粒为原核克隆及表达质粒,适用于原核生物的复制过程。而若图谱上呈现两个ori,则表明该质粒具备穿梭质粒的特性,既能在原核生物中复制,也能在真核生物中复制。
前文提到,若质粒图谱上只有一个ori,表示质粒是原核克隆及表达质粒;而图谱上有3个ori,则表示该质粒是穿梭质粒。因此该质粒为穿梭质粒。
3.看启动子确定质粒的作用
该质粒图谱中有7个启动子(白色箭头),U6启动子可用于构建shRNA和sgRNA载体;hPGK和AmpR启动子启动Puro和Amp抗性基因的表达,可用于筛选阳性克隆。T3和T7启动子分别是噬菌体T3和T7 RNA聚合酶的启动子,lac启动子是大肠杆菌乳糖操纵子的启动子,RSV启动子是rous肉瘤病毒增强子/启动子。
4.看筛选标记/抗性基因
多为抗生素抗性基因,用于检测和筛选含有质粒的细胞,主要分为原核筛选标记和真核筛选标记。在原核细胞的筛选过程中,常用的标记物质包括氨苄青霉素(Amp)、氯霉素(Cam)、卡那霉素(Kan)以及四环素(Tet)等;而对于真核细胞的筛选,则常采用嘌呤霉素(Puro)、新霉素(neo/G418)、潮霉素(Hyg)等作为标记。
图中有AmpR(氨苄西林抗性基因)和PuroR(嘌呤霉素抗性基因),AmpR用于原核细胞如大肠杆菌筛选,PuroR用于真核细胞如肿瘤细胞的筛选。当大肠杆菌和肿瘤细胞中不存在该质粒时就无法表达抗性基因,因此应用氨苄西林或嘌呤霉素可以筛选出阳性克隆。各抗生素作用机制与用途见前文。
5.看多克隆位点
是DNA载体上的人工合成序列,是外源基因的插入位点。MCS包含多个限制性酶切位点,每个限制性内切酶位点在整个载体质粒中是唯一的。一般可通过酶切后连接的方式将外源DNA插入质粒,多克隆位点一般位于转录启动和转录终止信号之间。
该质粒图谱中圆圈外围的黑体字母代表酶切位点,可用于插入外源基因。pLKO.1-Puro质粒常用于构建shRNA载体,插入的shRNA靶序列位于U6启动子下游且紧邻U6启动子。针对该质粒,我们常选用AgeI和EcoRI这两个酶切位点引入外源shRNA靶序列。
6.看转录终止信号
质粒图谱中pA或者poly A代表转录终止信号。
7.荧光标记
有的质粒带有荧光标记,用于直观判断质粒是否转染成功。如下图所示,与pLKO.1-Puro相比,pLKO.1-EGFP-Puro主要不同在于多了CMV启动子/增强子和EGFP序列(箭头表示),CMV启动子启动EGFP(增强的绿色荧光蛋白)的表达。其余部分与pLKO.1-Puro相差不大。