专题文献速递 | 引物编辑(Prime Editing)新进展

文摘   2024-09-28 17:00   浙江  

背景


经过近年不断地开发和优化,研究人员扩充基因编辑工具箱。常见的基因编辑工具CRISPR-Cas核酸酶(如Cas9)通过产生DNA双链断裂(DSB)来破坏基因,这可能导致不受控制的副产物,更严重时会导致细胞死亡。通过提供供体DNA序列,可以通过末端连接或同源定向修复(HDR)过程在单个切割位点或成对切割位点之间靶向插入目标DNA序列。尽管用途广泛,但由于部分细胞HDR效率低下,DNA供体敲入时伴随着插入/缺失副产物。此外,在靶或脱靶位点的DSB可导致大片段缺失、染色体异常等。


Figure 1 PE 的机制


由刘如谦教授团队提出的引物编辑(Prime Editor,PE)系统可以在不产生DSB的情况下精确安装碱基替换、小片段的插入和删除。其由两部分组成:DNA切口酶(nickase)与工程逆转录酶(RT)的融合蛋白;PE引导RNA——pegRNA。pegRNA包含一个指定目标位点的间隔体(spacer),一个单引导RNA(sgRNA)支架和一个编码所需编辑的3'端片段。该3'端扩展包含一个引物结合位点(PBS),互补的一部分DNA原间隔和一个RT模板,编码所需的编辑和下游基因组序列。PE系统与靶位点结合后,将含有PAM序列的DNA链切出,切出的DNA链碱基对与pegRNA中的PBS结合,从而将反转录的编辑序列直接引到靶DNA位点。新合成的编辑DNA的3'端随后通过细胞DNA修复途径替换,最终在目标位置进行所需的编辑(图1)。

通过将PE系统组分进行密码子优化,酶的点突变,引入nickingRNA等优化手段,刘如谦课题组开发了PE2,PEmax,PE5等升级系统。与位点特异性重组酶(SSR)联用,还实现了哺乳动物细胞中的大片段DNA的删除、反转和精确整合,丰富了基因编辑工具并为基因疾病的治疗提供了新的思路。本期文献速递将介绍最新几项关于PE编辑系统的优化和应用的工作。



01

PE-PACE:哺乳动物细胞大片段基因整合




传统的哺乳动物基因组靶向整合基因的方法存在可编程性低、效率低或特异性低等问题。为了进一步提高整合的效率,来自麻省理工学院-哈佛大学Broad研究所的刘如谦团队结合了原有引物编辑(PE)系统的可编程性和重组酶精确整合超过10kb大DNA片段的能力,提出了名为PASSIGE的基因编辑技术(图2a),该工作于2024年6月10日发表(Nat Biomed Eng. 2024:1-18)。研究人员通过噬菌体辅助连续进化(PACE)技术对Bxb1重组酶进行优化,从而显著提高PASSIGE的效率。

噬菌体辅助连续进化(PACE)技术(图2b),是一种蛋白质定向进化方法。这种技术将生物分子的实验室进化和噬菌体的生命周期结合在一起,让蛋白质在每24小时内进化60轮。选择噬菌体(SP)编码正在进化的蛋白质,宿主大肠杆菌细胞编码诱变质粒(MP),质粒将进化蛋白的活性与噬菌体必需基因gIII的表达联系起来。只有编码活性变体的噬菌体才会触发gIII表达和传播。通过模拟物竞天择的自然进化过程,经过数百小时的繁殖,对噬菌体进行达尔文进化选择,由此快速产生具有全新结构的重组酶变体。


Figure 2 PASSIGE和PACE技术原理


作者进化和工程改造了Bxb1重组酶变体(evoBxb1和eeBxb1),便显出显著的活性提升,将 PASSIGE与evoBxb1或eeBxb1一起使用称为evoPASSIGE或eePASSIGE。在预装重组酶着陆位点(attB/P)的人细胞系中介导了高达 60% 的供体整合(为野生型Bxb1的3.2倍)。

作者在优化了PASSIGE系统后,证明了evoPASSIGE和eePASSIGE的优越性:在安全港和治疗相关位点的单次转染实验中,带有eeBxb1的PASSIGE可以实现20-46%的数kb基因大小的cargo整合,平均靶向基因整合效率为23%(为野生型Bxb1的4.2倍),evoBxb1的基因整合效率也提高了2.7倍(图3)。也验证了evoPASSIGE和eePASSIGE系统可以在多种细胞系(HEK293T、N2a、Huh7、原代人成纤维细胞和人iPS细胞)中有效编辑,并且,值得一提的是,在原代人成纤维细胞的多个位点,整合效率超过30%(图4d),是迄今为止在哺乳动物细胞中报道的最高的RNA引导的基因组整合效率之一,超过了已知的挽救各种功能丧失遗传病的基因编辑效率。evoPASSIGE和eePASSIGE的性能分别平均分别比 PASTE(另一种使用引物编辑器与重组酶融合的基因编辑方法)高出9.1倍和16倍,证明了该技术在治疗相关基因整合方面的潜力。


Figure 3 所有位点中evoPASSIGE和eePASSIGE的整合效率相对于PASSIGE的倍数变化


Figure 4 在不同细胞系中评估 PASSIGE 变体的治疗潜力


总而言之,这篇文章展示了通过PACE技术进化Bxb1重组酶,显著提高了PASSIGE基因整合效率,为基因治疗和合成生物学提供了新的工具。


原文链接:https://doi.org/10.1038/s41551-024-01227-1




02

PE7:使用La增强PE编辑



目前,许多研究试图构建增强的PE编辑系统,主要集中在提高编辑效率上。为了安装编辑,PE蛋白结合pegRNA,并在该pegRNA的间隔序列的指导下,找到互补的DNA靶标。一旦与靶标结合,编辑复合物就会刻开一条移位的DNA链并释放出3’DNA末端。然后,该末端可以与pegRNA的3'延伸和pegRNA编码编辑的引物逆转录杂交,最终掺入基因组或被DNA错配修复(MMR)去除。已经报道了影响PE编辑效率的几个特征,包括编辑组分的表达、稳定性、定位和活性,以及靶向基因座的染色质背景。当MMR被抑制或规避时,可以更高效地安装小的PE编辑。



为了确定PE编辑的其他决定因素,普林斯顿大学Adamson教授团队于2024年4月3日在Nature上发表了题为:Improving prime editing with an endogenous small RNA-binding protein.(Nature, 2024;628(8008):639-647)的研究论文。本研究进行了基因组规模的CRISPR干扰(CRISPRi)筛选,从中确定了一个关键介质:小RNA结合蛋白La。

La(内源性RNA结合蛋白)是一种广泛表达的真核蛋白,参与RNA代谢的多个方面,其最显著的特征之一是结合新生RNA聚合酶III(Pol III)转录本3’端的多聚尿苷(polyU),并保护它们免受外切核酸酶的破坏。进一步研究显示,La促进跨方法(PE2、PE3、PE4和PE5)、编辑类型(替换、插入和缺失)、内源性基因座和细胞类型的PE编辑(图5),但对依赖于标准、未延伸gRNA的基因组编辑方法没有一致的影响。


Figure 5 La促进不同编辑类型,不同细胞类型和内源性基因座的基因编辑效率


以前的研究表明,La在RNA聚合酶III转录本的3’末端结合聚尿苷,研究人员发现La在功能上与多尿苷化引物编辑向导RNA(pegRNA)的3’末端相互作用。在这些结果的指导下开发了一种与La的RNA结合N末端结构域融合的引物编辑器蛋白(PE7)。该编辑器使用了优化La结合的合成pegRNA,提高了PE编辑效率(图6)。

接下来,作者评估了PE7在多个疾病治疗相关靶点上的编辑效果,包括镰状细胞病(HBB)、朊病毒病(PRNP)、家族性高胆固醇血症(PCSK9)、过继T细胞转移疗法(IL2RB)、艾滋病(CXCR4)和CDKL5缺乏症(CDKL5)相关靶点。值得一提的是,在U2OS细胞系中,与PEmax相比,PE7的编辑效率提升了10倍以上(图7)。


Figure 6 La在功能上与多尿苷化pegRNA的 3' 末端相互作用,融合La蛋白开发PE7系统


Figure 7 PE7可增强U2OS细胞中疾病相关靶点(上)和原代人类细胞(下)的PE编辑


总之,通过鉴定和表征La作为PE编辑的关键细胞决定因素,本研究扩大了对PE编辑成分如何与细胞环境相互作用提供了关键见解,并提出了稳定其中外源性小RNA的一般策略,展示了提高PE编辑效率的方法,并为未来的优化提出了有用的途径。


原文链接:https://doi.org/10.1038/s41586-024-07259-6




03

应用1:CFTR F508del的高效功能校正



囊性纤维化(Cystic Fibrosis,CF)是一种由CFTR基因突变导致的常染色体隐性遗传疾病,目前已鉴定出超过数千种CFTR基因突变,其中超过700种突变会导致囊性纤维化病变,其中85%的患者存在同一种突变——CFTR F508del,即CFTR基因中三核苷酸CTT缺失,导致CFTR蛋白中第508位的苯丙氨酸缺失。



小分子疗法在临床上被证明有效,但弊端是患者需要终生治疗。基于此,基因编辑代替疗法有希望从源头精确修正CFTR F508del突变,从而为患者提供一种根本的治疗方法。与上述简介一致,因为引物编辑无需依赖DNA模板就能在基因组中实现各种各样较短的替换、插入和删除,且一定程度上能够抵抗脱靶编辑。与Cas9等核酸酶介导的基因编辑相比,PE编辑不会产生DNA双链断裂,因此能够最小化不受控的插入和缺失突变、大片段缺失、p53激活等不良结果。2024年7月10日,刘如谦教授团队利用PE编辑治疗囊性纤维化基因突变的相关工作发表在Nature子刊上:Systematic optimization of prime editing for the efficient functional correction of CFTR F508del in human airway epithelial cells(Nat Biomed Eng, 2024)。

研究人员使用PE2和PE3系统来修正CFTR F508del突变,但编辑效率不足0.5%。通过PE编辑技术的最新优化策略(工程化pegRNA、PEmax结构,瞬时表达显性错配修复蛋白(MLH1dn),策略性沉默编辑,使用PACE进化的逆转录酶变体(PE6)、近端失活gRNA等)(图8,9),在永生化的人支气管上皮细胞模型中实现了高达58%的CFTR F508del修正效率(提高 140 倍),在囊性纤维化患者来源的原代气道上皮细胞中达到了25%的修正效率,实现了恢复CFTR依赖性阴离子通道活性。


Figure 8 部分PE系统优化示意图,具有改进F508del校正的增强功能。增强功能包括(5) epegRNA 3’ 结构RNA基序,(6)MLH1dn的共表达,(7)逃避细胞错配修复的翻译沉默编辑,(8)工程化和进化的PE编辑器蛋白(PEmax和PE6)。


Figure 9 使用epegRNA、沉默编辑、PE6c和dsgRNA进行F508del校正的组合改进


这些优化还带来了最小的脱靶编辑,成功编辑与插入/缺失突变(indel)的比率比Cas9核酸酶介导的同源定向修复(HDR)的比率高出3.5倍,并且在囊性纤维化患者的原代气道细胞中使CFTR离子通道的功能恢复到正常水平的50%(图10)(与使用elexacaftor、tezacaftor和ivacaftor等小分子药物联合治疗所达到的水平相当)。因此,研究结果支持对CF进行持久的、一次性治疗的可行性。


Figure 10 PE纠正CF患者原代气道上皮细胞中的CFTR F508del并挽救离子通道功能


原文链接:https://doi.org/10.1038/s41551-024-01233-3




04

 应用2:基于PE编辑的水稻品种育种



如上文提及,刘如谦教授团队通过噬菌体辅助连续进化(PACE),得到不同的逆转录酶变体,开发了新型PE编辑器(PE6a–d)。这些逆转录酶(RT)变体分别来自大肠杆菌Ec48重组子、酵母Tf1逆转录转座子和M-MLV。



2024年7月9日,中国农业大学陈其军团队研究了四种新型PE编辑器(PE6a–d)在转基因水稻中的编辑效率,发现其中PE6c表现出最高的编辑效率。相关工作发表于Journal of Integrative Plant BiologyJ Integr Plant Biol, 2024:jipb.13738)。


Figure 11 用于编辑水稻植物的PE系统组成


在这项研究中,研究人员在转基因水稻(Oryza sativa)植物中测试了四种 PE6变体和两种带有双RT模块的附加PE6构建体的编辑效率(图11)。PE6c具有来自酵母Tf1逆转录转座酶变体,产生了最高的PE编辑效率。与PEmax相比,PE6c编辑效率在15个基因的18个农艺重要靶位点的编辑效率平均倍数变化超过3.5。这些靶点涉及水稻的理想株型、氮利用效率、除草剂抗性、生物和非生物胁迫抗性等多个农艺性状。此外,该研究还证明了使用两个RT模块提高引物编辑效率的可行性:PE6db和PE6bd在上述靶点也表现出显著的编辑效率提升,分别提高了3.1倍和2.1倍(图12)。表明PE系统可以进行多模块化设计,是一种有效的优化策略,并且在水稻物种层面上得到了验证。

作者的结果表明,PE6c或其衍生物将是单子叶植物PE编辑的绝佳选择。通过引入双RT模块,大幅提高了水稻基因组编辑的效率。这一研究不仅在技术上具有创新性和突破性,还为基于PE编辑的水稻品种育种奠定了基础和实践支持,在农业农艺上具有广泛的应用前景。


Figure 12 PE6变体相对于PE3,在15个基因的18个农艺重要靶标上的PE编辑效率的倍数变化


原文链接:https://doi.org/10.1111/jipb.13738




05

 机器学习工具PRIDICT2.0/ePRIDICT



PE编辑的效率在不同的目标位点之间可能会有很大差异,并且受到PE编辑向导RNA(pegRNA)设计的强烈影响。因此,实现高的PE速率通常需要通过筛选多个pegRNA设计来优化pegRNA的特定部分,包括RNA二级结构,序列组成等,费时费力。



2024年6月21日,来自瑞士苏黎世大学的Krauthammer和Schwank教授团队在子刊Nature Biotechnology上发表了最新的研究成果:Machine learning prediction of prime editing efficiency across diverse chromatin contexts。该研究开发了能够可靠地预测PE编辑效率的机器学习模型PRIDICT2.0/ePRIDICT

研究人员之前已经开发了在广泛的PE编辑数据集上训练的机器学习模型来预测pegRNA的效率。这些模型的一个共同局限性是它们限制在预测某些编辑类型,比如:DeepPrime4仅限于1到3bp的编辑;MinsePIE3仅限于某些插入;PRIDICT1主要关注1bp的替换以及短的插入和缺失等等。此外,这些模型都没有解释局部染色质状态对编辑速率的潜在影响。在本篇研究中,研究人员通过开发两个互补的计算模型来解决这些缺点(图13上)。PRIDICT2.0(图13左下)是一个基于两个模型预测平均值的集成模型:Model A基于文库1训练并基于Library-Diverse进行微调,Model B基于文库1和Library-ClinVar4训练,然后在Library-Diverse上进行微调。随后,研究人员在不同环境中(不同细胞系,不同基因编辑类型:1bp替换,多碱基替换,片段插入,删除)验证PRIDICT2.0的预测准确性并与现有模型进行比较(图13右下)。随后,研究人员又训练了一系列线性和基于树的机器学习模型,以预测染色质特性对引物编辑效率的影响。显示预测编辑率和实验观察到的编辑率之间相关性最高的模型基于XGBoost框架,并被命名为ePRIDICT,用于“基于表观遗传学的PE编辑效率预测”。

作者通过验证得到,PRIDICT2.0可以评估pegRNA在错配修复缺陷型、错配修复细胞系以及原代细胞体内长度不超过15bp的所有编辑类型的性能,能够更可靠地预测PE编辑效率。并且,借助ePRIDICT进一步开发了新模型,该模型能够量化局部染色质环境如何影响PE编辑率。


Figure 13 具有靶标匹配的pegRNA文库Library-Diverse的筛选示意图(上),PRIDICT2.0预测模型以及预测效果(下)


原文链接:https://doi.org/10.1038/s41587-024-02268-2







总结




与CRISPR-Cas9、碱基编辑(BE)等基因编辑工具相比,引物编辑(PE)具有精确高和高度通用的优点。已被用于基因编辑、遗传建模、组学以及遗传疾病治疗等多个领域。尽管引物编辑技术如今已经成为比较成熟的基因编辑方法,但仍然在经历快速的迭代和更新,对PE编辑系统优化(如上述PACE进化RT的PE6系统,PACE进化Bxb1的整合系统,结合La蛋白的PE7系统等)以提高其编辑效率。在不同细胞和物种中都可以实现有效的编辑,如上文所述,在植物育种,基因疾病治疗等实际应用方面也有可观的进展。另一方面,联合机器学习(ML)等模型,利用数据预测计算PE编辑效率,大大加速了pegRNA等组分的优化速度,节省了人力、时间等成本。

然而,关于PE编辑的工作原理以及与细胞环境的相互作用如何影响编辑结果,仍有很多未知之处。PE编辑方法在带来希望的同时,也吸引着研究人员进行更深一步的研究。



本课题组常年全球招募具有化学材料、基因治疗、生物医学和生物信息等相关背景的副研究员、助理研究员、博士后和科研助理。

有意者请将简历发送至宋杰老师邮箱:jiegroup@126.com,或点击此处查看详情


往期回顾

Nature Communication | 模板跳跃PE使体内大片段插入和外显子重写成为可能


Nature Biotechnology|PE编辑器新策略实现较大片段的基因编辑


bioRxiv preprint | 工程核酸酶编辑器TESOGENASE,增强靶向基因组整合


Nature biotechnology | 用双AAV在小鼠脑、肝和心脏中的有效引物编辑


ACS | 用于哺乳动物诱导基因调控的工程化PROTAC-CID系统



者:zbn
审核:sj 
排版:xjc


宋杰课题组
学术交流,文献阅读,促进科研合作。
 最新文章