PNAS | Zfp106 与RNA G-四链体 结合并抑制由 G4C2 重复序列引起的 RAN 翻译和 RNA foci

学术   2024-10-19 18:02   湖南  

大家好,本次分享的文献是2024年7月发表在Proc Natl Acad Sci U S A.上的“Zfp106 binds to G-quadruplex RNAs and inhibits RAN translation and formation of RNA foci caused by G4C2 repeats”。通讯作者是加州大学旧金山分校医学院Brian L. Black教授,本工作发现了Zfp106会抑制GGGGCC重复序列引起的RNA foci和DPRs的形成,并提示Zfp106的RNA G-四链体结合功能有助于其抑制GGGGCC重复序列介导的细胞毒性。

背景

锌指蛋白 106 (Zfp106) 是一种Cys2-His2 (C2H2) 锌指蛋白,具有 4 个预测的锌指和 7 个 WD40 结构域。Zfp106主要定位于核仁和剪接体附近的核斑点,它是RNA 结合蛋白,参与RNA 代谢的多个方面,包括前 rRNA 加工、剪切和polyA mRNA 结合。小鼠中 Zfp106 基因的敲除会导致严重的神经肌肉疾病,类似于肌萎缩侧索硬化症 (ALS)。Zfp106在运动神经元特异性表达的恢复显著抑制了基因敲除小鼠的表型,这表明 Zfp106 对神经肌肉功能和运动神经元活力的需求是独立于运动神经元的。

家族性 ALS 和额颞叶痴呆 (FTD) 是一种相关的脑神经退行性疾病,最常见的原因是 C9orf72 基因的第一个内含子中六核苷酸序列 GGGGCC 异常扩增。健康个体的六核苷酸重复序列通常少于 30 个拷贝,而受影响的患者的 C9orf72 基因中可能有数百到数千个重复序列。目前已提出GGGGCC 重复序列的扩增通过两种不同的功能获得机制引起神经变性。一种是通过形成致病性重复 RNA foci和 RNA 结合蛋白的隔离来产生 RNA 毒性,另一种是通过异常重复序列相关非 ATG (RAN) 翻译产生的二肽重复序列蛋白 (DPR)。C9orf72 基因负责编码与自噬和免疫应答有关的鸟嘌呤核苷酸交换因子,其功能的丧失会加剧功能性毒性。功能获得性机制、RNA 毒性和 DPR 的产生都可能独立地导致应激颗粒形成和核质转运等通路的破坏。有趣的是,以前的工作已经确定 Zfp106 直接特异性结合 GGGGCC RNA 重复序列,并且 Zfp106 的共表达抑制了 C9orf72 ALS 果蝇模型中 30 个GGGGCC拷贝诱导的病理学和神经毒性。

GGGGCC 正义链 RNA 重复序列能够形成 G-四链体或 RNA 发夹结构,而反义GGCCCC 重复序列形成 I-基序和质子化发夹。茎环或发夹是最常见的 RNA 二级结构,在转录、RNA 加工、mRNA 输出、mRNA 稳定性和翻译中起重要作用。RNA 中的这些二级结构在 RNA 生物学中发挥着多种多样的作用,包括在剪切、多聚腺苷酸化、转录终止、翻译增强或抑制以及 mRNA 运输中的作用。在 C9orf72 ALS/FTD 的背景下,GGGGCC 重复序列诱导的 RNA foci通过相分离形成,并被认为依赖于 G-四链体结构。有趣的是,与 GGGGCC 重复序列形成的发夹或 G-四链体结构结合的小分子会减少 DPR 翻译和foci的形成,这表明靶向 GGGGCC 重复序列形成的二级结构可能具有治疗相关性。

在这里,作者表明 Zfp106 会与形成 G-四链体的RNA 序列结合。此外,作者发现 Zfp106 结合改变了GGGGCC 重复序列的 G-四链体结构,并且 Zfp106 能够特异性抑制 GGGGCC 介导的 RNA foci的形成。作者还验证了Zfp106 抑制 GGGGCC 诱导的哺乳动物细胞中的 RAN 翻译,并降低 C9orf72 患者来源细胞中 DPR 的水平。这些结果支持 Zfp106 在抑制与 C9orf72 ALS/FTD 相关的两种功能获得机制中的作用,并表明 Zfp106 识别和与 G-四链体的结合可能在神经退行性变的病理生物学中发挥作用,例如C9orf72 ALS/FTD疾病。

结果与讨论

1. Zfp106 抑制 GGGGCC 诱导的 RAN 翻译

为了深入了解 Zfp106 如何抑制由GGGGCC 重复序列表达诱导的细胞病变,作者将 Zfp106 表达质粒与 pCMV-(GGGGCC)30-EGFP共转染表达质粒或仅具有 30 个 GGGGCC 重复序列的对照 pCMV 质粒拷贝到 Neuro-2A 细胞中,并在有无Zfp106 表达的情况下测量 eGFP RNA 和蛋白质表达(图 1A)。Zfp106 显著抑制含有 30 个拷贝 GGGGCC 重复序列的eGFP mRNA 的蛋白表达,而不影响 mRNA 的稳态水平(图 1 A' 和 A”)。Zfp106 不影响 eGFP cDNA 的 5′-UTR 中含有 6× 或 60×亨廷顿病相关 CAG 重复序列的质粒的 eGFP 蛋白表达(图 1B)。这些数据表明,Zfp106 特异性抑制了包含 30×GGGGCC 重复序列的 eGFP mRNA 的翻译。有趣的是,Zfp106 的表达增加了包含 30×GGGGCC 重复序列的 eGFP mRNA 的核保留,表明 Zfp106 与 30×GGGGCC 重复序列包含的 mRNA 共表达介导的翻译抑制(图 1A′)可能是由于含有重复序列的 RNA 的核质转运改变。

图1. Zfp106抑制 RAN 翻译

pCMV-(GGGGCC)30-EGFP报告基因体系与 C9orf72 ALS/FTD背景的表达体系之间的重要区别在于,pCMV-(GGGGCC)30-EGFP表达的重复序列存在于 5′-UTR 中且GFP 蛋白表达通过标准 AUG 依赖性翻译发生,而在人类疾病环境中重复序列的翻译通过 RAN 翻译发生。因此,为了确定 Zfp106 共表达是否也抑制 RAN 翻译,作者将 Zfp106 表达质粒与二顺反子报告质粒共转染,该质粒通过来自人 C9orf72 基因的内含子序列的 70×GGGGCC 重复序列诱导的 RAN 翻译产生 NanoLuc 荧光素酶 (NLuc),报告基因构建体以经典 AUG 依赖性起始产生的萤火虫荧光素酶 (FLuc)作为内部对照(图 1C )。Zfp106 的共表达显著且特异性地降低了来自报告基因构建体的 NLuc 的 RAN 翻译,而不会影响来自同一质粒的 FLuc 的 AUG 依赖性翻译(图 1C′),且以 Zfp106 剂量依赖性方式发生抑制作用。重要的是,稳态 NLuc mRNA 水平不受 Zfp106的影响(图 1C”)。然而,NLuc mRNA 的核保留有所增加,进一步说明Zfp106 表达导致含 GGGGCC 的 RNA 保留在细胞核中。

为了确定 Zfp106 是否在疾病相关背景下抑制 RAN 翻译,作者利用单独表达 GFP-Zfp106 或单独表达 GFP 的慢病毒载体,转染了源自 C9orf72 患者的诱导多能干细胞 (iPSC)。转染后 1 周,对 GFP 阳性细胞进行分选,并使用先前通过阳性和阴性选择验证的抗体,通过免疫测定法对poly-GA(正义 GGGGCC 重复序列的 RAN 翻译产生的 DPR 之一)进行定量(图 1D)。重要的是,GFP-Zfp106 的过表达显著降低了 C9orf72 患者 iPSC 中的 poly-GA(图 1D′)。通过 GGGGCC 重复序列诱导的 RAN 翻译产生的 DPR 是动物模型中 C9orf72 病理学的主要原因,并且与人类疾病密切相关,这些结果表明 Zfp106 对 RAN 翻译的抑制可能有助于理解先前报道的 Zfp106 在体内的神经保护作用。

2. Zfp106 抑制 GGGGCC 重复序列诱导的 RNA foci的形成

含有 GGGGCC 重复序列的 RNA 也会在受影响的运动神经元中形成foci,这些foci与病理学和疾病密切相关。此外,RNA foci和 DPR 的存在并不排斥,两种病理相关现象经常同时发生。因此,作者研究了 Zfp106对含 GGGGCC 重复序列的 RNA foci的影响(图 2)。Jain 和 Vale 提出了一个系统, 29×GGGGCC 重复序列标记有 12×MS2 发夹环可以通过共表达 YFP 标记的 MS2 外壳结合蛋白来可视化(图 2A)。与之前发表的结果一致,在该系统中诱导29×GGGGCC RNA 重复序列导致形成许多核foci(图 2B)。值得注意的是,与核 RFP 对照转染细胞相比,Zfp106 共表达显著减少了foci(图 2 C、D 和 F)。相比之下,Zfp106 对 47×CAG 重复序列诱导的 RNA foci的形成没有影响(图 2 E 和 G)。作者还通过使用针对 MS2 发夹环的 RNA FISH 探针检查了每个细胞核的foci数量,发现Zfp106基本上消除了foci的形成。

图2. Zfp106抑制含 GGGGCC 的 RNA foci的形成

综上所述,图 1 和图 2 中的结果表明,Zfp106 能够抑制 RAN 翻译和由GGGGCC 重复序列引起的 RNA foci。这些观察结果对于理解 Zfp106 在 ALS 功能获得和丧失模型中的神经保护和神经退行性变中的作用具有重要意义。

3. Zfp106 与形成 G-四链体的 RNA 序列结合

观察到 Zfp106 抑制了 GGGGCC 重复序列引起的 RAN 翻译和 RNA foci的形成,结合作者之前已发表Zfp106 直接且特异性地结合 GGGGCC 重复序列,表明 Zfp106 的 RNA 结合可能参与其对重复序列诱导病理的抑制作用。作者之前的研究还表明,Zfp106 会直接与多种其他 RNA 结合蛋白相互作用,进一步表明Zfp106在细胞 RNA 加工中发挥重要作用,并且其 RNA 结合活性可能仅局限于 GGGGCC 重复序列。由于 GGGGCC 重复序列能够形成 G-四链体结构,并且由于 RNA G-四链体与 RNA foci的相分离和形成有关,因此作者推断 Zfp106 可能更普遍地与形成 G-四链体的 RNA 序列结合,并且这种能力可能赋予其对 GGGGCC 重复序列毒性的抑制作用。

作者使用电泳迁移率变化测定 (EMSA) 来测试全长 Zfp106 (图 3A) 与许多 RNA 重复序列的结合能力,包括预测形成 G -四链体的序列和发夹或其他非 G -四链体二级结构的序列(图 3B)。Zfp106 与形成 G-四链体的所有序列结合,而它未能与所有非 G-四链体形成序列显著结合(图 3B)。在促进 G-四链体形成的条件下,Zfp106 与 GGGGCC 重复序列有效结合(图 3B),而Zfp106 与反义 GGCCCC 重复序列(非 G-四链体形成)、CUG 重复序列、GGGGCC 重复序列与阻碍 G-四链体形成 (MUT) 的G>A 取代或 AAAACC 重复序列没有结合(图 3B)。同样,Zfp106 与 GC 茎环 (GC-SL) 序列(图 3B’’)或 CAG 重复序列(图 3C)几乎没有结合,这与 Zfp106 不抑制含有 CAG 重复序列的转录本的翻译或foci形成的观察结果一致(图 1B 和 2 E 和 G)。

图3. Zfp106结合RNA G-四链体

这些研究中使用的 Zfp106为全长 ~150 kD,包含 1,099 个氨基酸,主要由一个 N 端锌指、预测的低复杂性结构域、七个 WD-40 结构域和两个 C 端锌指组成(图 3A)。为了更深入地了解 Zfp106 与 RNA 的结合,作者接下来试图确定 Zfp106 中负责与 GGGGCC 重复序列结合的决定因素。作者发现 Zfp106 的 C 端 43kD 片段,包含氨基酸残基712-1099,包括 WD40 结构域和两个 C 端锌指,足以与(GGGGCC)4 进行稳定、特异性结合(图 3D),而Zfp106 的其他区域未显示出与 (GGGGCC)4 结合。

Zfp106除了结合 (GGGGCC)4和 (GGGGCC)3重复序列外,还能有效地结合其他平行的 G-四链体形成 RNA 序列,包括 TERRA 和NEAT1 中的序列(图 3 B′ 和 B“)。TERRA 重复序列的 G>U 取代突变阻碍了 G-四链体的形成,从而阻止了 Zfp106 的结合(图 3B′)。Zfp106 与 NEAT1 RNA 的结合特别有趣,因为 GGGGCC RNA 重复序列被认为可以取代 NEAT1 RNA 作为副斑样结构中的支架,并形成具有副斑特征的foci。此外,DPR 蛋白 poly-PR 结合并上调NEAT1导致副斑形成增加,这可能促进 poly-PR 的神经毒性作用。

为了验证Zfp106 是与 G-四链体特异性结合而不是因为 RNA初级序列,作者发现添加 KCl 后, Zfp106-(GGGGCC)4 EMSA 中Zfp106 结合增加,而添加 LiCl后, Zfp106-(GGGGCC)4 EMSA 中Zfp106 的结合降低(图 3 E 和 E′)。众所周知,G-四链体会受不同一价阳离子作用,其中钾具有稳定作用,而锂具有不稳定作用。同样,添加不同浓度的 TMPyP4(一种结合和扭曲 GGGGCC 重复序列 G-四链体结构的阳离子卟啉衍生物)会降低 Zfp106 与 (GGGGCC)4的结合(图 3E”)。

4. Zfp106 在 RNA 结合后改变 GGGGCC 重复序列的 G-四链体结构

疾病中约30 个 GGGGCC 重复序列的阈值与培养细胞表现出foci的重复长度相似,但高于体外 RNA 凝胶化所需的重复数。例如,低至 5 个 GGGGCC RNA 重复序列在体外形成球形凝胶状簇,但这个重复次数显然不足以在体内形成foci或相分离。体外与体内相变和凝胶化所需的重复数之间的差异可能是因为细胞内存在会改变G-四链体结构以阻止体内相分离产生的蛋白。因此,作者推断 RNA foci的破坏以及细胞和果蝇中 GGGGCC 重复引起的神经毒性的抑制可能是因为 Zfp106 结合和改变了 RNA G-四链体的二级结构。为了验证这一想法,作者通过圆二色谱 (CD) 分析了 Zfp106 (Zfp106[WD40+ZnF]) 的 C 端 43kD 片段与 GGGGCC重复序列的相互作用。CD 光谱证实 (GGGGCC)4RNA 分子形成平行 G-四链体结构,最小光谱为 236 nm,最大光谱为 264 nm(图 4A)。Zfp106[WD40+ZnF] 的 CD 光谱在 210 至 220 nm范围内显示负峰,但在 264 nm 处给出的信号极少或没有(图 4C),使作者能够监测在有无Zfp106 条件下(GGGGCC)4 的 G-四链体结构随温度的展开过程(图 4 A 和 B)。

图4. Zfp106 [WD40+ZnF] 改变 (GGGGCC)4 的 G-四链体结构

以RNA (GGGGCC)4等摩尔比浓度添加 Zfp106 的 C 端 43kD 片段 (Zfp106[WD40+ZnF]) 会导致 (GGGGCC)4 的G-四链体结构发生构象变化,表现在 264 nm 处峰的降低和变宽,以及 250 至 300 nm 范围内 CD 光谱形状的偏移和变化(图 4 A′ 和 B′)。250 至 300 nm 范围内的 CD光谱显示,随着温度的升高,单独 G4C2 重复的峰从 264 nm 偏移到 274 nm,这表明 G-四链体构象发生了变化(图 4A′)。有趣的是,当Zfp106 存在时,在较低温度下峰就发生了从 264 nm到 274 nm的偏移(图 4B′),这表明 Zfp106促进了 G-四链体构象变化。通过比较有无 C 末端的Zfp106在 274 nm 和 264 nm 处的 CD 吸收比,可以更清楚地表明这一观察结果(图 4D)。

Zfp106 会使 GGGGCC的 G-四链体发生构象变化的能力特别有趣,因为先前的研究表明 RNA foci的相变和形成取决于 G-四链体结构。事实上,如前所述,靶向 GGGGCC 重复序列 RNA G-四链体结构的小分子可以减少 RNA foci形成、DPR 水平和GGGGCC 诱导的毒性。有人提出 (GGGGCC)4可能以浓度和温度依赖性方式形成分子间和分子内 G-四链体。但是,当作者分析 (GGGGCC)4时,作者未能检测到(GGGGCC)4的分子间相互作用。因此,作者的数据表明 Zfp106 与 GGGGCC 重复序列的结合诱导分子内 G-四链体结构的变化,尽管不能排除在较高浓度的 GGGGCC 重复序列下分子间形式可能产生的影响,例如在体内可能发生。

鉴于观察到 Zfp106 的 C 端 WD40 + ZnF 区域足以进行 G-四链体结合和构象转变,作者测试了该片段对 GGGGCC 重复序列引起的 RAN 翻译和 RNA foci形成的影响。有趣的是,C 端 WD40+ZnF 和 N 端N+LCR 均未显著影响含有 GGGGCC 重复序列的 RNA的翻译。同样,C 端 WD40+ZnF 和 N 端 N+LCR 均未显著影响由29×GGGGCC 重复序列表达引起的 RNA foci。综上所述,这些观察结果表明,除了 C 端 DNA 结合区外,Zfp106蛋白的其他区域,包括 N 端区域、低复杂性结构域或两者兼而有之(图 4A),对于其在体内抑制 RNA 集落形成和 RAN 翻译的功能至关重要。

总体而言,作者的研究表明,Zfp106 C 末端 RNA 结合结构域是必要的,并且它对重复诱导的foci形成和 RAN 翻译的抑制作用以及细胞毒性的抑制作用可能是通过其 RNA 结合活性和特异性改变G-四链体结构产生的。

5. GGGGCC 重复序列可能对 Zfp106 或其他 G-四链体 RNA结合蛋白产生“海绵”样作用

先前的研究表明,GGGGCC RNA 重复序列会隔离参与多种细胞功能的G-四链体结合蛋白,这可能导致重复序列的细胞毒性作用。例如,G-四链体结合蛋白核仁素被 GGGGCC RNA 重复序列隔离,导致 C9orf72 ALS 患者出现核仁素错误定位和核仁应激。同样,GGGGCC RNA 重复序列对 G-四链体结合蛋白 hnRNPH/F 的隔离会导致 RNA 剪切缺陷和多聚腺苷酸化。GGGGCC 重复序列还被证明可通过隔离 RNA 结合蛋白 RanGAP1 来损害核质转运。因此,在 C9orf72 ALS/FTD 的背景下,GGGGCC 重复序列的部分毒性作用可能是由于 Zfp106 被隔离。事实上,小鼠 Zfp106 功能丧失会导致严重的 ALS 样神经肌肉疾病,也支持 Zfp106 隔离可能导致神经退行性疾病的观点。然而,Zfp106 功能丧失或隔离如何导致神经退行性变化尚不清楚, Zfp106 在 RNA 加工和代谢中的特定功能仍有待确定。Zfp106 结合RNA G-四链体并诱导 GGGGCC 重复序列的 G-四链体结构发生构象变化,表明Zfp106 可能在RNA G-四链体稳态和代谢中发挥作用。未来的研究将解决细胞内 Zfp106 结合RNA G-四链体的功能,以及“G4ome”失调是否是导致 C9orf72 ALS/FTD 或其他神经退行性疾病中神经退行性变化的机制。

结论

综上所述,作者发现含有锌指的 RNA 结合蛋白 Zfp106 能够抑制 RNA foci的形成,显著降低由 GGGGCC 重复序列引起的 RAN 翻译,并抑制 C9orf72 患者来源细胞中 DPR 的形成。Zfp106 会与RNA G-四链体结合,并导致 GGGGCC 重复序列形成的G-四链体发生构象变化。Zfp106 的 G-四链体 RNA 结合功能有助于其抑制 GGGGCC 重复序列介导的细胞毒性。


微信号:HanDa-Lab
课题组网站:https://www.hanlab.net/

撰稿:王杨

校对:彭瑞资

编辑:江言

∨ 点击“阅读原文”直达文献

韩达课题组
韩达课题组
 最新文章