【文献解读】斑马鱼胚胎的蛋白质谱分析揭示早期胚胎发育中的调控层次

文摘   科学   2024-09-24 17:00   江苏  


文献:da Silva Pescador G, Baia Amaral D, Varberg JM, Zhang Y, Hao Y, Florens L, Bazzini AA. Protein profiling of zebrafish embryos unmasks regulatory layers during early embryogenesis. Cell Rep. 2024 Sep 19;43(10):114769. doi: 10.1016/j.celrep.2024.114769. Epub ahead of print. PMID: 39302832.

杂志:Cell Reports

影响因子:7.5

母体到合子的转变在胚胎发育中至关重要,其特征是母体提供的mRNA降解和合子基因表达的启动。然而,这一转变过程中蛋白质水平的变化尚不清楚。在本研究中,我们利用定量质谱对斑马鱼胚胎发育全过程进行了蛋白质谱分析,并整合了转录组学和翻译组学的数据。我们的数据表明,与RNA的变化不同,蛋白质水平的变化较不动态。此外,蛋白质水平的增加与mRNA翻译相关,而蛋白质水平的下降则不相关,这表明存在活跃的蛋白质降解过程。有趣的是,来自纯合子基因的蛋白质在受精时就已存在,这挑战了现有基于mRNA的基因分类。作为概念验证,我们使用CRISPR-Cas13d靶向znf281b mRNA,该基因的蛋白质在受精后前两小时显著累积,证明其在发育中的重要作用。因此,我们的蛋白质谱分析与CRISPR-Cas13d结合,提供了一种互补的方法,以揭示胚胎发育中母体因子的功能。

介绍

母体到合子的转变(MZT)是早期胚胎发育中一个重要的过程,胚胎在这一过程中将遗传控制从母体提供的因子转变为激活其沉默的基因组。该转变已在多种物种中通过转录组学广泛研究,特定机制负责降解母体转录本,转录因子则激活沉默基因组。在斑马鱼中,TATA结合蛋白、microRNA-430、m6A和密码子最佳性等因素推动母体RNA的降解,而nanog、pou5f1、pou5f3、soxB1和核孔的成熟等因子则激活基因组,通常被称为合子基因组激活(ZGA)。在这一转变结束时,三个主要的胚胎胚层形成,胚胎将开始进行原肠胚阶段。

在MZT期间表达的基因已基于多种转录组学方法进行了广泛分类。一般来说,纯母体基因的mRNA自受精以来就存在,而没有在MZT期间进行新的转录;纯合子基因则在ZGA后独占表达。任何既有母体沉积又有合子转录的基因被称为母体-合子基因。最近,硫(SH)连接的烷基化代谢测序(SLAM-seq)能够以时间依赖的方式解开斑马鱼中觉醒基因组所转录的基因。因此,尽管mRNA水平的调控已被广泛研究,但MZT期间蛋白质水平的调控仍不明确。

在MZT期间调节蛋白表达的例子有很多。在秀丽隐杆线虫中,母体蛋白在MZT期间大量降解,而在果蝇和小鼠中,蛋白降解对于基因组激活至关重要。此外,秀丽隐杆线虫和果蝇的MZT中也描述了蛋白质磷酸化的变化。在斑马鱼中,受精激活了翻译,使合子能够快速翻译转录因子,而核孔的成熟促进了这些转录因子在细胞核内的定位,从而导致基因组的激活。研究早期斑马鱼发育中的蛋白质调控的一个主要障碍是胚胎中存在大量卵黄。事实上,其他研究者一直致力于开发新方法,排除卵黄对蛋白质纯化的影响,并应用多种质谱方法。尽管之前的研究很有价值,但它们要么未能识别大量蛋白,要么缺乏涵盖整个斑马鱼MZT的发育阶段。此外,消除卵黄可能会丢失卵黄中重要的母体沉积蛋白或与主要卵黄蛋白在生化上相似的蛋白。

在此,我们提出了一种创新的斑马鱼MZT定量蛋白质谱分析方法,避免在样品准备过程中消除卵黄。相反,我们在质谱数据获取过程中降低了卵黄蛋白的识别优先级。我们结合高通量测序和公开的核糖体谱分析,关联RNA水平和翻译效率的变化与蛋白水平的变化。我们的发现揭示,在MZT期间蛋白质比RNA更稳定,翻译可以解释蛋白质水平的增加,但无法解释蛋白质丰度的下降。此外,通过分析母体、母体-合子和合子基因的蛋白质水平,我们发现纯合子基因的蛋白质在受精时就已存在,可能源于卵母细胞或精子。这一结果挑战了基于mRNA表达的现有基因分类。最后,由于作为ZGA重要因子的nanog、soxB1和pou5f1在受精后翻译高度活跃,我们选择了znf281b作为靶点,因为其蛋白质水平在ZGA前显著增加,而CRISPR-Cas13d靶向znf281b mRNA则揭示了其在早期发育中的关键作用。因此,我们的创新性定量蛋白质谱分析不仅揭示了早期胚胎发育阶段中尚未被识别的调控层次,涉及纯合子mRNA的蛋白质沉积,还引入了一种创新策略来选择基因进行敲减,以明确母体供应的mRNA在胚胎发育中的作用。

结果

斑马鱼MZT期间的定量蛋白质谱分析

为了研究斑马鱼MZT期间的蛋白质波动,我们在单细胞阶段、受精后2小时(hpf,基因组激活前)以及4和6 hpf(基因组激活后)生成了定量蛋白质谱,通过质谱采用串联质量标签(TMT)进行精确定量(互动数据可在ShinyApp获取:https://simrcompbio.shinyapps.io/BazziniLab_Zebrafish_Protein_Profiling/)(图1A;表S1)。生物重复显示出显著的正相关性(r > 0.92, p < 0.001,Pearson相关性检验),主成分分析(PCA)显示重复样本按阶段和发育阶段进程聚类(图S1A–S1C)。共检测到2,227种独特蛋白质(图S1D),在所有时间点检测到2,150种蛋白质(图1B和S1E)。与已发表的数据集相比,识别出861种额外蛋白质,1,363种先前已识别的蛋白质在额外的发育阶段中测量了其定量(图S1F)。在识别蛋白质的大小上未观察到偏差(实验与预期的p = 0.1318,实验与卵黄的p < 0.001,Wilcoxon秩和检验)(图S1G)。为了增加蛋白质的检测,在质谱数据采集过程中降低了卵黄蛋白的识别优先级(详见STAR方法),仅定量了两种卵黄蛋白,这两种蛋白在样品中的水平适中(图S1H)。值得注意的是,我们的数据集中识别出许多已知参与斑马鱼早期信号传导和发育的母体蛋白,包括buc、β-catenin、cyclin-B、aurora kinase、vasa、成纤维生长因子(FGF)、与胰岛素生长因子(IGF)相关的蛋白、follistatin-like和eomesa(图1C),验证了关键发育调节因子在蛋白质水平上的成功检测。

图1 斑马鱼母本到合子转变过程中的定量蛋白质组学特征

尽管斑马鱼MZT期间的mRNA水平非常动态,但迄今为止,尚无其与蛋白质对应物的全基因组比较。为了比较MZT期间蛋白质和RNA水平的变化,从单细胞阶段到6 hpf的胚胎生成了总RNA测序(RNA-seq)(表S2)。生物重复显示出显著的正相关性(r > 0.88, p < 0.001,Pearson相关性检验),PCA的聚类结果与蛋白质数据的分析类似(图S2A–S2C)。首先,在这些阶段表达的所有基因中(每百万转录本超过2个[TPM]),13%的基因在蛋白质水平上得到了定量(图1D)。其次,在RNA和蛋白质水平上都被识别的基因中,超过50%的基因在前6 hpf的mRNA水平上发生了显著变化(调整后的p值[adj.p] < 0.05,倍数变化[FC] > 2),而仅有20%的基因在蛋白质水平上发生了显著变化(图1E;表S2)。此外,1-cell与6-hpf时间点之间的FC在蛋白质水平上也较小(最大FC为32),而在mRNA水平上则可达8,000,尽管两组数据的丰度值分布并无显著差异(p = 0.15,Wilcoxon秩和检验)(图1F)。此外,识别的蛋白质在这些发育阶段的RNA表达水平范围与整个斑马鱼转录组相似(图1G)。进一步地,只有少部分基因在RNA和蛋白质水平上发生显著变化(图1H,深红色点),而这些变化之间的部分并不一致(比较图1H的右上和左上象限)。总体而言,这里描述的定量蛋白质谱分析能够比较斑马鱼MZT期间基因调控的动态。尽管在这些发育阶段RNA变化十分动态,但其蛋白质对应物的变化则较少,提示并非所有的RNA变化都会转化为蛋白质变化。

蛋白质丰度的增加可通过翻译和更高的RNA表达来解释

为了进一步探讨蛋白质变化与mRNA水平及翻译的关系,我们分析了来自2、4和6 hpf斑马鱼胚胎的公开可用的核糖体谱数据集(表S3)。对上调和下调蛋白质的mRNA水平进行了比较(p < 0.05且FC > 2)(图2A)。上调的蛋白质在4和6 hpf时的RNA水平通常高于下调的蛋白质(p < 0.001,Wilcoxon秩和检验)(图2B)。为了最小化基于mRNA水平的潜在偏差,我们为翻译效率的比较创建了一组mRNAs,这些mRNAs与所研究组的RNA水平相匹配,并且在蛋白质水平上未发生变化。上调的蛋白质在2和4 hpf时的翻译效率高于其稳定蛋白质的对照组(p = 0.004和p = 0.05,Wilcoxon秩和检验),这表明mRNA翻译可以解释蛋白质积累的增加(图2C)。有趣的是,下调的蛋白质与其稳定蛋白质的对照组在翻译效率上相似(在2 hpf时p = 0.343,在4 hpf时p = 0.84,在6 hpf时p = 0.616,Wilcoxon秩和检验),这表明在斑马鱼MZT期间,蛋白质降解与翻译无关(图2C)。

图2 蛋白质丰度的增加可由翻译和更高的mRNA表达来解释

多个蛋白质降解通路的组成部分作为母体蛋白质被沉积,并且在MZT进程中显著增加(*adj.p < 0.05和log2FC > 1)(图S3A)。为了进一步确认合子正在利用蛋白质降解通路,我们在0至6 hpf的斑马鱼胚胎中进行了蛋白酶体活性测定(详见STAR方法)。值得注意的是,我们在所有测试的斑马鱼胚胎阶段观察到蛋白酶体活性(p < 0.001,任何阶段与抑制蛋白酶体样品比较时均显著;所有其他比较均不显著;单因素方差分析后进行Tukey的显著性差异检验)(图S3B)。总体结果表明,蛋白质丰度的增加与2和4 hpf时的更高RNA表达和翻译效率相关,而蛋白质表达的减少与这些发育阶段的翻译无关,这表明蛋白质水平的降低可能与特定的蛋白质降解通路有关。

在ZGA之前,识别出的纯合子基因在RNA水平上作为蛋白质大量沉积

母体到合子的转变(MZT)在转录水平上已经被广泛研究,主要关注母体贡献和合子转录的基因。为了比较这些基因组的RNA和蛋白质动态,首先我们分析了SLAM-seq数据集,将基因分类为纯母体基因、纯合子基因和母体-合子基因(图S4A;表S1和S2)。接下来,我们调查了识别的蛋白质来自哪个mRNA基因类(母体、母体-合子或纯合子)。如预期,通过质谱识别的大多数蛋白质源自被分类为母体-合子的mRNAs(80%)或纯母体的mRNAs(18%),而42个蛋白质来自纯合子mRNAs(图3A,内圈为RNA,外圈为蛋白质)。在比较蛋白质表达水平时,纯母体和母体-合子基因在MZT期间整体保持恒定的蛋白质水平(图3B,红色和紫色点),与它们在mRNA水平上的表达减少相反(图S4B)。例如,buc(母体)、fgfr1a(母体-合子)和lcp1(合子)是蛋白质(青色)和RNA(深蓝色)表达谱在MZT期间出现偏差的基因(图S4C)。基因本体分析显示,来自纯母体基因的蛋白质富集于代谢相关的生物过程(图S4D;表S4),而来自母体-合子基因的蛋白质则富集于代谢、RNA调控和翻译等术语(图S4E;表S4)。令人惊讶的是,识别的纯合子mRNAs大部分自受精以来就以蛋白质形式存在(图3B,浅蓝色点),仅有2个基因在基因激活后才被发现,符合RNA-seq数据的预期(图S4B,浅蓝色点)。

图3 在RNA水平上识别的纯合子基因在合子基因组激活之前高度沉积为蛋白质

在合子mRNA表达之前就存在合子蛋白质这一现象,提出了蛋白质可能仅由卵母细胞和/或精子提供,而不是以mRNA形式。为了探讨这一假设,我们分析了来自斑马鱼精子和卵母细胞的RNA-seq数据,以及生成的斑马鱼卵母细胞的蛋白质组学数据。卵母细胞的生物重复样本显示出显著的相关性(r > 0.85,p < 0.001,Pearson相关性检验),主成分分析(PCA)将卵母细胞的阶段归为一类(图S4F–S4H)。有趣的是,来自纯合子基因的蛋白质在mRNA水平上存在于卵母细胞、精子或两者中(图3C;表S2),其中6个纯合子基因也在卵母细胞的蛋白质组学中被识别(图S4I;表S5),这表明它们可能是母体和/或父体提供给胚胎的。此外,这组基因富集于与卵黄合胞层和脂质/脂蛋白代谢相关的生物过程(图3D和S4J;表S4)。由于这一组基因作为蛋白质沉积而非mRNA,我们决定称之为自纯合子转录开始的沉积蛋白。值得注意的是,有11个基因(图3C,“无”)无法通过卵母细胞或精子的mRNA表达来解释,这意味着它们可能在分析之前就已经在卵母细胞和/或精子中被表达、翻译并积累为蛋白质。

为了进一步探讨这一观察在其他物种中的保守性,我们分析了小鼠胚胎的蛋白质组学和5-炔基尿苷(EU)标记RNA-seq数据集。首先,小鼠的纯合子基因以类似于斑马鱼基因的方式被分类(图S5A;表S6),考虑到在小鼠中,合子转录在1细胞阶段结束时发生微弱波动(更多细节见STAR方法)。这一分析结果显示273个被归类为小鼠纯合子的独特基因被识别为同时具备mRNA和蛋白质(图S5B)。有趣的是,正如在斑马鱼中观察到的那样,这些纯合子mRNAs自受精以来就以蛋白质形式存在(图S5C和S5D),只有2个基因表现出真正的合子蛋白质模式。此外,这组基因在代谢过程(包括脂质代谢)相关的生物过程上也显著富集,与斑马鱼相似(图S5E)。值得注意的是,只有29个在斑马鱼中沉积的纯合子基因在小鼠中有直系同源基因,但在小鼠数据集中271个纯合子mRNA列表中没有发现。

总之,先前观察到的MZT分类转录动态并未伴随其蛋白质对应物,表明mRNA变化可能会影响后期发育中的蛋白质水平。此外,我们首次报告了斑马鱼和小鼠中被重新分类为纯合子的基因的蛋白质沉积。这些发现强调了进一步研究蛋白质调控的必要性,因为mRNA的变化或缺失可能无法解释MZT期间的所有过程。

MZT期间蛋白质动态的聚类分析

由于蛋白质动态与基于转录的分类存在差异,我们决定根据MZT期间蛋白质丰度变化对其进行聚类。为此,我们在四个发育阶段进行了一种基于中位数划分的聚类分析(PAM),识别出四个表现出不同蛋白质动态的独特聚类(图4A和S6A;表S1)。聚类1包含稳定的蛋白质,富含与酶活性相关的基因(图4B和S6B,蓝色条;表S7)。聚类2和聚类4包含随时间增加丰度的蛋白质,其中聚类2在2 hpf时显示出急剧上升,而聚类4则在4 hpf时呈现增加(图4A)。聚类2富集与转录相关的基因,而聚类4则富集与核糖体相关的基因(图4B和S6B,分别为红色和黄色条;表S7)。聚类3包含随时间降解的蛋白质(图4A),富含与蛋白质结合和细胞骨架相互作用相关的基因(图4B和S6B,深绿色条;表S7)。令人惊讶的是,所有聚类在RNA水平上的调控较蛋白质对应物存在延迟(图S6C)。例如,聚类2从一开始就表现出蛋白质表达增加,而其RNA表达仅在后期阶段(4和6 hpf)才有所增加(比较图4A和S6C)。在后期阶段,聚类的趋势在蛋白质和RNA之间更为一致(图4A和S6C)。有趣的是,尽管大多数识别的蛋白质在斑马鱼发育的某个阶段也以mRNA形式表达,但有106个基因仅被识别为蛋白质(图4C和S6D;表S7)。值得注意的是,这些蛋白质富集于与肽酶和脂质运输相关的术语(图4D;表S7)。总之,这四个定义的聚类为斑马鱼MZT期间的蛋白质动态提供了见解,并补充了先前描述的转录动态。此外,这个数据集将有助于后续功能筛选的候选选择。

图4 通过聚类蛋白质谱捕获母本到合子转变过程中的蛋白质动态

基因组激活前的快速蛋白质变化引发基因组激活因子

斑马鱼的合子基因组激活(ZGA)发生在受精后2小时(hpf)之后,在此之前,包括nanog、sox19b和pou5f3在内的关键转录因子的翻译量显著增加,这些转录因子的翻译在2-hpf标记之前就已经高度进行。因此,我们假设ZGA的关键因子必须迅速翻译,导致蛋白质丰度在2-hpf时间点之前增加。为了鉴定基因组激活的调节因子,我们对2-hpf阶段的胚胎与1-细胞阶段的胚胎进行了差异蛋白质表达分析。值得注意的是,nanog、sox19b和pou5f3的丰度显著增加(adj.p < 0.05 和 FC > 2),这与之前核糖体分析研究的发现一致(图5A)。此外,这组丰度显著增加的蛋白质在DNA结合和转录相关方面表现出富集(图S7A)。

图5 基因组激活前的蛋白质水平快速变化触发基因组激活因子

为了阐明这些快速翻译的蛋白质在合子基因组激活中的作用,我们使用了先前为斑马鱼优化的CRISPR-Cas13d系统来敲低znf281b的mRNA并监测斑马鱼的发育(图5B)。我们专注于znf281b,因为其蛋白质以前未被鉴定,它是一个预测的转录因子,尚未被证明参与斑马鱼的基因组激活,并且其同源物Zfp281与Nanog相互作用以调节小鼠胚胎干细胞中的胚层标记物表达。在斑马鱼发育的前6小时内,znf281b的mRNA高度表达(图S7B),并且其蛋白质表达在2-hpf之后继续增加,因此归入第2组(图S7C和4A)。注射后4小时的RT-qPCR分析显示znf281b的显著敲低效率。具体而言,与仅注射Cas13d蛋白的胚胎相比,共注射Cas13d蛋白和两个分别针对znf281b的单个导向RNA(gRNA)的胚胎显示出针对每个单独gRNA的显著敲低效率(分别为0.15倍和0.09倍变化,两者注射后p < 0.001,学生t检验)(图5C,比较黑色和品红色条)。如预期所料,未注射的胚胎与仅注射Cas13d蛋白的胚胎之间znf281b的表达没有显著变化(图5C,灰色和黑色条)。此外,与在哺乳动物和果蝇系统中报道的CRISPR-Cas13d导致的非特异性RNA降解的观察结果相反,CRISPR-Cas13d敲低胚胎显示出与对照组胚胎相当的核糖体RNA完整性(图S7D)。有趣的是,与仅注射Cas13d的胚胎相比,共注射Cas13d和每个针对znf281b的gRNA的胚胎在6-hpf时显示出严重的发育延迟表型(两种注射的gRNA均为p < 0.001,Fisher精确检验)(图5D)。未注射的胚胎与仅注射Cas13d的胚胎之间在发育上没有差异(图5D)。敲低胚胎中的发育延迟与破坏原肠胚形成的基因组激活失败表型相似。这种发育延迟在后来的发育中并未得到补偿,因为24-hpf胚胎存在严重的发育问题(图5E和S7E)。此外,原位杂交链反应(HCR)显示,在敲低胚胎中,中胚层标记物pcdh8和内胚层标记物sox32的表达均减少了约2.8倍,但差异不显著(图5F和5G),这表明znf281b可能与其哺乳动物同源物相似,也调节斑马鱼的胚层分化。

为确认这些效应特定于znf281b的缺失,我们进行了拯救实验,其中使用了编码znf281b的mRNA,该mRNA包含同义突变以防止gRNA结合,并在蛋白质的C末端融合了ALFA标签(图6A)。Western blot结果显示,在受精后6小时(6 hpf)可检测到注入的znf281b-ALFA mRNA的蛋白表达,但在更早阶段则检测不到(图S8A)。同义突变阻止了外源性mRNA的降解(图6B),且未引起非特异性RNA降解(图S8B)。此外,通过共注射znf281b-ALFA,并未影响CRISPR-Cas13d系统对内源性znf281b的靶向,这是通过使用特异性RT-qPCR引物检测znf281b的内源性3'非翻译区(UTR)来确定的(图6C)。拯救实验使用的是效率较低的纯化CRISPR-Cas13d蛋白批次(比较图5C和6B),这降低了znf281b的敲低效率。然而,这强调了通过调节敲低效率,也可以降低表型渗透率(比较图5D和S9C),进一步验证了znf281b的生物学意义。有趣的是,共注射三种不同浓度的znf281b-ALFA能够拯救由内源性znf281b敲低在受精后24小时(24 hpf)引起的表型(图6D)。具体而言,与仅注射Casd13d蛋白、靶向znf281b的gRNA和编码GFP的mRNA的胚胎相比,共注射Casd13d、靶向znf281b的gRNA和znf281b-ALFA的胚胎表现出较低的发育延迟百分比和显著更长的尾长(图6D和6E)。在受精后6小时(6 hpf)时,除了最高剂量的znf281b-ALFA导致轻微更多的发育延迟外(图S8C),但在受精后24小时(24 hpf)时则表现出拯救效果(图6D),其他剂量均未观察到显著的发育延迟差异。此外,znf281b-ALFA的过表达在任何时间点均未引起发育延迟(图6D和6E)。

图6 znf281b表型可通过外源性znf281b-ALFA mRNA得到挽救

为了进一步探究znf281b在母源-合子转换(MZT)期间的作用,我们对在受精后4小时(4 hpf)共注射Cas13d和靶向znf281b的gRNA的胚胎以及仅注射Cas13d的对照胚胎进行了RNA-seq分析(表S8)。Baia Amaral等人观察到的第一波合子转录在靶向znf281b时作为一个整体显著下调(图6F和S8D;基因集富集分析[GSEA] adj.p < 0.001),这表明znf281b是一种基因组激活因子。此外,由于小鼠胚胎干细胞中的znf281b同源物被描述为与nanog相互作用以促进生殖层特异性,我们比较了我们在4 hpf时znf281b敲低和先前描述的nanog敲除中显著变化的基因,发现两组数据中均有223个基因中的91个(约40%)显著下调(图6G)。综上所述,这些结果表明znf281b在斑马鱼基因组激活和胚胎发育中起着重要作用,并展示了如何基于我们的蛋白质组学特征与CRISPR-Cas13d系统相结合来靶向母源基因,从而揭示胚胎发育过程中基因的功能。

讨论与结论

在母源-合子转换(MZT)期间,mRNA的调控已被广泛研究,但蛋白质水平的调控则相对较少被探索。在此,我们生成了斑马鱼MZT期间的质谱数据集,该数据集能够在不消除卵黄的情况下对蛋白质进行定量。相反,我们在数据采集步骤中降低了卵黄蛋白的识别优先级。这使得与用缓冲液冲洗掉卵黄的方法(Link等人和Purushothaman等人的方法)相比,在0小时和2小时受精后(hpf)的胚胎中能够识别出更多的蛋白质。实际上,我们能够识别出几种母源沉积的蛋白质(图1C)和861种在先前斑马鱼MZT研究中未被识别的蛋白质(图S1F)。简而言之,这种创新的数据采集方法使得在斑马鱼MZT期间能够识别和定量先前未知的蛋白质。

我们在MZT期间的定量蛋白质组学分析提供了四大主要见解。首先,mRNA的波动并不总是转化为MZT期间的蛋白质调控。在斑马鱼发育的前6小时内,只有20%的已识别蛋白质被上调或下调,而在同一时间段内,超过50%的相同基因发生了RNA水平的变化(图1E)。此外,这些显著变化中只有一部分在mRNA和蛋白质水平上都发生,甚至有些变化是相反的(图1H)。事实上,在修订本手稿时,另一组也观察到了斑马鱼MZT期间mRNA和蛋白质调控之间的这种脱节。此外,蛋白质的变化并不遵循该领域基于转录本的分类的预期动态(比较图3B中的母源基因蛋白质表达与图S4B中的母源基因RNA表达)。实际上,除了丰度的变化外,蛋白质在MZT期间还可能发生翻译后修饰,这在果蝇、线虫、小鼠、以及现在的斑马鱼中均有观察到。另一层调控是特定蛋白质的细胞定位,如斑马鱼中描述的转录因子向细胞核的转运以进行合子基因组激活(ZGA)。在这方面,我们的数据集仅限于蛋白质丰度的定量,但补充研究早期胚胎发育期间翻译后修饰的富集数据集将非常有趣。然而,蛋白质丰度的快速变化在ZGA和发育进展中起着至关重要的作用,这可以在我们的数据集中进行探索,并补充仅基于转录组的分析。仍有一个问题尚未解决,即早期胚胎发育中的大量转录变化是否在MZT中起重要作用,因为它们的蛋白质对应物并没有发生如此剧烈的变化。总之,蛋白质调控可以在多个层面上进行控制,而质谱分析可以通过令人兴奋的生物学发现来补充转录组和翻译组数据集。

第二,MZT期间蛋白质水平的降低似乎并不是通过减少翻译和RNA下调来实现的。丰度降低的蛋白质与其他保持稳定的蛋白质具有相似的翻译效率(图2B和2C)。我们假设这些蛋白质必须被胚胎迅速清除,并需要特异性地靶向到蛋白酶体或自噬降解途径。蛋白酶体途径在斑马鱼MZT期间是活跃的(图S3B),并且这两种途径的组分都以蛋白质的形式母源沉积(图S3A)。此外,已知此类蛋白质降解途径对ZGA至关重要,并且它们的抑制会延迟或阻止小鼠和果蝇的发育。此外,我们的蛋白质组学分析中的下调蛋白质列表(图4A,集群3)代表了一个有趣的群体,可用于探索胚胎在早期胚胎发育期间以及不同模式生物之间所使用的泛素连接酶的特异性。总之,MZT期间的快速细胞命运转变可能需要快速消耗某些蛋白质,而胚胎通过在蛋白质水平而不是RNA水平上特异性地靶向这些蛋白质来实现这一点。

第三,在第一发育小时内,一组独特的蛋白质经历了快速翻译(图4A,集群2和4),这引发了关于胚胎如何优先翻译特定mRNA的问题。也许这些mRNA共享一个顺式调控元件来做出这种区分。在这方面,其他人已经证明了在不同生物体MZT期间多聚腺苷酸(poly(A))尾长度与翻译效率之间的相关性。此外,最近的研究还证明了3'和5'非翻译区(UTR)序列在早期胚胎翻译起始中的调节作用。例如,在小鼠和斑马鱼中,特定mRNA 3'末端的缩短会阻止早期发育期间的直接翻译激活,而5' UTR序列则驱动早期斑马鱼胚胎中特定RNA的翻译起始,上游开放阅读框(uORFs)则抑制翻译。因此,我们提议将我们的数据集与这些数据集相结合,以在未来证实哪些调控元件驱动更多的蛋白质丰度。值得注意的是,我们数据集中快速翻译的蛋白质是使用mRNA靶向的CRISPR-Cas13d系统筛选早期发育功能的最佳候选者。简而言之,我们的数据集不仅补充了关于胚胎如何优先翻译特定mRNA的研究,还提供了一个新的候选列表,用于探索它们在基因组激活和早期发育中的作用。

第四,在斑马鱼(图3C)和小鼠(图S5)中,从受精开始纯合子mRNA来源的蛋白质的鉴定挑战了基于mRNA的现有分类,以及因此产生的基因功能研究方法。例如,如果靶标效率高,纯合子基因适合使用CRISPR-Cas9进行靶向并在F0代胚胎中分析发育表型。然而,自受精以来沉积的纯合子基因编码的蛋白质可能会掩盖这些表型,从而降低在F0代筛选中使用CRISPR-Cas9靶向这些基因的热情。尽管如此,创建母本-合子突变体可能是确定这些基因在胚胎发育中作用的最佳方法。因此,我们提议,在未来将生殖细胞和早期胚胎的质谱分析相结合,可以为领域分类提供有用信息,并阐明令人兴奋的生物学现象。

此外,这些具有纯合子转录的沉积蛋白质在卵黄合胞体层和脂质/蛋白质代谢方面富集(图3D和S4C),我们假设它们可能在早期胚胎的营养中发挥作用。实际上,卵黄合胞体层在大约2.7小时受精后(hpf)形成,并为胚胎提供营养运输。这些代谢途径在人类和与卵黄合胞体层同源的哺乳动物组织中是保守的。实际上,从小鼠中沉积的纯合子基因在代谢过程中富集,包括脂质代谢(图S5E)。此外,我们不能排除这些蛋白质的沉积版本在翻译后修饰方面与合子转录版本不同的可能性。然而,问题仍然存在:为什么这些基因不会作为mRNA沉积,因为胚胎在基因组激活后会转录它们。总之,本报告确定了纯合子基因的沉积,并且其中一些蛋白质可能是由精子沉积的。

最后,我们使用CRISPR-Cas13d在斑马鱼母源-合子转换(MZT)期间对znf281b功能进行的实验性剖析,展示了基于蛋白质谱选择基因并使用适当方法进行靶向的重要性,其中znf281b是基因组激活前快速翻译蛋白质的一个例子。它的同源基因Zfp281与Nanog相互作用,以调节小鼠胚胎干细胞中的胚层标记物表达。实际上,znf281b的功能丧失导致了6小时和24小时受精后(hpf)的严重表型(图5D和5E),这与破坏原肠胚形成的表型相似。这种发育效应是znf281b下调所特有的,因为将与gRNA结合位点上的同义突变编码的znf281b mRNA共注射可以挽救24 hpf时的表型严重性和尾长(图6D和6E)。此外,Baia Amaral等人报道的第一波合子转录(图6F)以及中胚层和内胚层标记物(图5F和5G)在敲低胚胎中均下调,这表明znf281b除了如小鼠中所述调节胚层标记物表达外,还在斑马鱼中参与ZGA。仍待解答的一个问题是,znf281b与nanog的蛋白质相互作用是否在斑马鱼中也得到保守,这可能是事实,因为znf281b敲低与斑马鱼nanog敲除系共享了40%的下调基因(图6G)。此外,在ZGA之前丰度增加的剩余蛋白质(图5A)成为参与ZGA调控的理想候选基因,可逐一使用CRISPR-Cas13d进行靶向。总之,我们使用CRISPR-Cas13d mRNA敲低技术,基于蛋白质表达情况,在斑马鱼早期发育中鉴定了先前未表征的基因功能。

得益于我们的蛋白质组学数据集,我们能够揭示母源-合子转换(MZT)期间尚未被表征的基因调控层次,而这仅仅是个开始。尽管通过分析不同水平的RNA表达,该领域已经取得了重大发现,但我们的研究表明,将转录组学、翻译组学和蛋白质组学结合起来,对于进一步理解基因调控至关重要。此外,我们提出,结合多个组学数据集,可以为早期发育基因的广泛CRISPR-Cas13d筛选提供更精确的候选基因列表,其中znf281b就是这种方法的一个例子。

研究局限性

基于已识别的蛋白质,我们提出,在斑马鱼的母源-合子转换期间,mRNA和蛋白质的变化并不密切相关。然而,本研究仅能够识别斑马鱼MZT期间表达的所有RNA的13%,因此我们的结论仅适用于这些基因。这一局限性源于技术上的困难,即无法将细胞与这些胚胎中的卵黄进行物理分离,这发生在1细胞阶段。此外,我们的数据集仅限于蛋白质丰度的量化。然而,这将为生成更多数据集奠定基础,这些数据集还将包括早期胚胎发育过程中的翻译后修饰。

方法与材料

斑马鱼

斑马鱼实验严格按照IACUC批准的指导原则进行。用于样品收集和显微注射的斑马鱼胚胎来自3个独立品系中随机选择的亲本(AB、TF和TLF,年龄6-25个月)的交配。对于每组实验,胚胎均来自随机选择的12只雄性和12只雌性的交配。斑马鱼胚胎的发育阶段按照小时受精后(hpf)进行划分,如描述中所述。

质谱样品制备

包含25个去壳但未去卵黄的斑马鱼胚胎的四个生物学重复样品被迅速冷冻在尽可能少的E2培养基中。胚胎发育的四个时间点被纳入研究:1细胞期(0-hpf,受精后小时)、2-hpf、4-hpf和6-hpf。所有16个混合胚胎样品均通过加入100 μL哺乳动物裂解缓冲液(Promega #G938A)(50mM Tris-HCl(pH 7.5)、150mM NaCl、1% Triton X-100、0.1% 脱氧胆酸钠)和1x蛋白酶抑制剂混合物进行独立裂解。将试管涡旋并在90°C下孵育30分钟,然后在碎冰上冷却5分钟。将裂解物在4°C下以13,000 RPM离心20分钟。收集每个蛋白质上清液(约85 μL)并转移到新的Eppendorf管中。使用BCA蛋白质试剂盒根据制造商的说明从每个上清液的5 μL中测量蛋白质浓度。总蛋白质量范围在65至85 μg之间。在剩余的5 μL每个上清液上进行银染SDS-PAGE(NuPAGE 4-12% Bis-Tris凝胶,1mm x 12孔,在MOPS缓冲液中),以检查所有样品中的蛋白质谱是否一致。在丙酮沉淀之前,将剩余的蛋白质样品转移到新管中。

用于质谱分析的消化处理

通过加入三(2-羧乙基)膦(TCEP,最终浓度为5 mM)将样品还原,然后在55°C下孵育1小时。为了羧甲基化还原的半胱氨酸残基,加入5 μL新制的0.5 M 2-氯乙酰胺(CAM),并在室温下避光孵育30分钟。加入六倍体积(480 μL)预冷(−20°C)的丙酮,让沉淀过夜进行。接下来,将样品在4°C下以8000 x g离心10分钟。小心地将试管倒置以去除丙酮而不扰动蛋白质沉淀,然后将蛋白质沉淀在空气中干燥2-3分钟。

将沉淀的蛋白质溶解在100 μL 50 mM TEAB中,加入质谱级胰蛋白酶(Promega Gold)(质量比1:40),并在37°C下过夜消化。将消化的蛋白质样品以16000 x g离心30分钟并转移到新管中。根据制造商的说明,对每个消化后的样品中的10 μL进行荧光肽段测定(Pierce)。肽段量范围在21至30 μg之间。

串联质谱标签(TMT)标记

在使用前,立即让含有冷冻TMTpro 16plex试剂的小瓶在室温下回暖。向每个0.5mg的小瓶中加入20 μL无水乙腈。让TMT试剂溶解5分钟,期间偶尔涡旋,然后将试管短暂离心以收集溶液。根据肽段测定结果,为每个样品量出20 μg,并用100 mM TEAB将体积调整至100 μL,然后与TMT小瓶中的20 μL混合。0-hpf、2-hpf、4-hpf和6-hpf时间点的4个重复样品分别用TMTpro-126、-127N、-127C、-128N、-128C、-129N、-129C、-130C、-130C、-131N、-131C、-132N、-132C、-133N、-133C、-134N进行标记。标记反应在室温下进行1小时。为了测试标记效率,使用配备Nanospray Flex离子源和FAIMS Pro接口的Orbitrap Eclipse Tribrid质谱仪(Thermo Scientific)以及Dionex UltiMate 3000 RSCLnano系统,在2小时的C18反相(RP)梯度上对0-hpf_126、2-hph_128C、4-hpf_130C和6-hpf_132C样品进行LC/MSMS分析。所有检测到的肽段的TMT标记水平均>99%(数据未显示)。将16个不同标记的样品(每个30 μL)合并到一个新管中,并使用SpeedVac浓缩器(Savant)将所得体积减少到小于10 μL(约1小时)。

高pH反相分级

将干燥的TMT标记肽混合物重新悬浮在300 μL 0.1%三氟乙酸(TFA)中。将一个高pH分级柱(Pierce,目录号84868)放置在一个新的2.0 mL样品管上,并将300 μL TMT标记肽混合物加载到柱上。在3000 × g下离心2分钟后,收集流出液作为“流穿”组分。将加载的柱放置在一个新的2.0 mL样品管上,用300 μL ddH2O洗涤,并收集流出液作为“洗涤”组分。使用300 μL含0.1% TFA的5%乙腈进行额外一轮洗涤,以去除未反应的TMT试剂。使用含0.1% TFA的10%、12.5%、15%、17.5%、20%、22.5%、25%、50%和80%乙腈在新样品管中顺序洗脱,共收集9个HpH RP组分。使用真空离心法将溶剂蒸发至干燥。在LC-MS分析之前,将干燥样品重新溶解在44 μL缓冲液A(含0.1%甲酸的5%乙腈)中。

多重质谱分析

TMT标记的肽段在配备FAIMS Pro接口和Nanospray Flex离子源的Orbitrap Eclipse Tribrid质谱仪(Thermo Scientific)上进行分析,并与Dionex UltiMate 3000 RSCLnano系统相连。每个高pH反相(HpH RP)组分中的肽段(22 μL)通过自动进样器以2 μL/min的速度,使用U3000上样泵加载到Acclaim PepMap 100 C18捕获柱(内径0.3 mm,长度5 mm;Thermo Fisher Scientific)上。

自制的75 μm内径分析微毛细管柱填充了250 mm的1.9 μm ReproSil-Pur C18-AQ树脂(Dr. Masch)。使用AgileSLEEVE(Analytical Sales & Products)将柱温维持在40°C。有机溶剂溶液为:缓冲液A(pH 2.6)为水:乙腈:甲酸=95:5:0.1(体积比),缓冲液B为水:乙腈:甲酸=20:80:0.1(体积比)。色谱梯度设置如下:在2% B下进行30分钟的柱平衡;5分钟内升至10% B;90分钟内从10% B升至40% B;10分钟内升至90% B;在90% B下冲洗5分钟;0.1分钟内降至2% B;之后在2% B下进行15分钟的柱再平衡。纳米泵流速设置为0.180 μL/min。

Orbitrap Eclipse设置为运行TMT-SPS-MS3方法,采用三个FAIMS补偿电压(CV)分别为-40V、-55V和-70V,循环时间为1秒。简而言之,肽段在Orbitrap中以120,000的分辨率从400到1600 m/z进行扫描,随后在离子阱中以35% NCE的CID进行MS2碎裂,并设置为涡轮检测模式进行检测。启用45秒的动态排除。在ddMS2 IT CID步骤中,对从UniProtKB 2021-03下载的非冗余斑马鱼(Danio rerio)序列数据库进行实时搜索(RTS),并补充了常见的污染物。静态搜索包括氨基甲酰甲基(C位点Dmax = 57.0215 Da)和TMTpro16plex(Kn位点Dmax = 304.2071 Da),而甲硫氨酸氧化(15.9949 Da)作为可变修饰进行搜索。同步前体扫描(SPS)选择前10个MS2肽段,在Orbitrap中使用65% NCE的HCD碎裂进行TMT报告离子检测,分辨率为50,000。此外,还设置了RTS以拒绝使用包含“Contaminant”、“Phosvitin”和“Vitellogenin”等关键词的排除列表进一步碎裂映射到污染物和卵黄蛋白的肽段。

MS/MS数据处理

LC/MS数据集使用Proteome Discoverer 2.4(Thermo Fisher Scientific)进行处理。MS/MS光谱与补充了常见污染物的斑马鱼蛋白质数据库(UniProtKB 2021-03)进行比对。通过Proteome Discoverer实现的SEQUEST-HT设置为:前体离子质量容差10 ppm,碎片质量容差0.6 Dalton,最多允许两个未切割位点,半胱氨酸的静态修饰(+57.021 Da),以及赖氨酸和肽N端带有TMT标签(+229.163 Da)的动态甲硫氨酸氧化(+15.995 Da)。结果通过Proteome Discoverer中的Percolator以1%的假发现率(FDR)在肽水平上进行过滤。MS3光谱被处理以提取每个报告离子的强度。蛋白质通过汇总所有匹配肽谱匹配(PSM)的报告离子强度进行定量。使用ANOVA识别差异富集的蛋白质。

质谱数据分析

质谱数据首先被过滤,仅保留在时间点至少两个重复中出现的蛋白质,然后使用NormalyzerDE(版本3.18)进行归一化处理。每个蛋白质的倍数变化使用limma(版本3.54.2)计算,所得p值通过Benjamini-Hochberg方法进行校正。使用factoextra(版本1.0.7)、umap(版本0.2.9.0)和NbClust(版本3.0.1)包进行UMAP分析和确定聚类数量。蛋白质登录号通过biomaRt(版本2.54.1)映射到Ensembl基因和转录本ID。

小鼠质谱数据分析

从小鼠着床前胚胎的ProteomeXchange(PXD003315)下载的质谱数据来源于Pride存储库。LC/MS数据集使用FragPipe(版本22.0)进行处理,并选择TMT10默认工作流程。通过FragPipe实现的MSFragger(版本4.1)设置为:前体离子质量容差20 ppm,碎片质量容差20 ppm,最多允许两个未切割位点,半胱氨酸的静态氨基甲酰甲基化修饰(+57.02146),赖氨酸和肽N端带有TMT标签(+229.163 Da),以及甲硫氨酸的动态氧化(+15.995 Da)和N端乙酰化(+42.0106)。使用MSBooster(版本1.2.31)进行重新评分,然后通过FragPipe中的Percolator(版本3.6.4)在肽水平上将结果过滤至1%的假发现率(FDR)。使用TMT-Integrator(版本5.0.9)和IonQuant(版本1.10.27)处理MS2光谱,以提取每个报告离子的强度。MS/MS光谱与补充了常见污染物的小鼠蛋白质数据库(UniProtKB 2024-04)进行比对。

斑马鱼卵母细胞质谱数据分析

从斑马鱼卵母细胞的ProteomeXchange(PXD005137)下载的质谱数据来源于Pride存储库。使用msConvert调用峰并将RAW文件转换为mzML格式。LC/MS数据集使用FragPipe(版本22.0)进行处理,并选择LFQ-MBR默认工作流程。通过FragPipe实现的MSFragger(版本4.1)设置为:前体离子质量容差20 ppm,碎片质量容差20 ppm,最多允许两个未切割位点,以及甲硫氨酸的动态氧化(+15.995 Da)和N端乙酰化(+42.0106)。使用MSBooster(版本1.2.31)进行重新评分,然后通过FragPipe中的Percolator(版本3.6.4)在肽水平上将结果过滤至1%的假发现率(FDR)。MaxLFQ设置为最少1个离子,并在1%的FDR下应用运行间匹配。处理MS1光谱以提取强度。MS/MS光谱与补充了常见污染物的斑马鱼蛋白质数据库(UniProtKB 2021-03)进行比对。

RNA测序样本制备

通过自然交配配对雌性斑马鱼以“排出”成熟卵子,收集了两个生物学重复样本,每个阶段包含50个斑马鱼卵母细胞,用于建立卵发生时间线。在排出后1-11天(dpp)内对鱼进行安乐死并收集卵巢。在排出后1-2天收集I期和II期卵母细胞,在排出后4-7天收集III期卵母细胞(生发泡位于中央位置),在排出后8-10天收集IV期卵母细胞(生发泡不对称定位)。卵母细胞的分离基于先前的研究,并在含有I型和II型胶原酶的Leibovitz L-15(Sigma-Aldrich #L5520)分离介质中进行,具体使用的胶原酶类型和浓度取决于卵母细胞所处的阶段。I期和II期卵母细胞使用3 mg/mL的I型胶原酶(Sigma-Aldrich C0130)和3 mg/mL的II型胶原酶(Gibco 17101015)进行分离。III期卵母细胞使用3 mg/mL的I型胶原酶(Sigma-Aldrich C0130)进行分离。IV期卵母细胞则通过镊子和针头进行机械剥离,不使用胶原酶。分离后的卵母细胞迅速冷冻,并按照制造商的协议使用TRIzol(Invitrogen #15596026)提取RNA。

另外,还准备了三个生物学重复样本,每个样本包含20个去壳的斑马鱼胚胎,这些胚胎在TRIzol(Invitrogen #15596026)中迅速冷冻。样本涵盖了胚胎发育的四个时间点:1细胞期(0小时受精后,hpf)、2小时受精后、4小时受精后和6小时受精后。RNA使用Direct-zol RNA MicroPrep试剂盒(Zymo Research #R2062)按照制造商的协议进行提取。

RNA测序文库制备

斑马鱼卵母细胞(I-IV期)的总RNA-Seq文库是从100 ng高质量总RNA中生成的,该RNA的质量通过Bioanalyzer(Agilent Technologies)进行评估。文库制备遵循制造商的说明,使用TruSeq Stranded Total RNA Library Prep Gold试剂盒(Illumina,货号20020598)和TruSeq RNA单索引集A和B(Illumina货号20020492和20020493)。使用Bioanalyzer和Qubit Fluorometer(Life Technologies)对生成的短片段文库进行质量和数量检查。文库被标准化、混合,并在NextSeq 500仪器(Illumina)上以75 bp单端读取的方式在高输出流动池上进行测序,使用NextSeq Control Software 2.2.0.4。测序后,运行Illumina Primary Analysis版本NextSeq RTA 2.4.11和Secondary Analysis版本bcl2fastq2 v2.20,对所有文库进行去多路复用并生成FASTQ文件。

斑马鱼胚胎(受精后0小时、2小时、4小时和6小时)的总RNA测序文库是从500 ng高质量总RNA中生成的,该RNA的质量通过Bioanalyzer(Agilent)进行评估。文库制备遵循制造商的说明,使用TruSeq Stranded Total RNA Library Prep Gold试剂盒(Illumina #20020598)和TruSeq RNA单索引集A和B(Illumina #20020492和#20020493)。使用Bioanalyzer(Agilent Technologies)和Qubit Fluorometer(Life Technologies)对生成的短片段文库进行质量和数量检查。文库被混合、定量,并在Illumina NextSeq500仪器上以75 bp单端读取的方式在高输出流动池上进行测序。测序后,运行Illumina Primary Analysis(版本RTA 2.11.3.0)和bcl-convert 3.10.5,对所有文库进行去多路复用并生成FASTQ文件。

斑马鱼znf281b敲低胚胎的总RNA测序文库是从100 ng高质量总RNA中生成的,该RNA的质量通过Bioanalyzer(Agilent)进行评估,使用Watchmaker mRNA Library Prep Kit(Watchmaker,货号7BK0001)以1/5的反应体积进行。mRNA分离和文库构建按照微型化规模的协议完成。在文库扩增过程中,向3 μL文库中加入2 μL IDT索引引物(使用xGen Stubby Adapter-UDI Primers,96反应,货号10005921),再加入5 μL Equinox Amplification Master Mix(2x)。然后,根据步骤10.2,在55°C的退火温度下对这些文库进行12个循环的PCR扩增。在扩增后清理过程中使用1.0x SPRISelect(Beckman Coulter,货号B23318)珠比,扩增后的文库在10 μL Qiagen EB(Qiagen,货号19086)中洗脱。使用Bioanalyzer和Qubit Flex Fluorometer(Life Technologies)对生成的短片段文库进行质量和数量检查。将等摩尔文库混合、定量,并使用SG Library Compatibility Kit(遵循“为G4调整文库——保留原始索引”协议)转换为在Singular Genomics G4上处理。将转换后的文库池在G4仪器的F2流动池(货号700104)上进行测序,使用PP1和PP2自定义索引引物(包含在SG Library Compatibility Kit中,货号700141),使用Instrument Control Software G4-23.08.1-1,读取长度为:8 bp Index1,50 bp Read1,8 bp Index2,50 bp Read 2。测序后,运行sgdemux 1.2.0对所有文库进行去多路复用并生成FASTQ文件。

RNA测序分析

来自斑马鱼卵母细胞(I-IV期)和胚胎(0小时、2小时、4小时、6小时及znf281b基因敲低胚胎)的原始读数使用Illumina bcl-convert 3.10.5进行去复用,转换为FASTQ格式,允许最多一个不匹配。利用STAR比对器(版本2.7.3a)和Ensembl 106基因模型,将这些读数对齐到UCSC的danRer11基因组。使用RSEM(版本v1.3.0)将计数转换为TPM值,并使用TPM进行后续所有分析。使用edgeR(版本3.40.2)计算每个基因的倍数变化,并通过Benjamini-Hochberg方法对得到的p值进行调整。

从公共数据库Sequence Read Archive (SRA)中使用SRA工具包下载了斑马鱼精子的原始读数(GEO:GSE44075)。利用STAR比对器(版本2.7.3a)和Ensembl 106基因模型,将这些读数对齐到UCSC的danRer11基因组。使用RSEM(版本v1.3.0)生成TPM值,并使用TPM进行后续所有分析。

对于小鼠转录组数据,使用SRA 2.11.3的fastq-dump从GEO:GSE235547下载了36个GSM的fastq文件。利用STAR 2.7.10b(仅对配对读样本的第一个文件进行比对)和Ensembl 110基因模型,将这些读数对齐到小鼠参考基因组(GRCm39)。过滤掉原始读数计数少于5的基因,使用RStudio计算剩余基因的TPM值。

核糖体分析

从斑马鱼胚胎的核糖体保护片段(RPF)和输入RNA(GEO:GSE34743)中获取的原始读数已通过SRA工具包(版本2.10.8)从公共数据库序列读取档案(SRA)下载。使用FASTX工具包(https://github.com/agordon/fastx_toolkit,版本0.0.14)修剪了3'端适配器序列(ATCTCGTATGCCGTCTTCTGCTTG),仅保留长度在25bp至35bp之间(≥25bp且≤35bp)的读段用于进一步分析。剩余读段首先映射到一组ncRNAs,包括rRNA、tRNA、snRNA、snoRNA、miscRNA,使用bowtie2(版本2.4.2)。然后,所有未映射到ncRNAs的剩余读段使用STAR(版本2.7.3a)对斑马鱼参考基因组(danRer11带有Ensembl 102注释)进行了对齐。

从全基因组元基因图谱中,我们确定了读取长度和相应的P位点偏移量,用于下游分析。保留了长度为27、28、29和30bp的读取,并将检测到的P位点偏移量分别向3'端方向移动。然后,我们计算了34,867个蛋白质编码转录本的读取计数和每千碱基每百万读取的读取计数(RPKM)。使用自定义R脚本(版本3.1.6)执行元基因图谱、读取移动和RPKM计算。翻译效率计算为Log2((RPF + 0.005)/(RNA输入 + 0.005))。

斑马鱼解剖学(ZFA)本体论和GO分析

斑马鱼解剖学(ZFA)本体分析改编自参考文献89。ZFIN基因ID和ZFA ID是从ZFIN(http://zfin.org/downloads/phenoGeneCleanData_fish.txt 和 http://zfin.org/downloads/wildtype-expression_fish.txt)下载的,ZFA本体论是从https://obofoundry.org/ontology/zfa.html下载的。然后使用biomaRt(版本2.54.1)将ZFIN基因ID和ZFA ID映射到Ensembl基因ID。使用clusterProfiler(版本4.6.2)对ZFA、GO术语和GSEA进行了富集分析。

蛋白酶体活性测定

对于所有时间点,收集了50个去壳的斑马鱼胚胎,并按照描述进行去卵黄处理。将沉淀物重新悬浮在20μL新鲜匀浆缓冲液(50 mM Tris pH 7.5, 1mM DTT)中,并在Bioruptor Pico超声破碎仪(Diagenode)中以两轮10秒(两轮之间休息30秒)进行超声处理。将试管在4°C下以16,900 g离心10分钟,并将上清液转移到置于冰上的新试管中。使用Qubit蛋白质测定法(ThermoFisher #Q33212)测定蛋白质浓度。对于蛋白酶体活性测定,每个时间点的10μg总蛋白在匀浆缓冲液中用50μM Suc-LLVY-AMC(Enzo Life Sciences #BML-P802-0005)稀释至96孔板(Costar #3917)中每孔总共200μL。作为阴性对照,在所有样品中加入200μM MG132(Enzo Life Sciences #BML-PI102),外加10μg总蛋白和50μM Suc-LLVY-AMC以抑制蛋白酶体。在37°C下运行测定2小时,并在Infinite M200 Pro平板阅读器(Tecan)中每5分钟测量一次460nm发射信号。基于技术重复计算所有5分钟时间点的平均值,并通过线性回归计算每个生物重复品的斜率。所有分析均在R版本4.2.3中进行。

母本-合子基因分类

从参考文献21下载斑马鱼每个基因的合子成分得分,并结合本文中的RNA测序数据,将基因分为纯合子、纯母本和母本-合子组。在任何时间点具有至少0.05合子成分得分且在0小时和2小时受精后(hpf)时间点具有超过2 TPMs的所有基因被认为是母本-合子基因。在任何时间点具有至少0.05合子成分得分且在0小时和2小时受精后时间点具有少于2 TPMs的基因被认为是纯合子基因。在所有时间点具有少于0.05合子成分得分的所有其他基因被认为是纯母本基因。

小鼠着床前胚胎EU标记低输入乙炔尿苷(EU)标记总RNA(LET)-seq和RNA-seq,用于将基因分类为纯合子组。在第二次减数分裂中期(MII)卵母细胞和未标记的1细胞样品中TPMs均<2,并且在EU+ 1细胞、早期2细胞和晚期2细胞样品中TPMs>2的所有基因被认为是纯合子基因。

引导RNA(gRNA)、Cas13d蛋白和mRNA的生成

引导RNA(gRNA)的设计和CRISPR-Cas13d蛋白的纯化基于先前在斑马鱼中描述的协议,如参考文献54,55所述。针对每个目标基因,至少设计了两个gRNA。序列如下:znf281b gRNA 1 GTATGGGTATTAAACAGGAGAAGGTTTCAAACCCCGACCAGTT 和 znf281b gRNA 2 ACTGATATGTTGGACATGTCACTGTTTCAAACCCCGACCAGTT。为了设计救援实验,我们使用来自4小时受精后(hpf)斑马鱼胚胎的cDNA克隆目标基因的编码序列(CDS),然后使用Q5定点突变试剂盒(NEB #E0554S)按照制造商的协议对gRNA结合位点进行尽可能多的同义突变。携带不同构建的质粒随后被消化以线性化DNA,然后使用T3 mMESSAGE mMACHINE试剂盒(Thermo #AM1348)按照制造商的协议进行体外转录。在注射前,使用Qubit荧光定量法(Thermo #Q10211)对gRNA和mRNA进行定量。

斑马鱼胚胎注射和图像采集

在斑马鱼胚胎的单细胞阶段,将单个gRNA(700pg)与纯化的CRISPR-Cas13d蛋白(3ng)共同注射到胚胎中。对于救援实验,斑马鱼胚胎还被注射了编码目标基因CDS的mRNA(5pg、50pg或100pg)或与目标基因CDS等摩尔量的28.8pg非优化GFP_4(相当于100pg目标基因CDS)。注射后的胚胎在6小时和24小时受精后(hpf)进行收集、成像、分析和定量。

使用配备DFC9000 GT相机和PLANAPO 2.0x CORR物镜(用于6小时hpf)或PLANAPO 1.0x物镜(用于24小时hpf)的Leica M205 FA立体显微镜分析6小时和24小时hpf的斑马鱼胚胎表型。图像在Fiji中进行处理以添加比例尺,并根据文献78手动计算发育阶段。

Western Blot 分析

在进行Western Blot时,每个条件下收集了50个6小时受精后(hpf)的去壳斑马鱼胚胎,放入微量管中,并按照文献32所述的方法去卵黄。使用30μL的RIPA缓冲液(含150mM NaCl, 1% NP-40, 0.5% 脱氧胆酸钠, 0.1% SDS和罗氏cOmplete Mini蛋白酶抑制剂混合物(Roche #11836153001))进行蛋白质提取。然后,按照制造商的协议,将蛋白质样品加载到NuPage 4%至12% Bis-Tris 1.0mm迷你蛋白凝胶(ThermoFisher Scientific #NP0321BOX)上,同时使用PageRuler预染蛋白梯度带(ThermoFisher Scientific #26616)作为分子量标准。使用Trans-Blot Turbo RTA转印试剂盒(Bio-Rad #1704273)按照制造商的协议将蛋白质转移到PVDF膜上。膜先与抗ALFA一抗(Nano-Tag #N1581)孵育,再与IRDye 680RD山羊抗兔IgG二抗(Licor #926-68071)孵育,最后在Odyssey CLx Licor仪器(CLX-2084)上进行成像。

RNA提取、RT-qPCR和生物分析仪分析

将三个生物重复样本(每个样本包含20个4小时受精后(hpf)的去壳斑马鱼胚胎)迅速冷冻在TRIzol(Invitrogen #15596026)中。使用Direct-zol RNA MicroPrep试剂盒(Zymo Research #R2062)按照制造商的协议提取RNA。使用SuperScript IV反转录酶试剂盒(ThermoFisher Scientific #18090010)和OligoDT按照制造商的协议从提取的总RNA中合成cDNA。使用RNA 6000 Nano芯片(Agilent #5067-1511)在生物分析仪(Agilent Technologies)上按照制造商的协议分析RNA的完整性。RT-qPCR在QuantStudio 7热循环仪(ThermoFisher Scientific)上进行,使用的引物序列如下:cdk2ap2(管家基因)正向AGGATCTTGTGGCTCTTCTCCATCAC,反向TTTCACGGCTCATCTCCTCAATGAC;znf281b(CDS)正向AGGCGACTCGGGAAAGACACTT,反向ACTGCAGTGCTCGCATATGTGC;以及znf281b(3′ UTR)正向CCCGCTAGCTCAGGATCCAAAA,反向AGCATTGGGAGACAGTCCACGT。

原位杂交链式反应(HCR)

原位杂交链反应(HCR)是从参考文献92改编的,用于6-hpf斑马鱼胚胎。每个条件下共使用20个胚胎,去壳后固定在1.5mL的4%多聚甲醛(PFA)(Electron Microscopy Sciences #15710)中,该溶液用1x磷酸盐缓冲液(PBS)稀释,并在4°C下过夜。随后,用1x PBS洗涤胚胎,并通过一系列用1x PBS稀释的25%、50%、75%和100%甲醇溶液洗涤,每次洗涤5分钟。胚胎在-20°C下100%甲醇中放置2小时,然后在室温下用一系列25%、50%、75%和100%的含0.1% Tween的PBS溶液进行复水,每次洗涤5分钟。未进行蛋白酶K处理,其余步骤按照之前描述的方法进行。

针对pcdh8(ENSDARG00000006467)和sox32(ENSDARG00000100591)设计了探针,分别带有B5和B1启动子序列。信号通过B1-Alexa Fluor 488和B5-Alexa Fluor 546发夹结构进行放大。HCR后,用0.2 mg/mL DAPI对样品进行30分钟标记。使用配备Yokagawa CSU W1 Spinning Disk共聚焦显微镜(带50 μm针孔)的Nikon Eclipse Ti2显微镜,以全分辨率用Orca Flash 4.0 sCMOS相机拍摄样品图像。采用Nikon 40x长工作距离水浸物镜(NA 1.15)以最佳方式获取每个通道的图像。图像在Fiji中进行处理,并使用叠加投影来量化每个通道的总荧光强度。总荧光强度通过每个胚胎的切片数进行归一化处理。

量化与统计分析

所有统计分析均在R语言的4.2.3版本中进行。所展示的数据结果来自至少三次独立实验。用于数据格式化和可视化的软件包包括dplyr(版本1.1.2)、ggplot2(版本3.4.2)、ggforce(版本0.4.1)、ggborderline(版本0.2.0)、ggrepel(版本0.9.3)、ggfortify(版本0.4.16)、ComplexHeatmap(版本2.14.0)、pheatmap(版本1.0.12)、eulerr(版本7.0.0)、UpSetR(版本1.4.0)和plotrix(版本3.8.2)。

原文地址:https://www.cell.com/cell-reports/fulltext/S2211-1247(24)01120-3?_returnURL=https%3A%2F%2Flinkinghub.elsevier.com%2Fretrieve%2Fpii%2FS2211124724011203%3Fshowall%3Dtrue

注:因文章篇幅有限,所有相关引用文献,以及补充素材可以点击至原文查阅。
如有实验需求,可扫描下方二维码或后台私信客服~


关于木生物
ABOUT MURUIBIO


苏州木芮生物科技有限公司(以下简称“木芮生物”)成立于2018年1月22日,是一家致力于以斑马鱼为模式生物提供生物医学基础科研服务、斑马鱼实验操作试剂盒、斑马鱼临床疾病模型、其他生物学实验试剂以及进行斑马鱼应用技术转化的高科技公司。
木芮生物以斑马鱼为模式生物,建立起了上百种的临床疾病模型,深入探索相关疾病发生的深层次疾病机制, 进而为临床治疗疾病提供可行的治疗方案或者药物筛选机制。到目前为止,木芮生物已经建立起包括遗传、行为、 细胞、 生化分子等斑马鱼相关成熟的技术,并且依托这些技术成功将斑马鱼应用到基础科研、毒理测试、癌症药物筛选、 中药药效成分筛选、保健品开发和功效评价。
木芮生物经过六年的快速发展,公司现已有核心创业团队成员20余人,其中博士研究生1人,硕士研究生6人,本科生10余人。木芮生物成立后,陆续与江苏省产业研究院和苏州纳米应用技术研究所等科研单位建立起了科研合作,建立了“模式生物技术与应用研发中心”;公司于2020年被认定为“国家高新技术企业”,于 2021年底获得苏州工业园区“领军成长企业”称号。

敬请关注


苏州木芮生物
苏州木芮生物科技有限公司是一家致力于以斑马鱼为模式生物提供生物医学基础科研服务、斑马鱼实验操作试剂盒、斑马鱼临床疾病模型、其他生物学实验试剂以及进行斑马鱼应用技术转化的高科技公司。
 最新文章