导读
涡虫(Planarians)是扁形动物门(Platyhelminthes)涡虫纲(Turbellaria)的一类生物。它们大多是淡水生物,也有一些海水和湿润陆地环境中的种类。涡虫因其在实验室研究中显示出的非凡的再生能力而被广泛研究。
再生过程中,正确地重建前后轴(A-P Axis)对于形成一个结构和功能正常的个体是必要的。m6A修饰已经是表观研究的重要内容,在各种生物过程中均扮演重要角色,本研究中想要回答的科学问题是:
1)m6A修饰是否关联再生过程中的前后轴重建?
2)m6A修饰调控前后轴重建的机制是什么?
在生命科学问题中有很多问题,例如果实成熟[1]、胚胎发育[2]以及本文提到的生物体重建过程都是高度时空特异的,对于这种多时间点、多位置、多样本的研究,很多研究者经常因为复杂的实验设计而无从下手,如何在这个特殊的过程中研究动态可逆的RNA修饰? 如何结合高分辨高通量技术与其他生物学技术追踪修饰的变化?
为了给大家开拓思路,纽科生物为大家带来新年的第一篇公众号,解读2023年9月上线发表在期刊Computational and Structural Biotechnology Journal的项目文章Deciphering m6A dynamics at a single-base level during planarian anterior-posterior axis specification的有关解读,作为文章的作者之一,纽科生物全程参与该项目的数据分析工作。
文章
您需要了解的词汇:
【再生能力】涡虫能够从身体的一小部分重新长出整个个体,这是因为它们具有一种称为“多能干细胞”或“新体细胞”的细胞,这些细胞可以分化成各种不同类型的细胞;
【前后轴】A-P Axis (Anterior-Posterior Axis):涡虫身体的前端(头部)到后端(尾部)的方向,涡虫的前端通常是指它们的头部区域,在许多涡虫中,这个区域包括眼点(感光器官)和集中的神经细胞,形成了一个简单的大脑;涡虫的后端是指它们的尾部区域。这个区域在生理和功能上与头部区别明显;前后轴对涡虫的身体计划至关重要,特别是在再生过程中。涡虫的再生能力特别强大,即使是一小部分组织也能够再生出完整的涡虫。在这个过程中,正确地重建前后轴对于形成一个结构和功能正常的个体是必要的。
【PCG基因】“Positional Control Genes” (PCGs) 在发育生物学中指的是那些控制细胞位置信息的基因。它们在多细胞生物的发育过程中扮演着关键角色,负责确保细胞在正确的位置表达正确的基因,从而形成有序的组织结构和器官。PCGs的表达通常与生物体的体轴(如头尾轴、背腹轴)的建立、维持以及变化有关。
本项目文章亮点在于使用m6A-REF-seq用于单碱基分辨的分析m6A修饰特征,联合荧光信号、RNA-seq等其他数据多角度描述分析涡虫组织再生过程的时空特异性,整个文章对于研究在任何一个生物过程中动态可逆的RNA转录后修饰有着重要的借鉴意义。
研究成果
01
涡虫再生的动态调控
图3:涡虫再生的动态调控
1.1 取材
将再生分为两个阶段:第一阶段(从截肢后0到1天),代表伤口愈合阶段,该阶段在截肢后立即开始;第二阶段(从截肢后3、5、7和10天),特征是在伤口处发生芽胞组织(在伤口处的突起中再生缺失的身体部分)的发展、生长和分化,如图3左所示。为了研究与m6A甲基化相关的动态变化,我们在涡虫再生的不同阶段收集了涡虫的头部、躯干和尾部碎片。
1.2 m6A调控蛋白随时间的变化
很自然的联想是和m6A相关的酶随时间的变化如何?之前的研究已经报道了包括类似甲基转移METTL3、METTL14、KIAA1429、WTAP、Hakai、RBM15/RBM15B和ZC3H13等重要调控蛋白都会影响m6A水平的变化。考虑到物种的特殊性,这些调控蛋白不能像常人、大鼠、小鼠等常规物种中被完全确认与研究,通过分析日本裂头蚴与人类之间的序列相似性,发现METTL3、METLL14和YTHDC1的保守性分别为39.68%、50.73%和44.58%。图3中的结果展示了在RNAi抑制Mettl3、Mettl14、Ythdc1表达后涡虫的变化,发现Ythdc1阅读蛋白的沉默可以导致涡虫体长变短的显著表型。
1.3 m6A的变化
为了更直观的追踪m6A修饰水平的变化,直接使用免疫荧光对m6A水平进行检测。根据荧光信号,m6A在涡虫不同部分的各种细胞中普遍分布,且在皮下细胞中的表达相对较高。在再生过程中,头部和尾部的m6A信号呈现动态增加的趋势,且头部的荧光信号强于尾部。
上述三方面的检测结果表明,m6A修饰在涡虫再生过程中受到动态调节,因此凸显了m6A水平及其作为涡虫再生期间调节因子的潜在作用的重要性。
02
单碱基分辨绘制m6A变化图谱
由于涡虫物种、时序特征、单碱基分辨的特殊性,该研究中数据分析是一个难点,如何围绕已有的多时间点、多位置采样,综合分析m6A的变化是整个研究的关键。
2.1 涡虫基因组的拼接与描述
图4:涡虫基因组unigene的长度分布与BUSCO评估
在这次分析中使用软件Trinity进行组装,图4中的结果显示,单拷贝基因长度分布约为500bp,BUSCO评估显示组装的基因组完整性为84.3%。与公开可用的涡虫数据库PLANARIAN.JP相比,我们还观察到在denovo组装中有更高的映射率,表明本研究中进行组装的基因组能更有效的利用测序数据量对基因表达和甲基化修饰进行分析,提供了更好的参考基因组版本。
2.2头部、躯干和尾部的不同时间点修饰分布
图5:单碱基分辨m6A剖析揭示了涡虫再生过程中m6A修饰的特异性特征
在之前研究中所熟知的,用于分析m6A分布的分析模式同样适用于本研究,在确定了基因组版本的可靠性之后,对该物种的修饰特征进行分析。首先,头部(H)、躯干(M)和尾部(T)的甲基化修饰分布metagene结果同以往m6A修饰的特征类似,集中在终止密码子附近,单看每个部位的不同时间点的motif分析可以看到甲基化修饰的A碱基为中心,下游两个碱基相对保守,上游的两个位置具有碱基摇摆性。图5结果中最重要的部分是检测每个样本中被修饰基因的个数,总体来看H1、M10、T7中检测到被修饰的基因数目最多,其中带有一个m6A位点的基因数目明显多于多修饰位点的基因数目。
2.3 时空变化分析
基于上述分析,头部和尾部片段中识别的m6A位点在RNA中显示出不同的分布偏好,m6A的分布偏好性在A-P轴特化之间可能存在潜在联系。m6A的分布并非随机,而是主要富集在尾部片段的编码序列(CDS)区域和头部片段的3'非翻译区(3’ UTR)区。如图6所示,m6A在尾部的Eef1a-1、Rack-1和Odc-1基因的CDS中富集,由于这些基因已在细胞生长和/或组织发育中被报道,它们的m6A修饰可能与尾部片段前向伤口的再生相关。
分析结果显示,头部和尾部m6A修饰的转录区域差异在第0天就已存在,所以CDS和3’UTR的主要差异在再生之前就已经存在,暗示m6A可能通过m6A位点的优先分布来调节前后轴特化。
接下来很自然的联想是,再生的第一阶段和第二阶段中,m6A是如何被调控的?
图7分析中可以看到的是,在第一阶段的再生过程中(0-1天),m6A的变化发生在编码序列(CDS)以外的区域。相比之下,在第二阶段再生(3-10天)期间,包括CDS在内的所有区域的m6A水平都发生了变化。这些结果表明,m6A的区域和时间特异性特征可归因于涡虫A-P轴特化过程。
2.4 从区域到基因,从基因到功能
为了识别在A-P轴特化过程中受m6A修饰调控的基因,对切除后所有6个时间点的样本进行了不同群集的分析。
结果显示m6A修饰基因确实能区分再生的第一阶段和第二阶段,分别通过两个和四个不同的分子亚群集。这些群集根据m6A值进行排序。每一行是一个m6A甲基化位点,每一列代表不同的样本。
对上述群集进行了GO功能富集分析,图8结果中发现m6A修饰的mRNAs在多个生物过程中具有重要功能,包括转录后和翻译调控,例如mRNA稳定化、RNA剪接、mRNA聚(A)尾短化、蛋白质稳定化、翻译延伸、翻译启动等。这些结果突显了mRNA中m6A修饰在A-P轴规范过程中的动态调控,并暗示m6A修饰的重新配置可能调节基因表达,从而促进再生过程中不同阶段的过渡。
2.5 联合分析,m6A影响转录本水平
m6A的变化伴随的一定是下游生物学信号的变化,m6A影响转录还是蛋白翻译?比较含有m6A和不含m6A的基因在再生不同阶段的整体表达,图9结果显示在头部和尾部片段以及再生的第一和第二阶段,m6A修饰基因的表达更为丰富,即含有m6A的转录物在涡虫片段中比不含m6A的转录物有更高的表达水平。
然而,这种整合表达分析并未使我们能够发现m6A在A-P轴特化过程中的任何调控差异。为了进一步评估m6A修饰和转录之间的关系,对m6A-REF-seq和RNA-seq数据集进行了逐步分析,将基因分类为在再生过程中上调或下调的基因。值得注意的是,在头部片段再生的第一阶段,上调m6A的基因占调控基因的最高比例,这一基因群体显示出m6A和基因表达之间的正相关性(两者均上调)。然而,在第二阶段再生的头部片段中,下调m6A且表达增加的基因占主导地位。相反,再生尾部的第一阶段表现出负相关性,表现为m6A甲基化下调和基因表达上调,而第二阶段表现出正相关性(m6A甲基化和基因表达均上调)。这些结果进一步支持了m6A修饰与涡虫A-P轴规范在再生过程中的相关性,通过阶段依赖的转录调控。
03
聚焦阅读蛋白
3.1 聚焦Reader信息,寻找基因
图11:A-P轴特化相关的潜在m6A修饰PCG基因
做了上文的层层铺垫,在图3的结果中也提示Ythdc1的变化对整个A-P轴的特化过程起到重要影响,但是Ythdc1是Reader蛋白,该蛋白真正有可能识别并发挥调控作用的靶基因有哪些?作为整个文章的落脚点,文章的最后锁定PCG基因,这一类基因对于生物体的体轴(如头尾轴、背腹轴)的建立、维持以及变化有关,比较这些m6A修饰的PCGs的表达水平,未发现m6A修饰与头部或尾部再生中的基因表达之间有明显的相关性,m6A修饰可能不直接针对经典的PCGs,而是针对其他基因群。再生中的头部和尾部在截肢后不同时间点的特定m6A修饰基因之间取交集,以确定相应的m6A修饰基因群集,如图11所示,在再生的头部和尾部碎片中,分别鉴定出80个和13个特异性表达的m6A修饰基因。
3.2 共表达分析用于探索Ythdf1可能的下游靶点分子
这部分基因的功能注释大多数与生长、形态生成和组织再生相关,这表明相关基因可能在涡虫头部和尾部的再生过程中响应并受到m6A信号的调控。
在大多数生物和细胞类型中,m6A在给定的mRNA中的作用是通过m6A阅读蛋白传递。基于之前的研究以及保守性的对比,最终确定Ythdf1阅读蛋白。YTHDC1介导的转录控制在涡虫再生中的机制,通过识别截肢后每个时间点表达模式相似的共调控基因集。这种共表达分析产生了九个不同的簇,一个聚焦于包含m6A读者基因ythdc1的簇的热图显示,头部和尾部碎片之间表达基因的截然相反模式,这些结果表明YTHDC1在A-P轴规范中的不同调控行为。这些基因在转录调控、细胞增殖、mRNA剪接、染色质重塑和形态发育相关的功能注释中富集,进一步研究了ythdc1表达与头部和尾部特异的m6A修饰基因之间的相关性。
总结
该研究是研究RNA修饰在时空特异生物过程中的典型范例,这种研究中通常带有的挑战是样本多、时间点多而导致行文分析混乱,从该研究中可以总结经验:
1)明确实验设计是第一步,无论是发育、重编程、再生等时序过程,都会有标志性的节点信息,应该深入了解整个过程并对复杂但有序的过程进行进一步划分,明确取材和时空特异的对应关系,让读者清楚什么材料说明什么问题;
2)明确上面一点后,分别分析,先对各个位置和时间点进行分析,对于RNA修饰的描述已经有了固定成熟的一套规则,如motif、metagene、pie chart等都是常见的描述信息,这些看似常规的分析任务给后续的差异分析奠定基础;
3)差异和时序分析,cross locations or time point是核心问题,如果采取简单的排列组合,理论上能做非常多的比较,某些比较往往带来的信息是无效的,应该抓主要矛盾,说明哪些比较是有意义的,明确分析主线进行,获取分析线索;
4)明确落脚点,RNA修饰离不开writer、eraser、reader蛋白,根据之前的线索确定有明显变化的调控蛋白(例如本文中的Ythdc1),根据共表达、聚类等,以表达趋势为核心寻找具有相似表达pattern的靶基因作为潜在的调控靶点,并且最终聚焦在功能相关的基因家族;
5)结合表型实验,形态学、功能检测,给出更多的证据,干湿集合,完成文章。
纽科生物希望在新的一年里帮助更多科研工作人员完成对生命科学问题的探索。
【参考文献】
1. N6-methyladenosine RNA modification regulates strawberry fruit ripening in an ABA-dependent manner. Genome Biology, 2021.
2. The RNA m6A landscape of mouse oocytes and preimplantation embryos. Nature Structural & Molecular Biology, 2023.
关于我们
纽科生物提供专业的生物信息学数据分析和高通量测序服务。目前,公司已经和四川大学、复旦大学、上海交通大学、中山医院、华中科技大学等多所医院、高校的研究团队建立了长期良好的合作关系,提供高品质的数据分析和测序服务,帮助客户在European Heart Journal、Circulation Research、Nature Communications等多个著名杂志期刊上发表高水平科研文章,欢迎各位老师前来咨询。