技术创新丨“颠覆认知,DNA碱基居然不止ATGC这四个”

文摘   2024-11-27 20:41   广东  

01
序言

基因是生物体遗传信息的载体,它们决定了生物体的各种特征,从外表到内在,从发育到行为,因此被称为生命的“蓝图”和“程序”。人类基因程序的底层代码主要由四种碱基(A、T、G、C)按照特定排序构成。除了这四种常规碱基外,人类 DNA 中还存在四种非常规碱基:mC(5-甲基胞嘧啶)、hmC、fC 和 CaC。虽然这些非常规碱基在 DNA 中的含量不高,但它们在基因表达调控中扮演着重要角色。mC 是最早被发现且研究最深入的非常规碱基,其平均含量约占所有 C 碱基的10%。mC 具有特殊的生物学意义,它不仅决定了细胞的种类(如体细胞、生殖细胞、神经细胞),还影响了同卵双胞胎在长相和患病倾向上的差异。此外,mC 还与环境因素相关,例如,一个焦虑的老鼠妈妈可能会生下焦虑的后代,并且这种焦虑特质可以遗传给后代,即使最初的恶劣环境已经消失。hmC、fC 和 CaC 是最近发现的非常规碱基家族成员,它们在细胞中的含量更为稀少。尽管如此,这些碱基在中枢神经系统和胚胎干细胞中的含量较高,这表明它们在生物学上可能具有特别的意义,而不仅仅是为了存在。下面我们将为您带来 mC 和它的新碱基朋友们的故事。

图1 基因组中的“变数”——胞嘧啶和它的朋友们

上面我们提到 mC 的生物学作用都属于表观遗传学(Epigenetics)的研究范围。众所周知,DNA 序列的改变(也叫基因突变)往往能够明显改变生物的性状,也是很多遗传疾病的重要原因。而表观遗传学研究主要关注在 DNA 序列不变的情况下,由于蛋白质和核酸的化学结构改变而导致的可遗传基因表达或表型变化(图2A)。组蛋白修饰和 DNA 甲基化是表观遗传学中两种常见的修饰。在蛋白质水平上,组蛋白的修饰(如乙酰化、N-末端组蛋白尾部的甲基化)通过改变自身及其周围组蛋白的结构形态来调控基因表达,从而影响 DNA 的缠绕方式,维持分化细胞的状态(图2B)。在核酸水平上,DNA 甲基化通过 DNA 胞嘧啶-5-甲基转移酶(DNMTs)在胞嘧啶的 C5位添加甲基,将其转化为 mC),可以激活或抑制基因表达。长期以来,mC 被视为基因组的第五种碱基及表观遗传标记。与组蛋白修饰相比,DNA 甲基化在细胞分裂中更为稳定,并能够通过基因印记从亲代遗传,使得表观遗传信息能够代代相传。DNA 甲基化在细胞分化、基因组印记、X 染色体失活和癌症发生等许多过程中扮演着重要角色(图2C)。

图 2  表观遗传与一般遗传在分子生物学层面的区别(A);表观遗传调控的两种形式:DNA 甲基化和组蛋白修饰(B);表观遗传学:孩子成年后的抑郁可能与妈妈的早期生活压力有关(C)。参考出版物《Epigenetics: A Missing Link Between Early Life Stress and Depression》《Interactionsofearly-life stress with the genome and epigenome: from prenatal stress to psychiatric disorders》。


02
为什么 mC 能够抑制基因表达?

mC 与常规碱基 C 的唯一差别是在碱基的芳环外多了一个甲基(-CH3)。mC 就是利用这小小的甲基,通过两种方式成为了抑制基因表达“小能手”。第一种方式是空间结构上的。首先,mC 上的甲基团在立体上干扰蛋白质与其目标 DNA 序列的结合(图3A)。换言之,mC 的甲基“顶住了”蛋白结合 DNA 的位点,使其无法靠近。其次,甲基化都是在一段 DNA 序列中连续大量存在的。许多 mC 分子间的甲基形成了很强的非共价吸引,导致染色质结构的紧缩,从而减少转录因子和其他调控蛋白的结合能力,抑制特定基因的转录(图3B、C)。另一种情况下,甲基不是阻碍蛋白结合,相反,甲基化的 CpG 能够被一类称为5-甲基-CpG 结合蛋白(如 MeCP2、MBD1、MBD2、MBD3)特异性识别并结合。这些蛋白的结合就阻止了其他负责转录的酶的进一步结合,从而将这段基因“锁住”,无法被打开进行转录。

图3  mC 抑制基因表达的两种途径(A); DNA 甲基化和组蛋白标记共同作用,使得染色体收缩,抑制 GFP 基因表达(B);移除 mC 标记后,染色体得以打开,可以进行转录(C)。


03
被动去甲基化与主动去甲基化

DNA 甲基化水平并不是只能单向增加,细胞在不同生命阶段其甲基化水平可能发生减少。研究人员在胚胎干细胞,神经细胞,肿瘤细胞等细胞的不同生理阶段都观察到了甲基化水平降低的现象。在胚胎细胞的细胞分裂过程中,通常会观察到全基因组的 mC 去甲基化现象。这一过程通常被认为是 DNA 复制与 DNA 甲基转移酶(DNMT)抑制共同作用的结果。如图4所示,受精卵从刚刚形成到桑椹胚(morula)阶段,父源和母源 DNA 的甲基化水平都发生了明显下降。有趣的是,父源 DNA 和母源 DNA 的去甲基化过程采用了2种不同机理。从图中可以看出,母源 DNA 甲基化水平随细胞数量增加而降低。这是由于在这个阶段,负责甲基化的 DNMTs 被阻止进入细胞核完成其甲基化的工作,从而导致细胞分裂时新合成的 DNA 不再含有 mC。这样单个细胞内 mC 的含量就随着 DNA 的复制而被新生成的 DNA “稀释”了。上面的过程称为被动去甲基化。

图4 小鼠早期胚胎发育过程中的甲基化水平

而对于父源 DNA,情况则完全不同。父源 DNA 的甲基化水平在受精卵形成6小时内就迅速下降了,而这时细胞还没有进行分裂。因此,受精卵一定是进行了“主动”的去甲基化。实际上,人们对植物中的主动 DNA 去甲基化途径是有一定认识的,因为找到了一系列能够识别 mC 进行主动去甲基化的酶。例如糖基化酶/裂解酶 ROS1(repressor of silencing 1)和糖基化酶Demeter(DME),具有去甲基化酶活性。然而,在哺乳动物里,至今未发现功能相近的酶。因此,哺乳动物细胞主动去甲基化的机理长期成迷。直到2009年,两个研究团队分别独立在鼠脑细胞和胚胎干细胞中证明了 hmC 的存在,对表观遗传学的研究起到了重要推动作用。事实上,1950年代人们就在噬菌体中发现了 hmC。但是,这次的发现使得 hmC 成为哺乳动物细胞主动去甲基化的重要中间体。随后,科研人员在两年内又发现了两种新的表观遗传学碱基,hmC 的氧化产物,5-甲酰胞嘧啶(fC)和5-羧基胞嘧啶(CaC),提供了主动去甲基化的更多可能路径。

04
表观遗传学新碱基的主动去甲基化假说

从化学结构上看,hmC、fC 和 CaC 是 mC 在不同氧化阶段的产物。然而,通过化学氧化方法,不破坏 DNA 的其他碱基或糖环结构,而高效且可控地将 mC 依次转化为 hmC、fC 和 CaC 是非常困难的。这一点,作者似乎有深刻的了解。相比之下,酶的作用就显得容易得多。研究人员发现,TET 酶(Ten-eleven translocation 酶,一种依赖铁和α-酮戊二酸的双加氧酶)能够催化 mC 在 C5位的甲基氧化。mC、fC 和 CaC 都是 TET 酶催化氧化 mC 的产物,它们之间的差异在于氧化程度的不同。

主动去甲基化是一个复杂的生物学过程,有多种酶和系统参与其中。该过程首先由 TET(催化,mC 被氧化为 hmC,随后进一步转化为 fC 和 CaC。这两种中间产物作为碱基切除修复(base excision repair,BER)酶的底物,可以被如胸腺嘧啶 DNA 糖苷酶(Thymine-DNA glycosylase,TDG)和单链选择性单功能尿嘧啶-DNA 糖苷酶(Single-Strand Selective Monofunctional Uracil-DNA Glycosylase,SMUG)等酶识别并切除,形成无碱基位点。接着,DNA 聚合酶可以用正常的胞嘧啶 C 填充这些无碱基位点,完成去甲基化过程。

此外,hmC 在经过去氨反应后可转化为5-羟甲基尿嘧啶(hmU),这一过程由激活诱导的胞苷去氨酶(AID)和载脂蛋 B mRNA 编辑催化肽(Apolipoprotein B mRNA Editing Catalytic Polypeptides,APOBECs)催化,形成 U-G 错配。这种错配同样能通过 BER 途径被有效修复,以恢复原始的 C-G 碱基对。主动去甲基化不仅在胚胎干细胞的发育过程中起着关键作用,还在正常生理和病理过程中(如肿瘤发生)中发挥重要的调控功能。通过这一过程,细胞能够灵活调节基因表达,适应不同的环境和发育阶段。

图5 哺乳动物 DNA 去甲基化的可能路线


05
表观遗传学新碱基的检测

表观遗传学新碱基的研究离不开各种针对性的检测工具。目前,5-甲基胞嘧啶(mC)的检测常采用 Bisulfite 测序技术,该技术通过亚硫酸盐处理将 mC 转化为碱基 T。通过比较亚硫酸盐处理与未处理样品的测序结果,可以确定 mC 在 DNA 序列中的具体位置。在甲基化测序领域,Salus Pro 基因测序仪展现出卓越的性能(具体数据评测结果详见数据评测丨Salus Pro基因测序仪在全基因组甲基化测序表现卓越)。

hmC 的最早发现和验证采用了一种非常“传统”的检测手段——二维薄层层析(2D-TLC)。这是一种在有机化学中常用的 TLC 点板技术的二维形式。尽管方法传统,但它非常有效,成功证明了 hmC 的存在,并在《Science》杂志上发表。当然,这种方法主要用于定性分析,几乎无法进行定量检测。早期对这些新碱基的定量检测主要依赖于质谱技术。随着科研人员在检测技术方面的不懈努力,逐渐发展出多种改进方法。这些方法包括制备特异性荧光探针、改良免疫沉淀技术,以及结合现有测序技术实现单碱基分辨率的表观遗传学新碱基检测(图6)。详情参考《Chemical Methods to Identify Epigenetic Modifications in Cytosine Bases》。

图6  不借助 Bisulfite 测序直接检测 fC,达到单碱基分辨率

参考文献:

1.DNA demethylation. (2024, October 31). In Wikipedia. https://en.wikipedia.org/wiki/DNA_demethylation.

2.N M, Kumar PS, Manna D. Chemical Methods to Identify Epigenetic Modifications in Cytosine Bases. Chem Asian J. 2024 Feb 1;19(3):e202301005.

3.Saavedra K, Salazar LA. Epigenetics: A Missing Link Between Early Life Stress and Depression. Adv Exp Med Biol. 2021;1305:117-128.

4.Cruceanu C, Matosin N, Binder E B. Interactions of early-life stress with the genome and epigenome: from prenatal stress to psychiatric disorders. Current Opinion in Behavioral Sciences, 2017, 14: 167-171.







关于赛陆医疗


赛陆医疗创办于2020年,是国家高新技术企业和国家专精特新小巨人企业,专注于开发自主知识产权的上游测序平台,并基于其上构建了全球领先的超分辨空间组学平台,实现基因组学和空间组学产品的自主开发及科研临床端转化。公司突破了以往测序和组学产品在通量、成本、分辨率、自动化等方面的瓶颈,取得欧盟 CE-IVDR 等多项关键认证。公司发展迅速,现拥有国际领先的测序和组学平台,可以为中下游应用提供全面的解决方案,产品畅销海内外。





往期推荐
Historical articles

携手并进丨赛陆医疗与博尔诚签署战略合作协议,共推肿瘤精准防治



喜报丨赛陆医疗荣获国家级专精特新“小巨人”称号!



迅捷精准·靶握先机!丨赛陆医疗Saluseq Nimbo正式全球发布



专访丨从基因到健康:赵陆洋博士的科学探索与创业之路






Contact


公司地址:深圳市光明区凤凰街道塘尾社区恒泰裕大厦1栋2001

公司电话:0755-2374 5832

电子邮箱: info@salus-bio.com

与时竞“赛”,开启测序自由之“陆”!



赛陆医疗
以自主研发顶尖自动化、智能化空间生物学基础设施为己任,以透视基因组、转录组、表观组、代谢组、蛋白组的功能及相互作用网络为目标,打造探索人类生命构造的理想工具。
 最新文章