DNA甲基化是一种重要的表观遗传修饰方式,在基因调控、基因组稳定性、细胞分化和发育等方面起着关键作用。自从上世纪初首次提出染色体遗传学说以来,科学家们对DNA甲基化的研究经历了漫长而丰富的过程。本文将通过Trends in Genetics中的综述文章DNA methylation: a historical perspective,带大家系统回顾DNA甲基化的发展历史,展示其在科学研究中的重要里程碑和发现,揭示DNA甲基化研究的前世今生。
DNA甲基化(5-甲基胞嘧啶,5mC)的发现
1925年,Johnson和Coghill首次从结核分枝杆菌中分离得到5mC。1948年,Hotchkiss利用色谱法在牛胸腺DNA样本上观察到在胞嘧啶附近有一个微弱的条带,表现得像胞嘧啶,称为外胞嘧啶(Epi-cytosine)。1950年,Wyatt证实了5mC广泛存在于哺乳动物、昆虫和植物DNA中。1954年,Sinsheimer指出5mC并非随机分布在基因组DNA中,而是以CpG二核苷酸形式存在。
从1925年首次发现5mC,但对其研究一直很缓慢。原因在于当时还不清楚核酸是遗传物质,而后来1928年Frederick Griffith的转化实验,1944年Avery-MacLeod-McCarty实验,第二次世界大战的结束,1952年Hershey-Chase实验,以及DNA双螺旋结构的解析,为探索DNA中5mC可能的相关性奠定了必要的基础。同时发育生物学家Conrad Waddington在1942年提出了“表观遗传学”,并于1957年发表了他的表观遗传学理论。然而,直到DNA甲基化的功能在随后的几十年研究里变得更加清晰,这些概念才与DNA甲基化联系起来。
DNA甲基化的主要作用发现和探索历程
1965年,Arber首先提出了细菌中具有限制性内切和修饰系统(R-M系统)。其中甲基化敏感的“限制性内切酶”通过消除病毒的DNA来保护细菌宿主免受入侵病毒的侵害,而细菌DNA不受影响。1966到1968期间,Billen观察到细菌DNA甲基化与DNA复制之间的联系。正常的大肠杆菌生长过程中,DNA甲基转移酶活性在复制叉后很明显,其中5mC完全放置在未甲基化的新生DNA链上。Srinivasan和Borek认为5mC在细菌中起着决定性作用,因此类似的机制可能在真核生物中起作用,这可能是其细胞类型多样性的基础。四年后,他们报告了胚胎和成年大鼠不同组织的核提取物中DNA甲基转移酶的活性,并测试了它们对不同物种DNA甲基化的能力。这些实验表明,一些提取物如肾脏或肝脏,比大脑提取物具有更强的甲基转移酶活性。也意味着同一生物体的不同组织可能具有不同的5mC含量。
DNA甲基化的第一个生物学作用是从对细菌免疫和DNA复制基础的研究中收集到的,尽管尚不清楚这些功能是否会在高等生物中保守。一个关键的进展是基于发现的酶负责添加甲基到核酸聚合物的胞嘧啶。这表明DNA甲基化是可以调控的,从而为特异性靶标修饰提供了一条途径。
1970年,Vanyushin通过质谱量化了许多动物不同细胞类型中存在的5mC水平,包括海绵、软体动物、海胆、硬骨鱼、两栖动物、爬行动物和哺乳动物。虽然GC和5mC含量在物种之间可能存在差异,但在近亲物种之间往往更为相似,在不同组织之间通常具有可比性。1975年,Holliday等人发表三篇综述思考和研究DNA甲基化生物学作用,认为5mC在调节基因表达和协调发育中发挥作用。而限制性内切核酸酶的发现是促进DNA甲基化研究的关键一环。限制性内切酶首次从大肠杆菌和流感嗜血杆菌中被分离出来,其中HpaII能够识别和切割未甲基化的CCGG位点。1978年,HpaII的同分异构体MspI被发现能够定位全基因组中所有甲基化的CCGG位点。这对酶最终使研究人员能够确定特定CpGs在其局部序列背景下的甲基化状态。
20世纪70年代,关于DNA甲基化在基因调控中的作用的研究和假设模型都取得了显著进展。在本世纪末,该领域对物种内和物种间的DNA甲基化有了很好的认识,DNA甲基化作为基因表达的抑制因子被普遍接受。
启动子甲基化和CpG岛的发现
从20世纪70年代中期到80年代中期,体外和体内克隆以及转基因技术的发展使一系列新的实验能够探索DNA甲基化的序列背景和功能作用。1982年,Gjerset和Martin发表了从小鼠红细胞分离的核质中发现去甲基化活性的初步证据。1983年,对一些未甲基化基因转录不活跃的现象观察表明,仅仅甲基化缺失或缺乏并不一定会导致基因激活。还有报告发现组织特异性基因活跃,但整个基因的甲基化程度很高。此时关于甲基化何时何地作为基因抑制因子以及甲基化去除如何导致基因激活依然是一个谜。1985年,Bird和他的同事发现精子总体上是高度甲基化的,但在精子细胞的组成表达基因中也有低甲基化区域。随后对这些区域进一步表征发现其富含CpG,且它们对HpaII核酸酶切非常敏感。最初这些片段被命名为HpaII微小片段,后被命名为CpG岛(CpG islands,CGI)。1987年,Monk等人应用了一种新的低输入DNA末端标记技术来评估生殖细胞、受精卵和早期发育的小鼠胚胎中的DNA甲基化,鉴定胚胎发育期间的甲基化变化。1988年,Bestor及其同事在成功克隆了小鼠DNA甲基转移酶1 (Dnmt1),这是第一个哺乳动物DNA甲基转移酶。
20世纪80年代提供了对DNA甲基化总体分布和功能的重要见解,包括CGI的发现和对5mC在基因调控中的作用的大大提高的理解。十几种细菌和第一批哺乳动物甲基转移酶的成功克隆和鉴定代表了另一个里程碑。尽管普遍的共识是5 '启动子甲基化抑制转录,但这一规则的一些例外突出表明,仍需要进一步的研究来理解和解释DNA甲基化在特定环境中的作用。
真核生物DNA甲基转移酶的发现和鉴定
1990年,Bird注意到某些CGI在体外培养过程中有异常甲基化的倾向。一般CGI通常位于开放的、可接近的染色质中,因此推测,在正常发育和组织稳态过程中,必须积极保护其不被甲基化。1992年,Jaenisch实验室破坏了小鼠Dnmt1活性,导致体外和体内DNA甲基化的大部分(但不是全部)整体丧失,表明Dnmt1是维持整体甲基化所必须的。20世纪90年代,不同的研究小组利用基于同源性的BLAST搜索,独立鉴定了其他真核生物DNA甲基转移酶。这些研究奠定了后面Dnmt2识别半甲基化的DNA,维持DNA甲基化和Dnmt3A和Dnmt3B负责从头甲基化 (de novo methylation)的理论基础。
20世纪90年代主要探讨了哺乳动物DNA甲基转移酶和具有甲基结合结构域的5mC读取器的功能评估以及转录抑制的研究。基因组甲基化的重要作用(尽管尚未完全理解)帮助科学界对DNA甲基化产生了更广泛的兴趣。尽管令人兴奋,DNA主动去甲基化如何发生的问题在这个十年结束时仍然没有得到解决。
全局甲基化图谱建立与组蛋白修饰的联系
21世纪初,随着拟南芥、小鼠和人类基因组组装草案的完成,生命科学领域迎来重大革命,这些基因组图谱完成极大地促进研究表观基因组的发展。1992年首次报道的亚硫酸氢盐测序技术成为量化和定位DNA甲基化的金标准。
2000年,两项研究发现了Igf2/H19 印迹控制区(imprinting control region, ICR)中的四个CCCTC结合因子(CTCF)结合基序的甲基化缺失阻止了CTCF的结合,从而降低了ICR的增强子阻断活性,表明启动子外的甲基化也具有影响基因表达的调控机制。2001年,Tamaru和Selker发现粗神经孢子虫(Neurospora crassa)的基因dim-5是正常DNA甲基化模式所必需的,该基因编码一种组蛋白甲基化(H3K9)催化酶,这表明H3K9甲基化是一些DNA甲基化的上游所必需的。该研究将DNA甲基化和组蛋白甲基化联系起来,指出真核DNA甲基化可能依赖于特定的组蛋白修饰指导。2006年,利用酶和抗体进行5mC富集,然后进行微阵列杂交,在拟南芥基因组建立第一个全基因组DNA甲基化图谱。以往拟南芥中的研究已经发现了重复序列和转座元件的DNA甲基化,而基因组范围的甲基化图谱证实并扩展了这些结果。2008年,Meissner等通过亚硫酸氢盐还原测序(RRBS)报道了小鼠胚胎干细胞、胚胎干细胞衍生和原代神经细胞以及其他八种原代组织的 DNA 甲基化图谱,表明不同分化过程中各种元件(如保守的非编码元件、转座子)的甲基化模式。2009年,Lister等构建了哺乳动物中首个全基因组单碱基分辨率的DNA甲基化图谱,发现了数百个与多能性和分化有关的基因附近的差异甲基化区域,以及与转录活性降低相关的成纤维细胞中普遍降低的甲基化水平,为未来研究探索人类疾病和发育中这种关键表观遗传修饰奠定了基础。同年,Tahiliani发现 DNA去甲基化途径,TET1 能够在体外和体内将 5mC 转化为5-羟甲基胞嘧啶(5hmC)。后续Kriaucionis和Heintz相继发表的论文也证明5hmC在神经元中丰富,进一步强化了5hmC在主动去甲基化途径中的作用。
这十年提供了对DNA甲基化全基因组分布的关键见解,加上机制和结构检测技术的进步,建立了一个更全面的DNA甲基化观点。然而,大多数启动子实际上不受5mC的调控,这一发现促使人们从以启动子为中心的观点转向更全面、更全面的方法来理解DNA甲基化。重要的是,5mC与其他表观遗传修饰的相互联系,如组蛋白H3K9和组蛋白H3K4的甲基化。
DNMT的招募机制和全基因组甲基化
在这十年间进一步扩展了5mC的基本原理及其在基因组调控中的作用,测序技术的灵敏度、通量和可负担性的提高使一系列新的图谱研究成为可能,为许多新的见解提供了基础。比如DNA甲基化与转录因子的串扰,DNA甲基化谷,DNMT的变构调节,de novo DNMT的招募和定位,以及发育和疾病中的整体甲基化改变等。
利用测序技术绘制来自不同生物体的数百种细胞类型和发育阶段的甲基组图,改进了过去5mC几十年的见解,解释了一些重要的知识空白,并全面概述5mC的分布。结合结构研究,科学家们对DNMT的募集和活性调节,以及DNA甲基化对基因调控的影响有了更加详细的探究,但仍然有一些问题等待去探索。
这篇综述记录了DNA甲基化领域从开始到现在的时间顺序概述,这一历史视角突出了记录该领域创新和巨大进步的关键实验。DNA甲基化的许多核心概念是在20世纪90年代建立起来的,然而,最近的一些研究依然会更新我们的认知。自从在细菌中发现首次5mC以来,已经接近一个世纪的尾声,该领域已经非常成熟,DNA甲基化现在经常被用作研究其他生物过程和疾病表型的工具。尽管如此,在对这种微小但重要且有影响的DNA化学修饰有了完全的了解之前,仍有一些问题需要在未来解决。
艾斯基因创建于2016年,隶属于国家高新技术企业和创新型中小企业。核心团队是国内最早一批表观多组学科研技术开拓者之一,在Nature、Cell等顶级期刊发表论文数十篇。公司全力打造赋能基础科研、精准医学及人群队列研究的“创新多组学1+N”技术服务体系,服务于每一个合作项目。每年为70+海外和国内企业客户、200+高校和医院等客户提供20000+例样本的技术服务。