Chestnut Studying
摘要
‘Epigenetics’ is the process by which distinct cell types or cell states are inherited through multiple cell divisions. ‘Epigenomics’ refers to DNA-associated physical and functional entities including histone modifications and DNA methylation, not concepts of inheritance. Conflating epigenetics and epigenomics is confusing and causes misunderstanding of a fundamental biological process.
“表观遗传学”(Epigenetics)是指通过多次细胞分裂将不同的细胞类型或细胞状态遗传给后代的过程。“表观基因组学”(Epigenomics)是指与DNA相关的物理和功能实体,包括组蛋白修饰和DNA甲基化,而不是遗传的概念。将表观遗传学和表观基因组学混为一谈会引起混淆,并导致对基本生物学过程的误解。
正文
“表观遗传学”是指细胞类型或细胞状态的遗传(图1);该术语源自“遗传学”,后者指整个生物体的遗传。表观遗传学的概念是为了描述具有不同细胞类型的多细胞生物的基本特征而发明的。各种细胞类型在遗传上是相同的,但它们具有不同的生物学功能,并具有不同的蛋白质、RNA和其他信息分子的组合。重要的是,这些不同细胞类型的生物和分子特性是通过多次细胞分裂遗传的。例如,肌肉细胞产生肌肉细胞,皮肤细胞产生皮肤细胞。因此,遗传物质不足以提供细胞类型遗传所需的信息:这就是表观遗传学一词的由来。
“表观基因组学”源自“基因组学”,它应该指物理实体,而不是细胞类型和遗传的概念。基因组只是存在于所有细胞中的DNA序列,而表观基因组则包括在体内与DNA紧密相关的其他分子实体(图1)。这些实体包括组蛋白(其占用水平决定蛋白质与DNA的接触程度)、组蛋白修饰(例如在多个残基上发生的乙酰化、甲基化或磷酸化)以及DNA甲基化(及相关形式)。通常情况下,最实用的表观基因组学定义不包括序列特异性DNA结合蛋白以及由DNA结合蛋白(例如核小体重塑酶、组蛋白乙酰化酶和甲基化酶)招募的染色质修饰复合物,它们既产生表观基因组,又作用于表观基因组。
与不变的基因组不同,不同类型的细胞具有截然不同的表观基因组(图1)。此外,同一细胞类型的单个细胞的表观基因组之间存在密切联系,但并不完全相同。表观基因组是动态的,会因环境条件和细胞分化而迅速变化。
表观遗传学和表观基因组学之间的区别不仅仅是语义上的,而且对于科学清晰度也很重要。遗憾的是,当表观基因组学更合适时,表观遗传学一词却被频繁使用。例如,组蛋白修饰通常被称为“表观遗传标记”,维基百科将表观基因组定义为“细胞遗传物质上的一整套表观遗传修饰”。
除了将遗传概念与生物化学实体混为一谈之外,许多组蛋白修饰处于动态平衡状态,与表观遗传无关。相反,在某些情况下,在表观遗传中起作用的组蛋白修饰(例如甲基化的H3-K9和H3-K27)通常出现在不参与表观遗传状态的基因组位置。同样,虽然DNA甲基化通常有助于表观遗传的遗传,但一些与肿瘤发生相关的DNA甲基化事件并不以表观遗传的方式遗传,而且许多DNA甲基化位点与表观遗传学无关。因此,不应将组蛋白修饰和DNA甲基化称为“表观遗传标记”,而应称为“表观基因组标记”,对组蛋白修饰或DNA甲基化的基因组分析应称为表观基因组分析,而不是表观遗传分析。
从机制上讲,表观遗传的遗传是通过正反馈回路介导的,而正反馈回路最终由序列特异性的DNA结合转录因子控制(图1)。在第一个例子中,在哺乳动物细胞中,将转录因子MyoD外源引入到各种细胞类型中,可以将它们转化为肌肉细胞,并稳定地维持许多代。同样,外源引入Oct4、Sox2、Klf4和Myc可将许多细胞类型重新编程为诱导性多能干细胞(iPS)细胞;转录因子的其他组合可产生其他稳定的细胞类型。iPS细胞不仅能够稳定维持,而且经过适当处理后还能分化成特定的细胞类型。在涉及细胞状态而非细胞类型的继承的相关情况下,瞬态炎症信号可以启动自我持续的炎症反馈回路,将未转化的细胞转化为已转化的细胞(An epigenetic switch involving NF-kB, lin 28, let-7 microRNA, and IL6 links inflammation to cell transformation. Cell)。
由于引入的基因或环境信号是暂时存在的,它们只能启动,而不能维持稳定的细胞状态。当引入的基因存在时,它们会表达转录因子,激活编码相同转录因子的内源基因,以及组成天然生物体中正反馈环的其他转录因子。此外,这些关键的转录因子以适合细胞类型生物功能的方式调节基因的表达。一旦建立正反馈回路,在没有初始信号或引入基因的情况下,细胞状态可以稳定地维持多代。在这方面,通过瞬时引入编码关键蛋白的mRNA或蛋白本身,可以启动重新编程为新的稳定细胞类型。相比之下,染色质修饰活动缺乏转录因子的调节特异性,因此不足以建立或维持细胞类型。事实上,转录抑制因子在大肠杆菌中通过细菌噬菌体λ的裂解和裂解状态进行表观遗传学遗传,而大肠杆菌缺乏染色质,因此缺乏所有表观遗传标记。
在多细胞生物的发展过程中,不同的细胞类型有序地产生或消失。在此过程中,发育和/或环境信号会改变关键转录因子的水平和/或活性,从而形成新的正反馈回路并使原始反馈回路失活(图1)。新的细胞类型会稳定地遗传下去,直到下一个信号改变活跃转录因子的组合,从而影响发育途径的后续步骤。因此,自然发育过程中发生的允许细胞类型表观遗传遗传的正反馈环的产生,在机制上类似于通过关键转录因子的瞬时表达进行的人工重编程。
虽然转录因子介导的正反馈环是细胞类型表观遗传遗传的主要决定因素,但一些表观基因组标记在表观遗传遗传中起着重要作用(图1)。与关键转录因子不同,这些表观遗传标记不会直接和积极地影响特定细胞类型的表观遗传遗传和基因表达谱。相反,这些表观遗传标记对于异染色质基因沉默非常重要,这些基因不会影响甚至可能干扰特定细胞类型的遗传。异染色质基因沉默对于完全阻断特定细胞类型不合适的正反馈回路和发育途径是必要的。
异染色质沉默的三个经典例子涉及表观基因组标记及其相应的沉默蛋白(图1):Sir蛋白和去乙酰化组蛋白(仅存在于酵母中)、异染色质蛋白1(HP1)和H3-K9甲基化以及Polycomb复合物和H3-K27甲基化。在这三种情况下,表观遗传标记通过基于染色质的正反馈回路在多代间遗传。具体来说,沉默(或相关)蛋白将标记放入染色质中,并优先与具有相同标记的染色质结合,从而产生表观遗传记忆(图1)。此外,这些沉默蛋白与染色质的结合会受到转录相关标记(例如H3-K79和H3-K4甲基化)的抑制,这些标记是通过延长RNA聚合酶II招募的组蛋白甲基化酶引入的。这是一个相互的正反馈回路,其中转录抑制阻止H3-K4和H3-K79甲基化,从而增加沉默蛋白与缺乏这些修饰的区域结合。重要的是,这些表观遗传记忆机制会增强但不会决定表观遗传状态。
DNA甲基化在许多但并非所有真核生物中发生,它通过不同的机制来增强表观遗传状态(图1)。维持DNA甲基化酶强烈倾向于作用于半甲基化的底物,其中甲基化的CpG残基仅存在于DNA双链中的一条链上。这种半甲基化的底物是在DNA复制时产生的,此时新的双链在原始DNA链上包含甲基化的CpG,但在新合成的链上不包含甲基化的CpG。然后,维持DNA甲基化酶对相应的CpG残基进行甲基化,从而恢复两个子细胞的全甲基化状态。然而,在某些肿瘤抑制基因座上,维持DNA甲基化酶在细胞分裂时不能有效地恢复DNA甲基化,DNA甲基化需要持续招募DNA甲基化酶[4]。在这种情况下和其他情况下,一些基因的沉默涉及DNA甲基化和基于组蛋白修饰的机制。
通常,这种表观遗传标记通过特定DNA结合蛋白或新生双链RNA招募酶活性,靶向特定基因组区域,这种靶向有助于维持异染色质状态。然而,即使在缺乏招募蛋白或RNA的情况下,基于染色质的正反馈回路仍具有一定的维持沉默状态的能力。在这方面,在某些情况下(例如印记或X染色体失活),异染色质沉默只发生在两个亲本等位基因中的一个上,从而排除了简单的招募模型。
真核生物的表观基因组是复杂且不断变化的实体,具有多种组蛋白修饰和甲基化DNA残基。转录和其他基于DNA的进程与表观基因组标记相互作用,并受到其强烈影响,其中许多标记与表观遗传学无关。一些表观基因组标记是表观基因组记忆机制的一部分,它们通过沉默介导不适当发育途径的基因,在增强表观遗传状态方面发挥着关键作用。然而,不同细胞类型的遗传最终是由控制自我延续调节电路的DNA结合转录因子介导的。因此,为了避免对基本生物学过程的混淆和误解,表观遗传学(细胞类型的遗传)和表观基因组学(DNA模板的物理性质)的概念应该明确区分。
The distinction between epigenetics and epigenomics. Trends in Genetics. 2024