文献分享 | PNAS.:建立DNA甲基转移酶功能模型来预测健康细胞和癌细胞中的表观遗传关联模式

文摘   2025-01-25 18:47   宁夏  

供稿:刘玮,武汉大学

校稿:李天洲,武汉大学

推送:李天洲,武汉大学


    今天给大家分享的文献发表在Proceedings of the National Academy of Science上,标题为Modeling DNA methyltransferase function to predict epigenetic correlation patterns in healthy and cancer cells,通讯作者是斯坦福大学材料科学系的Andrew J. Spakowitzb教授。



      DNA甲基化是指在基因组的关键位置上将甲基标记共价添加到胞嘧啶核苷酸上。在哺乳动物中,甲基化最普遍发生在胞嘧啶磷酸鸟嘌呤二核苷酸上,即CpG位点,这些位点在基因组中分布不均匀。大多数基因组在高密度CpG区域(CpG岛)之外的CpG位点上都很稀疏。在细胞复制时,DNA甲基转移酶(DNMT)会在整个DNA序列中重现和维持甲基化模式。DNMT有三类:DNMT1、DNMT2和DNMT3,其中,DNMT2的作用尚未得到广泛研究,而DNMT1和DNMT3的功能有更多的认识。目前认为DNMT3负责从头甲基化,这种从头甲基化在胚胎发育过程中最为普遍;DNMT1通常充当DNA甲基化维持蛋白,确保新合成DNA的甲基化模式与母链相匹配甲基标记的正确模式是确保细胞正常运作所必需的,DNMT1功能异常可能导致癌症、神经发育障碍和其他健康状况等疾病。但人们对不同细胞类型中如何建立不同的甲基化谱了解甚少。确定影响独特甲基化谱建立的因素对于揭示细胞分化的复杂性和导致表观遗传相关疾病的机制非常重要。在本研究中,作者开发了一个模型,该模型可以捕捉DNA甲基转移酶在多尺度DNA环境中经历促进扩散过程的传输行为。在模型中,作者将DNA甲基转移酶设定为在DNA结合状态和非结合状态之间交替的粒子,将DNA模拟为聚合物链,该聚合物链表现出体内染色体DNA中看到的生物学相关行为。

      扩散模型定义了一个扩散粒子,它参与与聚合物链结合和解离的交替过程,如图1所示。粒子在束缚状态下的传输由概率函数(或格林函数)Gon控制,粒子在非束缚状态下的传输由Goff控制。整个传输过程可以在束缚状态和非束缚状态之间任意次交替。其中粒子沿DNA进行一维扩散,由函数Gon描述,并在整个核质中解离和三维扩散,由函数Goff描述。图1仅显示了该过程的两个步骤,该过程可以包含无数次结合状态和非结合状态之间的切换。结合状态下蛋白质的运输取决于其结合扩散率Don和其解离速率ku。同样,其非结合运输取决于其在整个核质中的扩散率Doff和结合率kb


图1 促进扩散过程示意图


      描述DNA聚合物的物理模型如图2所示,该模型被用来捕捉实验中观察到的多尺度行为。该模型确定了染色体DNA不同长度尺度下的三种不同行为模式,这三种行为模式是通过分析不同基因组长度下的DNA循环概率来确定的:在短长度(小于30 kb)下,DNA表现出类似于高斯链的循环概率幂律缩放;在中等长度尺度(约30至400 kb)下,染色体DNA表现为分形球体,这是因为黏连蛋白的存在,黏连蛋白在基因组中积极形成环;在较大的长度尺度(大于400 kb)下,DNA恢复到高斯链的行为。


图2 描述染色体DNA多尺度特性的示意图


      图3显示了DNA甲基转移酶在时间t内参与所述促进扩散过程时在每个基因组位置s上花费的总时间。该图表明,随着时间的增加,甲基转移酶会探索更多的基因组区域。平均时间的稳定期会延伸到更远的距离。在足够长的时间里,分布达到饱和,表明存在稳态探索分布。这种稳态探索时间取决于DNA甲基转移酶的转运特性,可以预测细胞复制后建立并在间期维持的稳态甲基化模式。



图3 DNA甲基转移酶在时间t时进行基因组探索的平均时间


      接下来,作者评估了结合距离lonlon:单个结合事件期间粒子的平均转位距离)如何影响探索分布。图4A展示了具有不同结合距离的蛋白质的稳态探索分布,这些蛋白质适用于染色体的生物相关多尺度模型(实线)和高斯链聚合物(虚线)。在纯随机游走和多尺度聚合物模型中,探索分布都表现出平台期,当lon增加时,该平台期会延伸到更远的距离,这说明在结合状态下行进更远距离的蛋白质将花费更多时间探索基因组的近端区域,然后再通过非状态跳跃运输到远端区域。当lon足够大时,多尺度环境中的探索分布与纯高斯链环境中相应蛋白质的探索分布没有区别。图4B显示,具有较短跳跃距离的蛋白质表现出具有较长平台期的探索分布,即loffloff:单个关闭状态下粒子的平均移位距离)的贡献与lon的作用相等但相反。以上结果说明,在较大的lon值和较小的loff值下,不同DNA环境中的探索分布没有差异。


图4 具有不同结合易位距离lon的甲基转移酶的稳态探索分布,loff = 10


      随后,作者通过定义甲基转移酶的甲基化速率κm,以建立指定基于甲基转移酶活性的甲基标记的模型。κm描述了一种蛋白质,它在结合时以某种速率κm沉积甲基标记。一个位点是否被甲基化取决于蛋白质在一个位点上停留的时间。图5展示了具有不同κm的甲基转移酶的甲基化分数。分布的形状与探索时间分布的形状一致,以虚线表示,图5显示甲基化率的增加与整个基因组中甲基化的整体增加相对应,这表明以更快的速度催化甲基化的DNA甲基转移酶将甲基化更多的基因组。甲基化分数在1处饱和,描述完全甲基化或甲基化的确定性。以上结果表明甲基化率对甲基化模式的建立具有显着影响。


图5 使用总探索时间分布和可变甲基化率确定的稳态甲基化分数分布

     

      DNA甲基化的主要基因组区域为CpG岛,作者扩展了模型关于CpG位点相关性的描述,以模拟生物系统,接着,将这些预测与通过全基因组亚硫酸盐测序实验测量的甲基化状态相关性进行比较(图6)6表明,拟合结果非常接近,重现了实验数据的定性和定量特征。这表明甲基化谱与DNA甲基转移酶行为之间存在密切的关系,表明不同的甲基化相关性模式可能是由于DNA甲基转移酶的可变结合行为造成的。


图6 9种癌细胞类型中的1号染色体理论预测的甲基化数据与实验获得甲基化数据的拟合结果


     综上所述,在这项研究中,作者提出了一个分子运输模型,该模型描述了在多尺度DNA环境中对DNA甲基转移酶的基因组探索,结合了甲基化率和CpG密度等生物学相关因素来预测甲基化模式,表明DNA甲基转移酶运输在表观遗传调控中的重要性。本研究的结果为未来的研究人员开发针对与异常DNA甲基化模式相关的疾病的机制原因的疗法提供了基本指导。


文章编号:491

原文链接:

https://doi.org/10.1073/pnas.2415530121

原文引用:

Ariana Y. Tsea and Andrew J. Spakowitzb*. Modeling DNA methyltransferase function to predict epigenetic correlation patterns in healthy and cancer cells. Proc. Natl. Acad. Sci. U.S.A., 2025, 122, e2415530121.

环境表观遗传学与暴露组学
核酸修饰研究相关文献分享
 最新文章