背景
01
转录因子的位置依赖性功能
文章"Position-dependent function of human sequence-specific transcription factors"探讨了人类序列特异性转录因子的功能如何依赖于它们的位置。研究通过使用大规模并行报告基因实验(MPRA),分析了转录因子结合位点的位置对其功能的影响,并评估了这些影响在不同序列背景下的可重复性。研究结果有助于理解转录因子如何在不同位置上调节基因表达,并为设计或识别功能性转录因子结合位点提供了依据。
文章的创新点在于,它通过对大量序列的并行分析,揭示了转录因子结合位点的位置对基因表达调控的关键作用。通过这样的研究,研究人员能够更好地了解转录因子在基因调控网络中的角色,并且这些发现对于未来设计基因调控元件、理解基因表达模式以及探索疾病相关变异的功能具有重要意义。
该研究还展示了如何通过实验设计和技术改进提高MPRA结果的可重复性,比如通过比较不同条形码重复物之间的启动子活动水平的变化,以及在不同实验条件下的TSS(转录起始位点)活动水平的一致性分析。这些方法学上的改进有助于确保实验结果的可靠性,并为其他类似研究提供了参考。
在研究中,选择了Sp1、YY1、NFY以及NRF1这几种转录因子的结合位点,并在人工设计的、转录因子基序贫乏的DNA背景上进行了一系列2bp增量的位移扫描实验。通过这种方式,研究人员能够观察到当这些结合位点从距离转录起始位点(TSS)上游100bp移动到下游40bp时,对TSS活动性的影响。
结果显示,不同转录因子结合位点的位置对其功能有显著影响。例如,Sp1结合位点在不同位置时,可以激活或抑制TSS的活性,这一点在垂直归一化的热图中得以体现。其他如YY1、NFY和NRF1结合位点的变化也显示出了类似的位置依赖性特征。此外,实验结果还表明,在合成序列中扫动转录因子结合位点的位置所造成的影响具有高度可重复性,这是通过对四个不同的条形码集合独立评估得出的结论。
这项研究强调了理解转录因子结合位点精确位置的重要性,这对于认识基因调控网络的本质及其在细胞状态转换中的作用具有重要意义。
图1.捕获数千个TSR变体的tss证实了TFs的位置依赖功能
原文链接:https://www.nature.com/articles/s41586-024-07662-z
02
增强子选择性在空间和时间上的研究
文章“Enhancer selectivity in space and time: from enhancer–promoter interactions to promoter activation”讨论了增强子与启动子之间在时间和空间上的选择性,以及这些选择性如何影响启动子激活的过程。尽管增强子的概念早在1981年就被提出,但增强子如何选择性地与对应的基因相互作用并激活它们仍然是一个尚未完全理解的问题。本文指出,基因表达的时空精确调控对于单细胞胚胎发育成复杂有机体至关重要,在发育过程中产生了数百种功能各异的细胞类型,而这些细胞类型共享同一个基因组,这意味着不同的基因会在特定类型的细胞中被激活。增强子是调控动物基因表达的主要组成部分,负责控制转录基因激活的时间和空间模式。
文章讨论了增强子和启动子之间互作的不同模型,包括通过结构蛋白质如CTCF和LDB1介导的稳定E-P互作,以及通过人工锌指强制染色质环路形成的转录激活。尽管增强子-启动子复合物的结构已经通过冷冻电子显微镜得到解析,但对于急性消耗Mediator和聚合酶II对E-P接触概率的影响,现有数据并不支持稳定的E-P互作模型。
此外,文章还提到,尽管测量到的三维距离通常大于实际距离,但这些测量值仍然与接触模型一致。因此,E-P互作可能是动态的而非静态的,但是实际相关的互作持续时间仍然不清楚。
最后,文章总结了当前对于增强子如何选择性地与对应基因互作并激活它们的理解依然有限。基因表达调控可以通过两个步骤发生:增强子-启动子互作和转录激活。三维增强子-启动子互作模型为解释启动子跳跃现象提供了一个合理的解释,而这是线性模型难以解释的。在空间上,三维增强子-启动子互作可以是接触或远距作用;在时间上,这些互作可以是动态的或稳定的。尽管初步证据表明E-P互作不太可能是非常稳定和持久的,但功能性相关的互作时间长度仍需进一步研究。此外,E-P互作是否通过接触或远距作用的方式发生也尚待确定。
图2.增强子-启动子相互作用模型
原文链接:https://www.nature.com/articles/s41580-024-00710-6
03
MethNet揭示癌症基因调控中心
“MethNet: a robust approach to identify regulatory hubs and their distal targets from cancer data”介绍了一种名为MethNet的新方法,旨在解决识别远端调控元件(CREs)及其与目标基因连接的问题,尤其是在癌症背景下。MethNet整合了大规模的DNA甲基化和基因表达数据,以揭示每个基因组启动子周围1Mb区域内存在的顺式调控元件。该方法的一个核心特点是它能够识别出一系列高度评价的CRE集群,这些集群被称为“中心”,因为它们对多个基因的调控有贡献,并且与患者生存率显著相关。研究者们利用了启动子捕获Hi-C技术来证实高评分的关联确实涉及到CRE与其基因目标之间的物理接触,并通过基于CRISPR干扰的单细胞RNA扰动测序进一步验证了CRE的功能影响。因此,由MethNet确定的CRE构成了一份有价值的资源,有助于解析复杂的基因表达机制,并优先验证预测的非编码疾病热点。
MethNet的工作原理是分析癌症样本中的DNA甲基化模式和基因表达水平,以识别那些可能对基因表达产生重要影响的顺式调控元件。通过使用捕获Hi-C技术,研究人员验证了MethNet预测的高排名关联确实涉及到了顺式调控元件与其目标基因之间的物理相互作用。此外,基于CRISPR干扰的单细胞RNA扰动测序进一步证实了这些顺式调控元件的功能影响。
文中提到,尽管编码区仅占基因组的很小一部分,但它们通常成为分析的重点,主要是因为全基因组测序的成本较高,而且编码序列较容易被识别并与基因表达变化直接联系起来。相比之下,非编码区内的顺式调控元件由于与目标基因之间可能存在数百千碱基对的距离,因此很难确定它们之间的关系。MethNet为解决这一难题提供了一个解决方案,并为理解复杂的基因表达机制以及优先验证预测的非编码疾病热点提供了宝贵的资源。
图 3. MethNet 管道概述
原文链接:https://www.nature.com/articles/s41467-024-50380-3
04
顺式调控元件的发现与验证
“Measurement of gene regulation in individual cells reveals rapid switching between promoter states”主要内容是关于基因调控网络的研究,通过综合分析大规模DNA甲基化和基因表达数据来识别顺式调控元件(CREs)。
文章主要探讨了基因调控网络中的几个关键概念和技术进展,特别是关注在细胞水平上如何通过定量分析来理解基因调控过程中的随机性和动态变化。文献引用了多个实验研究和理论模型,以阐明转录因子与DNA之间的相互作用、基因表达的噪声特性、以及细胞内信号传递的复杂性。
该文章引用了诸如Michael Ptashne的工作,讨论了基因开关的概念,并引入了基因调控网络的概念,强调了网络中的组件如何通过相互作用来控制基因表达。文献还介绍了如何利用单分子荧光技术和计算建模等方法来研究单个细胞中的基因表达动态,从而更好地理解基因调控网络的运作机制。
此外,还提到了细胞内基因表达的随机性和噪音,以及这些特性如何影响细胞的命运决定。通过分析转录因子与DNA结合的动力学,以及RNA聚合酶在转录过程中的行为,研究者们发现即使在相同的条件下,基因表达也会表现出较大的变异,这种变异是由生物系统内在的随机性引起的。
还提到了一些技术进步,比如如何在单细胞水平上测量基因表达,以及如何通过数学模型来预测和解释实验观察到的现象。这些技术的进步使得科学家们能够更加深入地了解细胞内部的调控机制,并为开发新的治疗方法提供了理论基础。
该文章综合了生物学、物理学和信息学的方法,展示了在理解和预测基因调控网络行为方面的最新进展,特别关注于如何量化和解析基因表达的随机性和动态变化。
图4. CI 调节 PRM 的示意图
原文链接:https://www.science.org/doi/10.1126/science.aad5214
总结
为了更好地理解基因表达调控的机制,研究者们开发了一系列工具和技术。例如,MethNet是一种整合大规模DNA甲基化和基因表达数据的算法,它能够帮助识别出那些在癌症中起到关键调控作用的顺式调控元件。通过这种方法,研究者们能够发现那些参与调控多个基因表达的“中心”区域,并且这些区域与患者的预后密切相关。
另外,通过大规模并行报告基因实验(MPRA),研究者们能够系统地分析转录因子结合位点的位置对其功能的影响,并且发现转录因子的功能会根据它们相对于转录起始位点(TSS)的位置而改变。这一发现揭示了位置依赖性在转录因子功能中的重要性,并且为设计或识别功能性转录因子结合位点提供了依据。
同时,对于增强子与启动子之间相互作用的研究显示,三维空间中的这些相互作用能够跨越较大的基因组距离,并且在不同的细胞类型中表现出高度的选择性。这表明了基因表达调控不仅是一个静态的过程,而且是一个动态的、受三维空间组织影响的过程。
综上所述,基因表达调控是一个复杂而又精妙的过程,它涉及多个层面的调控机制。通过运用先进的实验技术和计算工具,科学家们正在逐步揭开这一过程中的诸多奥秘,并且这些发现对于理解疾病的发生发展机制、指导未来的治疗策略具有重要意义。
本课题组常年全球招募具有化学材料、基因治疗、生物医学和生物信息等相关背景的副研究员、助理研究员、博士后和科研助理。
有意者请将简历发送至宋杰老师邮箱:jiegroup@126.com,或点击此处查看详情。
往期回顾
M3R Lab
作者|hmm
审核|sj
排版|xjc