单细胞CUT&Tag技术能够在单细胞水平探测蛋白-DNA相互作用,深入分析基因调控和染色质重塑在细胞命运决定及疾病发展中的作用。然而,目前相关研究主要集中在技术研究,关于生物学问题的研究仍较少。
本期,我们详细解读了一篇2024年发表的关于发育的scCUT&Tag+scRNA-seq文章,不论是实验室设计、研究思路还是分析方法都值得参考。该研究发表在国际杂志Nature Neuroscience(IF=21.2)上,题为“Single-cell epigenomic reconstruction of developmental trajectories from pluripotency in human neural organoid systems”。研究选取了人类大脑类器官(6个发育时间点)和视网膜类器官(2个时间点)模型,呈现了从多能性祖细胞到分化的神经命运的单细胞分析(包括H3K27ac、H3K27me3和H3K4me3组蛋白修饰的scCUT&Tag和scRNA测序)。
研究发现了从多能性状态到神经上皮细胞,再到大脑和视网膜区域和细胞类型规范的转变。研究揭示了在每个阶段,激活性和抑制性表观遗传修饰的转换可以预测和先于细胞命运决定,提供了基因调控元件和转录因子的时间表。此外,研究发现在神经上皮阶段去除H3K27me3会破坏命运限制,导致异常的细胞状态。
5个细胞系的大脑类器官的6个发育时间点,以及视网膜类器官的2个发育时间点;单细胞CUT&Tag做了三个修饰:H3K27ac、H3K4me3和H3K27me3。
1. 脑类器官发育的单细胞表观基因组图谱
为了解析组蛋白修饰在人脑和视网膜类器官发育过程中的作用和动态转换,研究同时进行了scCUT&Tag和scRNA-seq,涵盖了从诱导多能干细胞(iPSCs)到最终分化的神经元和胶质细胞的细胞命运转变。研究构建了5种不同细胞系大脑类器官6个发育时间点(days 5, 15, 35, 60, 120, 240)和视网膜类器官两个时间点(days 45和85)的单细胞水平的3种组蛋白修饰(H3K27ac、H3K27me3和H3K4me3)和RNA表达图谱。
使用scRNA-seq数据(38,149个细胞)进行UMAP降维和嵌入,揭示每个时间点不同的种群,比对参考基因组和分析标记基因的表达来进行细胞群注释。数据集中所代表的细胞涵盖了从第5天早期多能阶段到第15天分层神经上皮的转变,祖细胞在第35-60天之间分化为视网膜和大脑区域身份(端脑、间脑和非端脑)(图1b,c)。脑区特异性和视网膜神经元从第35天开始发育,并随着时间的推移而大量增加(图1b,c),到第120天星形胶质细胞和少突胶质细胞前体细胞(OPCs)出现,与人类胚胎发育中期的胶质细胞生成开关相一致。
研究用免疫荧光法研究了H3K27ac、H3K27me3和H3K4me3的空间分布,发现所有细胞核这三种组蛋白修饰的都有染色(图1d)。在脑类器官中进行了scCUT&Tag,所有实验中获得了高质量的数据,主要关注三个质控指标:fraction of reads in peaks(FRiP)、核小体分布模式和每个细胞的碎片中位数(Median fragments per cell)(中位数:H3K4me3,722;H3K27ac,641;H3K27me3,302)。UMAP显示了每个模式的时间过程中显著的细胞状态多样性(图1e-j)。
为了在表观基因组数据集中注释细胞状态,研究首先对每种模式进行了高分辨率的Louvain聚类,以通过增加每种模式的片段数量来增强结果的稳健性。然后,研究团队使用基于激活组蛋白标记(H3K27ac和H3K4me3)的相关性以及抑制性标记H3K27me3的负相关性,通过最小费用最大流(MCMF)二分匹配,将每个表观基因组高分辨率聚类与注释的单细胞RNA测序聚类进行了比较。基于这些匹配,研究将带注释的细胞标签从RNA转移到其他模式中,获得了每个细胞状态的大量peak。标记转移后,所有模式之间的细胞状态比例相似,甚至罕见的群体,如中间祖细胞,也可以在组蛋白修饰数据集中恢复,支持整合的准确性。
随后,研究检查了神经元细胞状态的异质性,发现除了端脑分支外,所有区域分支都包含抑制性和兴奋性神经元,而端脑分支则以兴奋性神经元为主。不同的细胞系显示出相似的细胞类型分布,所有细胞系都对不同的细胞状态和大脑区域特征有所贡献,这表明细胞系间的分化具有可重复性。
研究检测到在已知的细胞类型和区域标志调控因子(例如,FOXG1,前脑分支;NEUROD2,前脑神经元;SIX6,视网膜分支;LHX5,神经上皮和非前脑神经元;HOXB2,菱脑分支;POU5F1,多能干细胞(PSC);以及AQP4,星形胶质细胞)中,具有高度富集的激活标记信号(峰值)(图1k,l)。同时,研究还发现H3K27me3信号(抑制性)在缺乏相应基因表达的细胞状态中存在(图1m)。
据研究团队所知,这些数据提供了第一个全面的人类中枢神经系统发育的类器官表观基因组图谱,其中包含单细胞水平上的激活和抑制组蛋白修饰以及RNA表达。这个资源也可以在网站(https://episcape.ethz.ch)上进行交互式的浏览。
2. 区域多样化过程中的表观基因组转换
为了可视化神经上皮细胞分化为不同大脑区域的神经前体细胞(NPCs)和神经元,研究团队使用CellRank计算了基于每个区域身份的RNA表达的终端命运概率。研究对每个高分辨率簇的概率进行了汇总,并用它们构建了一个表征分化事件的图形(图2a,b)。这种图的力导向布局揭示了多能干细胞(PSCs)向神经上皮的转变,随后又分化为特定区域的神经发生支系(图2b)。通过将匹配的高分辨率染色质模式聚类(图2a)映射到这种图中,研究能够可视化组蛋白修饰在神经上皮与大脑区域支系之间的切换。
对于每种染色质修饰,研究通过汇总基因体及其延伸启动区域的reads数来计算基因活性得分。首先选取了最前面15个调控因子,这些调控因子在不同区域之间展现出了差异化的富集情况。图上(图2c)的基因活性显示,区域特异性的转录因子(例如,FOXG1、NEUROD2、LHX5和VSX2)往往在其表达域之外受到H3K27me3的广泛抑制,并且H3K4me3的水平较低。
为了验证前脑分支的表观遗传调控模式,研究从妊娠19周初级发育的前脑生成了scATAC-seq+scRNA-seq和bulk水平的CUT&Tag数据。研究发现这些区域调控因子上也有相同的激活和抑制型组蛋白修饰的富集现象。研究发现对于三种组蛋白修饰(H3K27ac、H3K27me3和H3K4me3),在类脑器官的端脑支系中,50个富集程度最高的区域(峰)在原发性发育大脑样本中也表现出类似的富集现象。此外,将原发性发育大脑的bulk CUT&Tag峰与类脑器官的scCUT&Tag峰进行交集分析,显示出两者之间有很高的重叠。这些结果表明,类脑器官在组蛋白修饰的表观遗传特征上与人类发育大脑有着显著的一致性,支持了类脑器官作为研究人类大脑发育的有效模型。
研究团队研究了在神经上皮形成不同大脑区域的过程中,染色质的修饰情况,识别出各个区域和细胞类型之间存在的不同组蛋白修饰。研究发现不同细胞系之间存在一致的模式,表明在分支分化过程中存在相似的表观遗传程序。对H3K4me3和H3K27ac峰附近的26个基因进行本体分析,发现其在发育过程中有很强的富集作用。激活性H3K4me3和H3K27ac峰在受体信号传导和代谢过程(PSCs)、胚胎发育和形态发生(非神经外胚层(NNE))以及模式形成和神经系统发育(神经上皮)方面表现出富集。
在区域神经发生和星形胶质细胞分化的分支中,激活峰附近发现富含与神经元成熟和分化(Tel)、脑区域发育(MRh)、眼睛和感觉器官发育(Ret)、胶质发生和胶质细胞分化(星形胶质细胞(Ast))、脑脊液产生以及代谢和免疫过程(脉络丛(Chp))相关的基因。与H3K4me3和H3K27ac修饰相比,在不参与大脑发育的发育调节因子中发现了抑制性H3K27me3结构域。研究发现H3K27me3的峰值与异染色质组装或细胞应激调控(PSC)、间充质干细胞增殖(NNE)、BMP信号通路(Tel)和其他细胞命运调控相关的基因接近,如胰腺细胞或角质形成细胞(Dien和MRh)。研究分析了在每个组蛋白修饰的分支特异性峰中富集的转录因子基序。研究发现FOXG1、NEUROD2(Tel)、OTX2、EMX2、LMX1A(Dien)、HOXB2、ZIC1、PAX7(MRh)、PAX6、VSX2和VAXs(Ret)均富集了motif。
由H3K27me3和H3K4me3共同富集在抑制基因上的染色质域被称为双价,有研究报道这种现象发生在发育过程中需要快速激活的基因上。研究在神经上皮阶段的匹配高分辨率簇中观察到了大量的H3K27me3和H3K4me3共同标记的染色质域(图2c,d)。研究将这些结构域称为二价结构域,并发现大约90%的结构域显示了两种组蛋白修饰之间的全序列重叠。几个转录因子结合基序被富集,其中包括已知的区域调控因子以及EGR1,这是一种先前被描述的参与表观遗传重构的即时早期基因。激活的二价染色质结构域(添加H3K4me3,去除H3K27me3))主要分布在端脑和间脑分支,而大多数二价峰在中-/菱脑泡中获得了抑制(H3K27me3)(图2d)。当细胞过渡到区域分支时,一小部分的结构域仍然是二价的。
研究接下来分析了H3K27me3和H3K27ac之间的切换,它们被认为是相互排斥的,因为它们安装在相同的组蛋白H3赖氨酸27残基上,很少在核小体内共存。事实上,研究没有发现H3K27ac和H3K27me3的共富集,这表明高分辨率的聚簇可以区分开关和共富集。
研究在神经上皮阶段发现了一组被抑制的H3K27me3峰,它们在单个区域分支中转换为活跃状态(H3K27me3的耗尽和H3K27ac的富集)(图2e)。这组峰在许多已知的区域调控因子中表现出富集,并与H3K4me3/H3K27me3共同调控峰的基序有很好地重叠,表明谱系特异性激活。这种个体区域分支的表观遗传激活伴随着附近基因的区域特异性表达(图2e),包括重要的区域身份调控因子,如EMX1和NFIB(Tel)、RSPO3和LMX1A(Dien)、WNT7A(MRh)和VSX2和VAX2(Ret)(图2f)。研究发现,60%的这些基因在神经上皮细胞内表现出先前的二价性。
接下来,研究团队分析神经胶质谱系内的区域化。研究整合了从1个月大到8个月大的类器官数据中的所有NPCs和星形胶质细胞。这揭示了前脑分支中存在一小部分外向辐射胶质细胞(图2g)。此外,研究还观察到了类器官中星形胶质细胞的区域特异性基因表达(图2g,h)。研究计算了来自不同区域的NPCs和星形胶质细胞之间的基因表达的区域差异(图2i),并发现FOXG1、OTX2、HOXB2和LHX2以及ZIC和IRX家族在神经元和星形胶质细胞群体中都定义了区域化,这与在小鼠和原代人类组织中的观察结果相似。
3. 表征发育过程中的调控元件
研究团队描述了数据集中的不同染色质状态。首先对峰集应用严格的筛选标准,并基于高分辨率簇中的检测,对所有不同类别的峰进行降维和嵌入(图3a,b)。这次聚类揭示了不同类组蛋白修饰的明显调控状态,并将启动子区域和远端区域区分开(图3b,c)。总体来看,启动子元件在高分辨率簇中的检测数量多于远端元件。研究量化了整个基因组中不同组蛋白修饰的富集,发现所有标记,特别是H3K4me3,在5’UTR和启动子区附近显示强烈富集,而H3K27ac和H3K27me3也在远端基因间位点显示富集。
在这个时间序列中识别出的峰与VISTA集合中不同脑区的50-60%实验验证的增强子相重合,这表明该研究选取的时间序列涵盖了脑区发育的大部分表观遗传状态。为了确定这种调控区域的表现是否也可以揭示峰集的共同调控,研究进行了聚类分析,并使用基因组区域富集注释工具(GREAT)富集对聚类进行注释。研究发现不同peak类的富集情况各不相同。在启动子簇中,研究识别出一个主要包含基本生物功能和核过程的簇(簇1),还有一个簇则包含与神经系统发育和特定神经元过程相关的peak(簇2)。这个簇还显示出神经转录因子(POU4F2和LMX1B)的富集。富含H3K27ac的远端元件(簇3和簇4)也与神经、胶质细胞和神经系统发育相关的项目和转录因子(NEUROD1、NEUROG2和NFIB)有很强的富集。
对于H3K27me3峰,研究识别出两个主要簇。一个簇包含更多的启动子峰,并且与H3K4me3有共同富集(簇5,过去称为“双价”)。这个峰簇富集在一般发育过程中。簇6包含远端H3K27me3富集峰,并富含对神经元稳态和神经发育重要的项。研究发现,大多数峰并不只属于一种细胞状态,而是在几种不同的细胞状态中被不同的组蛋白修饰(活性和抑制性)动态标记。
4. 在神经发生过程中,表观遗传激活先于基因表达
然后,研究团队探索了从多能干细胞到区域特异性神经元分化过程中的组蛋白修饰的动态。重点关注背侧端脑的轨迹,研究团队利用针对RNA的RNA速率和针对组蛋白标记的扩散图沿着拟时间排列细胞。为了获得所有模式在拟时间上的均匀时间点分布,研究对细胞进行了下采样,然后将它们分成50个相同大小的bin。
正如预期,研究发现多能细胞在标记有抑制性H3K27me3和激活性H3K4me3的染色质区域中富集,随着抑制性(H3K27me3)和活性(H3K27ac)区域的增加,这种标记在NPC阶段逐渐减少。有趣的是,当NPCs分化为神经元时,H3K27me3和H3K4me3共同标记的结构域的丰度再次增加。
研究用来自人类发育皮层的bulk水平的CUT&Tag数据验证了检测到的信号,并发现抑制性、活性和H3K27me3/H3K4me3共标记结构域的染色质状态与类器官数据一致。由于bulk测量的局限性,研究不能排除在主要的人类发育皮层数据中注释的一些二价性归因于组织的异质性。然而,原代组织主要包含端脑谱系的细胞,研究在90%的二价标记区域中发现H3K27me3和H3K4me3完全重叠。
接下来,研究团队根据拟时间表达和组蛋白修饰模式对基因进行了聚类,发现了6个具有不同拟时间动态的主要基因组(图4a)。簇1和簇2捕获从多能性向神经上皮细胞过渡过程中多能性基因的表观遗传沉默,伴随两种不同的拟时间动态:簇1中的基因在神经上皮阶段下调,并失去活跃的组蛋白修饰,同时获得H3K27me3(图4b;POU5F1),而簇2中的基因仅在神经前体细胞(NPC)阶段添加H3K27me3修饰,并在刚刚退出多能性后表达下降(图4b;FOXO1)。
簇3中的基因在神经上皮和神经前体细胞中表达,并且随着H3K27me3的增加,这些基因的转录水平减少(图4b;LHX5)。相比之下,簇4和簇5中的基因(图4a)同样在神经前体细胞中表达,但在H3K27me3水平下降后,活跃的组蛋白修饰和转录水平有所增加(图4b;POU3F3)。值得注意的是,研究观察到簇6中的神经元基因在RNA表达开始之前,失去了H3K27me3介导的抑制作用,并积累了H3K27ac和H3K4me3标记(图4b-f;NEUROD2和GRIA2)。
为了巩固这一分析并减小潜在干扰因素的影响,比如时间点的分布和数据质量。研究在严格质量筛选后,使用扩散图对所有类型的数据重复进行了单一时间点(第120天)的拟时间推断。在聚类后,研究再次得到了一个富含神经元基因的集群,该簇在RNA表达之前就已经带有激活标记的准备状态。
为了表征导致primed基因转录激活的一系列事件,使用与scCUT&Tag相同的120天类器官单细胞悬浮液,测量了同一单细胞中的转录组和染色质可及性(sc-Multiome-seq)。结果显示,激活的组蛋白修饰H3K27ac和H3K4me3在染色质可及性增加之前不久就已经建立,随后则是RNA表达的出现(图4e,f)。研究在无偏倚选择的神经元基因中也观察到了同样的效果。这些结果支持了一个模型,即染色质可以启动活性组蛋白修饰,指导靶基因的未来表达。
研究利用了人类发育大脑(19周)的单细胞多组学数据,记录了来自同一细胞的转录和染色质可及性,来检测神经元基因在初级人类皮层中是否也表现出表观遗传的预激活。事实上,神经元基因(NEUROD2、NEUROD6、BCL11B和STMN2)在发育中的人类皮层中,在RNA表达之前就显示出了可及性的增加(图4g)。这支持表观遗传预激在神经系统发育过程中发挥作用,特别是针对神经元特异性基因,这与其他发育系统的报告类似。最近的研究表明,H3K4me3在PolII暂停释放中是必需的。有趣的是,可以假设这些神经元基因上的H3K4me3标记在PolII释放进入延伸之前就会逐步积累。
为了探讨支持神经元基因预激的基因调控机制,研究根据有机体发育的scRNA-seq和scATAC-seq数据,结合单细胞CUT&Tag数据集中组蛋白修饰标记的调控区域,构建了一个基因调控网络。重点关注一个子网络,包括神经元簇中的所有基因,以及在神经元簇中至少三个基因之间共享的常见转录调控因子。随后总结了转录因子结合区域在拟时间轴上的表观遗传修饰模式。这揭示了bHLH转录因子(如NEUROD2或NEUROG2)在这个网络中占据核心枢纽地位,并展示了其调控元件在整个伪时间轴上逐步激活,伴随着抑制性标记的消失和活性染色质标记的获得(图4h)。
与NEUROD2作为预激簇基因调控的核心调解因子相一致,bHLH转录因子被认为能够在谱系预激的增强子上充当预激因子的角色。研究检查了在NEUROD2上下游起作用的基因表达,发现大多数上游调控因子(例如HEY1、KLF7和SOX2)是在激活标记被安装并且NEUROD2位点的染色质获得可及性之后表达的,但在NEUROD2表达之前(图4i,粉色表达谱)。这表明,激活的染色质标记在NEUROD2转录调控之前建立了一个转录上允许的环境。
相反,如预期,大多数下游目标基因(如CNTN1和RAS11B,蓝色表达谱)是在NEUROD2表达激活后才开始表达(图4i)。为了探讨其他脑区轨迹中神经元基因的表观遗传预激,研究将拟时间分析扩展到了间脑和中脑/菱脑分支(图4j)。在所有分支中鉴定出两个晚期表达的神经元基因簇(例如KCNN2、MAP3K13、NEUROD2、SLIT1、STMN2、SLC6A1、NSG1和CPLX2),并且在这些基因中检测到了与大脑额叶中观察到的类似的表观遗传预激现象(图4a,j)。
综上所述,分析揭示了在发育中的人脑器官中,从多能性到神经元分化过程中,组蛋白修饰与RNA表达之间的动态相互作用,并展示了神经元基因的表观遗传预激活现象。
5. H3K27me3的扰动揭示了它在命运获取过程中的作用
通过用A395抑制H3K27me3(EED/PRC2)来测试组蛋白修饰在早期脑类器官发育中的作用,从多能性阶段到神经上皮阶段(第0-15天;图5a),克服了全PRC2缺失(KO)中的严重发育缺陷。在后期阶段,EZH2小鼠皮层祖细胞的消耗改变了时序,并更倾向于分化而非自我更新。在神经上皮阶段(第15-18天),使用单细胞RNA测序和bulk CUT&Tag分析了EED抑制剂处理的类器官和对照组(图5a)。这显示出H3K27me3的浓度依赖性耗竭和竞争性激活的H3K27ac组蛋白标记的富集(图5b,c)。许多H3K27me3峰在神经上皮中也显示出对H3K4me3的共富集(图5b)。通过单细胞RNA测序,研究观察到H3K27me3耗竭峰附近基因表达的上调(图5c)。STMN2和POU5F1是展示强H3K27me3耗竭、伴随H3K27ac增益及mRNA表达上调的典型基因(图5c,d)。
研究整合了不同条件下的单细胞RNA测序数据,进行了聚类分析,并对结果进行注释(图5e)。研究观察到一个大型的神经上皮祖细胞群体(1、2、3和6簇),但发现抑制剂处理的细胞在多能细胞(4簇)、神经前体(7簇)、神经嵴(5簇)和神经元(8簇)中富集(图5e,f)。研究使用CellRank计算了转移概率,并确认细胞从神经上皮和多能性向神经前体、神经嵴和神经元转变(图5g)。研究在神经上皮簇中进行了差异表达(DE)分析,发现许多处理后上调的基因也是异位簇的标记基因。这些基因显示出依赖抑制剂的H3K27me3丧失、H3K27ac获得和mRNA上调,这表明H3K27me3的丧失使细胞身份向异位细胞状态转变。实际上,在发育图谱中,H3K27me3抑制后上调的主要基因是在神经上皮之外表达的(图5h)。研究发现,在H3K27me3丧失后,最强烈上调的基因位于神经上皮和多能干细胞中的转录许可H3K27me3/H3K4me3双价域内,因此在H3K27me3丧失后为激活做好了准备(图5b,i)。这表明H3K27me3在细胞从多能性向神经上皮过渡时,是稳定细胞命运决策所必需的(图5h,i)。
研究团队通过分析在异位簇中与上调基因紧密相邻的H3K27me3缺失峰中的结合基序,研究了哪些转录因子可能在细胞从多能性退出时破坏细胞命运决定(图5j)。这显示出TFAP2家族成员的结合基序富集,这些成员调节神经嵴和胚层再生细胞的特征。此外,还发现了STAT家族成员的富集,它们参与细胞增殖的调节。同时,也观察到了多个调节神经发育过程的转录因子的富集。研究猜测,在H3K27me3缺失后,这些转录因子对它们的靶基因的接触会增强,并诱导出一系列的失调,进而改变细胞命运的选择(图5k)。
总体而言,研究确定了H3K27me3介导的抑制如何在早期中枢神经系统发育中确保谱系稳定性的分子框架。研究在单细胞水平描述了其对早期发育阶段即时分支点的影响。
在人类早期脑发育过程中,基因表达必须被严格协调,以实现对各种细胞类型的有序分化。研究影响这些动态过程的表观遗传机制一直是一个挑战,特别是在全局范围内和单细胞水平上。脑类器官能够在体外模拟早期人脑区域化和细胞类型形成,在该研究中,通过在脑类器官中进行3个组蛋白修饰的scCUT&Tag来解决这一问题。
在发育类器官的发展过程中,结合了指示抑制和活跃染色质状态的单细胞CUT&Tag特征与RNA表达数据。研究发现染色质修饰的特征对特定细胞群体高度特异,并识别出关键细胞命运决定因素附近的区域特异性调控元件,这些元件往往在命运分叉点上标记有表观遗传开关,以促进基因表达。这些发现表明,染色质修饰因子在区域多样化和细胞命运稳定中至关重要。动态的组蛋白修饰对于细胞命运的正确决定和脑部区域化是非常关键的。组蛋白标记发育图谱将为理解人类大脑发育的表观基因组景观提供有价值的参考,有助于未来细胞命运承诺和重编程的研究。
精选合集,欢迎收藏哟!