近日,中国农业科学院深圳基因组研究所刘毓文课题组联合佛山鲲鹏现代农业研究院唐中林课题组在自然指数期刊《Genome Research》杂志上在线发表了题为“Analyzing super-enhancer temporal dynamics reveals potential critical enhancers and their gene regulatory networks underlying skeletal muscle development”的研究论文。
该研究创新性地提出一套分析框架,通过整合超级增强子(Super-enhancer,SE)发育时序模式、eRNA活性、基因表达、GWAS信号以及基于STARR-Seq的增强子调控型SNPs等多方面信息,精准识别影响性状的候选关键增强子。利用该分析框架,研究团队鉴定出了影响生猪产肉相关性状的候选关键增强子及其靶基因。
该分析框架的搭建逻辑如下:
首先对性状相关组织的SEs展开发育时序模式分类,结合多组学注释以及GWAS关联信号富集,初步筛选出可能影响性状的SE组成单元。SEs是由相邻的强增强子单元所构成,相较于普通增强子,其具备更强的调控能力与更为关键的生物学功能。接着,结合转录因子DNA结合域(TF DNA binding motif)分析以及TFs/eRNAs/genes共表达分析,推断出重要SE组成型增强子的上游TFs和下游靶基因,构建出可能影响复杂性状的增强子调控网络。最后,结合GWAS关联性信号和基于STARR-Seq的增强子功能性变异信息,对上述调控网络中的候选增强子进行过滤,从而得到在群体遗传学水平和分子生物学水平都得到证据支持的核心增强子调控网络。利用该分析框架,本研究产生了猪5个不同发育阶段的骨骼肌H3K27ac增强子标记数据,以此为基础构建了影响猪产肉相关性状的增强子核心调控网络,并对一个猪/鼠保守型增强子及其靶基因对肌肉分化的影响进行了基于CRISPR-Cas9的验证。
该分析框架不仅挖掘出了影响猪产肉相关性状的候选关键增强子和靶基因,也对从增强子为切入点解析人和动物复杂性状的遗传基础带来了新的思路。
具体来说,本研究以猪为模型,利用CUT&Tag技术绘制了骨骼肌5个关键发育节点(从胚胎期的初级肌纤维形成到出生后的骨骼肌发育成熟)的组蛋白H3K27ac修饰图谱,鉴定了三个不同发育时序模式的SE家族:持续型(Con,397个)、瞬时型(TS,434个)和新生型(DN,756个)(图1)。其中Con SEs特异联系到肌细胞分化和骨骼肌发育过程中,而TS SEs与胚胎形态发生和血管发育有关,DN SEs与骨骼肌收缩和代谢有关。与另外两种SEs相比,Con SEs呈现出更低的DNA甲基化水平以及更高的序列保守性,并且在群体遗传学信号方面,包括产肉性状GWAS信号和骨骼肌cis-eQTLs,都展现出更高的富集倍数。这些研究结果有力地表明,Con SEs极有可能是调控猪产肉性状的核心SE子集。
图1 猪骨骼肌SEs的发育时序模式分类
为了精准确定影响产肉性状的关键增强子,研究团队开发了一种新的分析框架来构建以增强子为核心的转录调控网络(如图2所示)。该网络初始骨架的构建是基于eRNA鉴定以及TFs/eRNAs/targets共表达分析。随后,利用与猪肉和胴体性状相关联的 SE eRNAs对该网络进行优化。为有效排除因连锁不平衡而产生混淆的GWAS信号,利用STARR-seq实验,从增强子中的性状关联性SNPs中,高通量鉴定出影响增强子活性的SNPs,并基于此信息对网络进行进一步过滤,并利用染色质拓扑相关结构域(Topologically associating domains,TADs)进一步明确增强子的靶基因。最终,该研究构建的影响产肉性状的潜在调控网络涵盖了30个候选关键增强子,其中20个源自Con SEs。这些增强子同时满足转录eRNAs、关联产肉性状GWAS信号以及含有增强子调控型SNPs。
图2 候选关键增强子调控网络的构建
接下来,研究团队基于猪/鼠3个层面的保守关系(DNA序列保守、表观信号保守、共线性保守)选择增强子在小鼠C2C12细胞中进行成肌分化的功能验证实验(如图3所示)。对20个Con型关键增强子在小鼠基因组上的同源序列展开分析,结果发现共有4个增强子满足上述的三重保守性。其中,增强子Chr12:34230720-34231974呈现出最高的共线性保守,并且与一个肥胖指数GWAS SNP rs81434214相关联。研究人员通过CRISPR-Cas9技术敲除了C2C12细胞中该增强子的同源序列。功能验证实验表明,敲除该增强子同源序列能够显著抑制C2C12细胞的成肌分化及其候选靶基因Akap1的表达。此外,利用siRNA降低Akap1表达也能够显著抑制C2C12细胞的成肌分化。这些结果作为概念验证,证明了本研究开发的框架是挖掘影响性状关键增强子的有效方法。
图3 候选关键增强子的保守性分析和功能验证
本框架挖掘关键增强子的重要核心模块是等位基因特异性的STARR-Seq方法。该方法于2017年被刘毓文研究员开发,可以高通量鉴定影响增强子活性的SNP,是在GWAS和eQTL关联性分析后,破除LD影响,精细定位调控型因果变异的有力工具。在本研究中,31%(17/55)候选关键增强子的调控型SNPs与PigGTEx中的猪骨骼肌cis-eQTLs重叠,且几乎全部(16/17)位于被认为对猪骨骼肌发育和产肉性状至关重要的Con型候选关键增强子中。这些位点的cis-eQTL效应和增强子调控方向一致,进一步说明该方法可以从cis-eQTLs中精细定位功能性SNPs。此外,在群体样本量有限导致cis-eQTLs检测效力偏低的情况下,等位基因特异性的STARR-Seq可以不依赖于大量群体样本鉴定潜在的调控型SNPs,因此,也是cis-eQTLs的重要补充。
论文链接:https://doi.org/10.1101/gr.278344.123