英文标题:Genetic control of DNA methylation is largely shared across European and East Asian populations
发表期刊:Nature Communications
影响因子:14.7
发表时间:2023年8月
研究机构:印度海德拉巴CSIR细胞和分子生物学中心、伦敦卫生与热带医学院等
涉及组学:illumina 850k DNA甲基化芯片 等
涉及算法:孟德尔随机化MR、逻辑回归模型、线性回归分析、ANOVA分析、敏感性分析、队列纵向分析、Meta分析、多元回归模型分析等
人类身高受遗传因素的强烈影响,但可改变的表观遗传因素的作用尚未得到充分研究,特别是在中低收入国家(LMIC)。作者在四个LMIC队列(n=1927)中研究了血液DNA甲基化与儿童身高之间的关联,并在SOCS3基因的三个CpG位点发现了稳定的关联性,该关联在一个高收入国家队列(n=879)中得到了重复验证。
SOCS3甲基化(SOCS3m)与身高的关联独立于遗传效应。孟德尔随机化分析证实了SOCS3m对身高的因果效应。在纵向分析中,SOCS3m在儿童中期最多可解释9.5%的身高方差,而身高多基因风险评分解释的方差从出生到21岁逐渐增加。儿童的SOCS3m与产前母亲的叶酸水平和社会经济地位相关。体外实验证实了SOCS3m对基因表达的调控作用。
总之该研究结果表明,表观遗传修饰可能在驱动LMIC儿童身高方面发挥重要作用。
本研究涵盖来自印度、冈比亚和英国的五个队列儿童数据。印度的MMNP和MPC、冈比亚的PMMST和ENID为中低收入国家队列,英国的ALSPAC是高收入国家队列。
MMNP是关于母亲饮食质量对后代出生结局影响的随机对照试验;MPC旨在评估母亲孕期营养状况对孩子心血管和认知结局的长期影响;PMMST研究孕前微量营养素补充对胎盘功能的作用;ENID探究产前和婴儿营养补充对婴儿免疫发育的影响;ALSPAC是对父母和儿童的纵向研究。
各队列均获得儿童父母知情同意,其详细信息总结于上图的表格中。
在MMNP队列作为发现队列开展EWAS研究,使用的是illumina的850k DNA甲基化芯片中的β值进行分析。
通过广义线性回归模型,调整儿童年龄、性别和甲基化衍生的替代变量(SVs)后,在Chr17染色体上发现三个CpG(cg11047325、cg13343932、cg18181703)与身高显著相关(FDR<0.05),几乎都在SOCS3基因的exon2附近。
这三个CpG的甲基化水平强相关(Pearson's r≥0.75),效应大小相似,1%的甲基化增加与平均0.25厘米的身高增加相关。同时,计算的基因组膨胀因子λ=0.98(Fig.2b),表明不存在基因组膨胀现象,且调整估计血细胞计数或母亲补充剂后,关联无显著变化。
另外,对该区域进行差异甲基化区域(DMR)分析,也发现相同的441bp区域与身高相关(调整P值(Stouffer)=2.1×10⁻¹¹)。
在三个中低收入国家的儿童中期横断面分析队列(MPC、PMMST、ENID)中对发现阶段的SOCS3的甲基化-身高关联进行重复验证。
在这些队列中,均观察到一致的效应方向,P值范围从0.047到3×10⁻¹⁴,且甲基化水平在各重复队列中同样呈现相关性。
在冈比亚的ENID队列中,还针对2岁儿童进行了早期儿童效应的关联分析,发现cg18181703的甲基化与身高显著相关(P=1×10⁻³)。敏感性分析表明,细胞计数变化对任何重复队列中的SOCS3甲基化-身高关联均无影响。
此外,在高收入国家的ALSPAC队列中,也成功重复并验证了这一关联结果(P=2.2×10⁻³),且细胞组成变化对该关联无影响。
发育迟缓定义为身高低于WHO年龄身高参考均值2个标准差,在中低收入国家儿童中较为常见。
印度队列中发育迟缓儿童占比10-15%,冈比亚队列中2岁时发育迟缓患病率较高,达24%,但5-7岁时降至5-8%。
在所有中低收入国家队列中,通过构建逻辑回归模型,将发育迟缓作为二元结果变量,SOCS3甲基化作为暴露因素,调整儿童年龄、性别、甲基化芯片批次效应等因素后进行分析。
结果发现,在发现队列(MMNP)中,SOCS3甲基化与发育迟缓呈负相关,1%的甲基化水平增加与发育迟缓相对风险平均降低9.0%相关(最大P=1.4×10⁻⁴)。
该关联在MPC和ENID2岁队列中得到重复验证,但在其他冈比亚队列(PMMST和ENID6岁)中未被重复出来,可能与这些队列中发育迟缓率较低和样本量较小有关。
在中低收入国家队列中,针对三个SOCS3 CpG位点进行cis-mQTL分析及Meta分析,未发现显著cis-mQTLs,表明SOCS3甲基化不受cis-遗传变异影响。检测cg18181703的trans-mQTL(rs4383852),仅在PMMST队列中有名义关联且不混淆主效应。
通过身高PRS进行敏感性分析,发现SOCS3 CpG位点效应大小在调整PRS后无变化,说明SOCS3甲基化可独立预测儿童身高。
由于高收入国家队列ALSPAC主要为欧洲人群的遗传背景,因此研究了遗传变异对SOCS3甲基化-身高关联的影响。首先对已知的cg18181703 trans-mQTL(rs4383852)进行敏感性分析,调整rs4383852基因型本身不改变效应估计值。
然而,当进一步调整PRS后,cg18181703与身高的关联减弱,这表明在高收入国家队列中,遗传因素对身高的影响可能更为复杂,且与SOCS3甲基化存在一定的相互作用。
通过单因素方差分析(ANOVA)模型评估各队列中平均后的SOCS3甲基化水平(三个CpG均值后的值)和身高PRS解释的身高方差比例,发现中低收入国家队列中二者解释量相似,高收入国家ALSPAC队列中SOCS3甲基化解释方差远低于身高PRS。
在MPC队列中进行纵向分析,该队列拥有从出生到21岁不同时间点的身高测量数据。通过构建联合ANOVA模型,研究从出生到成年期间,5岁期间测量的SOCS3甲基化水平和成人身高PRS对身高方差的分配情况。
结果发现,SOCS3甲基化和身高PRS在整个童年和青春期解释的身高方差相似,但在21岁时,身高PRS解释的身高方差显著多于SOCS3甲基化水平(分别为18% vs 1%,95%置信区间)。
此外,分析SOCS3甲基化在5岁时与5至21岁各个时间点的身高关联,发现虽在所有时间点均存在关联,但效应强度随年龄下降。
进一步通过构建条件身高变量,分析身高增益情况,发现SOCS3甲基化仅在出生至5岁期间与身高增益强烈相关,且在13.5至21岁时,5岁时较高的SOCS3甲基化与身高增加减少相关。
为评估SOCS3甲基化的稳定性,在MPC队列中选取352名参与者,对其5岁(使用850k甲基化芯片)和21岁(焦磷酸测序验证)时DNA甲基化水平进行相关性分析。
结果显示,SOCS3甲基化在三个CpG位点在这两个时间点均呈现强相关性,表明SOCS3甲基化随年龄具有较高的稳定性,其甲基化状态在儿童期到成年期相对稳定,可能在长期的生长发育过程中持续发挥作用。
为探究SOCS3甲基化与身高之间的潜在因果关系,进行了孟德尔随机化(MR)分析。
使用先前在欧洲人群中确定的cg18181703的trans-mQTL rs4383852作为工具变量,结合公开可用的大型欧洲身高GWAS(n=253,288)的汇总统计数据,以身高为结局,甲基化为暴露进行分析。
通过“TwoSampleMR”R包计算,使用Wald比估计器量化因果效应,结果发现cg18181703的DNA甲基化水平对身高存在因果效应,1%的甲基化水平增加与0.07SD的身高变化相关(95%置信区间:0.03-0.11;P=1.7×10⁻³),为SOCS3甲基化影响身高提供了因果证据支持。
在三个中低收入国家队列(MMNP、MPC、ENID)中,研究母亲孕期多种暴露因素对SOCS3甲基化的影响,包括母亲体重指数(BMI)、社会经济地位(SES)、妊娠同型半胱氨酸、血浆/红细胞叶酸和维生素B12浓度等。
通过线性回归模型,以甲基化残差为因变量,母亲暴露因素为自变量,调整儿童年龄、性别和批次效应后进行分析。
结果发现,除母亲叶酸和SES外,大多数暴露因素与SOCS3甲基化无关联,且在印度队列中,母亲叶酸和SES与SOCS3甲基化强相关(MMNP中Pearson's r=0.16,P=8.9×10⁻⁴;MPC中r=0.23,P=2.2×10⁻⁸)。
由于二者可能存在混淆,进一步通过多元回归模型分析,发现叶酸和SES各自分别独立与SOCS3甲基化相关。
随后,通过MR分析探究母亲孕期叶酸水平与5岁儿童SOCS3甲基化之间的因果关系,首先在GWAS数据中搜索MTHFR基因1Mb范围内与叶酸水平相关的遗传变异,在印度队列中进行关联分析后确定两个编码基因的突变位点(rs1801133和rs2639453)作为叶酸暴露的遗传工具,MR分析未发现母亲叶酸暴露与5岁儿童SOCS3甲基化之间存在因果关系。
在MPC队列中,该队列同时具有儿童和成人的横断面数据,研究SOCS3甲基化与BMI之间的潜在联系。
通过线性回归模型,以调整性别和年龄后的BMI残差为因变量,SOCS3甲基化为自变量(多种技术检测平台等进行了批次矫正后)进行分析。
结果发现,SOCS3甲基化与21岁时的BMI呈负相关,这与先前研究结果一致,但在儿童期二者关系相反。
进一步进行敏感性分析,调整身高后,确认21岁时的关联仍然存在,但5岁时调整身高后无明显关联,表明SOCS3甲基化与成人BMI和身高可能通过不同的生物学途径产生关联。
对包含三个SOCS3CpG的441bp区域进行体外细胞机制验证,,发现SOCS3甲基化构建体有增强子活性。体外甲基化实验表明该区域甲基化会抑制增强子活性,进而抑制SOCS3表达,为SOCS3甲基化影响基因表达从分子生物学的机制层面提供了有利的证据。
乳酸化修饰蛋白组在心血管疾病中的研究思路∣修饰蛋白组学专题
2025国自然热点:当空间转录组拥有百亿“像素”
转录组和蛋白组联合备战国自然2025,你还差一个翻译组!
NC:机器学习+DNA甲基化锁定FFPE样本转移癌的原癌部位
本文系联川生物公众号原创文章,未经授权禁止转载,侵权必究! 扫描下方二维码 点分享
点点赞
点在看