全基因组Meta分析确定阿尔茨海默病的特异性位点

学术   2024-10-28 23:37   湖北  


全基因组Meta分析确定阿尔茨海默病的特异性位点

简介

阿尔茨海默病(AD)是最常见的痴呆类型,影响全球4000多万人。AD的病因复杂,遗传因素发挥着关键作用。据报道大多数已知的基因位点只在欧洲血统的晚发型ADLOAD)人群中鉴定出来。作者对AD进行了两阶段的全基因组关联研究(GWAS),共有6878名中国人和63,926名欧洲人。结果发现除了载脂蛋白EAPOE)位点之外,还发现了三个新的AD易感位点(KIAA2013SLC52A3TCN2)和EGFR中的一个新的特异性变异(rs1815157)。在中国样本中观察到的复制变异(31%)多于欧洲样本(15%)。在结合全基因组关联和功能注释时,EGFRTCN2被列为两个生物学意义最重大的基因,并通过亚洲人群的表型组范围孟德尔随机化(phe-MR)探索潜在的致病因素。目前的研究揭示了新的AD易感位点,强调了不同人群在AD遗传学研究中的重要性,并推进了对疾病病因学的理解。该研究于20247月发表在Alzheimers Dement》,IF13

技术路线

主要研究结果

1. 队列人口统计

第一阶段样本包括1286例临床诊断的AD病例和1523例认知正常的个体。根据病例或对照组最后一次检查时的年龄AAO是否小于65岁将样本分为两个年龄组。对于年轻组,病例的平均(±SD)年龄为56.4±5.2岁,对照组为55.0±6.7岁。对于老年组,病例的平均年龄为72.9±5.4岁,对照组为72.5±6.2岁。

复制阶段的参与者为中国人(2A期)和欧洲人(2B期)。所有处于复制阶段的病例都被临床诊断为LOAD2A期:平均AAO=72.7±9.6岁;2B期:平均AAO=72.9±15.2岁)。进一步的详细人口统计数据见表1

1:第1阶段发现、第2A阶段和2B阶段参与者的人口统计数据

2. EOADLOAD之间的遗传重叠

作者研究了早发型ADEOAD)和晚发型ADLOAD)之间的遗传重叠。以欧洲五大GWASs中建立的LOAD风险位点为参考,估计了这些位点是否可以在中国EOADLOAD中得到验证。使用来自第一阶段发现样本的数据,对中国EOADLOAD进行了单独的GWASs。结果发现,来自欧洲样本的已知LOAD位点的15%的变异在中国LOADBIN1CLNKCD2APHS3ST5ANK3APOE)和EOADNME8PICALMIQCKKAT8APOE)中具有显著意义。最显著的信号是APOE rs429358,与EOADOR=2.32Pp=3.57×10-15padj=2.39×10-13)和LOADOR=2.49p=4.34×10-21padj=2.91×10-19)具有相似的相关性。第二个是BIN1 rs6733839。与LOAD显著相关(OR=1.31 p=8.24×10-4padj=0.03),与EOAD的相关性方向相同,但显著性较小(OR=1.15p=0.10)。值得注意的是,除NME8外,与中国EOADLOAD相关的所有名义上显著的变异均显示出与原始欧洲LOAD GWAS一致的方向,这表明EOADLOAD具有显著的遗传相似性。作者还系统地探索了EOADLOAD在不同显著性水平上的遗传重叠。EOADLOAD之间的共享变异的比例很高,但在p值阈值放宽时逐渐下降。当在全基因组显著性阈值(p<5×10−8)条件下时,APOE成为EOADLOAD的唯一共同显著性信号(图1)。

1:第一阶段(A)和第一阶段+2AB)与AD的全基因组关联

3. 全基因组Meta分析和复制确定新的特异性位点

由于在上述分析中观察到EOADLOAD之间的遗传重叠,下一步将EOADLOAD结合起来以加强AD易感位点的发现。对EOADLOAD GWAS的结果进行了Meta分析,分析后的基因组膨胀因子是适度的(λ=1.07)。除了APOE,在第一阶段Meta分析中,三个新的位点(7q31.212q23.322q12.2)达到了全基因组显著性阈值(图2A)。值得注意的是,亚洲和欧洲人群之间这些新位点的主要变体的等位基因频率存在显著差异。根据1000G参考,12q23.3rs14722611922q12.2rs3804080在东亚人群中很常见(MAF分别为0.010.05),但在欧洲人群中很少见。此外,7q31.2rs757278MAF1000G东亚人群中为0.01,但在1000G欧洲人群中为0.35

接下来在中国(2A期)和欧洲(2B期)样本中进行了复制分析,以评估结果的稳健性。结果发现,在第一阶段识别的所有提示性变异(P<1×10-5)中,31%Bonferroni校正后可以在独立的中国样本中验证(2A期)。值得注意的是,位点22q12.2TCN2)成功复制,p-值非常小(复制OR=0.67p=1.79×10-8),对发现样本(第1期)和复制样本(第2A期或2B期)的结果进行Meta分析。通过第1+2Ameta分析,确定了三个新的针对中国人群的全基因组显著信号,包括1p36.227p11.220p13位点(图2B和表2)。这三个信号在两个中国队列中都显示出统计学意义(发现p<1×10-5和复制padj<0.05),分层分析中没有发现性别偏倚。1p36.22位点(KIAA2013)和20p13位点(SLC52A3)以前在其他GWAS中没有报道,EGFR的领先信号rs1815157首次被确定为AD的新易感变异。.与阶段1+2A相比,阶段1+2BMeta分析没有发现任何额外的全基因组显著信号。除了不同的遗传相关性之外,作者再次注意到中国和欧洲人口之间等位基因频率的差异。例如,rs75680863-TTCN2)频率在中国样本中为0.12,但在欧洲人群中仅为0.001(表2)。这些发现进一步支持了AD的遗传决定因素在不同人群中有所不同的假设。

2:候选基因的功能探索和基因优先排序

2:阶段12A后达到全基因组意义的已确定位点的结果汇总

4. AD候选基因的功能解释和最优候选基因筛选

本研究基于第1+2A期的GWAS结果,进行了位置定位、脑eQTL定位和染色质相互作用定位,以识别与AD相关的新基因。这三种方法共识别了19个独特的候选AD基因。此外,进行了基于基因的关联测试,在Bonferroni校正后识别了10个显著基因。在中国样本中,基因定位策略和基于基因的关联测试产生了83个独特的候选AD基因。脑细胞类型分析显示,当比较AD病例与对照组时,这些候选AD基因在星形胶质细胞、少突胶质细胞和神经元中表现出差异表达(图2A)。此外,这些候选AD基因的基因本体富集分析显示,富集最多的GO术语与脂质代谢有关(图2B)。值得注意的是,这些本体与EOADLOAD之间共享基因富集的本体一致。

随后对所有候选AD相关基因进行了功能探索分析。这些分析包括检查与健康对照组相比AD大脑中的差异表达,以及人类和小鼠大脑中基因表达与AD神经病理学之间的相关性。发现经过多次测试调整后,23个基因在AD和健康对照组之间具有差异表达。此外,19个基因的表达水平与小鼠模型中淀粉样β)或tau病理相关。七个候选基因的表达水平也与人类死后样本中的AD特征显著相关,包括神经原纤维缠结(EGFRAPOC1PES1)的分布和严重程度、神经根斑块密度(EGFRAPOC1RNF215LIMK2)以及死亡时的一致认知诊断(SEC14L6TCN2),尽管除APOC1之外,这些基因尚未在体内与脑脊液诊断生物标志物相关。与AD特征相关的基因可以分为四个簇,其特征是它们参与脂质代谢、核糖体核糖核酸、表皮生长因子受体(EGFR)结合和丝裂原活化蛋白激酶信号传导。基于上述研究结果,作者制定了优先评分,包括通过GWAS的显著性、基于基因的相关性、功能定位、差异表达以及与AD神经病理学的相关性。该评分范围为010分。值得注意的是,三个基因——EGFRAPOC1TCN2——得分最高,因此被认为是最优先的(图3C)。

EGFR编码表皮生长因子受体,参与早期脑发育和脑萎缩。据报道,欧洲研究中有44EGFR变异与AD和相关痴呆有关,29种与淀粉样变性和脑疾病导致的死亡相关。此外,EGFR主要在星形胶质细胞中表达,并且发现该基因在受AD影响的多个脑区过表达(图3)。此外,EGFR可以与PSEN1PSEN2APOE相互作用,具有良好的治疗潜力和安全性,表明它是AD的一个有希望的药物靶点。APOC1虽然定位于APOE区域,但基因优先排序中优于APOE,因为APOC1在脑eQTL定位中具有显著意义,其表达水平与AD神经病理学显著相关,如神经原纤维缠结的分布和严重程度。APOC1也与脂质代谢特征有关。

TCN2是作者在中国meta分析中发现的一个新基因,编码一种属于维生素B12结合蛋白家族的蛋白质。研究发现TCN2的主要变异体rs75680863是一种可能的缺失错义变异体(联合注释依赖消耗[CADD]评分=22.2),在中国常见,但在欧洲人群中罕见。此外,背外侧前额叶皮层的eQTL rs5997690rs75680863处于连锁不平衡状态(样本中的LDr2=0.59),在样本中,它也与AD名义上相关(OR=0.73p=4.48×10-5)。TCN2可能参与血管机制,因为它在内皮细胞中表达,其变异体已被报道与多种脑血管疾病相关。

3:人类AD大脑和对照之间优先基因的差异表达

5. 全表型MR揭示平均红细胞血红蛋白浓度(MCHC)对EOAD的因果作用

最后,为了提供亚洲人群AD病因的因果见解,使用BioBank Japan Project的暴露进行了表型组范围的MR(或phe-MR)。在多次测试校正后,只有基因测定的平均红细胞血红蛋白浓度(MCHC)显示出对EOAD的显著保护作用(IVW OR=0.30Praw=4.09×10-4padj=0.03),如下图4所示

4MCHCEOAD上的因果作用图

结论

总之,本研究结果在阐明AD的复杂病因方面又向前迈进了一步。揭示了EOADLOAD之间存在广泛的遗传重叠。使用来自两个人群的数据,发现了三个新的AD易感位点(KIAA2013SLC52A3TCN2)和一个AD的易感信号(EGFR的先导信号rs1815157),在优先等级评分中可知,EGFRTCN2被优先列为与AD有关最重要的两个基因,可以作为AD潜在的药物靶点进行进一步研究。全表型孟德尔随机化表明,高平均红细胞血红蛋白浓度可能预防AD的发生。使用GWAS、表观基因组测序和更先进的技术在所有人群中对AD临床亚型的研究将有助于增强了解AD遗传图谱,并为AD病因学提供更有价值的见解。

参考文献

Ge YJ, Chen SD, Wu BS, et al. Genome-wide meta-analysis identifies ancestry-specific loci for Alzheimer's disease. Alzheimers Dement. Published online July 18, 2024. doi:10.1002/alz.14121. IF: 13.0 Q1

生信分析样本收集;基因分型和质量控制;GWASEOADLOAD的遗传比较;复制和Meta分析;候选AD基因的鉴定和优先排序;优先基因的随访;亚洲人群全表型组MR

谢!


  

英拜

课题设计与申报|分子生物学实验|细胞|机制调控|多组学检测分析




英拜生物
英拜生物提供专业的课题设计与申报服务,拥有完善的分子实验、细胞功能实验、机制调控实验,动物模型以及多组学检测分析检测平台,为您的科研助力!
 最新文章