全基因组Meta分析确定阿尔茨海默病的特异性位点
简介
阿尔茨海默病(AD)是最常见的痴呆类型,影响全球4000多万人。AD的病因复杂,遗传因素发挥着关键作用。据报道大多数已知的基因位点只在欧洲血统的晚发型AD(LOAD)人群中鉴定出来。作者对AD进行了两阶段的全基因组关联研究(GWAS),共有6878名中国人和63,926名欧洲人。结果发现除了载脂蛋白E(APOE)位点之外,还发现了三个新的AD易感位点(KIAA2013、SLC52A3和TCN2)和EGFR中的一个新的特异性变异(rs1815157)。在中国样本中观察到的复制变异(31%)多于欧洲样本(15%)。在结合全基因组关联和功能注释时,EGFR和TCN2被列为两个生物学意义最重大的基因,并通过亚洲人群的表型组范围孟德尔随机化(phe-MR)探索潜在的致病因素。目前的研究揭示了新的AD易感位点,强调了不同人群在AD遗传学研究中的重要性,并推进了对疾病病因学的理解。该研究于2024年7月发表在《Alzheimers Dement》,IF:13
技术路线
主要研究结果
第一阶段样本包括1286例临床诊断的AD病例和1523例认知正常的个体。根据病例或对照组最后一次检查时的年龄AAO是否小于65岁将样本分为两个年龄组。对于年轻组,病例的平均(±SD)年龄为56.4±5.2岁,对照组为55.0±6.7岁。对于老年组,病例的平均年龄为72.9±5.4岁,对照组为72.5±6.2岁。复制阶段的参与者为中国人(2A期)和欧洲人(2B期)。所有处于复制阶段的病例都被临床诊断为LOAD(2A期:平均AAO=72.7±9.6岁;2B期:平均AAO=72.9±15.2岁)。进一步的详细人口统计数据见表1。表1:第1阶段发现、第2A阶段和2B阶段参与者的人口统计数据
2. EOAD和LOAD之间的遗传重叠
作者研究了早发型AD(EOAD)和晚发型AD(LOAD)之间的遗传重叠。以欧洲五大GWASs中建立的LOAD风险位点为参考,估计了这些位点是否可以在中国EOAD和LOAD中得到验证。使用来自第一阶段发现样本的数据,对中国EOAD和LOAD进行了单独的GWASs。结果发现,来自欧洲样本的已知LOAD位点的15%的变异在中国LOAD(BIN1、CLNK、CD2AP、HS3ST5、ANK3和APOE)和EOAD(NME8、PICALM、IQCK、KAT8和APOE)中具有显著意义。最显著的信号是APOE rs429358,与EOAD(OR=2.32,Pp=3.57×10-15,padj=2.39×10-13)和LOAD(OR=2.49,p=4.34×10-21,padj=2.91×10-19)具有相似的相关性。第二个是BIN1 rs6733839。与LOAD显著相关(OR=1.31, p=8.24×10-4,padj=0.03),与EOAD的相关性方向相同,但显著性较小(OR=1.15,p=0.10)。值得注意的是,除NME8外,与中国EOAD或LOAD相关的所有名义上显著的变异均显示出与原始欧洲LOAD GWAS一致的方向,这表明EOAD和LOAD具有显著的遗传相似性。作者还系统地探索了EOAD和LOAD在不同显著性水平上的遗传重叠。EOAD和LOAD之间的共享变异的比例很高,但在p值阈值放宽时逐渐下降。当在全基因组显著性阈值(p<5×10−8)条件下时,APOE成为EOAD和LOAD的唯一共同显著性信号(图1)。图1:第一阶段(A)和第一阶段+2A(B)与AD的全基因组关联
3. 全基因组Meta分析和复制确定新的特异性位点
由于在上述分析中观察到EOAD和LOAD之间的遗传重叠,下一步将EOAD和LOAD结合起来以加强AD易感位点的发现。对EOAD和LOAD GWAS的结果进行了Meta分析,分析后的基因组膨胀因子是适度的(λ=1.07)。除了APOE,在第一阶段Meta分析中,三个新的位点(7q31.2、12q23.3和22q12.2)达到了全基因组显著性阈值(图2A)。值得注意的是,亚洲和欧洲人群之间这些新位点的主要变体的等位基因频率存在显著差异。根据1000G参考,12q23.3的rs147226119和22q12.2的rs3804080在东亚人群中很常见(MAF分别为0.01和0.05),但在欧洲人群中很少见。此外,7q31.2中rs757278的MAF在1000G东亚人群中为0.01,但在1000G欧洲人群中为0.35。接下来在中国(2A期)和欧洲(2B期)样本中进行了复制分析,以评估结果的稳健性。结果发现,在第一阶段识别的所有提示性变异(P<1×10-5)中,31%在Bonferroni校正后可以在独立的中国样本中验证(2A期)。值得注意的是,位点22q12.2(TCN2)成功复制,p-值非常小(复制OR=0.67,p=1.79×10-8),对发现样本(第1期)和复制样本(第2A期或2B期)的结果进行Meta分析。通过第1+2A期meta分析,确定了三个新的针对中国人群的全基因组显著信号,包括1p36.22、7p11.2和20p13位点(图2B和表2)。这三个信号在两个中国队列中都显示出统计学意义(发现p<1×10-5和复制padj<0.05),分层分析中没有发现性别偏倚。1p36.22位点(KIAA2013)和20p13位点(SLC52A3)以前在其他GWAS中没有报道,EGFR的领先信号rs1815157首次被确定为AD的新易感变异。.与阶段1+2A相比,阶段1+2B的Meta分析没有发现任何额外的全基因组显著信号。除了不同的遗传相关性之外,作者再次注意到中国和欧洲人口之间等位基因频率的差异。例如,rs75680863-T(TCN2)频率在中国样本中为0.12,但在欧洲人群中仅为0.001(表2)。这些发现进一步支持了AD的遗传决定因素在不同人群中有所不同的假设。图2:候选基因的功能探索和基因优先排序
表2:阶段1和2A后达到全基因组意义的已确定位点的结果汇总
4. AD候选基因的功能解释和最优候选基因筛选
本研究基于第1+2A期的GWAS结果,进行了位置定位、脑eQTL定位和染色质相互作用定位,以识别与AD相关的新基因。这三种方法共识别了19个独特的候选AD基因。此外,进行了基于基因的关联测试,在Bonferroni校正后识别了10个显著基因。在中国样本中,基因定位策略和基于基因的关联测试产生了83个独特的候选AD基因。脑细胞类型分析显示,当比较AD病例与对照组时,这些候选AD基因在星形胶质细胞、少突胶质细胞和神经元中表现出差异表达(图2A)。此外,这些候选AD基因的基因本体富集分析显示,富集最多的GO术语与脂质代谢有关(图2B)。值得注意的是,这些本体与EOAD和LOAD之间共享基因富集的本体一致。随后对所有候选AD相关基因进行了功能探索分析。这些分析包括检查与健康对照组相比AD大脑中的差异表达,以及人类和小鼠大脑中基因表达与AD神经病理学之间的相关性。发现经过多次测试调整后,23个基因在AD和健康对照组之间具有差异表达。此外,19个基因的表达水平与小鼠模型中淀粉样β(Aβ)或tau病理相关。七个候选基因的表达水平也与人类死后样本中的AD特征显著相关,包括神经原纤维缠结(EGFR、APOC1和PES1)的分布和严重程度、神经根斑块密度(EGFR、APOC1、RNF215和LIMK2)以及死亡时的一致认知诊断(SEC14L6和TCN2),尽管除APOC1之外,这些基因尚未在体内与脑脊液诊断生物标志物相关。与AD特征相关的基因可以分为四个簇,其特征是它们参与脂质代谢、核糖体核糖核酸、表皮生长因子受体(EGFR)结合和丝裂原活化蛋白激酶信号传导。基于上述研究结果,作者制定了优先评分,包括通过GWAS的显著性、基于基因的相关性、功能定位、差异表达以及与AD神经病理学的相关性。该评分范围为0至10分。值得注意的是,三个基因——EGFR、APOC1和TCN2——得分最高,因此被认为是最优先的(图3C)。EGFR编码表皮生长因子受体,参与早期脑发育和脑萎缩。据报道,欧洲研究中有44种EGFR变异与AD和相关痴呆有关,29种与淀粉样变性和脑疾病导致的死亡相关。此外,EGFR主要在星形胶质细胞中表达,并且发现该基因在受AD影响的多个脑区过表达(图3)。此外,EGFR可以与PSEN1、PSEN2和APOE相互作用,具有良好的治疗潜力和安全性,表明它是AD的一个有希望的药物靶点。APOC1虽然定位于APOE区域,但基因优先排序中优于APOE,因为APOC1在脑eQTL定位中具有显著意义,其表达水平与AD神经病理学显著相关,如神经原纤维缠结的分布和严重程度。APOC1也与脂质代谢特征有关。TCN2是作者在中国meta分析中发现的一个新基因,编码一种属于维生素B12结合蛋白家族的蛋白质。研究发现TCN2的主要变异体rs75680863是一种可能的缺失错义变异体(联合注释依赖消耗[CADD]评分=22.2),在中国常见,但在欧洲人群中罕见。此外,背外侧前额叶皮层的eQTL rs5997690与rs75680863处于连锁不平衡状态(样本中的LD,r2=0.59),在样本中,它也与AD名义上相关(OR=0.73,p=4.48×10-5)。TCN2可能参与血管机制,因为它在内皮细胞中表达,其变异体已被报道与多种脑血管疾病相关。图3:人类AD大脑和对照之间优先基因的差异表达
5. 全表型MR揭示平均红细胞血红蛋白浓度(MCHC)对EOAD的因果作用
最后,为了提供亚洲人群AD病因的因果见解,使用BioBank Japan Project的暴露进行了表型组范围的MR(或phe-MR)。在多次测试校正后,只有基因测定的平均红细胞血红蛋白浓度(MCHC)显示出对EOAD的显著保护作用(IVW OR=0.30,Praw=4.09×10-4,padj=0.03),如下图4所示图4:MCHC在EOAD上的因果作用图
结论
总之,本研究结果在阐明AD的复杂病因方面又向前迈进了一步。揭示了EOAD和LOAD之间存在广泛的遗传重叠。使用来自两个人群的数据,发现了三个新的AD易感位点(KIAA2013、SLC52A3和TCN2)和一个AD的易感信号(EGFR的先导信号rs1815157),在优先等级评分中可知,EGFR和TCN2被优先列为与AD有关最重要的两个基因,可以作为AD潜在的药物靶点进行进一步研究。全表型孟德尔随机化表明,高平均红细胞血红蛋白浓度可能预防AD的发生。使用GWAS、表观基因组测序和更先进的技术在所有人群中对AD临床亚型的研究将有助于增强了解AD遗传图谱,并为AD病因学提供更有价值的见解。参考文献
Ge YJ, Chen SD,
Wu BS, et al. Genome-wide meta-analysis identifies ancestry-specific loci for
Alzheimer's disease. Alzheimers Dement. Published online July 18, 2024.
doi:10.1002/alz.14121. IF: 13.0 Q1生信分析:样本收集;基因分型和质量控制;GWAS;EOAD和LOAD的遗传比较;复制和Meta分析;候选AD基因的鉴定和优先排序;优先基因的随访;亚洲人群全表型组MR
谢谢!
课题设计与申报|分子生物学实验|细胞功能|机制调控|多组学检测分析