抗N-甲基-D-天冬氨酸受体(NMDAR)脑炎是一种罕见的自身免疫性神经疾病。此疾病最初于2007年报道,与针对NMDAR的GluN1亚基的抗体相关,估计发病率每10万人/年约为0.03例,临床疾病特征是记忆功能障碍、癫痫发作、精神症状、行为改变和意识水平下降。虽然卵巢畸胎瘤和病毒感染,主要是单纯疱疹病毒1型(HSV1), 已被确定为抗NMDAR脑炎的潜在触发因素,但是许多患者没有可识别的免疫触发因素,因此,有必要对疾病的遗传易感性和环境因素进行探索。人类白细胞抗原(HLA)是一种与自身免疫性疾病相关的显著遗传因素,约占已知遗传易感性的一半。然而 ,目前的研究主要集中在HLA与抗NMDAR脑炎的相关性上,并且在遗传易感性方面的结果不一致,仅发现了较弱的关联性,如中国人群中的DRB1*16:02等位基因和德国的B*07:02等位基因。因此,除了研究抗NMDAR脑炎中HLA的易感性外,其他非HLA位点在该疾病发病机制中的可能作用也值得进一步研究。值得注意的是,最近在德国进行的一项小规模的全基因组关联研究(GWAS)发现了HLA区域外的新的遗传易感位点(LRRK1、ACP2和NR1H3)的抗NMDAR脑炎。鉴于抗NMDAR脑炎的罕见性和在不同人群中观察到的遗传多样性以及先前研究规模较小,对这种疾病背后的遗传基础的理解仍然比较有限。仍然需要更大规模的研究以探索和验证更多的遗传发现和证据。
针对以上问题,2024年5月11日,四川大学华西医院洪桢教授团队【第一作者刘旭博士等】联合华北理工大学孙良丹教授团队、中山大学附三院舒崖清团队等国内多个团队在【Neurology: Neuroimmunology & Neuroinflammation】杂志(IF = 7.8)上发表的一篇题为“Genome-Wide Association Study Identifies IFIH1 and HLA-DQB1*05:02 Loci Associated With Anti-NMDAR Encephalitis”文章,本研究揭示了与NMDAR疾病相关的基因变异,发现新基因IFIH1和HLA-DQB1*05:02位点与抗NMDAR脑炎相关,从而为疾病的遗传学研究和未来的治疗策略提供重要信息。
1. 研究人群
本项研究为多中心样本的病例-对照关联研究:来自6大医院的中国汉族病例(n=413),包括四川大学华西医院(n=207),成都上锦南府医院(n=87),中山大学附属第三医院(n=101),北京天坛医院(n=10),四川省人民医院(n=6)和郑州大学第一附属医院(n=2)。所有健康对照组(n=7,127)均来自IgA血管炎的GWAS研究,这些健康对照组是通过与中国多家医院的合作从中国汉族人群中招募的。对照组的临床评估为无系统性疾病、自身免疫性疾病和自身免疫性疾病家族史(包括一、二、三级亲属)。从外周血样本中提取基因组DNA,使用Illumina global screening array(GSA)进行基因分型,对原始的基因分型数据进行了系统的质量控制,以排除不合格的样本和单核苷酸多态性位点(SNPs),所有基因型分析均采用基因组Studiov2.0和PLINK 1.07软件进行分析【GWAS实验以及关联分析由Genesky Biotechnologies Inc., Shanghai, China上海天昊生物科技有限公司完成】。
1. 排除Call rate<95%的样本以及基于预测血统身份(PI_HAT >0.25)密切相关的个体。2. 排除异常杂合度(>平均±3 SD)样本;3. 主成分分析(PCA), 从方差标准化关系矩阵中提取20个主成分。使用平均距离加上3倍的SD作为阈值来识别异常值,并去除586个样本。4. 在排除性染色体和线粒体SNPs后,如果SNP位点在病例或对照组中call rate < 95%,人群中MAF < 1%,或对照组中偏离哈迪-温伯格平衡,也被排除(HWE P<1×10-4).
病例-对照关联分析采用Logistic回归分析,采用条件分析来确定独立的关联信号。对于新识别的风险位点, 使用LocusZoom生成区域关联图。利用GTEx ( 版本8)和其他技术鉴定了表达数量性状位点(eQTL)数据集。在本研究中,将全基因组水平的显著关联定义为p < 5×10-8以及与p < 5×10-5相关的暗示证据。
团队从 GSA 芯片中提取了位于 MHC 区域(chr6:29 - 34 Mb)的 6,422 个单核苷酸多态性位点(SNPs)用于后续分析,填充使用了一个由 10,689 名健康汉族受试者深度测序构建的包含 29,948 个变异的汉族 MHC 参考数据库。这个 MHC 参考数据库包含 8 个 HLA 基因(HLA-A、HLA-B、HLA-C、HLA-DRB1、HLA-DQA1、HLA-DQB1、HLA-DPA1 和 HLA-DPB1)、氨基酸(AA)多态性和 SNPs。使用 SNP2HLA 和 Beagle 软件来填充SNPs、两位和四位 HLA 等位基因以及 HLA AAs。团队应用了填充后的质量控制(QC)标准,即小等位基因频率(MAF)> 0.01 和推算质量(r2> 0.3),受试者和 SNPs 的call rate < 95% 和/或HWE P < 1.0 × 10−4 被排除。
【经过QC质控后,包括 25,859 个 SNPs、341 个等位基因(103 个两位和 238 个四位)和 813 个 AA 多态性在内的 27,013 个变异用于进一步分析。对于关联研究,双等位基因变异被编码为等位基因 1 和等位基因 2,而包括多位点残基位置和 HLA 等位基因在内的多等位基因变异被编码为单个等位基因的存在或不存在。为了评估 HLA 等位基因或 AA 多态性变异之间的独立信号,团队使用 PLINK 1.07 版本软件进行了逐步回归分析。该过程包括将顶级变异作为协变量进行条件处理,并迭代识别后续变异,直到没有变异达到显著阈值。为了避免遗漏潜在的显著关联,团队使用了严格的全基因组显著阈值(p = 5.0 × 10−8),并且还根据 Bonferroni 调整对测试变异的总数(p = 0.05/27,013)应用了研究范围的显著阈值(p = 1.85 × 10−6)】为了研究NR1多肽与HLAII类分子的结合,团队使用了在线工具NetMHCIIpan 4.0。人类NR1序列从UNIPROT数据库(登录号NP_015566.1)中检索并上传到工具。随后,选择DQB1*05:02进行比较,预测蛋白内的结合表位。使用AutoDock Vina软件来预测三级结构和对接。由于DQB1*05:02的晶体结构尚未通过实验确定,团队使用 Swiss-Model和DQB1*02:02为模板(蛋白质数据库代码6PX6),通过同源建模生成其结构。对接网格包含了整个肽结合的裂缝,扭转的数量被设置为零。团队还进行了AA结构预测,使用RCSB蛋白质数据库(RCSB.org),以确定AA变体在HLA-DQB1 (蛋白数据库代码1JK8)或HLA-B(蛋白质数据库代码1 A1M)蛋白质上的位置。
经过QC后,378例患者和6,576例对照患者中的379,039个变异的基因型数据保留下来进行相关性分析。基因组膨胀因子(λgc)为1.14,表明人口分层的影响很小。曼哈顿图如图1A所示。
团队鉴定了一个新的非HLA变异rs3747517 (p =1.06×10-8,OR = 1.55, 95%CI : 1.34-1.80),达到全基因组显著意义(p < 5×10-8)。该变异位于染色体2q24.2 IFIH1外显区,是一个错义突变(NM_022168:exon13:c.2528A>G:p.H843R),这是一种被广泛认可的与自身免疫性疾病相关的基因。值得注意的是,区域关联图显示了与位于IFIH1位点内的rs3747517(r2>0.2)的多个连锁不平衡(LD)(图1B),对rs3747517进行条件分析,没有发现进一步的独立关联 。团队对GTEx和脑内数据集的eQTL数据进行分析 ,发现rs3747517基因型与IFIH1在前扣带皮层和小脑皮层的表达水平显著相关(p = 0.016和p = 7.90×10-5)。对畸胎瘤、HSV感染后抗NMDAR脑炎和发病年龄小于18岁所定义的亚群进行进一步分析,没有发现全基因组显著相关性。在排除这些HSV感染后抗NMDAR脑炎患者后,团队仍然观察到IFIH1变异显著的相关性。采用SNP rs3747517进行性别分层分析,探讨对照组和病例中的性别相关差异。然而,按性别分层后,没有观察到名义上的异质性。团队随后评估了先前被确定为与抗NMDAR脑炎显著相关的其他非HLA SNP是否在团队的数据集中显示出任何显著的趋势。德国的一项全基因组关联研究报告了2个显著的关联,在LRRK1基因内的一个定位(rs10902588,p = 1.78×10-8),第二个是以ACP2和NR1H3基因在一个较大的高连锁不平衡区域(rs75393320,p =3.78×10-8)。尽管在团队的汉族队列中缺乏强有力的证据表明LRRK1位点和抗NMDAR脑炎之间存在关联,但团队确实在LRRK1位点上观察到一些SNP位点显示出名义上的显著性(p < 0.05)。这些发现表明LRRK1和抗NMDAR脑炎之间存在潜在的联系。团队无法分析rs75393320与该疾病的显著相关性,因为这些等位基因在东亚人群中的频率低于1%。2. HLA变异与抗NMDAR脑炎易感性的关联结果
团队观察到MHC区域内的5个SNP(rs2508008、rs9468731、rs139999228、rs1150770和rs1264562)获得了暗示的全基因组意义(p < 5×10-5),主要定位于RPP21和HLA-E的基因间区域。通过归因分析,团队系统地探索了MHC区域的HLA变异,在HLA I类和II类基因区域发现了919个SNP、34个AA变异和10个经典的HLA等位基因(两位数或四位数),在本研究中均达到显著水平。在II类中检测到最强的关联,特别是在HLA-DQB1区域。
在经典HLA等位基因中,患者HLA-DQB1*05:02、DRB1*16:02、HLA-A*11:01、HLAA*02:07的携带频率分别为26.7%(101/378)、15.6%(59/378)、48.4%(183/378)和27.5%(104/378)。与健康对照组相比,抗NMDAR脑炎的这些频率更高。在HLA-DQB1*05:02等位基因中观察到最强的关联(p =1.43×10-12;OR=2.10;95% CI:1.70–2.59),其次是HLA-DRB1*16:02 (p = 9.93× 10-10;OR=2.26;95%CI:1.73–2.96)。观察到HLA-A*11:01 、A*02:07和DPB1*05:01与诱发抗NMDAR脑炎的强相关性(p = 6.82× 10-8;OR=1.56;95%CI:1.33-1.84;p = 1.27×10-7 ; OR=1.73 ; 95% CI:1.41 –2.14 ;1.70)。在HLA-B、DQA1或DRA1位点的经典等位基因中没有观察到显著的相关性。在DQβ1的126位观察到最显著的关联,组氨酸(H)残基赋予了易感效应(p = 1.43×10-12;OR=2.10;95% CI:1.70 –2.59),以及在第57位与丝氨酸(S),也显示出一种易感效应(p = 1.54×10-12;OR=2.10 ; 95%CI:1.70 –2.59)。这些AA残基与HLADQB1*05:02处于完全连锁不平衡(LD)状态,并表现出相同的信号。强关联的HLA-DRβ1在28位谷氨酸残基(p = 1.14×10-9;OR= 0.53;95%CI:0.43-0.65)显示出保护作用。
3 . 经典等位基因HLA-DQB1*05:02、A*11:01和A*02:07 与抗NMDAR脑炎独立相关
团队进行了条件分析【conditional analysis通过 fine-mapping对casual SNP 致病SNP的精确定位方法,目的是确认是否存在次要的因果SNP secondary causal variants】,以评估与MHC区域的某些经典HLA等位基因的独立关联。HLA-DQB1*05:02和HLA-DRB1*16:02被鉴定为MHC的经典II级区域的显著等位基因。在HLA-DQB1*05:02上设置条件后,HLA-DRB1*16:02的关联被消除,表明这两个等位基因之间存在强大的LD。此外,在HLA-DQB1*05:02的条件作用下,第二个独立的等位基因为HLA-A*11:01 (p = 4.36×10-7;OR=1.52;95%CI:1.29-1.79;图2B)。对这两个等位基因的条件分析显示了第三个独立相关的信号与HLA-A*02:07(p = 1.28 × 10−8; OR=1.87; 95% CI:1.50–2.31; 图2C)。通过对HLA-DQB1*05:02、A*11:01和A*02:07进行条件分析,MHC区域内的残留遗传信号仅在DPB1*05:01内观察到(p = 8.07×10-5;OR=1.35;95% CI:1.16–1.56)。这些结果清楚地表明,几乎所有的关联信号都可以归因于这些特定的HLA经典等位基因,其中DQB1*05:02具有主要效应(图2)。
图2.与抗NMDAR脑炎相关的经典HLA等位基因的条件分析4. HLA-DQβ1-126H和HLA-B-97R是主要的独立MHC残基
团队还进行条件分析以确定与MHC基因中氨基酸变异的独立关联。通过对HLA-DQβ1-126H的条件分析显示出与HLA-B-97R有很强的第二种关联(p=3.40×10-8;OR=0.63;95%CI:0.53 –0.74;图3B)。当HLA-DQβ1-126H和HLA-B-97R同时作为协变量时,团队在HLA -DPβ1-35L处观察到第三个独立的信号(p =2.31×10-6;OR=1.43;95%CI:1.23-1.66;图3C) ; 然而,它没有达到研究范围内的显著性阈值(p = 1.85 × 10-6).对HLA-DQβ1-126H、HLAB-97R和 HLA-DPβ1-35L的条件调节几乎减弱了所有的AA关联信号(图3D)。因此,主要的独立MHC信号定位于HLA- DQβ1-126H和HLA-B-97R(图3)。HLA-DQβ1残基His126位于2个β-sheet结构的连接转折点上,并且位于β1域上。HLA-B残基Arg 97位于α1结构域内的 β-sheet结构上。
图3.与抗NMDAR脑炎相关的HLA氨基酸残基的条件分析
鉴于之前的研究结果表明,靶向NMDAR的致病性自身抗体与NR1亚基结合,团队试图预测该受体亚基中可被DQB1*05:02识别的潜在表位。通过使用NetMHCpan 4.0进行分析,团队鉴定了3个与DQB1*05:02强结合水平的肽,包括“indprl ”、“ iqavrdnkl ”和“ illvsddhe ”。在这3个预测的表位中,“ itgindprl ”对DQB1*05:02的预测结合亲和力最高。 目标序列“itgindprl ”的位置位于NR1的第658- 662个氨基酸之间蛋白质N端。计算对接分析显示, 目标序列“ itgindprl ”精确地符合DQB1*05:02和HLA-DQA1*01:02之间的肽结合槽,对接能量( ΔG)为-9.6千卡/mol(图4A)。在对接结构中,NR1肽主要位于HLA-DQB1*05:02和HLADQA1*01:02的异质二聚体的疏水腔中(图4B(a))。肽主要占据由链残基半胱氨酸(Cys)34、50、58、甘氨酸79、80、80、甘氨酸888、V91和Asn95,以及B链残基、62、79、Trp93、Gln96、Val99、Arg109、Val110、His113和Asn114组成的结合腔(图 4B(b-d))。对接结果表明,预测的表位与DQB1*05:02之间存在积极的相互作用。
本设计针对中国汉族人群抗NMDAR脑炎的最大队列研究,通过全基因组关联研究分析(GWAS)以及精细定位研究,研究发现并确定非HLA 区域的新位点(IFIH1),同时揭示了多个 I 类和 II 类 HLA 基因的等位基因和氨基酸多态性解释了抗NMDAR 脑炎在 MHC 区域内的大部分易感性风险。IFIH1 编码的干扰素诱导 RNA 解旋酶与 RIG - I 一起作为细胞质双链 RNA(dsRNA)传感器,检测病毒感染并启动抗病毒反应,其功能障碍可能会干扰 I 型干扰素(IFN)信号通路的正常功能,从而影响宿主对中枢神经系统中 HSV-1的防御,IFIH1 为宿主遗传、病毒和先天免疫反应或自身免疫之间提供了联系,有助于理解抗 NMDAR 脑炎的发病机制。HLA-DQB105:02和 DRB116:02 等位基因与多种自身免疫性疾病的风险增加相关,它们可能在自身抗体的产生中发挥重要作用。MHC 区域内特定的氨基酸多态性,即 HLA-DQβ1-126H 和 HLA-B-97R,在抗 NMDAR 脑炎的发病机制中起重要作用,HLA 氨基酸多态性可能通过改变与抗原肽的结合亲和力来影响T辅助细胞的调节并放大下游的免疫反应。总之,这些发现增强了对抗NMDAR 脑炎发展背后遗传机制的理解,并为下一步精准干预与相关药物靶点开发、治疗提供坚实的科学依据。Driving innovation for better life!