题目:Shared and Distinct Genomics of Chronic Thromboembolic Pulmonary Hypertension and Pulmonary Embolism
杂志:American Journal of Respiratory and Critical Care Medicine
作者:James Liley, Michael Newnham, Marta Bleda, Katherine Bunclark, William Auger, Joan Albert Barbera, Harm Bogaard, Marion Delcroix, Timothy M. Fernandes, Luke Howard, David Jenkins, Irene Lang, Eckhard Mayer, Chris Rhodes, Michael Simpson, Laura Southgate, Richard Trembath, John Wharton, Martin R Wilkins, Stefan Gräf, Nicholas Morrell, Joanna Pepke Zaba, and Mark Toshner
发表时间:2024 Mar 12
DOI:https://doi.org/10.1164/rccm.202307-1236OC
背景与目的:
慢性血栓栓塞性肺动脉高压(CTEPH)是一种罕见疾病,其特征在于血栓组织化和纤维化导致近端肺动脉阻塞,进而引发肺动脉高压和右心衰竭。尽管通常与急性肺栓塞(PE)事件相关联,但急性PE后血栓不溶解的病理生物学机制尚不明确,可能涉及凝血级联、血管生成、血小板功能障碍和炎症反应等复杂因素。除了与大体积急性PE、特发性PE和PE复发有关,抗凝治疗的不足也可能诱发血栓形成,然而这些因素并不能完全解释大多数CTEPH患者的病情。此外,约25%的CTEPH患者没有PE的既往史。鉴于治疗性抗凝治疗的开展和缺乏良好的CTEPH动物模型,辨认CTEPH患者凝血/纤溶途径的异常变得更加复杂。
CTEPH的遗传研究受到该疾病罕见性的限制,这对相关病例的收集构成挑战。一项欧洲前瞻性注册研究发现,非O血型群体中CTEPH风险增加,表明此位点与CTEPH有遗传关联。尽管ABO与PE或其他凝血障碍疾病的总体风险相关联,但尚未发现其他与CTEPH相关的遗传关联达到全基因组显著水平。
相比之下,特发性肺动脉高压(IPAH)的遗传基础已被更系统地研究。约10-20%的IPAH个体发现了BMPR2的杂合子体系突变,同时还发现了其他较罕见序列变异。一项最新的GWAS研究也识别了新的与IPAH病因和临床过程相关的常见变异。
深入了解CTEPH的遗传基础有助于理解其病因和病理机制,同时也有助于CTEPH的风险评估、预防策略和治疗方式的选择。因此,进行全基因组关联分析是有益的。与现有的PE和DVT GWAS的共同分析可以更全面地解释CTEPH的GWAS结果。鉴于遗传因素可能导致IPAH的发展,并且IPAH与CTEPH共享某些病理生物学机制,例如血管重塑、炎症反应和血管生成失调,研究者也在探讨CTEPH与IPAH之间的遗传关联。
方法与材料:
该研究已通过地区伦理委员会审批(伦理委员会编号:08/H0802/32,08/H0304/56)。所有参与者均已从各自机构获得书面知情同意。研究采用两阶段设计进行GWAS分析:发现阶段包括英国病例,复制阶段则包括混合病例,包括非英国和英国对照组。所有病例均根据国际指南诊断CTEPH,并通过认证专业中心进行诊断,辅以多模态影像学和侵入式血流动力学。英国病例除在三级中心MDT复查外,还在国家CTEPH MDT上接受复查,经过外科医生、心脏病专家、放射科医生和PH专家的多学科团队讨论。与文献一致的是,本研究的CTEPH病例中,PEA治疗最为常见(62.4%),BPA占2.4%,PEA/BPA合并占1.6%,仅药物治疗占33.6%。对照组来自随机选取的人群。样本基因芯片分析使用以下四个平台之一:Illumina HumanOmniExpress Exome-8 v1.2 BeadChip(1555例病例,1693例对照),Illumina HumanOmniExpressExome-8 v1.6 BeadChip(372例病例,12例对照),Affymetrix Axiom全基因组CEU 1阵列(541例病例,5984例对照,其中包括在Illumina HumanOmniExpressExome-8 v1.2 BeadChip上重新分析的1533例对照)和Affymetrix UK Biobank Axiom阵列(6717例对照)。研究者对数据集进行了样本和SNP的质量控制,并利用1000G EUR数据生成的主成分排除了非欧洲血统的病例
根据基因芯片分析的平台(Affymetrix或Illumina),研究者将发现队列分成两组进行分析。在每个队列中,使用十个主成分作为协变量,进行基于逻辑回归的关联统计分析,并进行了基因组膨胀的残余校正。由于每次分析涉及不同的样本,研究者采用Fisher方法合并跨平的结果进行Meta分析。
为了提高检测CTEPH遗传关联的能力,研究者将来自CTEPH Meta分析的p值与来自UK Biobank自报PE和DVT的GWAS p值进行了联合分析。每次联合分析的输出是一组针对CTEPH的p值,这些p值针对CTEPH和第二种疾病之间的整体遗传相似性进行了“调整”,我们称之为“V值”。研究者还进行了一项使用DVT结果代替PE结果的分析,但发现两次分析的结果非常相似,因此研究者主要关注PE的分析。研究者根据在发现和复制子队列中的不同证据水平,将遗传关联定义为三个重要性层次。第一层要求发现队列的P < 5 × 10-6,验证队列中的P <5 × 10-3,以及联合Meta分析中的P < 5 × 10-8,且该位点需要满足在发现队列的两个子分析和验证队列分析中效应方向一致。第二层要求发现和验证队列中的P < 5 × 10-2,并且在整体Meta分析中P < 5 × 10-8,再次要求效应方向一致。“调整”后的p值允许使用条件假设下的假发现率(cFDR)以类似于使用Meta分析p值的方式比较关联证据,因此定义了第三层关联,要求该位点在整体Meta分析P值或“调整”后的p值<5 × 10-8,并且满足发现和验证队列中效应方向一致。此外,由于基因芯片分析可能存在导致混杂的批次效应,并且验证队列中病例和对照组的来源不同,需要进行跨平台比较和地理匹配,从而导致关联统计数据存在较高的膨胀。
作为肺动脉高压的一种类型,研究者考虑了CTEPH是否与特发性肺动脉高压(IPAH)共享病理生理机制。研究者首先评估了CTEPH的GWAS与最近关于IPAH的一项GWAS是否有关联。为了评估IPAH和CTEPH之间在遗传基础上的相似性,研究者使用连锁不平衡得分回归(LDSC)来估计两种特征之间的遗传相关性ρg,该方法衡量两种疾病共享遗传基础的程度。由于研究中存在的随机因素,研究者观察到的效应大小会有轻微误差。因此,对于与CTEPH相关的每个变异,研究者评估了CTEPH和PE中观察到的效应大小是否与随机变化一致,以及CTEPH和PE/DVT是否存在相同的潜在遗传原因。具体而言,考虑一个零假设,即两种疾病对所有SNPs具有相同的效应大小,并进一步评估了在CTEPH和PE之间存在该种效应差异的概率。
结果:
经过质量控制(见图1)后,数据集包括发现队列中的1146例病例和5498例对照,以及验证队列中的761例病例和4865例对照。共有4655481个SNP通过了质量控制并被包括在最终分析中。在第二层显著阈值上,该研究具备约80%的能力来检测一个次要等位基因频率(MAF)为0.25的OR值为1.3的SNP,或一个MAF为0.05的OR值为1.7的SNP。在第三层显著性阈值上可检测的效应大小更为复杂;研究者计算了基因组膨胀因子(λ),它衡量了p值的整体分布,应接近于1。λ在发现队列中为0.95,在验证队列中为1.21,表明验证队列中的基因组膨胀较高。研究者未能通过纳入更多的协变量或使用线性混合模型来减少验证队列中的膨胀。因此,研究者得出结论,考虑到复制数据集中病例和对照之间存在不完美的地理匹配,这种程度的膨胀是不可避免的。为了避免由于这种膨胀而产生的假阳性,研究者对验证队列中的P值进行了校正。
图2 CTEPH GWAS结果的曼哈顿图
发现队列和验证队列的Meta分析的曼哈顿图显示在图2中。在第一层显著性上,发现了两个区域关联(FGG和ABO),以及在第二层显著性上存在另外一个关联(MYH7B)。另有两个区域(F11和HLA-DRA)基于Meta分析p值达到第三层显著性。 与PE的联合分析在第三层全基因组显著性上显示了四个新的关联(F2, TSPAN15, SLC44A2 和 F5/NME7)。来自三项分析的z分数图表显示了与DVT和PE的GWAS结果存在关联,但同一位点对于不同表型的效应大小存在不同(图4、5)。
图3 CTEPH和PE的联合分析结果
研究者发现了CTEPH与峰值SNP rs7659024的关联,该SNP位于FGG基因下游大约4kb处。FGG基因编码纤维蛋白原蛋白的γ链,是纤维蛋白的前体,而纤维蛋白是血凝块的主要非细胞成分。既往研究提示,FGG中的SNP多态性与DVT有关。在CTEPH中,p值最强的关联是ABO基因中的rs687289,该基因决定ABO血型。这个位点也已知与DVT有关。非O血型的患者患CTEPH的风险更高。
HLA-DRA, TSPAN15, F2, SLC44A2, F11 (第二层显著性)在HLA-DRA基因中发现了一个与第二层显著性相关的关联(变异rs17202899),既往研究表明,这个基因未曾显示与DVT或PE有关。这个变异与多种自身免疫反应相关,包括1型糖尿病、系统性红斑狼疮和多发性硬化症。位于10号染色体上的变异rs78677622是TSPAN15基因上游10kb处的内含子变异,已知与DVT有关。11号染色体上的变异rs149903077是DGKZ基因中的一个内含子变异,但可能对应于CTEPH与F2基因的关联,其位于F2基因上游390kb。19号染色体上的变异rs2288904是SLC44A2基因中的一个错义变异,该基因的变异与DVT有关。4号染色体上的变异rs2289252是F11基因中的一个内含子,该基因编码凝血因子11,其变异与DVT有关。20号染色体上的变异rs745849是MYH7B基因中的一个内含子,尽管这个变异本身对于DVT或PE都未达到全基因组显著性,但其附近存在有与DVT相关的其余SNP。 最后,研究者在1号染色体上的rs796548658发现了一个第三层显著性的关联。尽管峰值变异是NME7基因中的一个内含子,但它可能代表CTEPH与F5基因的关联,F5基因与DVT有强烈关联。 研究者没有发现CTEPH与IPAH之间共享病理生理学机制的遗传证据。CTEPH的GWAS和IPAH的GWAS之间没有明显的共享关联。CTEPH与自报PE之间的遗传相关性显著高于零,表明共享的遗传架构(估计ρg 1.07,标准误差0.44;针对H0:ρg =0的p值0.014)但与1没有显著差异,表明这项分析不能排除相同的遗传架构。故研究者得出结论,从遗传学角度来看,与IPAH相比,CTEPH与PE更为相似。
研究者发现F5基因中变异在DVT、PE和CTEPH之间观察到的效应大小存在显著差异。研究者还注意到,HLA-DRA和MYH7B变异,既往并未被认为与DVT或PE有关。如果F5在DVT中的峰值SNP(或处于紧密连锁不平衡的SNPs)观察到的OR值等于CTEPH中的真实OR值,此研究研究将有> 99%的效能在第一层显著性下检测到这样的关联。同样,如果我们研究中发现的HLA-DRA关联的观察到的OR值对应于DVT中的真实效应大小,那么DVT的研究将有> 99%的效能检测到该关联。
故研究者得出结论,F5和HLA-DRA中的致病变异在CTEPH中的效应大小与其在DVT和PE中的这些变异中的效应大小不同;而另一方面,也不能得出MYH7B中的致病变异的效应大小在CTEPH与DVT或PE之间存在差异。
图4 CTEPH和DVT的遗传关联
图5 CTEPH和PE的遗传关联
局限性:
尤其是在验证队列中,这导致膨胀难以通过增加协变量或者是使用广义线性模型来消除。该研究的主要研究人群是欧洲人,那么接下来补充其他种族人群的CTEPH遗传数据是有必要的4.受限于样本量、研究设计和具体实施情况,此研究无法阐明罕见遗传变异对CTEPH病理生理机制的贡献。
研究结论:
此研究提供了CTEPH的首个大规模全基因组关联分析(GWAS),并首次展示如何在一个复杂的遗传相关性疾病中利用和比较这些基因相关数据集。该研究确立了血栓形成/纤溶的失调在CTEPH病因中的首要地位,并扩展了对包括炎症在内的其他病理生理机制的理解。此外,研究者还得出CTEPH与IPAH没有共享的遗传关联的结论。
研究思考:
1.样本量充足。本研究的发现队列和验证队列都包括了上千例CTEPH的病人。2.本研究设置了显著的三个阈值,可以在尽可能扩大阳性位点数的基础上,判断不同遗传变异的关联强度。3.本研究利用LDSC和联合分析算法,进一步判断了CTEPH和IPAH、PE之间的关联;这对于研究CTEPH发生发展的病理生理机制具有重要意义。
后续研究方向:
3. 结合CTEPH转录组学、蛋白组学、代谢组学进行多组学联合分析4. 根据CTEPH的GWAS结果,通过多种方式注释和筛选候选基因,并补充基因相关的机制研究。
参考文献:Liley J, Newnham M, Bleda M, Bunclark K, Auger W, Barbera JA, Bogaard H, Delcroi× M, Fernandes TM, Howard L, Jenkins D, Lang I, Mayer E, Rhodes C, Simpson M, Southgate L, Trembath R, Wharton J, Wilkins MR, Gräf S, Morrell N, Pepke Zaba J, Toshner M. Shared and Distinct Genomics of Chronic Thromboembolic Pulmonary Hypertension and Pulmonary Embolism. Am J Respir Crit Care Med. 2024 Mar 12. doi: 10.1164/rccm.202307-1236OC.