本文刊于:中华心血管病杂志,2024, 52(11): 1253-1260
作者: 王斐1 陈秋丽1,2 朱心宇1,3 汪敏先1,2,3
单位: 1 中国科学院北京基因组研究所 国家生物信息中心 国家基因组数据中心;2中国科学院大学 国家生物信息中心 数据资源部; 3中国科学院大学中丹学院
摘要
冠心病严重危害人类生命健康,每年造成超过900万人死亡 [ 1 ] 。在发达国家如美国和英国,通过积极实施预防医学策略,冠心病的流行趋势在20世纪60至70年代出现拐点,其发病率和死亡率逐年下降 [ 2 , 3 , 4 ] 。然而,《中国心血管健康与疾病报告2023》的数据显示,近20年来我国冠心病的患病率和死亡率均呈持续上升趋势 [ 5 ] 。因此,冠心病的精准防治仍是我国医疗保健领域面临的主要挑战。
尽管冠心病防治在基础研究与临床实践领域均取得了明显进展,但当前药物治疗效果仍不够理想,即使采用降脂、降压和阿司匹林等多种药物的联合治疗方案,冠心病患病风险也仅降低30%~45% [ 6 , 7 ] 。主要原因在于冠心病的危险因素众多、病理机制多样且临床表现及预后转归复杂。因此,对于疾病的治疗策略不能一概而论,必须通过创新性的研究策略来阐明患病个体的具体病因,从而开展有针对性的精准治疗,才能有效改善治疗效果、降低残余风险。
队列基因组学是一门专注于将队列研究与基因组学技术进行紧密结合的学科,其研究目标在于深入探讨基因与环境、生活方式、疾病发病率以及其他影响人类健康的因素之间的复杂相互作用。队列基因组学通过长期追踪大规模人群,系统性地收集队列成员在遗传、健康状况、临床诊断、生活方式和环境暴露等多方面的数据,旨在深入理解基因与环境等因素如何共同影响个体的健康状况和疾病发展。通过对大规模人群多维数据的精确测量与深入分析,队列基因组学能够有效揭示个体的复杂病因,进而为疾病的精准治疗提供科学依据和指导。
一、队列基因组学与药物研发
队列基因组学在研究个体基因与疾病之间的因果关系方面具有明显优势。遗传基因是首要致病因素,且终生稳定、不易受到外界干扰,因此,遗传研究被视为指导创新药物研发的理想工具。例如2021年美国食品药品监督管理局(FDA)批准的50个药物中2/3的药物有遗传学证据的支持 [ 8 ] ,Minikel等 [ 9 ] 的研究显示,有遗传学证据支持的新药研发成功率能够提高2.6倍。目前,新药研发的平均周期长达12.5年,耗资高达25亿美金 [ 10 ] ,队列基因组学研究对于促进新药研发、降低研发成本具有重要意义。
流行病学调查显示,低密度脂蛋白胆固醇(low-density lipoprotein cholesterol,LDL-C)为有害胆固醇,而高密度脂蛋白胆固醇(high-density lipoprotein cholesterol,HDL-C)与心血管疾病风险降低相关 [ 11 ] 。然而,孟德尔随机化的遗传因果分析结果显示,仅LDL-C与冠心病风险存在因果关系,HDL-C和疾病风险只有相关性而没有因果关系 [ 12 ] 。因此,围绕降低LDL-C研发的治疗药物,如前蛋白转换酶枯草溶菌素9(proprotein convertase subtilisin/kexin type 9,PCSK9)抑制剂、NPC1L1(Niemann-Pick C1-like 1)抑制剂等均取得明显成效 [ 13 , 14 , 15 , 16 , 17 , 18 ] ,而针对HDL-C的药物如烟酸类药物均未达到预期效果 [ 19 ] 。NPC1L1基因失活突变与LDL-C水平和冠心病风险降低相关 [ 18 ] ,依折麦布(通过抑制NPC1L1的蛋白质产物来减少胆固醇吸收)的成功研发进一步验证了NPC1L1失活突变可有效减少心血管事件 [ 13 ] 。尽管脂蛋白相关磷脂酶A2在流行病学和模式动物研究中均表现出良好效果 [ 20 , 21 ] ,但在入选了28 000多例冠心病患者的随机临床试验中脂蛋白相关磷脂酶A2抑制剂被证明无效 [ 22 , 23 ] 。脂蛋白相关磷脂酶A2基因常见和罕见变异相关的遗传学研究表明,这些变异与冠心病风险无显著相关性,从遗传学角度进一步印证了临床试验结果 [ 24 , 25 ] 。这些正面或者反面的例子都证明了队列基因组学在新药研发中的重要指导作用。
靶向特定基因的创新型治疗措施或将为冠心病的治疗带来革命性的改变。靶向PCSK9的药物具有较好的疗效及安全性,如Inclisiran不仅治疗效果显著,且1年仅需注射2次,能有效改善患者的依从性 [ 26 ] 。美国Verve Therapeutics公司首次利用基因编辑方法沉默灵长类肝脏中的PCSK9基因,期望实现一次治疗达到永久降低冠心病风险的目标 [ 27 ] 。队列基因组分析能有效模拟PCSK9抑制剂的治疗效果。Dron等 [ 28 ] 通过对209 537名受试者进行基因组测序,发现携带载脂蛋白B(apolipoprotein B,APOB)基因或PCSK9基因功能缺失遗传变异的个体在30年随访中冠心病风险降低了约49%。因此,基于大规模人群队列的遗传学研究不仅能够验证靶基因干预的有效性,还能估计干预的效能。近年来随着人群队列研究的快速发展,特别是英国生物样本库及美国All of Us等百万人级队列基因组学项目的实施,基于队列基因组学的遗传研究将成为推动冠心病治疗新措施创新研发的主要驱动力之一,有望指导开发出更多治疗新措施。
罕见变异关联分析是一种基于大规模人群基因测序数据探索与疾病直接相关的基因的重要遗传分析方法。由于受自然选择的作用,对基因功能具有明显影响的遗传变异在人群中的分布频率往往较低 [ 11 ] ,这类变异被称为罕见变异。在人群中罕见变异携带者数量有限,传统的以单个变异为单位的关联分析方法往往难以实施。而罕见变异关联分析的策略则以基因或基因组功能单元为分析单位,通过对比基因功能单元内罕见变异携带者数量在患病组与健康对照组中的分布差异,鉴别出与疾病风险相关的基因或基因组功能单元 [ 29 , 30 ] 。罕见变异关联分析的优势在于其能够直接识别出致病基因或功能单元,从而为后续的机制验证分析提供了明确的目标,对冠心病治疗新靶标的开发具有重要的指导意义。
在现有技术体系下,利用单克隆抗体、反义寡核苷酸及基因编辑等方法实现基因功能降低或失活的技术已较为成熟。相较于上调基因表达或增强基因功能的技术,这些技术更成熟,在操作上也更为简便 [ 44 , 45 , 46 ] 。因此,功能失活性罕见变异但对冠心病风险具有保护作用的基因,已成为开发新型治疗策略的关键目标,已有多个针对此类基因的药物获得了美国FDA的批准或正处于临床试验阶段( 表1 ) [ 13 , 14 , 15 , 16 , 17 , 18 , 34 , 37 , 38 , 39 , 47 , 48 , 49 , 50 , 51 , 52 , 53 , 54 ] 。
(点击查看大图)
二、队列基因组学与疾病风险精准评估与预警
冠心病高风险个体的精准识别对疾病的预防和临床诊断具有重要的指导意义。根据美国医学遗传学和基因组学学会的指导意见,LDLR、PCSK9及APOB等3个基因被定义为家族性高胆固醇血症的医学可操作基因 [ 55 ] 。尽管这些基因的致病突变会增加心血管疾病风险,但借助当前成熟的医疗手段,能够有效进行监测、管理或治疗,从而降低遗传因素的影响。因此,在临床进行基因检测时,无论是否与主诉症状相关,均建议向受试者报告相关遗传检测结果,以便加强对个体的疾病风险管理。然而,通过检测LDLR、PCSK9及APOB基因致病位点所能筛选出的高风险个体非常有限,总人群中携带者占比不超过1% [ 56 , 57 ] ,对比冠心病在人群中的高患病率,提示需要发展更加有效的疾病风险识别模型与手段。
冠心病全基因组关联研究(genome-wide association studies,GWAS)全球合作联盟CARDIoGRAMplusC4D( https://www.cardiogramplusc4 d.org/)通过荟萃分析整合了全球主要的GWAS统计数据。汇总后的数据具有样本量大、统计效力高等优势,从而能够最大限度地识别与疾病相关的遗传位点。截至目前,CARDIoGRAMplusC4D联盟已整合了181 522例冠心病患者及1 165 690名健康对照的GWAS荟萃分析数据,在全基因组范围内共鉴定出241个与冠心病风险显著相关的独立遗传位点 [ 58 ] 。尽管单一遗传变异对疾病风险的贡献相对有限,但若综合考虑全基因组范围内所有风险变异的累积效应,就会发现遗传变异对疾病风险的影响非常显著。全基因组多基因风险评分正是基于这一原理,以加权求和的方式整合全基因组范围内所有对疾病风险有贡献的位点,从而实现对疾病遗传易感性进行更准确和更高效的评估。Khera等 [ 59 ] 构建的冠心病多基因风险评分模型在疾病风险分层方面取得了里程碑式的进展。该模型得分排名前8%、2.3%、0.5%的个体的冠心病患病风险分别是其他个体的3、4或5倍。笔者与Patel等通过训练性能更优的多基因风险评分模型构建了GPSmult模型,该模型能够从人群中识别上述高风险人群的比例提高至20%、9.6%、4.9%。这些高风险个体的患病风险,与LDLR、PCSK9及APOB等主效基因中罕见致病变异的遗传效应相当,但多基因风险评分模型能够识别出的等效高风险个体数量是主效基因检测的5~10倍 [ 60 ] 。Khera等 [ 59 ] 的研究进一步证实,这种评估方法不仅适用于冠心病,同样适用于心房颤动、糖尿病、炎症性肠病、乳腺癌等复杂疾病。近年来,越来越多的研究也表明,多基因风险评分模型在评估常见复杂疾病及罕见病风险方面均展现出良好的适用性 [ 61 , 62 ] 。
就具体某一个体而言,除全基因组遗传易感性以外,可能还同时存在主效基因风险,个体遗传风险的精准评估应考虑两者的交互作用及影响。笔者与Fahed等通过构建主效基因突变与多基因风险评分整合模型,将是否携带LDLR、PCSK9及APOB的致病突变及冠心病多基因风险评分同时纳入分析框架。分析结果显示,并非所有携带主效基因致病突变的个体都会发病,多基因风险背景对主效基因风险突变具有明显的遗传修饰作用。如主效基因突变携带者中多基因风险评分排名最低的1%的个体,由于具备良好的全基因组遗传背景,其总体患病风险与非携带者相近;而部分个体若同时受到主效基因突变及全基因组累积效应的双重影响,其患病风险则可能是非携带者的8~10倍 [ 57 ] 。该模型通过量化个体的多元遗传风险,不仅提高了对个体疾病风险的预测准确性,还从遗传角度解释了致病突变不完全外显现象。因此,该工作荣获美国国家人类基因组研究所人类基因组研究咨询委员会评选的2020年度遗传信息用于临床实践的十大进展之一 [ 65 ] 。
基于个体血液样本的全基因组测序不仅能够精确检测胚系突变,量化主效基因及全基因组多基因风险等遗传风险,同时还能识别造血干细胞中后天获得的体细胞突变以及估算细胞端粒长度等。这些因素都随着年龄的增长而发生变化,并且也被多项研究证实与冠心病风险密切相关 [ 66 , 67 , 68 , 69 ] 。随着测序技术、可穿戴智能风险监测技术及人工智能技术的发展,回望冠心病遗传风险预警模型的发展历史,通过队列基因组学解析各个危险因素对疾病风险的评估作用,以及探究多因素的交互影响作用,进一步发展出基于多元危险因素的整合模型,未来有望开发出更为精准和全面的、依据个体遗传特性的、个体化的风险评估预警方案( 图1 )。
(点击查看大图)
三、中国心血管疾病精准医学的发展亟须进一步推动队列基因组学研究
编辑:白 洋
审核:白 洋
《中华心血管病杂志》2025年1期至2026年6期重点号安排
投稿网址
www.editorialmanager.com/cardiodiscovery
作者须知
https://edmgr.ovid.com/cardiologydiscovery/accounts/ifauth.htm