【专题评论】队列基因组学与冠心病精准医学

健康 2024-12-05 18:02 北京

点击标题下「蓝色微信名」可快速关注

本文刊于：中华心血管病杂志,2024, 52(11): 1253-1260

作者: 王斐¹陈秋丽^1，2 朱心宇^1，3汪敏先^1，2，3

单位： ¹ 中国科学院北京基因组研究所国家生物信息中心国家基因组数据中心；²中国科学院大学国家生物信息中心数据资源部； ³中国科学院大学中丹学院

摘要

冠心病发病与遗传因素密切相关。该文从队列基因组学和冠心病精准医学的角度，介绍了利用大规模人群队列进行的基因组学遗传分析在冠心病创新型治疗药物研发及患病风险精准评估与预警方面的创新研究与临床应用。同时，总结并评论了冠心病遗传学领域的重要研究方法和成果，特别是在基于大规模人群队列解析冠心病遗传基础、发现致病基因及治疗新靶标以及进行遗传风险评估等方面的进展。最后，对该领域当前面临的主要挑战进行了剖析，并展望了我国冠心病精准医学的发展前景。

正文

冠心病严重危害人类生命健康，每年造成超过900万人死亡 ^［^1 ］。在发达国家如美国和英国，通过积极实施预防医学策略，冠心病的流行趋势在20世纪60至70年代出现拐点，其发病率和死亡率逐年下降 ^［^{2 , 3 , 4 ］}。然而，《中国心血管健康与疾病报告2023》的数据显示，近20年来我国冠心病的患病率和死亡率均呈持续上升趋势 ^［^5 ］。因此，冠心病的精准防治仍是我国医疗保健领域面临的主要挑战。

尽管冠心病防治在基础研究与临床实践领域均取得了明显进展，但当前药物治疗效果仍不够理想，即使采用降脂、降压和阿司匹林等多种药物的联合治疗方案，冠心病患病风险也仅降低30%~45% ^［^6 , 7 ］。主要原因在于冠心病的危险因素众多、病理机制多样且临床表现及预后转归复杂。因此，对于疾病的治疗策略不能一概而论，必须通过创新性的研究策略来阐明患病个体的具体病因，从而开展有针对性的精准治疗，才能有效改善治疗效果、降低残余风险。

队列基因组学是一门专注于将队列研究与基因组学技术进行紧密结合的学科，其研究目标在于深入探讨基因与环境、生活方式、疾病发病率以及其他影响人类健康的因素之间的复杂相互作用。队列基因组学通过长期追踪大规模人群，系统性地收集队列成员在遗传、健康状况、临床诊断、生活方式和环境暴露等多方面的数据，旨在深入理解基因与环境等因素如何共同影响个体的健康状况和疾病发展。通过对大规模人群多维数据的精确测量与深入分析，队列基因组学能够有效揭示个体的复杂病因，进而为疾病的精准治疗提供科学依据和指导。

一、队列基因组学与药物研发

队列基因组学在研究个体基因与疾病之间的因果关系方面具有明显优势。遗传基因是首要致病因素，且终生稳定、不易受到外界干扰，因此，遗传研究被视为指导创新药物研发的理想工具。例如2021年美国食品药品监督管理局（FDA）批准的50个药物中2/3的药物有遗传学证据的支持 ^［^8 ］，Minikel等 ^［^9 ］的研究显示，有遗传学证据支持的新药研发成功率能够提高2.6倍。目前，新药研发的平均周期长达12.5年，耗资高达25亿美金 ^［^10 ］，队列基因组学研究对于促进新药研发、降低研发成本具有重要意义。

流行病学调查显示，低密度脂蛋白胆固醇（low-density lipoprotein cholesterol，LDL-C）为有害胆固醇，而高密度脂蛋白胆固醇（high-density lipoprotein cholesterol，HDL-C）与心血管疾病风险降低相关 ^［^11 ］。然而，孟德尔随机化的遗传因果分析结果显示，仅LDL-C与冠心病风险存在因果关系，HDL-C和疾病风险只有相关性而没有因果关系 ^［^12 ］。因此，围绕降低LDL-C研发的治疗药物，如前蛋白转换酶枯草溶菌素9（proprotein convertase subtilisin/kexin type 9，PCSK9）抑制剂、NPC1L1（Niemann-Pick C1-like 1）抑制剂等均取得明显成效 ^［^{13 , 14 , 15 , 16 , 17 , 18 ］}，而针对HDL-C的药物如烟酸类药物均未达到预期效果 ^［^19 ］。NPC1L1基因失活突变与LDL-C水平和冠心病风险降低相关 ^［^18 ］，依折麦布（通过抑制NPC1L1的蛋白质产物来减少胆固醇吸收）的成功研发进一步验证了NPC1L1失活突变可有效减少心血管事件 ^［^13 ］。尽管脂蛋白相关磷脂酶A2在流行病学和模式动物研究中均表现出良好效果 ^［^{20 , 21 ］}，但在入选了28 000多例冠心病患者的随机临床试验中脂蛋白相关磷脂酶A2抑制剂被证明无效 ^［^{22 , 23 ］}。脂蛋白相关磷脂酶A2基因常见和罕见变异相关的遗传学研究表明，这些变异与冠心病风险无显著相关性，从遗传学角度进一步印证了临床试验结果 ^［^{24 , 25 ］}。这些正面或者反面的例子都证明了队列基因组学在新药研发中的重要指导作用。

靶向特定基因的创新型治疗措施或将为冠心病的治疗带来革命性的改变。靶向PCSK9的药物具有较好的疗效及安全性，如Inclisiran不仅治疗效果显著，且1年仅需注射2次，能有效改善患者的依从性 ^［^26 ］。美国Verve Therapeutics公司首次利用基因编辑方法沉默灵长类肝脏中的PCSK9基因，期望实现一次治疗达到永久降低冠心病风险的目标 ^［^27 ］。队列基因组分析能有效模拟PCSK9抑制剂的治疗效果。Dron等 ^［^28 ］通过对209 537名受试者进行基因组测序，发现携带载脂蛋白B（apolipoprotein B，APOB）基因或PCSK9基因功能缺失遗传变异的个体在30年随访中冠心病风险降低了约49%。因此，基于大规模人群队列的遗传学研究不仅能够验证靶基因干预的有效性，还能估计干预的效能。近年来随着人群队列研究的快速发展，特别是英国生物样本库及美国All of Us等百万人级队列基因组学项目的实施，基于队列基因组学的遗传研究将成为推动冠心病治疗新措施创新研发的主要驱动力之一，有望指导开发出更多治疗新措施。

罕见变异关联分析是一种基于大规模人群基因测序数据探索与疾病直接相关的基因的重要遗传分析方法。由于受自然选择的作用，对基因功能具有明显影响的遗传变异在人群中的分布频率往往较低 ^［^11 ］，这类变异被称为罕见变异。在人群中罕见变异携带者数量有限，传统的以单个变异为单位的关联分析方法往往难以实施。而罕见变异关联分析的策略则以基因或基因组功能单元为分析单位，通过对比基因功能单元内罕见变异携带者数量在患病组与健康对照组中的分布差异，鉴别出与疾病风险相关的基因或基因组功能单元 ^［^{29 , 30 ］}。罕见变异关联分析的优势在于其能够直接识别出致病基因或功能单元，从而为后续的机制验证分析提供了明确的目标，对冠心病治疗新靶标的开发具有重要的指导意义。

截至目前，罕见变异关联分析研究已成功识别出至少12个基因，其罕见突变直接影响冠心病风险 ^［^{31 , 32 , 33 , 34 , 35 ］}。一项研究采用罕见变异关联分析对4703例早发冠心病患者与5 090例健康对照的全外显子组数据进行比较，结果显示低密度脂蛋白受体（low-density lipoprotein receptor，LDLR）基因的罕见突变与冠心病风险之间存在显著关联，LDLR致病突变携带者的冠心病患病风险增加了约4倍 ^［^31 ］。还有研究通过罕见变异关联分析证实了与甘油三酯富集脂蛋白代谢相关的基因，特别是脂蛋白脂肪酶通路中的基因，与冠心病风险具有显著关联 ^［^36 ］。脂蛋白脂肪酶的活性是决定从循环中清除膳食脂肪速率的关键因子，其功能缺失的杂合突变个体表现出甘油三酯水平升高，冠心病风险增加 ^［^36 ］。载脂蛋白A5基因编码的蛋白可增强脂蛋白脂肪酶活性，其功能缺失突变可显著增加冠心病风险 ^［^31 ］。相反，载脂蛋白C3和血管生成素样蛋白4基因的罕见突变（其蛋白产物抑制脂蛋白脂肪酶）与冠心病风险降低有关 ^［^{34 ， 37 , 38 , 39 ］}。2005年，Cohen等 ^［^40 ］对128名低LDL-C水平受试者的PCSK9基因区域进行了测序，发现PCSK9基因的2个功能失活性突变能有效降低LDL-C水平和冠心病风险。此外，一项涉及冰岛2636名受试者的全基因组测序研究揭示了17号染色体上12 bp的片段缺失可导致去唾液酸糖蛋白受体1基因的功能性失活；杂合突变携带者的非HDL水平降低了153 mg/L（ P=1.0×10 ^-16），并且这种突变与冠心病风险显著降低相关 ^［^41 ］。这一发现在小鼠模型上得到了机制验证 ^［^42 ］。目前，通过罕见变异关联分析鉴定出的12个致病基因中，有5个基因的功能缺失变异会增加冠心病患病风险，这些基因包括与血脂代谢通路相关的LDLR、载脂蛋白A5和脂蛋白脂肪酶，以及与血压调节通路相关的SVEP1和一氧化氮合酶3 ^［^{34 ， 43 ］}。另外7个基因的功能缺失变异则对心血管疾病风险具有保护作用，这些基因均与血脂调节相关，包括PCSK9、NPC1L1、载脂蛋白C3、血管生成素样蛋白4、血管生成素样蛋白3、溶血磷脂酸和去唾液酸糖蛋白受体1。这些保护性的遗传变异在指导冠心病新型治疗药物的研发上起到了至关重要的作用。

在现有技术体系下，利用单克隆抗体、反义寡核苷酸及基因编辑等方法实现基因功能降低或失活的技术已较为成熟。相较于上调基因表达或增强基因功能的技术，这些技术更成熟，在操作上也更为简便 ^［^{44 , 45 , 46 ］}。因此，功能失活性罕见变异但对冠心病风险具有保护作用的基因，已成为开发新型治疗策略的关键目标，已有多个针对此类基因的药物获得了美国FDA的批准或正处于临床试验阶段（表1 ） ^［^{13 , 14 , 15 , 16 , 17 , 18 ， 34 ， 37 , 38 , 39 ， 47 , 48 , 49 , 50 , 51 , 52 , 53 , 54 ］}。

（点击查看大图）

二、队列基因组学与疾病风险精准评估与预警

冠心病高风险个体的精准识别对疾病的预防和临床诊断具有重要的指导意义。根据美国医学遗传学和基因组学学会的指导意见，LDLR、PCSK9及APOB等3个基因被定义为家族性高胆固醇血症的医学可操作基因 ^［^55 ］。尽管这些基因的致病突变会增加心血管疾病风险，但借助当前成熟的医疗手段，能够有效进行监测、管理或治疗，从而降低遗传因素的影响。因此，在临床进行基因检测时，无论是否与主诉症状相关，均建议向受试者报告相关遗传检测结果，以便加强对个体的疾病风险管理。然而，通过检测LDLR、PCSK9及APOB基因致病位点所能筛选出的高风险个体非常有限，总人群中携带者占比不超过1% ^［^{56 , 57 ］}，对比冠心病在人群中的高患病率，提示需要发展更加有效的疾病风险识别模型与手段。

冠心病全基因组关联研究（genome-wide association studies，GWAS）全球合作联盟CARDIoGRAMplusC4D（ https：//www.cardiogramplusc4 d.org/）通过荟萃分析整合了全球主要的GWAS统计数据。汇总后的数据具有样本量大、统计效力高等优势，从而能够最大限度地识别与疾病相关的遗传位点。截至目前，CARDIoGRAMplusC4D联盟已整合了181 522例冠心病患者及1 165 690名健康对照的GWAS荟萃分析数据，在全基因组范围内共鉴定出241个与冠心病风险显著相关的独立遗传位点 ^［^58 ］。尽管单一遗传变异对疾病风险的贡献相对有限，但若综合考虑全基因组范围内所有风险变异的累积效应，就会发现遗传变异对疾病风险的影响非常显著。全基因组多基因风险评分正是基于这一原理，以加权求和的方式整合全基因组范围内所有对疾病风险有贡献的位点，从而实现对疾病遗传易感性进行更准确和更高效的评估。Khera等 ^［^59 ］构建的冠心病多基因风险评分模型在疾病风险分层方面取得了里程碑式的进展。该模型得分排名前8%、2.3%、0.5%的个体的冠心病患病风险分别是其他个体的3、4或5倍。笔者与Patel等通过训练性能更优的多基因风险评分模型构建了GPSmult模型，该模型能够从人群中识别上述高风险人群的比例提高至20%、9.6%、4.9%。这些高风险个体的患病风险，与LDLR、PCSK9及APOB等主效基因中罕见致病变异的遗传效应相当，但多基因风险评分模型能够识别出的等效高风险个体数量是主效基因检测的5~10倍 ^［^60 ］。Khera等 ^［^59 ］的研究进一步证实，这种评估方法不仅适用于冠心病，同样适用于心房颤动、糖尿病、炎症性肠病、乳腺癌等复杂疾病。近年来，越来越多的研究也表明，多基因风险评分模型在评估常见复杂疾病及罕见病风险方面均展现出良好的适用性 ^［^{61 , 62 ］}。

多基因风险评分模型的预测效果主要取决于两个关键因素，一是对遗传位点疾病风险效应值估计的准确性，二是遗传因素对疾病的总体贡献度（常以遗传力来度量）。例如基于500万人身高GWAS数据建立的多基因风险评分模型已能充分解释身高的遗传贡献，对于利用遗传信息估计身高而言，进一步增加样本量对改善准确性几乎无益，信息量已经趋于饱和 ^［^63 ］。然而，尽管当前的GWAS数据特别是由疾病联盟领导的荟萃分析已纳入大量样本，但对于位点遗传效应估计的准确性仍有待进一步提高。例如，对于冠心病而言，现有的GWAS研究样本量仍然不足，因此多基因风险评分模型尚难以完全解释其遗传力，增加GWAS数据的样本量是提高冠心病多基因风险评分模型预测准确性的可行方法。在当前冠心病GWAS样本量相对有限的情况下，特别是对于非欧洲人群，整合共病、危险因素及不同人群种族GWAS等关联信息是提升位点遗传效应估计准确性以及多基因风险评分模型预测效能的可行手段。Lu等 ^［^64 ］通过整合卒中、糖尿病、血压、血脂等全基因组关联研究信息构建了中国人群冠心病多基因风险评分模型，该模型表现出良好的预测效果。笔者与Patel等采用两层神经网络架构有效整合了多族裔人群、多临床危险因素及多关联共病等信息，构建了冠心病GPSmult新模型 ^［^60 ］。在总计超过51万人的独立验证人群中的验证结果显示，GPSmult对疾病风险进行准确分层的能力明显提升，最高与最低百分位数个体的患病风险相差近27倍。GPSmult的疾病风险预测准确性甚至超过了美国心脏病学会（American College of Cardiology，ACC）/美国心脏协会（American Heart Association，AHA）合并队列方程组（Pooled Cohort Equations，PCE），在ACC/AHA PCE基础上进一步改善了约40%个体的风险预测准确性。然而，多基因风险评分主要反映了个体先天遗传易感性，而PCE则更多量化了个体后天患病风险。通过综合利用多基因风险评分及PCE模型，整合来自先天遗传和后天环境因素等多方面的信息，有望开发出更为精准的个体风险量化模型，以进一步提升个体健康管理水平。

就具体某一个体而言，除全基因组遗传易感性以外，可能还同时存在主效基因风险，个体遗传风险的精准评估应考虑两者的交互作用及影响。笔者与Fahed等通过构建主效基因突变与多基因风险评分整合模型，将是否携带LDLR、PCSK9及APOB的致病突变及冠心病多基因风险评分同时纳入分析框架。分析结果显示，并非所有携带主效基因致病突变的个体都会发病，多基因风险背景对主效基因风险突变具有明显的遗传修饰作用。如主效基因突变携带者中多基因风险评分排名最低的1%的个体，由于具备良好的全基因组遗传背景，其总体患病风险与非携带者相近；而部分个体若同时受到主效基因突变及全基因组累积效应的双重影响，其患病风险则可能是非携带者的8~10倍 ^［^57 ］。该模型通过量化个体的多元遗传风险，不仅提高了对个体疾病风险的预测准确性，还从遗传角度解释了致病突变不完全外显现象。因此，该工作荣获美国国家人类基因组研究所人类基因组研究咨询委员会评选的2020年度遗传信息用于临床实践的十大进展之一 ^［^65 ］。

基于个体血液样本的全基因组测序不仅能够精确检测胚系突变，量化主效基因及全基因组多基因风险等遗传风险，同时还能识别造血干细胞中后天获得的体细胞突变以及估算细胞端粒长度等。这些因素都随着年龄的增长而发生变化，并且也被多项研究证实与冠心病风险密切相关 ^［^{66 , 67 , 68 , 69 ］}。随着测序技术、可穿戴智能风险监测技术及人工智能技术的发展，回望冠心病遗传风险预警模型的发展历史，通过队列基因组学解析各个危险因素对疾病风险的评估作用，以及探究多因素的交互影响作用，进一步发展出基于多元危险因素的整合模型，未来有望开发出更为精准和全面的、依据个体遗传特性的、个体化的风险评估预警方案（图1 ）。

（点击查看大图）

三、中国心血管疾病精准医学的发展亟须进一步推动队列基因组学研究

尽管队列基因组学在冠心病遗传机制解析、新药研发及个性化患病风险评估方面取得了长足的进展，但当前队列基因组数据主要源自欧美人群，且模型的开发与优化多针对欧美遗传背景开展，使用欧美数据所得出的结论在中国人群中的适用性仍需深入研究和验证。

已有研究表明，由于人群遗传背景的差异，基于欧美人群建立的模型直接用于中国人群时，预测准确度显著降低 ^［^70 ］。因此，增加中国人群的研究样本量，收集更多中国人群相关的遗传、分子多组学及影像多模态等数据，是解析中国人群特异的遗传背景机制及开发更为准确的中国人群风险评估模型的关键。除了增加数据量，还需在方法学上进行提升与优化，特别是识别和分析中国人群特有的遗传组成及疾病风险因素。比如乙醛脱氢酶2（aldehyde dehydrogenase 2，ALDH2）基因的rs671变异（导致504位的氨基酸由谷氨酸变为了赖氨酸）是东亚人群特有的遗传变异，在东亚人群中频率高达25%，而在其他人群中几乎不存在。该突变会引发饮酒红脸反应，另外还显著增加冠心病风险 ^［^71 ］。但在基于欧美人群数据构建的模型中，该变异的贡献和权重往往被忽略或低估。因此，在针对中国人群的优化模型中，需要对该位点及其他国人特有位点进行单独建模，以提升模型的预测效果 ^［^{72 , 73 ］}。

最终，新解析的遗传机制及新开发的风险评估模型，必须在中国人群的独立队列中进行验证，以确保其稳定性和可靠性。这将推动更为精准和高效的疾病风险预测与预警，为个性化疾病预防、治疗及健康管理奠定基础，最终促进我国冠心病精准医学的长足进步。

当前，大规模人群队列的遗传及基因组学分析加深了对冠心病风险和病因学的认知，在国际多个队列研究和生物样本库的建设引领下，大规模、高质量的生物样本库建设已经成为生命健康发展研究的关键基础设施，成为了现代医学研究不可或缺的资源。虽然与英国生物样本库及All of Us等欧美百万人级高质量队列仍有差距，近年来我国的队列基因组学研究也取得了长足的发展，如中国慢性病前瞻性研究队列、广州出生队列、复旦大学泰州队列等高质量队列建设应运而生，一些高质量的科研成果也随之涌现。未来，中国队列将在解析中国人群的疾病危险因素及致病机制方面，以及开发出更为有效的预防和干预方案方面发挥更加重要的作用。

精准医学的精髓是将病种按病因细分，然后在病因细分的基础上针对性地精细入组和精准治疗 ^［^74 ］。我国人群的多样性和庞大的人口规模将为病因的细分及研究提供充足的队列样本基础，这也是我国发展精准医学的重要优势。通过运用队列基因组学，结合表型组学和临床数据等多维度信息，揭示疾病预警、诊断、治疗及预后等关键环节的科学原理，有望阐明冠心病发病与转归的个体化机制，最终实现精准医疗的目标。

利益冲突所有作者声明无利益冲突

编辑：白洋

审核：白洋

《中华心血管病杂志》“优秀科研成果优先出版平台”投稿

《中华心血管病杂志》2025年1期至2026年6期重点号安排

征文启事｜《中华心血管病杂志》2024年12期“遗传性心血管病”重点号

征文启事丨《中华心血管病杂志》2025年第1期“高血压流行病学”重点号

征文启事丨《中华心血管病杂志》2025年2期“主动脉疾病”重点号征文启事

征文启事丨《中华心血管病杂志》2025年第3期“急性冠脉综合征残余风险管理”重点号

征文启事丨《中华心血管病杂志》2025年第4期“瓣膜病介入治疗”重点号

征文启事丨《中华心血管病杂志》2025年5期“冠状动脉腔内影像与功能学”重点号征文启事

征文启事丨《中华心血管病杂志》2025年第6期“心血管转化医学”重点号