01
Outline
✦
虽然很多经典模型(如PREVENT,SCORE2等)能用于动脉粥样硬化性心血管疾病(ASCVD)的风险评估,但这些风险模型主要关注ASCVD的总体风险,忽略了心力衰竭、瓣膜性心脏病及痴呆等多样心血管结局的复杂病理机制。尽管加入个别生物标志物可改善模型区分力,但效果有限。遗传风险评分虽具备潜力,但需要结合传统危险因素才能有效。
近年来,蛋白质组学和高通量计算建模的快速发展为心血管疾病风险评估提供了新的可能性。基于蛋白质组的风险模型可能优于传统方法,不仅提升了预测精准性,还为全面的疾病风险管理和个性化医疗铺平了道路。最近,Frederick K. Ho等人在《Circulation》上发表了一项重要研究,题为《A Proteomics-Based Approach for Prediction of Different Cardiovascular Diseases and Dementia》,该研究基于UK Biobank蛋白质组数据,分析了51859名无心血管病史个体的血浆样本,研究筛选出222种蛋白质,对包括心梗、中风和痴呆在内的多个结局显示出强大的预测能力。
02
Methods
✦
2.1
研究人群
来自UK Biobank数据库。UK Biobank招募了超过50万名40至69岁的参与者(2007年至2010年)。研究对象为没有主要心血管结局病史且具有蛋白质组数据的个体。
2.2
蛋白质组检测
研究使用了Olink Explore 3072平台分析血浆样本,检测3072种蛋白标志物。对于缺失值(中位值约为2.4%),研究采用链式方程的多重插补方法进行处理,并在灵敏度分析中验证了完整数据分析的结果。
2.3
终点事件及随访
主要终点是主要不良心血管事件(MACE),包括ASCVD和心力衰竭(HF)的合并事件,定义依据ICD-10编码。ASCVD定义为致命性冠心病、致命及非致命性心肌梗死(MI)、致命或非致命性卒中。
次要终点包括ASCVD、HF、MI/血运重建、中风、主动脉瓣狭窄(AS)、腹主动脉瘤(AAA)和痴呆。
2.4
统计分析
1. 关联分析
通过类似于基因组宽关联研究(GWAS)的暴露组宽关联分析,估算每种蛋白与研究结局的关联。采用Cox比例风险模型调整了潜在混杂因素(如年龄、性别、种族、教育、饮酒、BMI、血压等),并使用Bonferroni校正来控制多重检验误差。
2. 预测模型构建与验证
数据集随机分为训练集(80%)和验证集(20%)。
使用LASSO回归方法,从蛋白标志物中筛选出预测能力最强的蛋白,建立以下三个预测模型:
1)仅包含PREVENT模型风险因子的传统模型。
2)包含年龄、性别及蛋白标志物的蛋白模型。
3)综合PREVENT模型风险因子与蛋白标志物的增强模型(PREVENT 加蛋白)。
模型通过交叉验证优化c统计量,随后在验证集中评估性能(包括区分能力、分类性能和校准能力)。
灵敏度分析:对SCORE2风险评分及其组合模型进行了相似的验证分析,以验证结果的稳健性。
03
Results
✦
【蛋白质与结局的关联】
使用暴露组宽关联分析发现多个蛋白标志物与研究结局显著相关。NT-proBNP(N末端脑钠肽前体)是与MACE、ASCVD、MI、卒中、AS及HF关联最强的蛋白。ProADM(前降钙素基因相关肽)和GDF-15(生长分化因子-15)也与多个结局显著相关,而MMP-12(基质金属蛋白酶-12)与AAA的关联尤为强烈。GFAP(胶质纤维酸性蛋白)和NEFL(神经丝轻链蛋白)则主要与痴呆相关。
图1. 蛋白标志物的火山图
【模型性能】
LASSO算法选择的蛋白数量根据预测的结局和基础模型的不同而有所变化。
在PREVENT加蛋白模型中,用于预测AAA的蛋白数量最少(n=4)。
在蛋白模型中,用于预测MACE的蛋白数量最多(n=86)。
总体来看,蛋白模型中筛选出的蛋白总数为222种,覆盖所有研究结局;而PREVENT加蛋白模型中的蛋白总数为177种,数量略少。
表1. LASSO筛选出的MACE危险比最显著的十大标志物
1. 区分能力
在验证数据集中,与PREVENT模型相比,蛋白模型的c统计量显著更高:
MACE提高了0.051,ASCVD提高了0.035,MI/血运重建提高了0.023,卒中提高了0.024,AS提高了0.015,HF提高了0.060,AAA提高了0.0244,痴呆提高了0.068。
PREVENT加蛋白模型进一步提高了c统计量,但改进幅度相较蛋白模型较小。
2. 分类性能
蛋白模型对MACE的连续净分类指数(NRI)提高了19%,分类NRI提高了9%。
痴呆的分类改进幅度最大,连续NRI提高了36%,分类NRI提高了30%。
PREVENT加蛋白模型的结果与蛋白模型类似。
3. 校准能力
在校准能力上,MACE预测模型在验证数据集中表现良好。蛋白模型在主动脉瓣狭窄的校准能力优于PREVENT模型,但在心衰风险上略有低估。
表2. 验证队列中3种模型的C统计量和净分类指数
图2.相比于基于PREVENT风险因子的传统模型,蛋白模型和增强模型(PREVENT加蛋白)的增加区分度
此外,对SCORE2与SCORE2加蛋白模型的比较显示,c统计量、NRI和校准结果均与上述分析一致。
04
Comment
✦
本文利用蛋白质组学技术和机器学习方法,探索了多种蛋白标志物在预测MACE及其他心血管和神经系统疾病中的应用潜力。研究基于UK Biobank数据,筛选出222种关键蛋白标志物,并构建了以蛋白为核心的预测模型。结果显示,在预测不良事件风险中,蛋白模型在区分能力和分类性能方面显著优于传统风险评分模型(如PREVENT和SCORE2)。
这一研究表明,蛋白质组学结合机器学习可作为传统风险因子模型的强有力替代方法,为疾病早期发现和个性化管理提供了新思路。随着技术进步和成本优化,这种方法有望在临床实践中普及,推动精准医学在心血管和相关疾病领域的发展。
Comment总结:
亮点:大样本长期随访队列,统计方法严谨。
展望:可在其他数据库中验证该研究结论的可靠性
写在最后
2. 我们前期在“观科研”公众号、B站“开心doctor”、小红书“开心doctor”等平台上面也做了一些基础性的工作,发布了医学科研相关的推文以及视频,详细信息可扫描下方二维码订阅观看。
微信公众号的推送规则发生改变(不再按照时间顺序来显示),如果没有将“inHEART”设置为星标,你就可能错失里面的精彩推送。