Nat Med | 血浆蛋白质组学助力常见与罕见疾病风险预测

文摘   科学   2024-09-22 14:45   广西  


研究背景

精准医疗的核心挑战是开发临床实用的工具来识别高危人群,从而实现及时诊断、早期开始治疗并改善患者预后。在各种不同的疾病病理中,从最初出现症状到确诊往往需要数月或数年的时间。在过去几十年中,单个血浆蛋白已成为少数疾病的特异性诊断检测指标,包括诊断心力衰竭的B型利钠肽(BNP)、诊断急性冠状动脉综合征的肌钙蛋白、诊断创伤性脑损伤的泛素C端水解酶L1(UCH-L1)和胶质纤维酸性蛋白(GFAP)等。血浆蛋白质组特征可捕捉健康行为和当前健康状况,并可整合“静态”遗传和动态环境决定因素的疾病风险。


血浆蛋白质组学是否能单独或联合为多种疾病提供临床有用的预测或机理信息,目前还不得而知。首先,以往的蛋白质组学研究参与者太少,无法评估罕见病和常见病。其次,以往对疾病发病的研究主要集中在少数常见疾病上,而非采取探索性的发现方法。第三,以往的研究没有报告与临床模型(不含蛋白质)相比的筛查指标,而这些指标可为纳入健康档案和转化评估提供信息。


2024年6月,来自英国剑桥大学临床医学院的Claudia Langenberg教授团队在Nature MedicineIF:58.7)期刊发表了题为“Proteomic signatures improve risk prediction for common and rare diseases”的研究论文。研究利用英国生物库医药蛋白质组学项目(UKB-PPP)——迄今为止最大的蛋白质组实验的数据:(1)系统地研究可测量的血浆蛋白质组对218种不同病理疾病的10年预测潜力,超过基于常规护理(无临床化验和有临床化验)和多基因风险评分所获信息的模型;(2)确定疾病特异性蛋白质预测因子,与各种疾病共有的预测因子相比,这些预测因子指向潜在的病因机制;(3)确定疾病蛋白质组特征的筛选指标是否达到或超过目前临床实践中使用的血液化验指标。研究结果表明,少量血浆蛋白特征包括疾病特异性蛋白和几种疾病共有的蛋白预测因子)可对常见病和罕见病进行临床有用的预测。



主要成果

1、 研究从英国生物库医药蛋白质组学项目(UKB-PPP)的41,931人中,将约3,000种血浆蛋白质的测量结果与临床信息相结合,得出了218种常见病和罕见病(81-6,038例)10年发病率的预测模型。

2、 研究将使用蛋白质组数据开发的预测模型与仅使用基本临床信息或将临床信息与37种临床检测数据相结合开发的模型进行了比较。对于67种不同病理类型的疾病,包含5到20个蛋白质的模型的预测性能优于使用基本临床信息开发的模型(中位delta C-index=0.07;范围=0.02-0.31)
3、 在多发性骨髓瘤、非霍奇金淋巴瘤、运动神经元疾病、肺纤维化和扩张型心肌病等52种疾病中,蛋白质模型的表现进一步优于利用基本信息结合临床检测数据建立的模型。
4、 在EPIC-Norfolk研究中对蛋白质模型进行的外部验证显示,该模型在预测所测试的六种疾病方面具有良好的普适性。

研究设计

【样本队列】
选研究在UKB-PPP中开展了一项队列研究,使用Olink Explore 1536和Explore Expansion平台进行了血浆蛋白质组学分析,通过2,941项检测针对2,923种独特蛋白质进行了分析。开发了218种疾病的预测模型,这些疾病在UKB-PPP随机子集(N=41,931;193种疾病)图1)或“联盟选择”子集(218种疾病中的25种)的10年随访期间至少有80多个发病病例(补充图1)。

充图1 英国生物库药物蛋白质组学项目(UKB-PPP)研究样本设计


【实验设计】
图1研究设计


研究结果

与临床模型相比,蛋白质特征提高了疾病预测能力

研究首先开发了一个基于临床信息的疾病风险预测模型。临床模型包括年龄、性别、体重指数(BMI)、自我报告的种族、吸烟状况、饮酒量和自我报告的父系或母系病史,对于基线评估的15种疾病,临床模型的中位一致性指数(C-index)=0.64(四分位距(IQR)=0.58-0.72)


在67种罕见病和常见病中,添加5至20种蛋白质可显著改善临床模型C-指数中位数增加=0.07,范围=0.02-0.31)(图2a)。蛋白质可改善临床模型(C-指数(delta C-index)改善的95%置信区间(CI)>0)的疾病包括多发性骨髓瘤(MM)(delta C-index =0.25(95% CI 0.20-0.29,似然比(LR)=6.55)、非霍奇金淋巴瘤(delta C-index=0.21(0.14-0.28),LR=6.08)、肺纤维化(delta C-index=0.09(0.03-0.14),LR=6.83)、乳糜泻(delta C-index=0.31(0.21-0.38),LR=8.07)、扩张型心肌病(delta C-index=0.17(0.10-0.22),LR=6.97)和运动神经元病(delta C-index=0.11(95% CI 0.04-0.16),LR=4.38)图2a)。


图2 在67种疾病的基本临床风险因素基础上增加蛋白质组信息,提高疾病发病率的预测性能

在这67种疾病中,中位检出率(假阳性率(FPR)为10%,检出率(DR))为45.5%(范围为10.8-80.8%),而临床模型的检出率为25%(范围为9.5-51.2%)图2b)。这67种疾病的中位LR为4.55(范围为1.08-8.07),与临床模型相比提高了0.12至6.92(图2c)。另外包括血液化验结果的模型显示,只有28种疾病的预测效果明显优于临床模型(中位数delta C-index=0.08,范围=0.01-0.28)图3)。对于67种疾病中的52种,与使用血液化验的临床模型相比,基于蛋白质的模型获得了更高的LRs范围为0.13-5.17)图3b,c)。


3 基于蛋白质的模型(临床风险因素+蛋白质)与基于生物标志物的模型(临床风险因素+血液检测)的预测性能比较


与单个信息量最大的蛋白质相比,少量蛋白质特征(5-20个蛋白质)C指数比临床模型平均提高了5.4%,在所有取得显著提高的疾病中都是如此。对于其中的64%,最多包含510个蛋白质就能达到性能饱和。在通过蛋白质显著提高预测能力的67种疾病中,血液病或免疫病的预测能力提高了8倍多(OR=8.6;P=0.004)

尽管研究的广度以及UKB-PPP数据的规模和新颖性使得大多数蛋白质模型无法进行外部复制,但研究还评估了欧洲癌症前瞻性调查(EPIC)-Norfolk(N=295-1116;N病例=5-236)中蛋白质比临床模型更能改善预测的67种疾病中6种疾病的结果的普遍性。在EPIC-Norfolk研究中,使用UKB-PPP数据训练的模型获得了高度可比的C指数(Pearson r=0.81;P=0.002补充图2a),蛋白质信息模型的预测结果优于临床模型(Pearson r=0.97;P=0.001补充图2b)。


这表明在UKB中训练的预测蛋白和模型具有普适性。虽然在UKB中训练的模型并没有明确用于预测10年以上的发病率,但在EPIC-Norfolk研究中,UKB训练的模型在预测20年发病率方面的表现仍远远优于临床模型(补充图2c)。研究进一步证实了蛋白质特征在6种测试疾病中的5种疾病的预测性能比临床基准有了显著提高(补充图2c

补充图2 EPIC-Norfolk研究的外部验证

预测疾病的蛋白质

具有临床相关性改进的67个预测模型共包括501个蛋白质靶点,其中147个被选中用于两种或两种以上(范围2-16)疾病,其中大多数(约89%)被选中用于两种或两种以上临床疾病(范围2-9)图4a)。平均而言,与高度特异性蛋白质相比,这些蛋白质对预测单个疾病的贡献率相对较低(图4b),而且研究进一步观察到特定生物通路没有富集。


图4 预测蛋白的疾病特异性

专门预测一种疾病的蛋白质

研究只发现了对一种疾病具有强预测性的蛋白质(图4c)。与特定疾病的选择得分相比,这些蛋白质在其他疾病中的特征选择得分平均低86%。这些蛋白质包括TNF受体超家族成员17(TNFRSF17或B细胞成熟抗原)MM的特异性预测因子,以及TNFRSF13B——意义未定的单克隆性淋巴瘤病(MGUS)的强预测因子,MGUS是MM发病前的一种病症(每年约有百分之一的MGUS病例发展为MM)。在此,研究提供的证据表明,血浆中这些受体水平的升高可有力地预测这些血癌的未来发病情况。以前的研究已经表明,血浆TNFRSF17与MGUS发展为MM之间存在关联。在这里,研究发现了五种蛋白特征的附加价值,它比单纯的临床风险因素+TNFRSF17的辨别能力提高了7%。


多基因风险评分与临床模型和蛋白质模型的比较

对于UKB中有多基因风险评分(PGS)23种疾病,研究发现只有7种疾病的多基因风险评分比临床模型(无血液检测)显著提高了预测能力,但与蛋白质对这7种疾病的预测能力(中位数delta C-index=0.03,范围=0.01-0.14相比,多基因风险评分在临床上的提高微乎其微(中位数delta C-index=0.08,范围=0.02-0.30

总结

研究展示了少量蛋白质特征在改善常见病和罕见病发病预测方面的潜力。通过将约3,000种广义捕获血浆蛋白与电子健康记录(HER)相整合,发现在所研究的218种疾病中,有52种疾病的蛋白质是最佳预测模型,不仅优于常用的患者特征,也优于大量临床使用的血液化验和PGS

对于许多疾病来说,广泛捕获的蛋白质组技术为解决诊断延误问题提供了新的可能性,这是首个基于血液的生物标志物,也是首个与当前实践相比预测模型更佳的证据。研究结果强调了血浆蛋白质组特征可为治疗性临床试验的需求和设计提供信息。总之,研究证明,少量血浆蛋白特征与电子病历整合后,可通过疾病特异性蛋白和几种疾病共有的蛋白预测因子,为常见病和罕见病提供比标准临床检测更好的新预测方法


原文链接:https://www.nature.com/articles/s41591-024-03142-z


参考文献


Carrasco-Zanini, J., Pietzner, M., Davitte, J. et al. Proteomic signatures improve risk prediction for common and rare diseases. Nat Med (2024). https://doi.org/10.1038/s41591-024-03142-z



编译:慕白

对:Evan Flle

排版:Sail

封面来源:Freepik


往期推荐

旦生医学 | 工业化智能蛋白芯片助力新发传染病全周期应对能力建设

2024-09-16

Nature Aging〡英国生物样本库中主要突发疾病和死亡率的血液蛋白评估

2024-09-15

旦生医学智能蛋白芯片技术在新冠疫苗群体免疫进化大队列研究中获得突破

2024-09-04

Adv.Sci.∣国家蛋白质科学中心于晓波联合团队揭示新冠-宿主群体疫苗免疫协同进化规律和防护策略

2024-09-01

Nat. Med.〡蛋白质组学分析心肺功能预测发病和死亡风险

2024-08-11



了解更多蛋白芯片、组学进展请关注下方名片



关于旦生医学

旦生医学(ProteomicsEra Medical Co.,Ltd,)是集高端分子芯片设计、研发、生产和应用为一体的生物医药高科技企业,由留学归国高层次人才创立。企业目标是通过国际前沿生命组学、分子芯片和人工智能技术获取和解析人体健康密码(标志物),开发下一代高通量、智能化临床检测试剂、设备和蛋白药物,为人类的健康保障、疾病预防、检测和治疗提供产品、技术和咨询服务,联系方式:010-85885591,18601967980。


本文来源于公开发表论文,仅供学习交流,不构成商业目的。转载需注明来源芯医学。投稿与合作请留言或联系我们(xinyixue2022@126.com)。


芯医学
介绍蛋白芯片和前沿组学技术在精准医学、生物标志物、体外诊断和药物研发中的应用进展,相关产品、会议和产业热点。
 最新文章