Nature Aging〡英国生物样本库中主要突发疾病和死亡率的血液蛋白评估

文摘   科学   2024-09-15 14:27   广西  


研究背景

循环蛋白质组可以让我们深入了解导致疾病的生物学途径。识别年龄相关疾病的高风险人群可能有助于个性化医疗。循环蛋白可以区分疾病病例和对照组,并描述事件诊断的风险。单一蛋白质标记物可以深入了解疾病的介质,但同时利用多种蛋白质可能会提高临床效用。


2024年7月,英国爱丁堡大学的Danni A. Gadd团队在 Nature Aging (IF:17志上发表了题为“Blood protein assessment of leading incident diseases and mortality in the UK Biobank”的研究论文。作者展示了大规模蛋白质组学采样如何识别候选蛋白质靶标,并促进预测中后期与年龄相关的主要事件结果并在47600名40-70岁的个体中使用了1468次Olink血浆蛋白测量。通过Cox回归模型开发的ProteinScore用来评估其对19种事件结果的5年或10年发病率建模的实用性。作者将ProteinScores与临床生物标志物、多基因风险评分(PRS)和代谢组学指标一起建模,以研究这些标志物如何用于增强风险分层。



主要成果

● 研究测试了英国生物数据库(n=47600)1468Olink蛋白水平与23种年龄相关疾病的发病率和死亡率之间的关系,报告了963种蛋白质水平与21种事件结果之间的3209种关联。
● 使用Cox回归模型开发了基于蛋白质的评分(ProteinScores)。当应用于测试集时,有六种蛋白质分数提高了对10年发病结果的曲线下面积估计值,超过了年龄、性别和24种生活方式因素、临床相关生物标志物和物理测量的综合集合。
● 2型糖尿病蛋白质评分的表现优于多基因风险评分和HbA1c用于监测和诊断2型糖尿病的临床标志物此外,还比较了使用代谢组学和蛋白质组学特征进行评分的性能

研究设计

【样本队列
作者排除了UKB-PPP英国生物样本库制药蛋白质学项目)样本中相关的个体,剩下的数据集包含51562个个体,测量了1474个Olink蛋白质分析物。接着,排除了数据缺失率大于10%的3962个个体,然后又排除了数据缺失率大于10%的4个蛋白质。其余缺失的蛋白质测量数据(占总测量数据的1%)通过K-近邻(Knn:k=10)估算法进行估算。最终数据集由47600个个体和1468个Olink蛋白质分析物组成。(图1

 图1 UKB-PPP蛋白质测量数据处理步骤总结
【实验设计】


研究结果

蛋白质与事件结果的关联

作者发现不同的血浆蛋白水平与23种疾病(包括导致残疾和健康预期寿命缩短的主要原因)的发病和全因死亡率相关表1。对24种结果的随访期最长为15年

表1 英国生物样本库在最长15年的随访过程中分析的24种事件结果(n=47600人)


23种结果之间存在5273种显著关联Bonferroni调整P值阈值=3.1×10-6。在进一步调整健康和生活方式风险因素(体重指数(BMI)、饮酒量、社会贫困程度、教育状况、吸烟状况和体育锻炼)后,P<3.1×10-6的关联有3209个(图2a)。这3209项关联涉及963种独特的蛋白质分析物和21种结果,从肌萎缩性脊髓侧索硬化症、膀胱炎和多发性硬化症的1项关联到死亡率和肝病的652项和663项关联不等。


图2a 英国生物库(n=47600)中单个蛋白质与事件结果的关联


有54种蛋白质与八种或八种以上的突发疾病有显著关联(图2b);在所有情况下,基线蛋白质水平越高,患病或死亡风险越高(即危险比(HR)>1。在这54种蛋白质中,生长分化因子15GDF15)的相关性最大(11例事件结果),其次是白细胞介素6IL-6)和纤溶酶原激活剂尿激酶受体PLAUR)(10例事件结果


图2b 英国生物库(n=47600)中单个蛋白质与事件结果的关联

蛋白质分数开发

作者针对至少有150例发病病例的19种疾病,通过CoxPH弹性净回归法开发了ProteinScores50次随机迭代(方法中,为每种结果选择了曲线下面积(AUC)差异中位数超过最小调整模型的ProteinScores,从子宫内膜异位症的5个特征到全因死亡率的201个特征不等(图3)。


图3 ProteinScore特征选择

图4a总结了将ProteinScores加入协变量组越来越复杂的三个模型后AUC的差异。在8个实例中,单个蛋白质分数的性能等同于或高于26个协变量的最大集合。对包含和不包含蛋白质分数的协变量集合的受试者工作特征曲线(ROC)之间的显著差异进行了检验。有11个蛋白质分数的ROC P<0.0026(Bonferroni-adjustedP值阈值)超过了最小调整协变量。当将蛋白质分数添加到包含最小调整协变量和生活方式协变量的模型中时,有9个蛋白质分数在ROC模型比较测试中的P<0.0026。当将蛋白质分数添加到进一步调整了另外18个临床可测量协变量的模型中时有6个蛋白质分数(2型糖尿病、慢性阻塞性肺病(COPD)、死亡、阿尔茨海默氏痴呆症、缺血性心脏病和帕金森氏病)的模型比较中,使用和不使用ProteinScore的P<0.0026(图4b


图 4 ProteinScores为英国生物库中的事件结果提供的价

探索2型糖尿病蛋白质分数

该研究选择了2型糖尿病作为案例进行探讨。糖化血红蛋白(HbA1c)是2-3个月内长期血糖水平的平均值,用于监测临床前糖尿病风险42-47mmol mol-1和诊断疾病(两次重复测量>48mmol mol-1。由于2型糖尿病蛋白质分数的附加值超出了包括HbA1c在内的扩展协变量集,因此作者直接比较了测试样本中HbA1c和蛋白质分数。在测试样本中,有1105个病例(平均发病时间为5.4年(标准差为3.0年))和3264个对照组提供了所有测量指标。基于等级的蛋白分数和HbA1c逆正态变换水平对病例和对照组分布的区分类似(图5a),而HbA1c水平在蛋白分数风险十分位数中往往更高(图5b)。在2型糖尿病10年发病率的增量CoxPH模型中(图5c),单一使用蛋白质分数(AUC=0.89)的结果优于HbA1cAUC=0.85)和PRS(AUC=0.68)。在单独使用HbA1c和HbA1c与ProteinScore的ROC模型比较中,发现ProteinScore有显著改善(ROC P<0.0026)


图5 2型糖尿病ProteinScore的探索


代谢组评分比较

在一项敏感性分析中,考虑了代谢组学和蛋白质组学特征来生成评分。选择2型糖尿病和全因死亡率的原因如下:(1)它们有大量的病例;(2)这些特征的蛋白质分数是表现最好的蛋白质分数之一;(3)有证据表明这两个特征可能会被代谢组学特征分层。在有蛋白质数据的47600人中,共有12050人有代谢组学数据(补充说明。就全因死亡率而言,蛋白质组评分(AUC=0.82)优于代谢组评分(AUC=0.69),当两个评分同时建模时,AUC0.83。对于2型糖尿病,蛋白质组分数(AUC=0.87)和代谢组分数(AUC=0.85)的性能比较接近,当两个单项分数同时建模时,相加的AUC为0.89

总结

总之,这项研究量化了反映多种中晚期疾病的循环蛋白质组特征。这些数据表明,利用蛋白质组学、代谢组学、遗传数据与传统的风险因素组合,可进一步完善疾病危险分层。将蛋白质分数与利用代谢组学特征生成的分数结合起来考虑,2型糖尿病和全因死亡率的风险评估可获得额外的改善。不过,尤其在全因死亡率方面的风险评估中ProteinScore往往优于传统的的临床标志物、多基因风险评分和代谢组评分。

原文链接:https://doi.org/10.1038/s43587-024-00655-7

参考文献


Gadd, D.A., Hillary, R.F., Kuncheva, Z.et al. Blood protein assessment of leading incident diseases and mortality in the UK Biobank. Nat Aging 4, 939–948 (2024). https://doi.org/10.1038/s43587-024-00655-7


编译:Sail

校对:Evan Flle

排版:Sail

封面来源:Freepik


往期推荐

Alzhelmers Dement | 血液多指标生物标志物用于阿尔茨海默病的早期检测

2024-07-14

Nat Common | 纵向血浆蛋白质组学分析揭示结直肠癌诊断和西妥昔单抗治疗反应的生物标志物

2024-07-07

Nat.Med |脑脊液蛋白质组学揭示阿尔茨海默发病自然史

2024-06-29

Nat Commun | 血浆蛋白质组分析揭示双阻断剂疗法后胆固醇标志物的动态变化

2024-07-21


了解更多蛋白芯片、组学进展请关注下方名片



关于旦生医学

旦生医学(ProteomicsEra Medical Co.,Ltd,)是集高端分子芯片设计、研发、生产和应用为一体的生物医药高科技企业,由留学归国高层次人才创立。企业目标是通过国际前沿生命组学、分子芯片和人工智能技术获取和解析人体健康密码(标志物),开发下一代高通量、智能化临床检测试剂、设备和蛋白药物,为人类的健康保障、疾病预防、检测和治疗提供产品、技术和咨询服务,联系方式:010-85885591,18601967980。


本文来源于公开发表论文,仅供学习交流,不构成商业目的。转载需注明来源芯医学。投稿与合作请留言或联系我们(xinyixue2022@126.com)。


芯医学
介绍蛋白芯片和前沿组学技术在精准医学、生物标志物、体外诊断和药物研发中的应用进展,相关产品、会议和产业热点。
 最新文章