血浆蛋白质图谱:探索健康与疾病的新窗口
在当今人口迅速增长和老龄化加剧的背景下,维护全球健康、减少疾病负担已成为现代医学面临的核心挑战。精准医学(Precision Medicine)旨在通过早期预测、个性化风险评估及个性化治疗来应对这些挑战。虽然基因组学研究为理解人类疾病奠定了重要基础,但基因仅仅是蓝图,真正执行功能的是蛋白质。蛋白质组学(Proteomics)能够直接反映体内的生物过程和病理变化,因此在实现精准医学的目标中扮演着不可替代的角色。
大规模蛋白质组学研究的突破
复旦大学的科研团队开展了一项涵盖53,026名成年人的大规模蛋白质组学研究,绘制了详细的血浆蛋白质图谱(Plasma Proteome Atlas),揭示了2,920种血浆蛋白与1,706种疾病和健康特征之间的复杂关联。研究数据来自UK Biobank,平均随访时间长达14.8年。通过对这些数据的深入挖掘,研究揭示了168,100个蛋白质-疾病关联以及554,488个蛋白质-特征关联,发现了一些潜在的疾病诊断标志物和治疗靶点。这一研究的规模和深度在蛋白质组学领域前所未有,为理解人类生物学及病理学特征提供了新工具和新视角。
在健康管理中,蛋白质作为遗传和环境风险的直接表达者,能够提供比基因组信息更具细节的疾病机制。虽然基因组变化能够反映疾病的易感性,但蛋白质能直接揭示疾病的发病过程及当前状态。因此,系统性绘制蛋白质与健康及疾病的关联图谱对于精准医学至关重要。这种图谱不仅有助于深入理解生物过程,还为个性化诊断和干预提供了坚实的科学基础。此外,血浆中的蛋白质变化可以敏感地反映出身体内部的生理或病理状态,使其成为疾病诊断和监测的关键指标。了解这些蛋白质与健康状况之间的关系,将显著提高疾病的预防与干预效率。
该研究收集了53,026名参与者的血浆样本,涵盖了2,920种符合质量控制标准的蛋白质,并将这些蛋白质与720种疾病和986个健康特征进行了关联分析。研究对象中的疾病分为两类:一类是“现患疾病”(prevalent diseases),即采样时已存在的疾病;另一类是“新发疾病”(incident diseases),即随访过程中新出现的疾病。
研究采用了回归分析和Cox比例风险模型,揭示了显著的蛋白质-疾病关联,包括60,942个与现患疾病的关联和107,158个与新发疾病的关联。例如,NTproBNP与心脏病死亡之间的关联是先前已知的,而NBL1蛋白对慢性肾病的高度风险影响(HR=17.055, p < 1 × 10^-300)则是新发现。这样的风险比表明NBL1在慢性肾病的病理过程中可能起着关键作用,这对于临床实践具有重要的参考价值。
为了确保结果的科学性和稳健性,研究人员采用了Bonferroni校正以减少假阳性结果的概率。调整后的结果仍显示出显著性,证明了这些关联具有坚实的统计基础和生物学意义。这种严格的统计方法保证了研究结论的可靠性,也为进一步的临床验证和实验室研究奠定了基础。
模式图(Credit: Cell)
蛋白质的多效性与疾病关联
在蛋白质-疾病关联的研究中,团队还发现了蛋白质的“多效性”(pleiotropy),即同一个蛋白质与多种疾病存在关联。例如,GDF15蛋白与205种现患疾病及397种新发疾病相关,通常作为这些疾病的风险因子。这种广泛的关联使得GDF15成为重要的生物标志物,具有极高的临床潜力。蛋白质的多效性不仅揭示了不同疾病之间潜在的共同病理机制,也为发展广谱治疗策略提供了新思路。
具体而言,GDF15与糖尿病、高血压、心血管疾病及某些癌症的升高密切相关,可能是多种病理过程的共同信号。GDF15与糖尿病的强关联(HR=3.125, 95% CI = 2.865-3.403, p < 1 × 10^-50)进一步验证了其作为潜在治疗靶点的价值。这表明GDF15可能参与调节能量代谢和炎症反应,其升高反映了身体在应对代谢和炎症压力时的综合反应。通过更深入理解GDF15的作用机制,未来可能开发出针对这些疾病的新型治疗方法。
蛋白质与健康特征的深度联系
除了疾病,血浆蛋白质还与许多健康特征显著相关。研究发现,2,707种蛋白质与986个健康特征存在554,488个显著关联。例如,GDF15和CDCP1与认知功能(cognitive function)高度相关,GDF15的效应值为14.464(95% CI = 12.423-16.506, p = 9.32 × 10^-44),而CDCP1为7.997(95% CI = 6.248-9.745, p = 3.29 × 10^-19)。这些数据揭示了蛋白质水平与认知功能和神经精神障碍之间的联系,为进一步研究神经退行性疾病和精神障碍的生物学基础提供了重要线索。
在肥胖和体重管理方面,研究发现LEP(瘦素)与体重指数(BMI)显著相关(效应值为8.756, 95% CI = 7.323-10.189, p < 1 × 10^-30),进一步强调了LEP在调节体重和代谢平衡中的关键作用。瘦素是调节食欲和能量平衡的重要激素,其浓度变化与肥胖、代谢综合症等健康问题密切相关。这些发现不仅为个性化健康管理提供了支持,也为改善生活方式干预措施的效果提供了科学依据。例如,基于瘦素水平的干预可能帮助更有效地管理肥胖问题。
疾病分群与生物学特征
研究团队通过蛋白质-疾病关联强度对660种疾病进行了分群,最终得到40个不同的疾病群组。例如,群组1主要包括肝纤维化和肝硬化等疾病,这些疾病富集于蛋白质修饰、酒精代谢及神经相关通路中,提示这些机制在疾病发病中可能起到重要作用。
通过对这些群组中富集的蛋白质进行生物通路分析,研究发现,涉及酒精代谢的ALDH2和ADH1B蛋白在肝硬化和酒精性肝病中显著表达(p < 0.001),这表明这些蛋白质可能在酒精相关疾病的病理过程中发挥关键作用。针对这些途径的治疗靶点可能为酒精性肝病的干预带来突破。此外,研究团队还识别出与神经系统相关的蛋白质在这些疾病中的重要性,为理解酒精对神经系统的影响提供了新的视角。
此外,非霍奇金淋巴瘤的多个亚型被聚类到一个富集于B细胞活化途径的群组中,强调了免疫系统在这些疾病中的作用。通过这些疾病的系统分群与生物特征分析,研究为重新定义疾病分类,尤其是在癌症及自身免疫性疾病的精确诊断和治疗上提供了新的思路。B细胞在免疫系统中的功能复杂,而其异常激活与许多免疫性疾病和淋巴瘤的发生密切相关。通过这些关联,研究为开发新型免疫治疗策略提供了新的方向。
蛋白质在疾病诊断与预测中的应用
蛋白质在疾病预测和诊断中展现出显著优势。在预测模型中,蛋白质数据在92种疾病中表现出较高的预测能力(AUC > 0.80),特别是在内分泌和代谢疾病中表现尤为突出。在疾病诊断中,基于蛋白质的模型在124种疾病中表现同样优异(AUC > 0.80),例如1型糖尿病和慢性肾病等。
以2型糖尿病伴周围循环并发症的预测为例,模型AUC高达0.974(95% CI = 0.963-0.982)。对于高血压性肾病和慢性肾炎综合征,蛋白质模型的AUC分别为0.951和0.925,显示了其在临床中的潜力。这些模型的高性能归因于蛋白质能够实时反映生理及病理变化,尤其是在疾病的早期阶段,使其成为理想的诊断标志物。相比于基因标志物,蛋白质水平的动态变化更能反映个体的健康状况,因此在疾病的早期检测和精准干预中具有独特优势。
NTproBNP作为心衰的标志物,其在心脏病患者中的风险比(HR)为2.238(95% CI = 2.102-2.378, p < 1 × 10^-100),进一步验证了其在临床中的广泛应用价值。NTproBNP的升高与心力衰竭的严重程度相关,这使其成为诊断和监测心血管健康的重要工具。通过检测NTproBNP的变化,医生可以更早期地发现心脏功能的异常,从而进行及时干预,显著改善患者预后。
潜在的治疗靶点与药物再利用
通过孟德尔随机化(Mendelian randomization, MR)分析,研究发现了474种潜在的因果蛋白质-疾病对,其中一些如SEMA3F、SERPINF1和PCSK9,与多种疾病存在因果关系,为蛋白质作为治疗靶点提供了理论依据。此外,研究还发现了一些药物再利用的机会,例如,靶向BSG蛋白的药物可能有助于抑郁症的治疗。
具体而言,GDF15与溃疡性结肠炎和类风湿性关节炎等自身免疫疾病之间存在显著因果关系,进一步支持其在这些疾病中的病理作用。FURIN与高血压之间的因果关联(OR=1.438, 95% CI=1.347-1.536, p=1.57 × 10^-27)表明其在心血管疾病中的潜力。通过了解这些因果关联,未来可以开发出更有效地针对心血管疾病和免疫疾病的治疗药物。
PCSK9作为低密度脂蛋白胆固醇(LDL-C)的调节者,其在冠心病患者中的因果关联(OR=1.872, 95% CI=1.654-2.121, p<1 × 10^-60)为PCSK9抑制剂在心血管治疗中的应用提供了坚实的证据。这些因果关联为靶向治疗的开发提供了明确方向,并有助于推进个性化治疗方案的实施。此外,PCSK9抑制剂在临床试验中的成功进一步证实了蛋白质组学研究的重要性,通过这些抑制剂的应用,可以有效降低心血管疾病的发病率,为患者带来显著的健康改善。
精准医学的新前景
该蛋白质组学图谱研究为我们全面理解健康与疾病机制提供了重要资源。研究不仅揭示了蛋白质与疾病之间的复杂关系,还展示了其在疾病预测、诊断及治疗中的巨大潜力。将蛋白质组学整合到疾病诊断及个体化治疗中,将更好地实现精准医学,提高疾病管理的效率和有效性。通过这些蛋白质组学数据,未来我们有望实现对个体健康状态的动态监测,提供更加精准和个性化的健康建议。
研究提供的开放资源(https://proteome-phenome-atlas.com/) 将对未来研究产生深远影响,无论是用于理解疾病机制,还是用于开发新的标志物和治疗靶点,这些数据都将发挥至关重要的作用。这一开放资源不仅为科研工作者提供了宝贵的工具,也为医学教育和公共健康策略的制定提供了新的数据支持。
血浆蛋白质组学研究通过揭示人类疾病的生物学特征,为精准医学提供了新的工具与方法。这项研究代表了蛋白质组学在健康与疾病研究领域的重大突破。未来,随着更多数据的积累与技术进步,蛋白质组学将在疾病的早期诊断、风险评估及个性化治疗中发挥更为重要的作用。通过深入挖掘蛋白质与疾病的关联,有望开发出更加有效的治疗策略。
参考文献
End
往期精选
一文读透细胞死亡(Cell Death) | 24年Cell重磅综述(长文收藏版)
热文
Cell | 是什么决定了细胞的大小?
热文
Cell | AI取代科研人员还有多远?
新英格兰 | 司美格鲁肽(semaglutide)又有新发现:助力关节炎治疗
热文