Claudia L.教授柳叶刀新作｜Olink蛋白组学结合AI赋能大型队列解码疾病先兆

文摘 2024-11-12 14:32 上海

研究团队

Claudia Langenberg教授为英国剑桥大学伦敦玛丽女王学院（Queen Mary University of London, MRC）流行病中心负责人，2022年被任命为玛丽女王学院新成立的精准健康大学研究所(Precision Health University Research Institute, PHURI）主任，主要研究方向为分子流行病学，聚焦于糖尿病和相关代谢紊乱的病因学及机制，通过整合大规模基因组、蛋白组及代谢组等多组学数据，研究蛋白基因组与疾病表型间的因果相关性和特异性。血浆蛋白质组技术作为基因组和表型组间的「桥梁」，具有确定新的疾病过程的潜在功能。将具有互补性的蛋白质组学技术与基因组学整合，即使采用中等规模的样本，也可以识别出代谢疾病的全新介质，并具有治疗干预疾病的潜力。

Claudia Langenberg教授发表文章系列解读：

剑桥大学团队使用Olink蛋白组学开创上百种疾病预测新纪元

Olink Explore蛋白组学揭秘7天禁食后人体系统性适应

Olink蛋白组学助力绘制人类蛋白组-疾病图谱

超灵敏血浆蛋白组挑战基因与疾病间之鸿沟

研究背景

基于血液组学，特别是蛋白组学，展示了在预测疾病发生和进程方面的巨大潜力，但往往缺乏系统性和严格的大规模测试。与基因组不同，作为信息传递核心层的蛋白组会随着早期疾病的发展而动态变化。而循环蛋白因其宽动态范围、较长半衰期、主要内源性来源以及易于获取等特性，成为了疾病预测、诊断和预后的优选生物标志物。然而，现有的临床标志物多源自针对性研究，缺乏与其他组学生物标志物的系统性比较或结合。高通量蛋白组学技术的日益普及与AI机器学习方法的引入，使得对蛋白组平台的系统性、数据驱动研究成为可能，为发现新生物标志物和评估其在不同疾病中的特异性或共享性提供了新途径。

新文速递

Claudia Langenberg教授团队近期又在国际期刊Lancet Digit Health（IF =23.8）发表了基于欧洲前瞻性癌症调查-诺福克（EPIC-Norfolk）队列的一项研究成果：这是一项大规模队列的多疾病研究，研究团队利用Olink Explore 3072平台，旨在识别23种疾病和全因早逝的稀疏蛋白质特征；结果显示，仅5种蛋白质的预测模型超过了大多数疾病的多基因风险评分的预测性能，并且与基本患者信息模型结合后，进一步提高了7种疾病的预测性能；10种蛋白质稀疏共病特征改善了7种疾病预测，并超越了患者信息模型，实现了与疾病特异性特征相似的性能；该研究展示了大规模蛋白组学在开发稀疏特征以改进预测策略方面的潜力，包括用于预测多种疾病的常见生物标志物panel，并为未来研究疾病原因提供了指导。

研究设计

多项病例-对照研究被设计并嵌套在EPIC-Norfolk研究中，包括随机抽取的对照亚队列（n=1,759）和在随访10年内发展出10种较不常见疾病之一的参与者（n=989）。通过Olink Explore 3072平台对两个独立批次的样本（n_set1 =1,040, n_set₂=1,708）进行蛋白组学分析，检测了2,923种独特蛋白标志物。同时，采用Affymetrix UK Biobank Axiom Array进行全基因组基因分型。使用AI机器学习框架来推导出23种单独疾病和全因早逝发病的稀疏预测蛋白质模型，并从2,923种血清蛋白中推导出可预测多种疾病的独特通用稀疏共病特征模型，通过特征选择和交叉验证进行模型测试。

试验设计

研究解读

基于之前开发的识别24种突发结果的稀疏预测蛋白集合模型，研究团队进一步用两个批次的蛋白组数据来设计独立的特写选择和验证集。整个数据集分成两个独立的特写选择（70%，n=452-821）和验证（30%，n=194-352）子集，并使用最小绝对收缩和选择算子回归在200个子样本上进行特征选择。仅使用前5种蛋白的模型在大多数疾病中的表现优于使用所有2,319种蛋白质的模型，中位C-index提高了0.04。在研究的11种疾病中，仅使用蛋白质模型（中位C-index为0.74，IQR 0.66–0.80）与基本患者信息模型（中位C-index为0.71，IQR 0.65–0.75）表现相当或更优。此外，仅蛋白质模型在17种疾病的预测上还优于包含多达722万个遗传变异的多基因风险评分（PRS）模型，中位C-index差异为0.13（IQR 0.10–0.17）。

研究进一步表明，添加前5个蛋白质到患者信息模型可以改善7种疾病的预测性能（中位C-index为0.82，IQR 0.77‒0.82)：II型糖尿病、前列腺癌、全因早逝、COPD、肺癌、肾脏疾病和心力衰竭。最大的改进体现在II型糖尿病（C-index提高0.11）、前列腺癌（0.10）和全因早逝（0.08）。

23种疾病和全因早逝的蛋⽩质⽣物标志物的交叉验证预测性能

研究还探索了是否可以得出一个独特通用稀疏蛋⽩质组学特征，用于同时预测多种疾病，这将提供一种具有更高临床转化潜⼒的经济有效策略。在21种单独发病疾病中，前10种共病蛋⽩质的C-index中位数为0.72（IQR 0.64‒0.76）。平均而⾔，这高于疾病特异性蛋⽩质特征的表现，这可能表明存在共同的疾病机制。这10种蛋白质在6种疾病和全因早逝的预测性能上超过了患者信息模型（C-index变化范围0.02–0.06；中位C-index 0.81, IQR 0.80–0.82）。

10种共病蛋⽩对20种疾病和全因早逝的交叉验证预测性能

研究发现，基于高于固定阈值的标准化选择分数来选择可变数量的蛋白质作为预测因子（范围从1到16个蛋白质），其C-index与仅选择5个蛋白质时相似（r=0.99）。在最佳预测因子中，除了已确立的临床生物标志物外，还包括一些迄今为止在文献中很少报道的强预测性蛋白质，如肺癌和慢性阻塞性肺病（COPD）中CXCL17和肾病中的LMOD1。总体而言，在来自疾病特异性特征的前20种蛋白标志物中，这些蛋白质的表现至少与患者信息模型相当或有所改进，其中有26种蛋白在两种或多种疾病之间共享。尽管结果表明与其他组学（如代谢组学）相比重叠较少，这也进一步佐证某些特定蛋白在不同疾病间存在共性的重要性。

在蛋白质模型至少达到或超过患者信息模型性能的疾病中，前20种蛋白质的标准化特征选择得分

写在最后

预测未来疾病风险能够实现早期干预，并针对高危人群和个人制定预防策略。本研究通过采用Olink蛋白组学研究系统且前瞻性地评估了血清蛋白对于提高疾病风险预测能力的潜力，为如何有效整合蛋白质组学、健康记录及机器学习以改善疾病预测提供了深刻见解, 并为不断增加的大规模队列研究利用蛋白组图谱取得进一步进展提供了指导。

尽管过去几年遗传和多基因预测备受关注，但本研究显示蛋白组学模型通常优于基于静态遗传信息的模型。反映了循环蛋白质在捕捉当前健康状况和作为早期疾病检测因子方面的潜力，它们可能对病理过程敏感，甚至在出现明显症状之前。相比之下，多基因风险评分（PRS）是静态的，无法捕捉疾病过程对环境和生活方式风险因素的响应阶段。同时也表明大规模蛋⽩组学平台有助于制定系统且无假设的⽣物标记物发现策略，有望改善⽣物标志物的发现和预测策略。

参考文献：

1. Carrasco-Zanini J, et al. Proteomic prediction of diverse incident diseases: a machine learning-guided biomarker discovery study using data from a prospective cohort study. The Lancet. Digital Health,（2024）6: e470–79.

来源：Olink Proteomics

推荐阅读

都！是！低！价！双11狂欢特惠，限时限量抢！

2025国自然-Xenium空间原位检测技术——“后单细胞时代”研究利器

华大时空-伯豪生物首批FF V1.3内测数据新鲜出炉！

最新顶刊文献速递|单细胞转录组系列（10月）

文献解读 | 泛癌通讯揭示SPP1+肿瘤相关巨噬细胞在缺氧条件下扩张并促进癌症恶化

END

咨询热线：17702139967

邮箱：market@shbio.com

发现“分享”和“赞”了吗，戳我看看吧

伯豪生物

伯豪生物是生物芯片上海国家工程研究中心的有机组成部分，是国家工信部专精特新“小巨人”以及上海市科技小巨人企业。聚焦单细胞（核）多组学、空间转录组学以及Olink蛋白组学等服务产品，协助客户发表SCI论文超过2000篇，平均影响因子超过5。

探索肿瘤转移奥秘！泛癌转录组图谱揭示原发性与转移性肿瘤的基因表达差异及转移适应机制

文献解读|单细胞RNA测序揭示血脂异常诱导的舒张功能障碍模型中心脏巨噬细胞代谢应激依赖性激活

顶刊文献速递|单细胞转录组系列（12月）

新研究发布｜一文全面了解三代甲基化芯片的更新迭代

伯豪生物植物单细胞抽核实验纪实-小麦

文献解读｜对人类胰腺癌的空间和单细胞转录组数据的综合分析揭示了与不良预后相关的中间癌细胞群

项目文章 | 单细胞转录组测序揭示右心室容量超荷会通过免疫反应重启心肌细胞的增殖

文献解读｜肿瘤免疫的泛癌症蛋白质基因组学特征

外泌体专题II｜Olink精准蛋白组学助力细胞外囊泡研究

植物抽核哪家强！伯优试剂来帮忙！杨树茎抽核及单细胞数据实测

CRISPR智库 | CORDSv2：一锅法RPA-Cas12a体系检测DNA/RNA病毒

文献解读｜单细胞RNA测序技术解析人类胎盘在足月分娩期间的母体-胎儿信号传导

一陆向前，伯豪生物16周年年终盘点

项目文章｜Cancer Cell-TREM2在中枢神经系统癌症和外周肿瘤中的独特作用

国自然上分秘籍|单细胞转录组联合膜蛋白打出免疫研究“组合拳”

文献解读 | 单细胞空间转录组联合分析揭示了与胰腺癌预后不良相关的中间态癌细胞群

项目文章|单细胞转录组测序揭示锰离子在肿瘤NK细胞功能调控中的角色

Sci Adv | 陈亮/刘宝辉/顾颖利用单细胞多组学探秘胶质瘤的空间异质性

伯豪云流程新成员| mRNA分析云流程正式上线！

EMPEROR临床大队列｜Olink Explore蛋白组学升级揭秘恩格列净治疗心力衰竭新机制

项目文章|单细胞核转录组测序揭示N7-甲基鸟苷酸（m7G）tRNA修饰减弱的致病机理

最新顶刊文献速递|单细胞转录组系列（11月）

伯豪生物肖华胜董事长受邀参加促进专精特新中小企业发展壮大论坛并在“协力·赋能”圆桌对话环节发言

人类细胞图谱的计算技术-细胞类型注释

促销 | Xenium 5K亚细胞空间原位检测限时5折

促销 | 单细胞Flex限时限量抢购

文献解读 | 单细胞RNA测序揭示区分过敏性接触性皮炎和刺激性接触性皮炎的分子特征

11月高分文献速递 | 单细胞RNA+ATAC系列

文献解读 | 一个正常的人类细胞类型的DNA甲基化图谱

人类细胞图谱计划草图第一版完成——神经系统细胞图谱

细胞核分离试剂盒应用文章|脑单细胞转录组学结果揭示了:百草枯对帕金森病伴重度抑郁症的共病相关细胞类型特异性变化的影响

2025国自然热点 | 中性粒细胞胞外诱捕网(NETs)该如何研究

文献解读 | CSF、血浆和尿液的综合蛋白质组学鉴定DDC可作为早期帕金森病的生物标志物

Nature Methods | 新算法利用空间转录组数据构建肿瘤的“空间进化图谱”

都！是！低！价！双11狂欢特惠，限时限量抢！

2025年国自然 | 单细胞RNA测序揭示儿童急性髓系白血病复发和缓解肿瘤微环境的变化

【会议通知】2024前沿技术和临床转化研讨会

文献解读 | 整合单细胞RNA测序和空间转录组学破译人类子宫腺肌症的全面转录图谱

Olink双十一低价促销！

Claudia L.教授柳叶刀新作｜Olink蛋白组学结合AI赋能大型队列解码疾病先兆

都！是！低！价！双11狂欢特惠，限时限量抢！

2025国自然-Xenium空间原位检测技术——“后单细胞时代”研究利器

Genome Med | 首次揭示DNA去甲基化可促进结直肠癌细胞释放cfDNA，或可提高液体活检的灵敏度

华大时空-伯豪生物首批FF V1.3内测数据新鲜出炉！

最新顶刊文献速递|单细胞转录组系列（10月）

文献解读 | 泛癌通讯揭示SPP1+肿瘤相关巨噬细胞在缺氧条件下扩张并促进癌症恶化

眼科案例甄选｜Olink蛋白组学为眼疾深层机制探索带来新视角

速预约 | 伯豪生物单细胞云流程实操培训带你冲刺科研赛场

十月高分文献速递｜空间转录组系列

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉