硕博赶紧用起来！Cell53,026人蛋白质-表型资源库

文摘 2025-01-16 14:51 广东

前言

2025 年的第一期 cell 上发表了一篇《健康与疾病中 53,026 名成人的血浆蛋白质组图谱》，这篇文章包含了大量的资源，这边进行了相关探索。
文章主要是通过申请到的 UK Biobank 数据进行的数据分析，然后给出数据分析的结果。
如果想要详细了解文章内容，请看今天其他推文《Cell | 健康与疾病中 53,026 名成人的血浆蛋白质组图谱 | 提供分析结果和源代码》，推文对该文章原文进行了逐字逐句的中文精读。

文章亮点

构建涵盖1706种人类疾病和特征的全面蛋白质组学图谱
基于机器学习的大数据分析揭示有前景的诊断和预测生物标志物
识别出37种药物重新定位前景和26个潜在的安全靶点
提供一个开放获取的蛋白质组-表型组资源以推进精准医学

文章摘要

大规模蛋白质组学研究可以深化我们对健康和疾病的了解，并促进精准医学的发展。
在这里，我们提供了英国生物银行（UK Biobank）中53,026名个体（中位随访时间：14.8年）的详细血浆蛋白图谱，该图谱链接了406种常见疾病和660种新发疾病以及986种与健康相关的特征，代表了迄今为止最全面的蛋白质组谱。
这一图谱揭示了168,100个蛋白质-疾病关联和554,488个蛋白质-特征关联。
超过650种蛋白质在至少50种疾病中共存，超过1,000种蛋白质显示了性别和年龄上的异质性。
此外，蛋白质在疾病鉴别方面表现出巨大的潜力（183种疾病中的曲线下面积[AUC] > 0.80）。
最后，整合蛋白质数量性状位点数据确定了474种因果蛋白质，提供了37种药物再利用机会和26种具有有利安全性的潜在靶标。
这些结果提供了一个开放获取的综合蛋白质组-表型资源（https://proteome-phenome-atlas.com/），有助于阐明疾病的生物学机制，并加速疾病生物标志物、预测模型和治疗靶标的开发。

蛋白质组-表型资源探索

网址

https://proteome-phenome-atlas.com/

网站布局简单，四大板块清晰明了
指引清晰，操作简单
分为流行病学关联，生物医学洞见，预测诊断，基因组关联
截止今天，已有 35000+ 浏览量

流行病学关联

从疾病的角度查看分析结果

血浆蛋白与疾病终点之间的关联分别使用 Cox 比例风险回归和逻辑回归进行，分别针对新发疾病和常见疾病。
血浆蛋白与健康相关特征之间的关联分析，采用线性回归对连续特征（作为结果）和二元特征（作为暴露因素），以及比例优势逻辑回归对有序分类特征。

假如想要看阿尔兹海默症的分析结果，操作如下：

可以看到， 424 种蛋白质在 0.05 的显著性水平下表现出关联。253 个蛋白质呈正相关，171 个呈负相关。可以从这些数据里面找分子进行研究，或者给自己的分子添加强有力的临床相关数据。
完整结果可以在底部进行下载

从蛋白质的角度查看分析结果

血浆蛋白与疾病终点之间的关联分别使用 Cox 比例风险回归和逻辑回归进行，分别针对新发疾病和常见疾病。
血浆蛋白与健康相关特征之间的关联分析，采用线性回归对连续特征（作为结果）和二元特征（作为暴露因素），以及比例优势逻辑回归对有序分类特征。

同样的，我们可以从蛋白质的角度，查看研究的目标蛋白质跟数据库中的哪些疾病关联。

生物洞见

这部分对疾病相关蛋白进行了通路和富集分析（对于新发疾病，P < 0.05/(2920*660)；对于常见疾病，P < 0.05/(2920*406)）。对每种疾病，都进行了基因本体（GO）术语、Reactome 通路和组织类型的富集分析。

预测诊断

建立了两个模型，一个预测模型和一个诊断模型;
使用了与疾病相关的蛋白（对于新发终点事件，P < 0.05/(2920*406)；对于常见终点事件，P < 0.05/(2920*660)）。
预测模型（疾病数量=660）旨在确定一个基线健康参与者是否会患上某种疾病（预测为类别 1）或保持健康（预测为类别 0），并且排除了那些已经对该疾病有常见诊断的个人。
诊断模型（疾病数量=406），它旨在区分一个参与者是否经历过或目前正在经历某种疾病（预测为类别 1）与那些没有经历过的人（预测为类别 0）。

基因组关联

从疾病的角度查看分析结果

基因组关联分析通过孟德尔随机化（MR）分析进行，使用蛋白质-疾病分析中确定的显著蛋白质-疾病对（对于新发疾病，P < 0.05/(2920*406)；对于常见疾病，P < 0.05/(2920*660)）。
蛋白质到疾病的 MR 分析将蛋白质数量性状位点（pQTL）数据作为暴露因素，将疾病 GWAS 数据作为结果，而对于疾病到蛋白质的分析，暴露因素和结果则相反。
大多数疾病 GWAS 来自 FinnGen 研究 [2] 发布 DF9，其余疾病 GWAS 是在没有蛋白质数据的 UKB 参与者子集中计算的。
为了选择工具变量（IV），对具有全基因组显著性的 SNPs（P < 5×10^−8）进行了连锁不平衡（LD）聚类。如果只有一个 IV 可用，则使用 Wald 比率来估计 MR 效应；
如果有两个或更多 IV 可用，则使用逆方差加权方法。MR 分析使用 R 中的“TwoSampleMR”包（v.4.2.0）进行。

从蛋白质的角度查看分析结果

同上

代码

提供了完整的分析代码

github

https://github.com/jasonHKU0907/proteome-phenome-atlas

数据

文章的大部分数据是向 UKB 申请得到的，看了全篇，并没有提供原始的数据，只提供了分析的结果，无法得到原始数据，比较可惜。
UKB 的数据不知道申请难度如何？有没有小伙伴可以提供一下申请经验?

生信菜鸟团

生信菜鸟团荣誉归来，让所有想分析生物信息学数据的小伙伴找到归属，你值得拥有！

推荐账号，扫码关注

最新文章

基因组数据在精准医学中扮演什么角色

计算视觉 | Nat.Methods | 一个用于跨九种模态的生物医学对象联合分割、检测和识别的基础模型

前瞻 | Nature | 人类细胞图谱：从细胞普查到统一的基础模型

精准医学 | Nat.Med | 使用常规血液检测和临床数据预测癌症检查点抑制剂免疫治疗的疗效

Nat.Genet | 从 DNA 序列预测 RNA-seq 覆盖度作为基因调控的统一模型

生信程序 | Nat.Genet | 在疾病关联位点精细定位因果组织和基因

期刊泛读 | Cell 出版社 | 优质期刊

数据库合集 | 更新至 67 个

数据挖掘之中性粒细胞胞外陷阱相关预后模型

玩转服务器—你的数据是否完整？

ChIP-Seq 简介

基因的功能推断之单细胞亚群的特异性高表达

能根据差异基因来反推样品的分组情况吗

基因的功能推断之敲减过表达的干扰它

基因的功能推断之大队列的共表达分析（比如：WGCNA）

基因的功能推断之大队列表达量相关性排序后gsea分析

基因的功能推断之大队列高低分组后差异分析然后功能富集

单细胞揭示了结直肠癌微环境中肥大细胞的激活

共享服务器助力学习与分析！

你选择哪种三代测序

如何用血常规发 Nature，临床常见指标的深度挖掘

综述 | Nature | 更新一下关于 2 型免疫的认知

生信算法 | 矩阵分解除了NMF，也可以试试这个 NatGenet 新发的 GBCD 算法

机器学习模型都值得用Nature新算法尝试一下，作者似乎想要干掉传统机器学习

数据库介绍 | NAR | LncSEA 2.0：用于长非编码 RNA 相关的集合和富集分析

空间组学 | NatMethods | SpatialData: 一个开放和通用的空间组学数据框架

期刊泛读 | Cancer_Cell | 第 1 期 | If 48.8

髓外中性粒细胞生成：狡兔三窟？

玩转服务器—Jupyterhub一键开启Python学习之旅

学生信，谁还不是一个菜鸟啊？（至少曾经是吧）

肿瘤病人和正常人有差异表达但并不是说他们的血液层面就很显著

第一眼差点就被这个变化倍数唬住了

还有必要背诵和掌握正则表达式语法规则吗

硕博赶紧用起来！Cell53,026人蛋白质-表型资源库

如何用大语言模型做富集分析，这篇NatMethods文章教你

scRNA分析之后，如何看待结果和进行实验验证？这篇文章告诉你

人工智能 | NatMed | 用于疾病诊断辅助的通用医学语言模型

生信程序 | NatGenet | 使用潜在嵌入多变量回归分析多条件单细胞数据

数据库介绍 | NAR | SPDB：一个全面的资源和知识库，用于单细胞分辨率下的蛋白质组数据

细胞图谱 | NatMed | 人类血管细胞的器官型图谱

Cell | 健康与疾病中 53,026 名成人的血浆蛋白质组图谱 | 提供结果数据和源代码

玩转服务器—从卡顿到秒装，Conda焕新极速体验

10X单细胞转录组全方位吊打BD平台吗

转录组测序的表达量的两个归一化方向会影响差异分析吗

读《人类线粒体基因组》|系统回答：线粒体基因表达阈值到底卡多少合适

基于Python的Xenium空转分析流程

跟着Seurat官网学Xenium空转分析

肿瘤新抗原该怎么分析

强烈推荐！好看免费全面的在线绘图平台，点点即可快速组合成好看的示意图！

泛读合集 | 2024 全年 | Nature 系列优质期刊

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉