✦
医学科研新动向
✦
Mapping biological influences on the human plasma proteome beyond the genome
Nature Metabolism
<蛋白组学>
研
究
背
景
研究设计
1. 数据来源与收集:
本研究使用SomaScan v4平台,测量8350名健康参与者血浆中4775种蛋白质水平。
测量样本来自芬兰研究,该研究收集了参与者的详细表型信息,包括遗传、生活方式、饮食、身体活动和临床生物标志物。
2. 特征选择:
通过机器学习方法筛选了多达56个不相关的变量作为解释因素。采用LASSO回归对训练数据集进行100次子采样,并使用交叉验证优化超参数。
这些解释因素涵盖遗传风险评分(GRS)、身体成分指标(如BMI、体脂分布)、代谢指标(如血糖、肝肾功能)及生活方式(吸烟状态等)。
3. 线性混合模型分析:
对每个蛋白质使用线性混合模型进行方差分解,定量分析基因和表型变量对蛋白质水平的贡献。使用UMAP降维技术对蛋白质进行聚类分析,探索解释变量对血浆蛋白变异的影响模式。
4. 双样本孟德尔随机化分析:
采用双样本孟德尔随机化方法,评估可调控的生物学因素与相关蛋白质水平之间的因果关联。利用遗传工具变体评估多达541种蛋白质的因果效应,并进行灵敏度分析以验证结果的稳健性。
核心结果
1. 血浆蛋白变异的主导因素
2. 不同解释变量对蛋白变异的总体贡献
3. 选择性解释的蛋白质
4. 血浆蛋白的因果决定因素
5. 蛋白质与疾病风险的因果关联
小
结
-END-
文字丨本人编写,如有补充,下方留言即可
(点击左下角“阅读原文”即可获取全文)