IF-18.9/Q1 | 综合基因组与表型数据的血浆蛋白质组变异解析及其生物学调控因素

文摘   2024-10-02 19:06   美国  

医学科研新动向

Mapping biological influences on the human plasma proteome beyond the genome

Nature Metabolism

<蛋白组学>

随着蛋白质组学技术的进步,血浆中的数千种蛋白质已被同时测量。然而,这些蛋白的来源和功能尚不完全明确,尤其是非分泌性蛋白的生物学意义。本研究通过整合基因组数据和详细的表型信息,探讨影响人类血浆蛋白质组的关键因素,涵盖了遗传与可调控的生活方式因素。研究的核心目的是阐明这些因素对蛋白质水平的贡献,并使用因果推断方法揭示潜在的蛋白质与疾病之间的因果关联,从而为疾病机制提供新的见解。

研究设计

1. 数据来源与收集

  • 本研究使用SomaScan v4平台,测量8350名健康参与者血浆中4775种蛋白质水平。

  • 测量样本来自芬兰研究,该研究收集了参与者的详细表型信息,包括遗传、生活方式、饮食、身体活动和临床生物标志物。

2. 特征选择

  • 通过机器学习方法筛选了多达56个不相关的变量作为解释因素。采用LASSO回归对训练数据集进行100次子采样,并使用交叉验证优化超参数。

  • 这些解释因素涵盖遗传风险评分(GRS)、身体成分指标(如BMI、体脂分布)、代谢指标(如血糖、肝肾功能)及生活方式(吸烟状态等)。

3. 线性混合模型分析

  • 对每个蛋白质使用线性混合模型进行方差分解,定量分析基因和表型变量对蛋白质水平的贡献。使用UMAP降维技术对蛋白质进行聚类分析,探索解释变量对血浆蛋白变异的影响模式。

4. 双样本孟德尔随机化分析

  • 采用双样本孟德尔随机化方法,评估可调控的生物学因素与相关蛋白质水平之间的因果关联。利用遗传工具变体评估多达541种蛋白质的因果效应,并进行灵敏度分析以验证结果的稳健性。

核心结果

1. 血浆蛋白变异的主导因素

通过UMAP分析,血浆蛋白质的主要变异来源为基因和表型因素。超过60%的蛋白质变异由遗传因素主导,cis-pQTL对蛋白质变异的贡献中位数为3.10%,最高可达74.27%。例如,NRX1A(Neurexin 1)由其遗传变异解释的比例高达77.3%。另一方面,慢性炎症状态对某些蛋白质的贡献显著,例如CRP的变异中位贡献率为68.34%,而肝功能指标ALT对肝脏相关蛋白的贡献中位数达到56.66%。

2. 不同解释变量对蛋白变异的总体贡献

不同解释变量对蛋白质水平的贡献差异明显。技术因素是多数蛋白质变异的主要来源,中位贡献率为7.29%,某些蛋白质如CRP和PCSK9的技术变异解释率分别达70.02%和64.60%。此外,BMI和脂肪量等体成分变量也对一部分蛋白质的变异有显著影响。例如,BMI对某些蛋白质的变异贡献中位数为0.36%,总脂肪质量的中位贡献为0.55%,最高可达40.30%。

3. 选择性解释的蛋白质

部分蛋白质的变异几乎完全由单一因素主导。例如,骨质密度是SOST(硬化素)变异的主要解释变量,贡献率为10.7%。年龄对TAGLN(转肌动蛋白)的变异贡献达到14.8%。另外,药物治疗对蛋白质变异的影响也很显著,例如,CTHRC1(胶原三螺旋重复蛋白1)的变异27.2%由他汀类药物解释,这可能提示其潜在的脱靶效应。

4. 血浆蛋白的因果决定因素

孟德尔随机化分析表明,ALT是95种蛋白质的主要决定因素,最高贡献率达12.79%。例如,COL6A3与肾功能相关的变异被ALT解释的比例为12.79%。同时,eGFR(估算肾小球滤过率)是肾功能相关蛋白的关键决定因素,其对50种蛋白质的变异贡献显著,尤其在肾功能下降时,90%的蛋白质变异明显增加。此外,吸烟状态对39.98%的蛋白质变异有影响,慢性低度炎症(CRP)对多种蛋白质的影响也很显著,最高贡献率达到68.34%。

5. 蛋白质与疾病风险的因果关联

通过因果分析,研究识别了304种蛋白质与20种疾病发生风险的关联。例如,总脂肪质量与T2D相关蛋白质显著富集,富集比值比(OR)为17.01;外周动脉疾病(PAD)相关蛋白质在吸烟状态下显著富集,OR为16.79。此外,CRP在肾功能下降(eGFR降低)相关蛋白中也有明显的富集,其对多种疾病风险的贡献比值比高达18.44。


本研究通过结合基因组学和表型数据,揭示了遗传与可调控因素在血浆蛋白质水平中的重要作用。超过60%的蛋白质变异由遗传因素主导,但慢性炎症、肝肾功能和生活方式等可调控因素也显著影响部分蛋白质水平。双样本孟德尔随机化分析验证了ALT和eGFR等生物指标在调控蛋白质变异中的因果作用,尤其是在肝脏和肾脏功能相关的蛋白质中。该研究还识别了多种蛋白质与疾病发生风险的因果关联,为疾病的早期干预和个性化治疗提供了新的视角。

-END-

文字丨本人编写,如有补充,下方留言即可
点击左下角“阅读原文”即可获取全文

医学科研新动向
每日分享-相关领域包括:MIMIC、NHANES、SEER、GEO、TCGA、CHARLS等公共数据库最新研究成果解读。深入剖析机器学习、生信分析与临床流行病学研究方法。
 最新文章