MR不仅选题要创新,思路更要创新!复旦团队11+新作:孟德尔随机化结合蛋白组学+机器学习,0实验谁能不爱!

学术   2024-11-11 10:03   上海  
如何在内卷成风的孟德尔随机化领域获取一席之地?选题这点就不用说了,小云已经说过无数次。今天咱们来说另外一个关键点——思路创新!如何创新呢?最常见的就是与多种不同的方法结合!一起看看小云今天给大家带来的这篇创新佳作吧!
这篇文章来自复旦大学陈兴栋团队,探讨了与骨质疏松症相关的血浆蛋白质。纯生信发了11+,究竟如何办到的呢?
1)首先,作者基于UK Biobank评估了血浆蛋白与骨质疏松症之间的关系,并鉴定出134种与骨质疏松症显著相关的血浆蛋白。
2)接着通过孟德尔随机化方法证实17种血浆蛋白与骨质疏松症之间存在因果关系。
3)通过机器学习验证了基于10种蛋白质构建的预测模型能够提前5年预测骨质疏松症发病。
4)而且,分析确定了与免疫、脂质代谢和FSH调节相关的蛋白质模块。
该研究将孟德尔随机化与机器学习及组学分析的结合,提高因果推断的准确性。想跳出常规,在孟德尔随机化方向做点新东西的小伙伴快来联系小云吧!专业团队,为您服务~ps:如果想提高分析效率,可以联系小云试用高速服务器,让分析顺畅无比!

定制生信分析

云服务器租赁

(加微信备注99领取试用)

   
题目:血浆蛋白质组学分析揭示了与骨质疏松症相关的蛋白质和三种特征模式:一项前瞻性队列研究
杂志:Journal of Advanced Research(IF 11.4)
发表时间:2024.10

关注公众号,后台发送“123”可以直接获取原文PDF,文献编号:241111


研究背景
探索与骨质疏松症相关的血浆蛋白可以深入了解骨质疏松症的病理发展,为筛查高危人群确定新的生物标志物,并促进发现有效的治疗靶点。本研究旨在鉴定与骨质疏松相关的潜在蛋白,并从蛋白质组学角度探讨其潜在机制。
研究思路
该研究包括英国生物银行(UKB)中42325名无骨质疏松症的参与者,其中1477人在随访期间出现骨质疏松症。使用Cox回归和孟德尔随机化分析来检验血浆蛋白与骨质疏松症之间的关系。利用机器学习来探索对骨质疏松症风险具有强预测能力的蛋白质。
研究结果
鉴定与骨质疏松症相关的蛋白质
在分析的2919种血浆蛋白中,205种蛋白在模型1中显示出与骨质疏松症的显著相关性(图2A)。在模型2中,134种蛋白仍与骨质疏松症显著相关(图2A)。在所有模型中,硬化蛋白(SOST)、脂联素(ADIPOQ)、肌酸激酶b型(CKB)、生长/分化因子15 (GDF15)和IGFBP2与骨质疏松症的相关性最显著。    
此外,作者探索了134种蛋白质与不同部位骨密度T评分之间的纵向关联(图2B)。线性回归分析显示,16、17和20种蛋白质分别与腰椎、股骨颈和全身骨密度T评分之间存在显著关联。在所有三个部位中,SOST与BMD t评分保持着最强大的关联。
在亚组分析中,观察到55岁以上的个体和女性(尤其是绝经后女性)中与骨质疏松相关的血浆蛋白数量更多,相关性更强(图2C)。值得注意的是,SOST仅在年龄较大的个体(>55岁或绝经期女性)中与骨质疏松症显著相关,而FSHB在年龄较小的女性群体(<55岁、女性或非绝经期女性)中与骨质疏松症显著相关。
血浆蛋白与骨质疏松症之间的因果关系
采用双样本孟德尔随机化,作者验证了欧洲人群血浆蛋白与骨质疏松症之间的因果关系(图3 3)。Steiger方向试验支持所有与骨质疏松症显著相关的蛋白的定向因果关系。11种蛋白与骨质疏松有显著相关性(至少3种MR方法P < 0.05), 6种蛋白与骨质疏松有暗示相关性(至少2种MR方法P < 0.05)。值得注意的是,来自肿瘤坏死因子(TNF)家族的四种蛋白与骨质疏松症显著相关,TNFRSF9在所有方法中都显示出显著相关性。    
机器学习识别具有显著预测能力的蛋白质
首先,根据预测模型中与骨质疏松相关的134种蛋白的显著性对其进行排序(图4A)。FSHB、SOST和ADIPOQ是最重要的预测因子。随后,选择了排名前10位的蛋白进入模型进行进一步预测分析。SHAP图显示,FSHB和SOST在骨质疏松患者中具有最广泛的范围,突出了它们较强的预测能力(图4B)。    
并利用筛选出的10个蛋白建立预测模型。在相同的测试数据集上,血浆蛋白模型的AUC为0.781,与传统的因子模型相比,表现出更优异的性能(图4C)。此外,将患者分为发病时间为5年、5 - 10年和10年以上三组(图4D)。其中,蛋白模型较准确地预测了前5年的骨质疏松风险。
WGCNA构建蛋白模块网络
在这134种蛋白质中,根据蛋白质共表达模式确定了三种不同的蛋白质模块,蛋白质计数从11到59不等(图5A)。通过途径富集分析,发现这些模块分别与免疫、脂质代谢和促卵泡激素(FSH)信号通路相关(图5C)。此外,在每个模块中鉴定了枢纽蛋白(图5B)。    
骨质疏松症危险因素、蛋白质模块和骨质疏松症之间的关系
在完全调整模型中,免疫模块,脂质代谢模块和FHS模块均与骨质疏松症风险增加相关(图6A)。限制三次样条分析显示脂质代谢模块和促卵泡刺激素模块无显著非线性,而免疫模块呈现显著非线性。
随后,作者联合分析了蛋白质模块与生活方式、饮食、遗传和女性特异性因素的关系(图6C)。
进一步,中介分析结果如图6所示。关于生活方式(图6D),免疫模块被确定为吸烟、睡眠时间、身体活动和骨质疏松症之间关联的部分中介,中介比例分别为21.03%、8.78%和13.54%。脂质代谢模块介导吸烟与骨质疏松之间10.22%的关系,而显著抑制运动与骨质疏松之间的关系,抑制率为18.10%。FSH模块显著调节睡眠与骨质疏松之间的关联(9.95%),而显著抑制吸烟与骨质疏松之间的关联(4.51%)。在遗传因素方面(图6E),虽然脂质代谢和FSH模块显著介导了PRS与骨质疏松症之间的关联,但中介比例相对较小,分别为2.58%和2.67%。就女性特异性因素而言,FSH模块在绝经与骨质疏松的关联中发挥了至关重要的中介作用,占中介比例的47.24%(图6F)。此外,免疫模块在更年期与骨质疏松症的关联中所占的介导比例为4.10%。    
文章小结
这篇文章基于UK Biobank确定了几种与骨质疏松相关的蛋白,并强调了血浆蛋白通过免疫、脂质代谢和FSH调节三种主要途径影响骨质疏松进展的作用。文章没有涉及一点实验却讲述了一个完整的生信故事,思路严谨,方法创新式!UKB+孟德尔随机+机器学习的这一组合用法新意满满!想来一篇?那就抓紧联系小云吧!
ps:机器学习()和孟德尔随机化()课程上线了,感兴趣的宝子可以自行获取哦~

定制生信分析


云服务器租赁

热点推荐

孟德尔随机化

临床公共数据分析

单细胞测序

肿瘤免疫与微环境

机器学习

单基因分析

生信云服务器

代码合集(点击查看)

培训班系列(点击查看)

云生信学生物信息学
专注生信10余年,原创文章数千篇; 公号资料免费领,寻求服务找小云; 长期学习加关注,生信干货更不停。
 最新文章