14.3/Q1,机器学习+数据库轻松拿捏高尿酸血症的早期检测和预后预测

文摘   2024-09-14 18:10   海南  

机器学习(ML)是人工智能的一个关键分支,擅长解释大量数据和准确评估复杂模式。还不会使用机器学习?赶紧来看看这篇14+文章!解码生信,持续更新临床生信文献与思路解读,感兴趣的老师可以关注CC

文章标题:Multimodal Machine Learning-Based Marker Enables Early Detection and Prognosis Prediction for Hyperuricemia

中文标题:基于多模态机器学习的标记物可实现高尿酸血症的早期检测和预后预测

发表期刊:Advanced Science

发表时间:2024年7月

影响因子:14.3/Q1

研究背景

高尿酸血症 (华) 已成为第二普遍的代谢紊乱,其特征是期延长且无症状,引发痛风和代谢相关结果。高尿酸血症和痛风的早期检测和预后预测对于先发制人的干预至关重要。
研究方法

整合来自英国生物样本库和 8900 名南方医院参与者421287遗传和临床数据,开发并验证了一个堆叠式多模态机器学习模型,以综合其作为高尿酸血症 (ISHUA) 计算机模拟定量标志物的概率。

结果分析
1.临床特征与高尿酸血症和痛风的相关性

在 UKBB 和南方医院队列中,临床特征与 华 显著相关,但 CHO 除外,它仅在南方医院队列中显著。此外,Cox 比例风险回归模型表明,这 10 种临床特征与患痛风的风险升高相关。

2.所选 SNP 的注释和富集分析

选定的 SNP 进行注释,定位到 460 个非冗余基因,这些基因中的大多数与尿酸代谢或炎症有关。在 KEGG 通路富集分析中,发现包括胆固醇代谢途径和 I 型糖尿病在内的 9 条通路显著富集。同样,GO 富集分析揭示了尿酸盐代谢过程、外源性生物运输和主动脉发育等生物过程的富集。

3.堆栈式 ML 模型在训练集中的性能

对训练样本中的 38277 个遗传变量进行最小绝对收缩和选择运算符 (LASSO) 算法分析,确定了用于识别 华 的最重要遗传变量 。叠加模型使用遗传和临床特征的组合,预测 华 的准确率为 0.736 ,敏感性为 0.828 ,特异性为 0.723 。结果表明,包含遗传和临床特征的堆叠模型比单个分类器表现更好。


4.ISHUA 的预后评估

利用从堆叠多模态模型得出的 华 概率为 UKBB 火车集的参与者生成 ISHUA,并评估其预后意义。观察到 华 和 ISHUA 的已知危险因素之间存在相关性。

5.高危人群生活方式与不良结局之间的关联

在训练组的高危组中,具有中等和良好生活方式特征的参与者痛风、CAD,高血压、DmT2、终末期肾病和全因死亡的风险比较低 。

文章小结

我们建立并验证了一个可靠且实用的堆叠多模态 ML 模型,该模型在遗传和临床数据上进行了训练,以合成 华 的 insilico 定量标记,能够及时识别 华,并为痛风和代谢相关结果的个性化风险分层提供潜力。此外,我们证明生活方式的改变可以减轻高危人群的不良后果。(如果你是在寻找如何将机器学习融入你的研究,或者需要技术帮助,欢迎滴滴CC~)

解码生信
解码生物信息分析最前沿文献和思路,提供专业的生信分析服务:思路设计,生信分析,代码复现,欢迎老师们定制分析服务
 最新文章