院士都在用的数据库!第920医院首发药物暴露生存预测模型,联手MIMIC数据库,轻松拿下二区SCI,大有搞头,速来学习!

文摘   2024-08-19 18:00   上海  

上分神器预测模型,大家肯定不陌生吧,但是在机器学习套路繁多,各类模型如此卷的今天,阿星却看到一篇常规分析流程,工作量尚可(5图)的文章发表在6.1分的二区期刊《J TRANSL MED》,第一眼还以为是因为纯堆工作量(9000+样本),但是仔细一看却别有洞天,原来作者首推出了基于药物暴露的生存预测模型,这么个新鲜玩意儿,阿星必须带大家学起来:

1、公开数据的可利用性:研究基于公开的MIMIC数据库该数据库提供大规模的、真实世界的重症监护室患者数据,这使得研究方法和结果具有高度的透明度和可复制性,便于其他研究者验证和利用这些数据进行进一步研究。

2、思路具有创新性:文章提出了首个基于药物暴露的生存预测模型,这种创新性的思路为严重心力衰竭患者的预后评估提供了新的视角和方法。

3、结果具有开创性:研究结果不仅验证了模型的有效性,还特别指出了DeepSurv模型在临床实用性方面的优势,为心力衰竭患者的治疗和管理提供了开创性的预测工具ps:数据库虽好,但发文不仅要懂数据统计方法,还要精通热门选题,而且一般的电脑可能都跑不动这么大参数的模型了,如果不愿求诸于人,阿星这里有服务器独享服务,还能带你探索最新生信热点,共同开启科研新篇章!    

题目:基于药物暴露的新型可解释严重心力衰竭患者脆弱期生存预测模型的开发与验证

杂志:Journal of Translational Medicine

影响因子:IF=6.1

发表时间:2024年0806

后台回复“888”获取原文献,文献编号240819

研究背景

心力衰竭(HF)是全球主要的心血管病患和死亡原因,对公共卫生构成重大威胁。尽管已有大量投资用于HF的预防和治疗,但患者出院后的脆弱期仍面临高达15%的死亡风险,且现有评分系统在预测这些患者的预后方面存在局限性。    

研究思路

研究者首先识别严重心力衰竭患者出院后脆弱期的高死亡风险和现有评分系统的不足,设定目标开发基于药物暴露的预测模型,通过从临床数据库中提取数据,并且应用机器学习和深度学习算法来构建和评估模型性能,接着进行模型解释性分析以确定关键变量的贡献,最终在不同队列中验证了模型的准确性和实用性。

数据来源

数据集

数据库

数据类型

详细信息

MIMIC-III

MIMIC-IV

收治患者的医疗数据

外部验证队列A(MIMIC-III数据库)有4463名患者,外部验证队列B(920th医院)有254名患者

MIMIC IV

MIMIC-IV

收治患者的医疗数据

训练队列,有4811名患者,内部验证队列有2062名患者

主要结果  

1.基线特征

研究者通过对MIMIC-IV数据库的筛选和预处理图1,共纳入6873名严重心力衰竭患者,分为训练队列和内部验证队列。外部验证队列包括MIMIC-III数据库的4463名和第920医院的254名患者。三个队列性别比例均衡,患者年龄中位数分别为75、73和72岁。药物治疗包括β阻滞剂、利尿剂等    

图1 研究纳入流程图

2.生存预测模型的建立与验证

研究者使用训练队列开发并训练了三种生存预测模型(图2和图3),共纳入24个变量,包括6个个人信息变量和18种药物暴露情况。通过Spearman相关性分析LASSO变量筛选,最终CoxPH模型纳入10个独立预测变量,而RSF和DeepSurv模型则包含全部24个特征。验证结果显示,DeepSurv模型表现最佳,具有最高的平均AUC值。

图2 三种模型的曲线下面积(AUC)    

图3 预测误差曲线显示三种模型在每个时间点的最佳评分

3.特征重要性

研究者通过排列重要性分析,确定了CoxPH、DeepSurv和RSF模型中各个预测因子的贡献。年龄、ICU和医院住院时间等对模型预测准确性很重要,排列后C指数平均降低超过1%(图4)(ps:C指数是评估预测模型性能的一个统计量,尤其在生存分析中使用,衡量的是模型预测的生存概率与实际观察到的生存时间的一致性)。SHAP值分析进一步阐释了DeepSurv模型中特征的预后方向,年龄和ICU住院时间是预测生存的顶级变量(图5)。最终结果表明基于药物暴露的模型是合理且有前景的。(ps:如果你也想构建一个临床预测模型,SHAP值可以帮你评估特征重要性和实现模型可解释性    

图4 RSF和DeepSurv模型的特征重要性热图    

图5 使用SHAP解释器解释DeepSurv模型的结果

文章小结 

本文通过从MIMIC-IV数据库中提取并预处理了严重心力衰竭患者的数据,构建了CoxPH、RSF和DeepSurv三种生存预测模型,通过Spearman相关性分析、LASSO变量筛选、交叉验证和性能评估等手段,优化并验证了模型的准确性和实用性。此外,利用排列重要性和SHAP分析深入解释了模型特征的贡献,最终在不同队列中验证了模型的泛化能力和临床应用潜力。虽然分析思路比较常规,但阿星发现这是首次尝试开发和验证基于药物暴露的临床预测模型,且专门用于预测严重心力衰竭(HF)患者的生存情况。看到这里我们是不是感觉这篇文章使用的工具可以为我们所用呢?作者研究了严重心力衰竭患者那我们举一反三,别的疾病会不会也适用于基于药物的临床预测模型?还在等什么,赶紧扫码联系阿星,寻找更多新思路吧!



阿星有话说




生信星持续为大家带来最新生信思路,更多创新性分析思路请点击下方链接。想复现这种思路或者定制更多创新性思路欢迎直接call阿星,生信星团队竭诚为您的科研助力!



往期精选

19 August 2024



   

生信星
生信星提供专业生信分析服务,助您把握科研最新动态;思路设计、生信分析,就来找阿星~
 最新文章