Med-MIMIC,持续分享MIMIC临床生信文献与思路解读,捕捉当下热点思路,感兴趣的老师可以点点关注~需要定制化分析的老师欢迎扫码联系~
文章标题:Development and validation of novel interpretable survival prediction models based on drug exposures for severe heart failure during vulnerable period
中文标题:基于药物暴露的脆弱期严重心力衰竭的新型可解释生存预测模型的开发和验证
发表期刊:J Transl Med .
发表时间:2024年8月
影响因子:6.1/Q1
严重心力衰竭 (HF) 在脆弱期的死亡率较高,而用于准确评估其预后的靶向预测工具,尤其是基于药物暴露的预测工具,在很大程度上仍未得到探索。因此,本研究旨在利用药物信息作为主要预测因子,开发和验证这一时期重度 HF 患者的生存模型。
思路
我们从 MIMIC-IV 数据库 (作为训练和内部验证队列) 以及 MIMIC-III 数据库和当地医院 (作为外部验证队列) 中提取了重度 HF 患者。采用 Cox 比例风险模型 (CoxPH) 、随机生存森林 (RSF) 和深度学习生存预测 (DeepSurv) 三种算法来整合参数 (部分住院信息和药物暴露持续时间) 以构建生存预测模型。主要使用受试者操作员特征曲线下面积 (AUC) 、 Brier 评分 (BS) 和决策曲线分析 (DCA) 评估模型性能。模型的可解释性由排列重要性和 Shapley 加法解释值决定。
结果分析
1. 基线特征
从 MIMIC-IV 数据库中确定了 6873 名重症 HF 患者,其中 4811 名和 2062 名分别在训练队列和内部验证队列中。对于外部验证队列,我们分别纳入了来自 MIMIC-III 数据库和第 4463 医院的 254 名参与者和 920 名参与者。
2. 生存预测模型的开发和验证
在本研究中,我们使用训练队列生成和训练 3 个模型 (CoxPH 、 RSF 和 DeepSurv ) 用于生存预测。共选取 24 个变量,包括 6 个个人信息变量 (年龄、性别、BMI、医院和 ICU LOS、种族) 和 18 种药物暴露情况,用于构建模型。对于 RSF 和 DeepSurv 模型的开发,完全整合了 24 个功能。在进行 100 次重复随机搜索和 5 倍交叉验证后,我们选择了那些在交叉验证中显示最高平均 C 指数的参数作为最佳参数。验证结果表明,无论队列如何,所有 3 个模型在预测重度 HF 患者在脆弱期的生存率都表现出高 AUC 值。时间依赖性 AUC 超过 0.7,表明这 3 个模型在预测长期和短期生存状态方面具有可靠的能力。由于 DeepSurv 模型表现出最有效的预测性能,我们还进行了亚组分析以评估其模型性能,这进一步证实了该模型在各种亚群中具有理想的预测性能。
3. 特征重要性
评估可变排列重要性确定了对 DeepSurv 和 RSF 模型预测准确性很重要的特征,随着年龄、ICU 和医院 LOS、BMI 和肾上腺素能/多巴胺能药物、ACEI、硝酸盐、抗生素、β阻滞剂、H2RAs、维生素 K 拮抗剂、HMG-CoA 还原酶抑制剂、肝素、利尿剂和抗血小板药物的暴露持续时间的排列,C 指数平均降低超过 1%。
此外,SHAP 用于解释最佳 DeepSurv 模型,该模型提供了有关特征预后方向的附加信息。提供了因素的积极或消极影响的汇总图,并按图 SHAP 的平均绝对值对临床特征进行排序。
文章小结
本研究建立的生存预测工具主要通过输入药物治疗持续时间,可应用于处于脆弱期的重度 HF 患者,从而有助于前瞻性地做出最佳临床决策。今天为大家分享的文章纯公共数据挖掘+统计分析,就发到了一区!如果你也想在临床方向发高分文章,不妨试试这个省钱省事又省力的思路吧!