Med-MIMIC,持续分享MIMIC临床生信文献与思路解读,捕捉当下热点思路,感兴趣的老师可以点点关注~需要定制化分析的老师欢迎扫码联系~
文章标题:Construction and validation of prognostic models in critically Ill patients with sepsis-associated acute kidney injury: interpretable machine learning approach
中文标题:脓毒症相关急性肾损伤危重患者预后模型的构建和验证:可解释的机器学习方法
发表期刊:J Transl Med .
发表时间:2023年6月
影响因子:6.1/Q1
急性肾损伤 (AKI) 是脓毒症危重患者的常见并发症,通常与不良预后有关。我们旨在使用机器学习 (ML) 方法为脓毒症相关 AKI (S-AKI) 患者构建和验证可解释的预后预测模型。
统计方法
从重症监护医学信息市场 IV 数据库 2.2 版收集训练队列的数据以构建模型,并从浙江大学医学院附属杭州市第一人民医院提取患者数据进行模型外部验证。使用递归特征消除 (RFE) 确定死亡率的预测因子。然后,采用随机森林、极端梯度提升 (XGBoost) 、多层感知器分类器、支持向量分类器和 logistic 回归分别建立重症监护病房 (ICU) 入院后 7 、 14 和 28 天的预后预测模型。使用受试者工作特征 (ROC) 曲线和决策曲线分析 (DCA) 评估预测性能。SHapley 加法解释 (SHAP) 用于解释 ML 模型。
结果分析
1. 基线特征
在训练队列中,S-AKI 患者 7 天内的总死亡率为 28% (n = 712)。在单变量分析中,入院年龄;AKI 分期;SOFA 评分;合并症,例如充血性心力衰竭、糖尿病复杂性和转移性癌症;生命体征,例如心率、呼吸频率和 SpO2;动脉血气 (ABG) 指标,如 lactate_max、aniongap_max 和 bicarbonate_max;血小板计数、白细胞计数、血钾水平、机械通气、血培养和痰培养阳性等血常规指标在组间被认为具有显著意义。
2. 在模型中选择的特征
本研究使用 RFE 算法从训练队列的数据中选择特征。根据特定的特征排名标准,RFE 从一整套开始,然后逐一剔除最不相关的特征,选择最重要的特征。最后,RFE 分别在 3 组中选出前 40 个重要特征。
3. 模型比较
XGBoost 算法模型在 7 天、 14 天和 28 天组中的 AUC 最高。RF 模型的性能仅次于 XGBoost,明显优于其他三个模型。三组的 F1 分数、准确度、精密度和召回率的结果如图 1 所示。4. XGBoost 分类模型的性能优于 3 组中的其他模型。根据五个预测模型的 DCA 结果,XGBoost 的净收益明显大于所有三组中的其他模型。
4. 可解释性分析
图 7 说明了如何使用 SHAP 方法来解释单个模型预测。图中显示了四个示例。它代表了一种直观的方式来指导临床医生和患者的决策,并提高他们对所开发模型如何做出特定预测的理解。力图从基值(所有预测的平均值)开始。每个预测变量(及其相应的 Shapley 值)都由一个箭头表示,该箭头相对于基值增加(以红色显示)或减少(以蓝色显示)模型的预测值。
5. 外部验证
我们验证了 2018 年至 2022 年从浙江大学(中国浙江)杭州市第一人民医院入组的外部队列。XGBoost 在所有模型中表现出最佳性能,尤其是与 SVC 和 MLP 模型相比。图 9 显示了五个模型之间 F1 分数、准确率、精密度和召回率的比较。XGBoost 的综合性能最好。
文章小结
ML 是预测 S-AKI 患者预后的可靠工具。SHAP 方法用于解释 XGBoost 模型的内在信息,这可能被证明在临床上有用,并帮助临床医生定制精确管理。今天为大家分享的文章纯公共数据挖掘+统计分析,就发到了一区!如果你也想在临床方向发高分文章,不妨试试这个省钱省事又省力的思路吧!