Med-MIMIC,持续分享MIMIC临床生信文献与思路解读,捕捉当下热点思路,感兴趣的老师可以点点关注~需要定制化分析的老师欢迎扫码联系~
文章标题:Machine learning models for mortality prediction in critically ill patients with acute pancreatitis-associated acute kidney injury
中文标题:用于急性胰腺炎相关急性肾损伤危重患者死亡率预测的机器学习模型
发表期刊:Clin Kidney J .
发表时间:2024年9月
影响因子:4/Q1
急性肾损伤 (AKI) 的发生与急性胰腺炎 (AP) 患者死亡率增加相关,表明早期准确预测急性胰腺炎相关急性肾损伤 (AP-AKI) 危重症患者死亡率的重要性。本研究旨在通过将 AP-AKI 危重患者的性能与传统的 logistic 回归 (LR) 模型进行比较,开发和验证基于机器学习的 AP-AKI 危重患者院内死亡率预测模型。
思路
这项研究使用了来自三个临床数据库的数据。预测因子由 Recursive Feature Elimination 算法识别。LR 和两个机器学习模型——随机森林 (RF) 和极限梯度提升 (XGBoost)——是使用 10 倍交叉验证开发的,用于预测 AP-AKI 患者的院内死亡率。
研究人群
本研究是一项回顾性队列研究,使用了来自三个临床数据库的数据:重症监护医学信息市场 IV (MIMIC-IV)、EICU 协作研究数据库 (EICU-CRD) 和来自中国长沙中南大学湘雅医院的临床数据存储库。
纳入标准: AP 和 AKI 的临床诊断并入住 ICU。
排除标准:年龄 <18 岁,ICU 住院时间 ≤24 小时,≥25% 缺失数据或结局变量缺失。对于多次入院的患者,本研究仅包括第一次 ICU 入院。
结果分析
1. 预测变量选择
最终的最佳特征子集确定了 8 个变量:年龄、中性粒细胞、RDW、BUN、白蛋白、SBP、RRT 和血管加压药。这 8 个变量被认为是开发院内死亡率预测模型的预测因子。
2. 模型开发
LR 模型 [0.788 (95% CI 0.767–0.808)] 和 RF 模型 [0.894 (95% CI 0.880–0.908)] 的 AUC 值相比,XGBoost 模型的 AUC 值 [0.941 (95% CI 0.931–0.952)] 在训练集中显著更高 (均 P < .001)。
图 3 显示了训练集中已建立模型的校准曲线。LR、RF 和 XGBoost 模型的 Brier 评分分别为 0.099、0.066 和 0.039。
图 4 显示了 XGBoost 模型中的特征重要性排名,图 4 显示了 3 月 1 日的 X 级特征重要性排名。5 根据其 SHAP 值显示每个特征的重要性。
3. 模型验证
XGBoost 模型的性能是可以接受的,AUC 值为 0.724 (95% CI 0.648–0.800)。然而,它与外部验证集中的 LR (P = .898) 和 RF 模型 (P = .206) 没有显着差异。图 7 显示了外部验证集中已建立模型的校准曲线。LR 、 RF 和 XGBoost 模型的 Brier 评分分别为 0.221 、 0.224 和 0.217。
文章小结
XGBoost 模型在使用 MIMIC-IV 和 eICU-CRD 数据的训练集中的区分和校准方面均优于 LR 和 RF 模型,并确定了 8 个预测因子 (年龄、中性粒细胞、RDW、BUN、白蛋白、SBP 、RRT 和血管加压药)。然而,由于研究人群的特征、院内死亡率和训练集与外部验证集之间的样本量存在差异,训练集结果的普遍性仍然是一个问题,仍需要未来的验证。今天为大家分享的文章纯公共数据挖掘+统计分析,就发到了一区!如果你也想在临床方向发高分文章,不妨试试这个省钱省事又省力的思路吧!