Med-MIMIC,持续分享MIMIC临床生信文献与思路解读,捕捉当下热点思路,感兴趣的老师可以点点关注~需要定制化分析的老师欢迎扫码联系~
文章标题:Machine learning-based model for predicting the occurrence and mortality of nonpulmonary sepsis-associated ARDS
中文标题:基于机器学习的模型,用于预测非肺脓毒症相关 ARDS 的发生和死亡
发表期刊:Sci Rep .
发表时间:2024年11月
影响因子:3.8/Q2
急性呼吸窘迫综合征 (ARDS) 是危重患者呼吸衰竭的常见原因,其特征是突然发作的非心源性肺水肿伴低氧血症。ARDS 的常见原因包括肺部感染、非肺败血症、误吸、外伤、胰腺炎等。重症监护病房 (ICU) 的 ARDS 发病率约为 10%,ARDS 患者的死亡率为 27-39%。对有脓毒症相关 ARDS 风险的患者进行早期干预可以改善患者的预后。目的是建立一个基于机器学习的模型,用于预测非肺脓毒症相关 ARDS 的发生和死亡率。
思路
从 MIMIC-IV 数据库中随机选择 80% 的脓毒症患者,既往无肺部疾病且具有非肺部感染部位,用于通过机器学习技术(包括 K 最近邻、极端梯度提升、支持向量机、深度神经网络和决策树方法)构建预测模型。其余 20% 的患者用于验证模型的准确性。此外,还使用了本地数据进行进一步的模型验证。
结果分析
1. 基线特征
在这些非肺脓毒症患者中,发生频率排名前三的感染部位是血液、尿液和腹部。两组之间大多数基线参数的差异具有统计学意义 (P 值小于 0.01),这提高了模型的准确性。总体而言,NPS-ARDS 患者的 PaO2 较低和较高的乳酸水平,两组之间的感染部位分布相似。
2. 两组患者预后
非肺脓毒症患者的死亡率更高,ICU 住院时间更长。与非 NPS-ARDS 组相比,NPS-ARDS 组的 ICU 住院时间显著更长 (6.2 ± 5.2 天 vs. 4.4 ± 3.7 天,p < 0.01),较高的 28 天死亡率 (19.5% vs. 14.9%,p < 0.01) 和较低的 60 天累积生存率 (log rank = 5.791,P = 0.016)。差异均具有统计学意义 (P 值均小于 0.05),表明发生 NPS-ARDS 的脓毒症患者预后较差。建立早期预测模型可能在改善结果方面发挥作用。
3. 建模中使用的参数
非 NPS-ARDS 组患者入院时氧合指数较高,而死亡组患者入院时乳酸水平、凝血酶原时间、查尔森合并症指数评分和血尿素氮水平较高,尿量较低。微循环障碍、凝血异常、肾功能损害和严重疾病史会增加 NPS-ARDS 患者的死亡率。
4. 内部验证
使用从 MIMIC-IV 数据库中选择 80% 的患者并采用五种不同的机器学习方法,构建了预测模型。预测 NPS-ARDS 的准确性在 53.5 到 87.8% 之间。DT (87.8%) 的准确度最高,其次是 DNN (83.7%) 和 XGBoost (77.5%)。预测 NPS-ARDS 患者死亡率的准确性在 65.2% 到 71.8% 之间,XGBoost 的准确性最高 (71.8%),其次是 DT (70.9%) 和 SVM (69.0%)。总体而言,XGBoost 在预测这两个事件方面表现出更高的准确性。为了进一步验证模型的准确性,我们使用本地数据进行了内部验证。
5. 外部验证
使用当地数据验证上述模型,预测 NPS-ARDS 发病率的准确性在 63.4 至 78.0% 之间,而预测 NPS-ARDS 患者死亡率的准确性在 66.1 至 81.4% 之间。与内部验证结果一致,XGBoost 在预测发病率 (78%) 和死亡率 (81.4%) 方面表现出更高的准确性。结合内部和外部验证的结果,使用 XGBoost 构建的模型可用于预测非肺脓毒症患者 ARDS 的发生和死亡率。
文章小结
通过极端梯度提升法建立的模型可以在一定程度上预测非肺脓毒症相关 ARDS 的发生和死亡。今天为大家分享的文章纯公共数据挖掘+统计分析,就发到了一区!如果你也想在临床方向发高分文章,不妨试试这个省钱省事又省力的思路吧!