IF-8.8/Q1 | 基于MIMIC数据库的可解释机器学习模型预测ICU非心脏手术患者中新发房颤的风险

文摘   2024-11-03 19:04   美国  

医学科研新动向

Interpretable machine learning model for new-onset atrial fibrillation prediction in critically ill patients: a multi-center study

Critical Care

<2024年11月03日>

新发房颤(NOAF)是重症监护病房(ICU)中非心脏手术患者常见的并发症之一,且具有显著的不良预后。NOAF的发生率因研究对象不同而波动,约为1.7%至43.9%,其发病率的高度不一致反映了患者病理生理条件的异质性。在病理生理层面上,NOAF会导致心房失去有效收缩功能,并伴随心室率增快,进一步引起心排出量下降和血流动力学不稳定。对于感染性休克或急性肾损伤等危重疾病患者,NOAF更被认为是疾病严重程度的标志,可能与多器官功能障碍相关。NOAF不仅会增加ICU住院患者的卒中风险,还显著提高了心衰发作率和院内外死亡率。然而,现有关于NOAF的研究多集中于心脏手术患者的术后管理,针对ICU非心脏手术患者的研究相对较少。尽早识别ICU中NOAF的高风险人群并进行针对性干预成为亟需解决的问题,这为NOAF的预测模型开发提供了科学和临床价值。随着机器学习在医学领域的应用增多,具有高解释性和临床适用性的模型可能为NOAF的早期预测提供新思路。

研究设计

  • 数据来源本研究数据来自MIMIC-IV数据库,并使用MIMIC-III子集作为外部验证数据集。MIMIC-IV数据集包含2008年至2020年期间的ICU数据,MIMIC-III则包含2001年至2008年期间的数据。

  • 研究对象纳入标准包括年龄大于18岁、ICU住院超过两天、无既往房颤病史和无心脏手术史的患者。数据筛选后共计纳入16528例患者用于训练和内部验证,另有6037例患者用于外部验证。

  • 特征选择采用LASSO回归进行特征选择,从多种临床变量中筛选出与NOAF相关的特征,包括人口学信息、合并症、实验室指标、生命体征及治疗措施等。最终筛选出23个特征作为模型输入变量。

  • 机器学习模型构建了八种ML模型,包括XGBoost、支持向量机(SVM)、Adaboost、多层感知器(MLP)、神经网络(NN)、朴素贝叶斯(NB)、逻辑回归(LR)和梯度提升机(GBM),并通过十折交叉验证确定最佳模型参数。

  • 模型性能评估使用ROC曲线、AUC值、敏感性、特异性、F1分数、准确性等指标评估模型性能,并绘制校准曲线和决策曲线(DCA)分析模型的临床适用性。

  • 可解释性分析通过SHAP方法分析XGBoost模型的特征贡献,以SHAP力图和群体图形式可视化模型的可解释性。

核心结果

1: 特征选择(Fig 2)

  • 变量选择:使用LASSO回归筛选出23个变量,包括:
  • 人口学特征年龄、体重。
  • 实验室指标白细胞最大值(WBC_max)、血尿素氮最小值(BUN_min)、钾最小值(potassium_min)。
  • 生命体征心率最小值(HR_min)和最大值(HR_max)、收缩压最小值(SBP_min)、舒张压最大值(DBP_max)、体温最小值(temperature_min)和最大值(temperature_max)、血氧饱和度(SpO2_min)。
  • 临床干预机械通气、连续肾脏替代治疗(CRRT)、血管加压药的使用。
  • 变量重要性年龄、机械通气、尿量、脓毒症、BUN、SpO2、CRRT、体重在模型中贡献最大,这些特征的LASSO回归系数见图2A。

2. 模型性能比较(Fig 3)

  • 模型AUC值XGBoost在内部验证中的AUC为0.891(95% CI: 0.873–0.888),在外部验证中的AUC为0.769(95% CI: 0.756–0.782),表现最佳。其他模型的AUC值分别为:GBM (0.877), Adaboost (0.859), NN (0.825), MLP (0.807), NB (0.792), SVM (0.788)和LR (0.786)。
  • 敏感性与特异性:XGBoost模型的敏感性为0.826,特异性为0.775,均高于其他模型。(Table 2)
  • F1分数和准确性:XGBoost模型的F1分数为0.805,准确率为0.801,同样优于其他模型的表现。

3. 校准和临床收益分析(Fig 4)

  • 校准曲线:六种模型(XGBoost、GBM、SVM、LR、MLP和NN)在校准曲线中表现出较好的预测一致性,而NB和Adaboost的校准性能较弱。
  • 决策曲线分析(DCA):除Adaboost外,其他模型在不同阈值范围内均显示出较高的净收益,其中XGBoost模型在绝大多数阈值范围内的净收益最高。
  • 临床影响曲线(CIC):在0.6的风险阈值下,XGBoost模型的阳性预测接近实际阳性数,且假阳性率适中,符合临床风险平衡要求。

4. 模型可解释性分析(Fig 5)

  • SHAP特征贡献图(Fig 5A)XGBoost模型中SHAP值最大的特征为年龄、机械通气、尿量、脓毒症、BUN、SpO2、CRRT和体重,说明这些变量对NOAF预测有最显著的影响。
    • 年龄:是NOAF最强的预测因素,随着年龄的增加,NOAF的风险显著上升。
    • 机械通气和尿量:与急性病情严重程度相关的干预手段,机械通气和尿量的变化均显著影响NOAF的风险。
    • BUN和SpO2:分别反映肾功能和氧合状态,对预测NOAF具有较高权重。
  • 个例分析(Fig 5B)SHAP力图对一个具体患者的NOAF风险预测进行了可解释。该患者的高风险主要由HFrEF、脓毒症、体重增加和年龄等变量推动,图中黄色代表对高风险的正向贡献,紫色代表负向贡献


  1. 研究目标:本研究旨在通过机器学习模型预测ICU非心脏手术患者中新发房颤(NOAF)的风险,以便于早期识别高危患者并进行干预。

  2. 数据来源与对象:使用了MIMIC-IV数据库作为训练数据,MIMIC-III子集作为外部验证数据。共计纳入16528例符合标准的ICU患者,其中1520例发生了NOAF,另有6037例患者用于外部验证。

  3. 特征选择:通过LASSO回归从众多临床变量中筛选出23个关键变量,主要包括人口学特征、实验室指标、生命体征和干预措施等。

  4. 模型构建与选择:比较了八种机器学习模型的预测效果,最终选择XGBoost模型作为最佳模型,其在内外部验证中的AUC分别为0.891和0.769,表现优于其他模型。

  5. 模型性能与临床应用:XGBoost模型在敏感性、特异性、F1分数和准确性上均表现良好,并在校准和决策曲线分析中显示出较高的临床适用性。研究确定0.6为NOAF高风险的最佳阈值。

  6. 解释性分析:使用SHAP方法揭示了模型关键变量对NOAF预测的影响。年龄、机械通气、尿量、BUN、SpO2等变量在模型中占据重要角色。

  7. 研究意义:本研究提供了一个基于机器学习的NOAF风险预测工具,具备较高的预测准确性和良好的临床应用前景。

  8. 局限性:由于研究为回顾性设计,数据可能存在遗漏或信息偏倚;另外,由于数据来源单一,还需进一步通过多中心前瞻性研究验证模型的广泛适用性。

-END-

文字丨本人点滴积累,如有补充,下方留言即可

(左下角点击阅读原文”即可获取全文

医学科研新动向
每日分享-相关领域包括:MIMIC、NHANES、SEER、GEO、TCGA、CHARLS等公共数据库最新研究成果解读。深入剖析机器学习、生信分析与临床流行病学研究方法。
 最新文章