✦
医学科研新动向
✦
Interpretable machine learning model for new-onset atrial fibrillation prediction in critically ill patients: a multi-center study
Critical Care
<2024年11月03日>
研
究
背
景
新发房颤(NOAF)是重症监护病房(ICU)中非心脏手术患者常见的并发症之一,且具有显著的不良预后。NOAF的发生率因研究对象不同而波动,约为1.7%至43.9%,其发病率的高度不一致反映了患者病理生理条件的异质性。在病理生理层面上,NOAF会导致心房失去有效收缩功能,并伴随心室率增快,进一步引起心排出量下降和血流动力学不稳定。对于感染性休克或急性肾损伤等危重疾病患者,NOAF更被认为是疾病严重程度的标志,可能与多器官功能障碍相关。NOAF不仅会增加ICU住院患者的卒中风险,还显著提高了心衰发作率和院内外死亡率。然而,现有关于NOAF的研究多集中于心脏手术患者的术后管理,针对ICU非心脏手术患者的研究相对较少。尽早识别ICU中NOAF的高风险人群并进行针对性干预成为亟需解决的问题,这为NOAF的预测模型开发提供了科学和临床价值。随着机器学习在医学领域的应用增多,具有高解释性和临床适用性的模型可能为NOAF的早期预测提供新思路。
研究设计
数据来源:本研究数据来自MIMIC-IV数据库,并使用MIMIC-III子集作为外部验证数据集。MIMIC-IV数据集包含2008年至2020年期间的ICU数据,MIMIC-III则包含2001年至2008年期间的数据。
研究对象:纳入标准包括年龄大于18岁、ICU住院超过两天、无既往房颤病史和无心脏手术史的患者。数据筛选后共计纳入16528例患者用于训练和内部验证,另有6037例患者用于外部验证。
特征选择:采用LASSO回归进行特征选择,从多种临床变量中筛选出与NOAF相关的特征,包括人口学信息、合并症、实验室指标、生命体征及治疗措施等。最终筛选出23个特征作为模型输入变量。
机器学习模型:构建了八种ML模型,包括XGBoost、支持向量机(SVM)、Adaboost、多层感知器(MLP)、神经网络(NN)、朴素贝叶斯(NB)、逻辑回归(LR)和梯度提升机(GBM),并通过十折交叉验证确定最佳模型参数。
模型性能评估:使用ROC曲线、AUC值、敏感性、特异性、F1分数、准确性等指标评估模型性能,并绘制校准曲线和决策曲线(DCA)分析模型的临床适用性。
可解释性分析:通过SHAP方法分析XGBoost模型的特征贡献,以SHAP力图和群体图形式可视化模型的可解释性。
核心结果
1: 特征选择(Fig 2)
变量选择:使用LASSO回归筛选出23个变量,包括: 人口学特征:年龄、体重。 实验室指标:白细胞最大值(WBC_max)、血尿素氮最小值(BUN_min)、钾最小值(potassium_min)。 生命体征:心率最小值(HR_min)和最大值(HR_max)、收缩压最小值(SBP_min)、舒张压最大值(DBP_max)、体温最小值(temperature_min)和最大值(temperature_max)、血氧饱和度(SpO2_min)。 临床干预:机械通气、连续肾脏替代治疗(CRRT)、血管加压药的使用。 变量重要性:年龄、机械通气、尿量、脓毒症、BUN、SpO2、CRRT、体重在模型中贡献最大,这些特征的LASSO回归系数见图2A。
2. 模型性能比较(Fig 3)
模型AUC值:XGBoost在内部验证中的AUC为0.891(95% CI: 0.873–0.888),在外部验证中的AUC为0.769(95% CI: 0.756–0.782),表现最佳。其他模型的AUC值分别为:GBM (0.877), Adaboost (0.859), NN (0.825), MLP (0.807), NB (0.792), SVM (0.788)和LR (0.786)。 敏感性与特异性:XGBoost模型的敏感性为0.826,特异性为0.775,均高于其他模型。(Table 2) F1分数和准确性:XGBoost模型的F1分数为0.805,准确率为0.801,同样优于其他模型的表现。
3. 校准和临床收益分析(Fig 4)
校准曲线:六种模型(XGBoost、GBM、SVM、LR、MLP和NN)在校准曲线中表现出较好的预测一致性,而NB和Adaboost的校准性能较弱。 决策曲线分析(DCA):除Adaboost外,其他模型在不同阈值范围内均显示出较高的净收益,其中XGBoost模型在绝大多数阈值范围内的净收益最高。 临床影响曲线(CIC):在0.6的风险阈值下,XGBoost模型的阳性预测接近实际阳性数,且假阳性率适中,符合临床风险平衡要求。
4. 模型可解释性分析(Fig 5)
SHAP特征贡献图(Fig 5A):XGBoost模型中SHAP值最大的特征为年龄、机械通气、尿量、脓毒症、BUN、SpO2、CRRT和体重,说明这些变量对NOAF预测有最显著的影响。 年龄:是NOAF最强的预测因素,随着年龄的增加,NOAF的风险显著上升。 机械通气和尿量:与急性病情严重程度相关的干预手段,机械通气和尿量的变化均显著影响NOAF的风险。 BUN和SpO2:分别反映肾功能和氧合状态,对预测NOAF具有较高权重。 个例分析(Fig 5B):SHAP力图对一个具体患者的NOAF风险预测进行了可解释。该患者的高风险主要由HFrEF、脓毒症、体重增加和年龄等变量推动,图中黄色代表对高风险的正向贡献,紫色代表负向贡献
小
结
研究目标:本研究旨在通过机器学习模型预测ICU非心脏手术患者中新发房颤(NOAF)的风险,以便于早期识别高危患者并进行干预。
数据来源与对象:使用了MIMIC-IV数据库作为训练数据,MIMIC-III子集作为外部验证数据。共计纳入16528例符合标准的ICU患者,其中1520例发生了NOAF,另有6037例患者用于外部验证。
特征选择:通过LASSO回归从众多临床变量中筛选出23个关键变量,主要包括人口学特征、实验室指标、生命体征和干预措施等。
模型构建与选择:比较了八种机器学习模型的预测效果,最终选择XGBoost模型作为最佳模型,其在内外部验证中的AUC分别为0.891和0.769,表现优于其他模型。
模型性能与临床应用:XGBoost模型在敏感性、特异性、F1分数和准确性上均表现良好,并在校准和决策曲线分析中显示出较高的临床适用性。研究确定0.6为NOAF高风险的最佳阈值。
解释性分析:使用SHAP方法揭示了模型关键变量对NOAF预测的影响。年龄、机械通气、尿量、BUN、SpO2等变量在模型中占据重要角色。
研究意义:本研究提供了一个基于机器学习的NOAF风险预测工具,具备较高的预测准确性和良好的临床应用前景。
局限性:由于研究为回顾性设计,数据可能存在遗漏或信息偏倚;另外,由于数据来源单一,还需进一步通过多中心前瞻性研究验证模型的广泛适用性。
-END-
文字丨本人点滴积累,如有补充,下方留言即可
(左下角点击“阅读原文”即可获取全文)