Med-MIMIC,持续分享MIMIC临床生信文献与思路解读,捕捉当下热点思路,感兴趣的老师可以点点关注~需要定制化分析的老师欢迎扫码联系~
文章标题:Improving the Prognostic Evaluation Precision of Hospital Outcomes for Heart Failure Using Admission Notes and Clinical Tabular Data: Multimodal Deep Learning Model
中文标题:使用入院记录和临床表格数据提高心力衰竭医院结果的预后评估精度:多模态深度学习模型
发表期刊:J Med Internet Res.
发表时间:2024年5月
影响因子:5.8/Q1
临床记录包含与患者过去和当前健康状况相关的结构化数据之外的上下文信息。本研究旨在设计一种多模态深度学习方法,以使用入院临床记录和易于收集的表格数据来提高心力衰竭 (HF) 医院结果的评估精度。利用临床叙述的潜力并通过多模态深度学习 (DL) 方法对其进行建模,可以提高患者护理的精度,并有助于改进院内死亡率的预测模型。
纳入与排除标准
纳入标准:根据国际疾病分类诊断代码,我们纳入了 ≥16 岁 HF 患者的所有首次入住 ICU 的患者。
排除标准:我们排除了在 ICU 中住院时间少于 24 小时且没有入院记录的患者。
将患者分为 4 个队列以支持适当的模型评估,包括开发、内部验证、前瞻性验证和外部验证队列。
统计方法
用于开发和验证多模态模型的数据回顾性地来自 3 个开放访问的美国数据库,包括 2001 年至 2019 年从一家教学医院收集的重症监护医学信息市场 III v1.4 (MIMIC-III) 和 MIMIC-IV v1.0,以及 2014 年至 2015 年从 208 家医院收集的 eICU 合作研究数据库 v1.2。研究队列由所有重症 HF 患者组成。分析临床记录,包括主诉、现病史、体格检查、病史和入院用药,以及电子健康记录中记录的临床变量。我们为住院患者开发了一个深度学习死亡率预测模型,该模型接受了完整的内部、前瞻性和外部评估。采用综合梯度和 SHapley 加法解释 (SHAP) 方法分析风险因素的重要性。
结果分析
1. 基线特征
2001 年至 2016 年期间,从 MIMIC-III 和 MIMIC-IV 联合数据集中收集了 12,486 例 (14.1%) HF 患者的样本;它们被随机分为一个开发集和一个独立的内部验证集。此外,从 2017 年至 2019 年从 MIMIC-IV 中提取了 1896 例 (18.3%) HF 患者,用于前瞻性验证集。对于外部验证集,从 eICU-CRD 数据集中提取了 7432 例 (15%) HF 患者。4 个队列中院内死亡率的患者比例从 14% 到 19% 不等。
2. 模型性能评估
在调整超参数后,我们通过最佳模型的受试者操作特征曲线展示了内部、前瞻性和外部验证集的鉴别性能(图 2)。在所有 3 种验证评估类型中,多模态模型的 AUROCs 均显著高于两种单峰模型。内部、前瞻性和外部验证集分别为 0.838 (95% CI 0.827-0.851) 、 0.849 (95% CI 0.841-0.856) 和 0.767 [0.762-0.772]。
3. 临床笔记中各个部分的贡献
通过将 5 种临床记录 (包括主诉、现病史、病史、入院用药和体格检查) 与临床变量相结合重新训练所有预测模型,分别评估其性能贡献。我们发现所有验证队列中的个体贡献远低于总体贡献。具体来说,与其他笔记类型相比,病史和体格检查包含更多信息,有助于评估 HF 患者的预后。
4. 临床记录可视化和解释
我们应用 IG 方法来研究深度网络预测对其输入特征的归因,旨在为单个预测提供解释。IG 是根据预测输出相对于输入字的梯度计算的。较高的 IG 值表示单词对模型预测的意义较大,而较低的值表示重要性较低。我们使用 SHAP 技术对重要的临床变量进行了排名。52 个临床变量中的前 20 个(图 4)表明,对于结构化表格数据,排名最高的变量也与疾病严重程度和较差的预后相关。这些变量代表临床重要信息,例如使用格拉斯哥昏迷量表的精神状态、尿量、机械通气、活动和呼吸频率测量。
文章小结
这项回顾性预后研究旨在开发、验证和解释用于 HF 危重患者院内结局的多模态 DL 预测模型。该模型是根据第一个 ICU 入院日的入院记录和记录构建的。同时,我们比较了多模态和单峰模型之间的差异,并探讨了入院记录在 HF 临床实践中的个体重要性。今天为大家分享的文章纯公共数据挖掘+统计分析,就发到了一区!如果你也想在临床方向发高分文章,不妨试试这个省钱省事又省力的思路吧!