Med-MIMIC,持续分享MIMIC临床生信文献与思路解读,捕捉当下热点思路,感兴趣的老师可以点点关注~需要定制化分析的老师欢迎扫码联系~
文章标题:M3T-LM: A multi-modal multi-task learning model for jointly predicting patient length of stay and mortality
中文标题:M3T-LM:一种用于联合预测患者住院时间和死亡率的多模态多任务学习模型
发表期刊:Comput Biol Med .
发表时间:2024年10月
影响因子:7.0/Q1
确保准确预测住院时间 (LoS) 和死亡率对于提高医院服务效率至关重要,尤其是在考虑到有限的医疗保健资源带来的限制的情况下。对来自不同来源的异质性临床记录数据进行综合分析,可以改善 LoS 的预后和诊断水平以及死亡率。目前,大多数现有研究只关注单一数据模态或倾向于单一任务学习,即分别训练 LoS 和死亡率任务。这限制了可用多模态数据的利用,并阻止了可能捕获不同任务之间相关性的特征表示的共享,最终会阻碍模型的性能。为了应对这一挑战,本研究提出了一种新的多模态多任务学习模型,称为 M3T-LM,以整合临床记录以同时预测住院患者的 LoS 和死亡率。
M3T-LM
M3T-LM 框架通过构建针对每种模态量身定制的子模型来整合多种数据模态。具体来说,一种新型的注意力嵌入一维 (1D) 卷积神经网络 (CNN) 旨在处理数值数据。对于临床笔记,它们被转换为序列数据,然后利用两个长短期记忆 (LSTM) 网络对文本序列数据进行建模。二维 (2D) CNN 架构,称为 CRXMDL,旨在从胸部 X 射线 (CXR) 图像中提取高级特征。随后,集成多个子模型来制定 M3T-LM,以捕获患者 LoS 和模态预测任务之间的相关性。所提出的方法的效率在 MIMIC-IV 数据集上得到了验证。
数据提取
结果分析
1. 数据集描述和预处理
为了有效地预测住院患者的 LoS 和死亡率,我们在本研究中使用 MIMIC-IV v1.0 数据集和 MIMIC-CXR-JPG v2.0.0 数据集。
2. 实验设置和性能指标
实验使用 Python 3.6 深度学习框架进行,其中常用的库包括 Keras、Scikit-learn、TensorFlow 和 Matplotlib 在图形处理单元 (GPU) 的帮助下被利用。用于操作 Python DL 框架以实现建议的 M3T-LM 的硬件环境包含 AMD EPYC 7502P 32 核处理器、32 GB 内存和 RTX A6000 GPU。
3. 死亡率预测的 ROC 曲线
在这项研究中,LoS 定义为以天为单位测量的出院和入院之间的时间。死亡率由表 ADMISSIONS 中的 hospital_expired_flag 字段描述,其中 1 表示死亡,0 表示医院患者的生存率。图 3 描绘了 LoS 和死亡率的分布。从图 3 中可以直观地看到,大多数 LoS 都在 20 天以下,并且死亡率分布中存在阶级不平衡问题。生存类别(0 类)包含大多数样本,而死亡率类别(1 类)仅包含少量样本。分布极不平衡。
4. 测试混淆了不同方法的矩阵
利用合成少数过采样技术(SMOTE)来增强少数类样本,以确保训练集中正负样本的平衡分布。使用 SMOTE,生成新的合成数据,使死亡率类别中的样本数量非常接近生存类别中的样本数量。
文章小结
我们的方法在处理混合回归和分类任务方面优于最先进的 (SOTA) 方法。今天为大家分享的文章纯公共数据挖掘+统计分析,就发到了一区!如果你也想在临床方向发高分文章,不妨试试这个省钱省事又省力的思路吧!