IF-5.8 | 基于MIMIC数据库的TabNet机器学习模型预测ICU心脏骤停

文摘 2024-09-26 19:18 美国

✦

医学科研新动向

✦

Early Prediction of Cardiac Arrest in the Intensive Care Unit Using Explainable Machine Learning: Retrospective Study

J. Med. Internet Res.

< 2024年09月17日>

研究背景

心脏骤停（CA）是重症监护病房中导致患者死亡的主要原因之一。尽管已有许多基于机器学习的预测模型能够较为准确地预测CA，但由于缺乏对不同ICU亚群患者的异质性研究，这些模型在实际临床中的应用仍然存在困难。传统的评分系统如SAPS-II、SOFA等虽然被广泛用于预测心脏骤停，但其敏感性较低，误报率较高。本文旨在提出一种具有临床解释性的集成学习模型，能够在不同ICU环境下提前24小时预测CA事件，并提供可解释的预测结果。

研究设计

1. 数据来源：

使用了MIMIC-IV和eICU-CRD两个数据库。MIMIC-IV包括46,520名ICU患者的数据（2008-2019年），eICU-CRD包含超过200,000次ICU住院记录（2014-2015年）。
两个数据库中的数据涵盖了生命体征、实验室检查、临床事件、药物使用和生存统计等信息。

2. 数据预处理：

对生命体征（如心率、血压、呼吸率、血氧饱和度等）进行采样，将12小时的时间窗口分为12个1小时的区间，每个区间取平均值。
使用LOCF（最后观察值向前填充）和LOCB（最后观察值向后填充）方法对缺失值进行插补。
计算EWS（早期预警评分），每小时更新一次生命体征的评分，并根据医学专家确定的正常范围去除异常值。

3. 特征提取：

生命体征特征：提取12小时窗口内的标准化生命体征数据。
多分辨率统计特征：使用4小时、6小时和12小时滑动窗口生成统计特征，包括均值、最小值、最大值和标准差，捕捉不同时间段内的模式变化。
基尼指数特征：计算每个生命体征的基尼指数，衡量其在输入时间窗口内的变化不平衡度。

4. 模型开发：

TabNet分类器：该模型适用于处理表格数据，利用深度学习捕捉数据间的复杂关系。
成本敏感学习：为应对类别不平衡问题，使用成本敏感学习方法，给予心脏骤停类别更高的惩罚权重（100:1）。
特征筛选：采用递归特征消除（RFE）和Boruta方法选择最相关的特征，并结合多数投票机制筛选出86个（MIMIC-IV）和94个（eICU-CRD）特征。

4. 模型评价指标：

使用10倍交叉验证和跨数据集验证评估模型性能，主要指标包括：

AUROC（受试者工作特征曲线下面积）：衡量模型整体分类能力。
事件召回率（Event Recall, ER）：预测出的真实事件占总事件的比例。
误报率（False Alarm Rate, FAR）：无事件情况下的报警率。
敏感性（Sensitivity）：模型检测出心脏骤停的能力。

6. 模型解释性：

TabNet决策掩码：分析每个特征对模型预测的贡献，生成局部和全局特征重要性信息。

核心结果

1. 基线特征:

心脏骤停组在多个生命体征上与非心脏骤停组存在显著差异（Table 1）。

心率：心脏骤停组的平均心率显著高于非心脏骤停组（p<0.001）。在MIMIC-IV数据集中，心脏骤停组的平均心率为88.79次/分钟，非心脏骤停组为87.10次/分钟。
血氧饱和度（SpO2）：心脏骤停组的血氧饱和度略高于非心脏骤停组，差异具有统计学意义（p<0.001）。
呼吸率：两组的呼吸率差异显著（p<0.001），心脏骤停组为21.26次/分钟，非心脏骤停组为20.99次/分钟。

2. TabNet模型与基线模型的性能对比

在MIMIC-IV数据集中，TabNet模型的AUROC和敏感性显著高于传统方法：

AUROC：TabNet模型的AUROC为0.80，而NEWS（National Early Warning Score）模型为0.39，SOFA（Sequential Organ Failure Assessment）为0.59。
敏感性：TabNet模型的敏感性为0.80，NEWS为0.39，SOFA为0.59。
误报率：TabNet模型的误报率为0.77，SOFA为0.90。

在eICU-CRD数据集中，TabNet的表现同样优于传统模型：

AUROC：TabNet模型达到0.99，敏感性为0.99，误报率为0.36，远高于基线模型。

3. 跨数据集验证结果

跨数据集验证显示了TabNet模型在不同环境下的强大泛化能力：

在MIMIC-IV训练、eICU-CRD测试的情况下，TabNet模型的AUROC为0.99，敏感性为0.99，事件召回率为0.99，误报率为0.45。
反之，eICU-CRD训练、MIMIC-IV测试时，AUROC依然保持在0.99，敏感性为0.99，事件召回率为0.99，误报率为0.50。

4. 特征重要性分析

模型的特征重要性分析揭示了影响心脏骤停预测的关键特征：

生命体征：心率、血氧饱和度和体温是模型中最重要的特征。心率波动越大，基尼指数越高，说明心脏骤停前患者生命体征不稳定。
统计学结果：独立t检验和FDR校正结果显示，心率、SpO2、体温等20个特征在心脏骤停组与非心脏骤停组之间存在显著差异（p<0.001）。

5. 不同ICU类型中的模型性能

在不同ICU类型（普通ICU和心脏ICU）中，TabNet模型表现出较高的一致性：

普通ICU：AUROC为0.80，敏感性为0.80，误报率为0.77。
心脏ICU：AUROC提升至0.89，敏感性为0.89，误报率降低至0.77。

这一结果表明，TabNet模型在不同ICU环境下的预测性能稳定，尤其在心脏ICU中表现尤为出色，模型能够识别出更多的心脏骤停事件并有效减少误报。

小

结

这篇文章提出了一种基于解释性机器学习的模型TabNet，用于预测重症监护病房（ICU）中心脏骤停（CA）的发生。通过对MIMIC-IV和eICU-CRD数据库的患者数据进行分析，本文展示了该模型在不同ICU亚群中的稳定性和泛化能力。以下为该研究的主要发现和结论：

多分辨率特征与基尼指数的创新应用
提取生命体征的多分辨率统计特征和基尼指数，捕捉心脏骤停前的关键变化，显著提升了模型的预测能力。
TabNet模型性能优越
TabNet模型在MIMIC-IV和eICU-CRD数据集中均表现出色，在AUROC、敏感性和误报率等关键指标上显著优于传统模型，如NEWS、SOFA等。
跨数据集验证
TabNet模型在跨数据集验证中表现出极强的泛化能力，无论是在MIMIC-IV训练、eICU-CRD测试，还是相反的情况下，均保持高AUROC和敏感性。
模型解释性增强临床应用价值
通过TabNet的解释性分析，可以清晰了解每个特征对心脏骤停预测的贡献，特别是心率、SpO2和体温等生命体征的变化，对于临床决策具有重要意义。
不同ICU亚群中的表现一致性
模型在普通ICU和心脏ICU中的表现均衡，尤其在心脏ICU中的表现尤为突出，表明该模型适用于多种ICU环境。
临床应用前景
本研究展示了TabNet模型在临床早期预警系统中的应用潜力，能够提供提前24小时的心脏骤停预警，帮助在关键时刻进行及时干预，降低患者死亡率。

-END-

文字丨本人编写，如有补充，请随时告诉我
（点击左下角“阅读原文”即可获取全文）

http://mp.weixin.qq.com/s?__biz=MzkzOTcyMzUyNQ==&mid=2247486000&idx=1&sn=bb06b0be8106fc591f92a8dc3444ebf0

医学科研新动向

每日分享-相关领域包括：MIMIC、NHANES、SEER、GEO、TCGA、CHARLS等公共数据库最新研究成果解读。深入剖析机器学习、生信分析与临床流行病学研究方法。

最新文章

IF-23.5 | 单细胞多组学整合揭示乳腺癌亚型分子调控机制

IF-21.2 | 脑功能连接、蛋白组与影像组数据整合揭示上额回与下颞回间分子网络在脑区功能连接中的调控机制

Nature Genetics | 炎症新靶点-CRISPR筛选揭示TNF mRNA的m6A修饰在巨噬细胞炎症调控中的关键作用

Nature Genetics | 肿瘤新靶点-基因组负担分析揭示肿瘤易感基因及稀有变异新靶点

IF-14.7/Q1 基于多组学整合分析的鸡腹部脂肪沉积及其肥胖与代谢相关遗传调控机制研究

IF-58.7/Q1 儿童与青少年肥胖相关脂质谱特征及其在心血管代谢风险中的潜在干预作用

Q1/14.4 | 深度生成模型预测新化学扰动对转录响应的影响以加速药物发现

Nature Medicine | 基于肥胖亚型划分的心血管代谢疾病精准风险预测：一种BMI-生物标记不一致性分析

2024新版TCGA转录组+临床数据R语言下载和整理

R语言完整代码下载2024新版TCGA数据库 miRNA数据

Nature正刊 | 单细胞多组学染色质重塑研究：BRD4在Cx3cr1+巨噬细胞与纤维母细胞非细胞自主通讯中对心力衰竭的调控

IF-14.7/Q1 血浆蛋白质组学与多基因风险评分结合提高结直肠癌个性化筛查和风险预测

IF-14.7/Q1 整合多组学与深度学习解析食管鳞状细胞癌的分子亚型及其预后关联

IF-14.7/Q1 多组学整合揭示脓毒性休克亚群差异：开发基于蛋白组学的个体化液体管理策略预测模型

IF-27.7/Q1 炎症性肠病中抗肿瘤坏死因子治疗的单细胞纵向图谱：细胞异质性、炎症机制及治疗反应的关键预测

IF-40.8/Q1 基于组学的研究揭示C. parakroppenstedtii分泌新型糖脂促进肉芽肿性小叶乳腺炎的发展

IF-31.7/Q1 赤松（Pinus densiflora）基因组组装及重测序揭示基因组进化与等位基因失衡机制

IF-14.7/Q1 多组学整合揭示脓毒性休克亚群差异：开发基于蛋白组学的个体化液体管理策略预测模型

IF-14.7/Q1 整合多组学与深度学习解析食管鳞状细胞癌的分子亚型及其预后关联

IF-8.5/Q1 MIMIC-IV-应激性高血糖比值与重症心房颤动患者全因死亡率关联的回顾性研

IF-21.2/Q1 基于单细胞RNA测序的人类小胶质细胞异质性分析-跨疾病亚型识别及其功能调控潜力

IF-14.7/Q1 血浆蛋白质组学与多基因风险评分结合提高结直肠癌个性化筛查和风险预测

IF-14.7/Q1 中国2010-2018年高空腹血糖相关心血管疾病负担的区域和年龄差异分析

IF-9.6/Q1 纯生信分析 | 酒精使用障碍对人类大脑基因表达的影响及潜在治疗靶点发现

顶刊级别的科研绘图技巧：配色如何提高科研影响力

IF-6.2/Q1 溴化阻燃剂暴露与慢性肾病及肾功能指标的关联研究：基于NHANES数据库的分析

IF-58.7/Nature Medicine | 基于DNA甲基化特征的肺腺癌脑转移预测模型：从组学数据到临床应用

IF-5.0 非肿瘤生信-凝血相关基因在急性心肌梗死中的诊断模型构建

IF-14.7/Q1 单细胞RNA测序揭示肝脏驻留Th1样细胞在原发性胆汁性胆管炎中的促炎作用及JAK/STAT抑制剂的治疗潜力

IF-21.4/Q1 全球控烟政策的比较：基于网状Meta分析的系统评价

IF-18.9/Q1 | 综合基因组与表型数据的血浆蛋白质组变异解析及其生物学调控因素

MIMIC-IV v3.0 数据库安装详解与步骤

IF-31.7/Q1 | 基因组研究揭示代谢综合征的共同遗传特征及其对多种健康的影响

IF-23.6/Q1 | 基于UK Biobank的蛋白质组分析揭示健康饮食模式可降低慢性疾病风险并延长寿命

R语言下载+处理GEO数据库基因表达数据

IF-12.4/Q1 | 基于自然语言处理（NLP）的ClinicalBigBird模型在麻醉ASA-PS评分分类中的优越性

IF-10.1/Q1 中老年人长期PM1暴露与认知的关系：来自CHARLS和UKB的证据

IF-9.4 | 孟德尔随机化识别心血管相关蛋白-基于UKB和中国Kadoorie生物样本库的证据

IF-5.8 | 基于MIMIC数据库的TabNet机器学习模型预测ICU心脏骤停

Q1/ IF-10.7 武汉大学中南医院队列+MIMIC IV：高血清镁水平增加脓毒症患者死亡风险

MIMIC IV+eICU+协和医院回顾性队列 | 基于预测模型的血压反应指数（BPRI）对脓毒性休克患者住院死亡率的预测分析

Q1/IF-7.7 纯生信分析DUSP6蛋白在脓毒症诱导的急性肺损伤中的作用

纯生信分析47天发Q1区7.7分 | 加权基因共表达网络分析+分子对接研究POU2AF1在肝细胞癌中的作用

生信-预后模型发6.1分 | M2巨噬细胞相关基因预后模型预测胃癌患者

IF-40.8/Q1 | 微生物在健康与疾病中的作用机制及临床转化

IF-23.5/Q1 | 中国高危前列腺癌患者的多组学整合分析揭示代谢脆弱性与潜在诊断标志物

孤独与多种疾病有关？孟德尔随机化+UK biobank五图一表拿下21.4分nature子刊！

Q1/ IF-8.2 生信+环境暴露-多氯联苯（PCBs）相关基因在前列腺癌中的预后模型构建

Q1/IF-12.2 生信+NHANES 48天发表 | 挥发性有机化合物暴露对青少年生长发育的影响

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉