历史最高!一周之内,MIMIC数据库发了9篇二区以上!| MIMIC-IV数据库周报(10.26~11.01)
文摘
健康
2024-12-04 11:49
浙江
重症医学数据库(MIMIC)是由计算生理学实验室开发的公开数据集,其中包括与数千个重症监护病房入院相关的去识别化健康数据,致力于推动临床信息学、流行病学和机器学习的研究。MIMIC数据库于2003年在美国国立卫生研究院的资助下,由美国麻省理工学院计算生理学实验室、美国哈佛医学院贝斯以色列女执事医疗中心(Beth Israel Deaconess Medical Center,BIDMC)和飞利浦医疗公司共同建立。MIMIC 数据库目前已经产生了MIMIC Ⅱ、Ⅲ、Ⅳ三个版本,包含了BIDMC所有内外科ICU患者的数据。MIMIC Ⅲ数据库收集了BIDMC 2001年6月至2012年10月ICU收治的53423例成年患者数据和2001年至2008年收治的7870例新生儿重症患者数据。MIMIC Ⅳ数据库在MIMIC Ⅲ的基础上做了一些改进,包括数据更新和部分表格重构,收集了2008至2019年BIDMC收治的超过19万名患者、45万次住院记录的临床数据。数据库收集了三类数据:临床数据,从ICU信息系统和医院档案中汇总;高分辨率生理数据,从床边监护仪获得;死亡数据,来自社会保障局死亡档案。2024.10.26-2024.11.01PubMed数据库“标题/摘要:MIMIC-IV OR MIMIC-III”搜索发现,共发表12篇MIMIC-IV论文。其中2篇一区,7篇二区。
外国学者文章
文章题目:电子健康记录的问题回答:数据集和模型的范围审查。研究背景:患者相关数据的问答(QA)系统可以帮助临床医生和患者。例如,它们可以帮助临床医生做出决策,并使患者更好地了解自己的病史。大量的患者数据存储在电子健康记录(EHR)中,使得电子健康记录质量保证成为一个重要的研究领域。由于数据格式和模式的差异,这与使用医学网站或科学论文检索答案的其他医学QA任务有很大不同,因此研究电子病历QA至关重要。研究目的:本研究旨在对现有的电子病历质量保证工作进行方法学回顾。本研究的目的是识别现有的EHR QA数据集并对其进行分析,研究该任务中使用的最先进的方法,比较这些最先进模型使用的不同评估指标,最后引出EHR QA中的各种挑战和持续存在的问题。方法:检索Google Scholar、ACL Anthology、ACM digital Library和PubMed 4个数字资源,检索2005年1月1日至2023年9月30日期间的文章,收集电子病历质量管理相关文献。我们的系统筛选过程遵循PRISMA(系统评价和荟萃分析的首选报告项目)指南。我们共纳入4111篇论文,根据纳入标准筛选后,获得47篇论文供我们进一步研究。选定的研究然后根据其范围分为2个互不排斥的类别:“电子病历质量保证数据集”和“电子病历质量保证模型”。结果:通过系统筛选,获得了47篇电子病历QA论文进行最终评审。在47篇论文中,53% (n=25)是关于EHR QA数据集的,79% (n=37)是关于EHR QA模型的。据观察,电子病历的QA是相对较新的和未开发的。大部分作品都是最近的。此外,据观察,emrQA是迄今为止最受欢迎的EHR QA数据集,无论是在引用方面还是在其他论文中的使用方面。我们根据其模式对EHR QA数据集进行了分类,我们推断重症医疗信息集市(MIMIC-III)和国家自然语言处理临床挑战数据集(即n2c2数据集)是最流行的EHR数据库和EHR QA中使用的语料库。此外,我们确定了EHR QA中使用的不同模型以及用于这些模型的评估指标。
结论:EHR QA研究面临多重挑战,如临床注释的可用性有限,EHR QA的概念规范化,以及生成现实的EHR QA数据集所面临的挑战。研究中仍有许多空白,需要进一步研究。本研究将有助于未来研究者关注电子病历质量保证中可能有未来研究方向的领域。
文章题目:危重患者新发房颤预测的可解释机器学习模型:一项多中心研究。研究背景:新发心房颤动(NOAF)是重症监护患者最常见的心律失常,与不良预后和疾病负担相关。及早发现高危人群至关重要。研究目的:本研究旨在使用机器学习(ML)创建和验证危重患者NOAF预测模型。数据来源:数据来自重症监护医疗信息市场(MIMIC)的两个非重叠数据集,其中MIMIC- iv用于训练,MIMIC- iii的子集用于外部验证。方法:采用LASSO回归进行特征选择。采用8种ML算法构建预测模型。基于识别、校准和临床应用评估模型性能。SHapley加性解释(SHAP)方法用于模型特征的可视化和个案预测。结果:在16528例MIMIC-IV患者中,1520例(9.2%)在icu入院后发生房颤。建立了23个变量的模型,其中XGBoost效果最好,验证的AUC为0.891(0.873-0.888),外部验证的AUC为0.769(0.756-0.782)。主要预测因素包括年龄、机械通气、尿量、败血症、血尿素氮、经皮动脉血氧饱和度、持续肾脏替代治疗和体重。风险概率大于0.6被定义为高风险。一个友好的用户界面已经开发出来供临床医生使用。结论:我们建立了一个ML模型来预测危重患者无心脏手术的NOAF风险,并验证了其作为临床可靠工具的潜力。SHAP提高了模型的可解释性,使临床医生能够更好地了解NOAF的原因,帮助临床医生提前预防并改善患者的预后。
文章题目:从电子健康记录中稳健提取肺炎相关临床状态。研究背景:电子健康记录(EHR)的挖掘有望自动识别综合疾病表型。然而,这一承诺的实现受到可推广的基础真值信息的不可获得性、数据的不完整性和异质性以及缺乏对多队列的泛化的阻碍。方法:我们在此提出了一种数据驱动的方法来识别临床状态,我们对SCRIPT研究招募的585名疑似肺炎的重症监护患者实施了临床状态,我们将其与MIMIC-IV数据集中的9918名肺炎患者进行了比较和整合。我们从他们结构化的电子病历中提取和整理了一组主要的临床特征(SCRIPT和MIMIC-IV分别为53和59个特征),包括疾病严重程度评分、生命体征等,完整性不同。我们将不规则时间序列汇总为每日频率,分别得到SCRIPT和MIMIC的12,495和94,684对患者日。我们定义了一个“常识”基础真理,然后在半监督管道中使用它来优化数据预处理的选择,并将特征空间减少到四个主成分。结果:我们描述并验证了一种基于集成的聚类方法,该方法使我们能够稳健地识别五种临床状态,并使用高斯混合模型来量化聚类分配中的不确定性。我们发现三种状态与疾病结果(死亡与康复)密切相关,而另外两种状态反映了疾病的病因学,从而证明了所确定状态的临床相关性。
结论:与标准方法相比,结果相关的临床状态显著增加了对死亡率的歧视。
文章题目:基于深度神经网络的重症监护病房急性心力衰竭患者死亡事件预测。研究背景:重症监护病房(ICU)急性心力衰竭(Acute heart failure, AHF)具有危重、进展迅速、病情复杂多变的特点,其病理生理过程涉及多器官、多系统的相互作用。这使得全面准确地预测院内死亡事件变得困难。传统的基于统计学和机器学习的分析方法存在模型性能不足、先验依赖导致准确率不高、难以充分考虑多个风险因素之间的复杂关系等问题。因此,将深度神经网络(deep neural network, DNN)技术应用于具体场景,预测重症监护下AHF患者的死亡事件,已成为研究前沿。数据来源:本研究以MIMIC-IV重症监护数据库为主要数据源。方法:采用合成少数过采样技术(SMOTE)对数据集进行平衡。采用基于电子病历数据挖掘的深度神经网络模型-反向传播神经网络(BPNN)和循环神经网络(RNN)对重症监护下AHF患者的院内死亡事件判断任务进行了研究。此外,还构建了多个单机学习模型和集成学习模型进行对比实验。此外,我们通过修改深度神经网络模型的分类阈值来实现各种最优性能组合,以满足ICU中不同的现实需求。最后,我们利用SHapley加性解释(SHAP)建立了一个可解释的深度模型,从全局和局部解释的角度揭示了每位患者最具影响力的病历特征。结果:在该场景下的模型性能方面,深度神经网络模型优于单一机器学习模型和集成学习模型,准确率、精密度、召回率、F1值和ROC曲线下面积最高,分别达到0.949、0.925、0.983、0.953和0.987。SHAP值分析显示,ICU评分(APSIII、OASIS、SOFA)与院内死亡事件发生显著相关。结论:我们的研究强调了基于dnn的死亡事件分类器为预测和评估ICU AHF患者的预后提供了一种新的智能方法。此外,ICU评分是最具预测性的特征,这意味着在模型的决策过程中,ICU评分可以提供最关键的信息,对急性心力衰竭患者住院死亡率的正贡献或负贡献最大。
文章题目:危重心房颤动患者住院死亡率的机器学习预测模型。研究背景:房颤(AF)在重症监护病房(ICU)患者中很常见,并显著提高住院死亡率。现有评分系统或模型对ICU房颤患者的预测能力有限。我们的研究开发并验证了机器学习模型来预测ICU房颤患者的住院死亡风险。数据来源:对重症监护医学信息市场(MIMIC)-IV数据集和eICU合作研究数据库(eICU- crd)进行分析。方法:在比较的十个分类器中,适应性增强(AdaBoost)在预测房颤患者的全因死亡率方面表现更好。开发并验证了具有15个特征的紧凑模型。结果:全变量模型和紧凑型模型均表现出优异的性能,训练集中的受试者工作特征曲线(auc)下面积为1(95%置信区间[CI]: 1.0-1.0)。在MIMIC-IV检验集中,所有变量模型和紧凑模型的auc分别为0.978 (95% CI: 0.973 ~ 0.982)和0.977 (95% CI: 0.972 ~ 0.982)。在外部验证集中,所有变量模型和紧凑模型的auc分别为0.825 (95% CI: 0.815-0.834)和0.807 (95% CI: 0.796-0.817)。结论:基于adaboost的预测模型经过了内部和外部验证,突出了其对房颤ICU患者住院死亡风险评估的较强预测能力。更多文章如下:
外国学者:
中国学者: