TyG指数依旧给力!中国学者结合MIMIC连发两篇二区 | MIMIC-IV数据库周报(11.16~11.22)

文摘   健康   2024-12-13 17:48   浙江  

重症医学数据库(MIMIC)是由计算生理学实验室开发的公开数据集,其中包括与数千个重症监护病房入院相关的去识别化健康数据,致力于推动临床信息学、流行病学和机器学习的研究。

MIMIC数据库于2003年在美国国立卫生研究院的资助下,由美国麻省理工学院计算生理学实验室、美国哈佛医学院贝斯以色列女执事医疗中心(Beth Israel Deaconess Medical Center,BIDMC)和飞利浦医疗公司共同建立。

MIMIC 数据库目前已经产生了MIMIC Ⅱ、Ⅲ、Ⅳ三个版本,包含了BIDMC所有内外科ICU患者的数据。MIMIC Ⅲ数据库收集了BIDMC 2001年6月至2012年10月ICU收治的53423例成年患者数据和2001年至2008年收治的7870例新生儿重症患者数据。MIMIC Ⅳ数据库在MIMIC Ⅲ的基础上做了一些改进,包括数据更新和部分表格重构,收集了2008至2019年BIDMC收治的超过19万名患者45万次住院记录的临床数据。

数据库收集了三类数据:临床数据,从ICU信息系统和医院档案中汇总;高分辨率生理数据,从床边监护仪获得;死亡数据,来自社会保障局死亡档案。



2024.11.16-2024.11.22PubMed数据库“标题/摘要:MIMIC-IV OR MIMIC-III”搜索发现,共发表12MIMIC-IV论文。其中1篇一区,4篇二区

国学者文章

1.外国学者文章介绍(一)


文章题目:使用生成式人工智能生成以患者为中心的出院指令的质量和安全性

研究背景以患者为中心的出院指导可以改善依从性和结果。
数据来源:MIMIC-IV数据集
方法:使用GPT-3.5生成以患者为中心的出院指示,我们评估了反应的安全性、准确性和语言简化性。
结果:在对MIMIC-IV的100份出院摘要进行测试时,18%的人发现了人工智能工具可能造成的有害安全问题,其中6%的人出现了幻觉,3%的人出现了新药。

结论:人工智能工具可以生成以患者为中心的出院指令,但需要仔细实施以避免伤害。




2.外国学者文章介绍(二)


文章题目:DySurv:基于条件变分推理的生存分析动态深度学习模型

研究背景纵向电子健康记录的机器学习应用通常预测固定时间点的事件风险,而生存分析通过估计时间到事件的分布来实现动态风险预测。在这里,我们提出了一种新的基于条件变分自编码器的方法,DySurv,它结合了来自电子健康记录的静态和纵向测量来动态估计个人死亡风险。
数据来源:eICU合作研究(eICU)和重症监护医学信息市场数据库(MIMIC-IV)
方法:DySurv直接估计累积风险发生率函数,而不对事件发生时间的潜在随机过程进行任何参数假设。我们对DySurv在医疗保健领域的6个时间到事件基准数据集,以及从eICU合作研究(eICU)和重症监护医学信息市场数据库(MIMIC-IV)中提取的2个现实世界重症监护病房(ICU)电子健康记录(EHR)数据集进行了评估。
结果:DySurv在跨一致性和其他指标的事件时间分析方面优于其他现有的统计和深度学习方法。在eICU病例中,时间相关一致性达60%以上。与使用中的ICU评分,如急性生理和慢性健康评估(APACHE)和顺序器官衰竭评估(SOFA)评分相比,它的准确性提高12%以上,敏感性提高22%。DySurv的预测能力是一致的,生存估计在不同的数据集之间仍然是分开的。

结论:我们的跨学科框架成功地结合了深度学习、生存分析和重症监护,创造了一种从纵向健康记录中预测事件时间的新方法。我们在来自各种医疗保健数据集的几个测试集上测试了我们的方法,并将其与现有的正在使用的临床风险评分基准进行比较。




3.外国学者文章介绍(三)


文章题目:使用大型语言模型在急诊医学中生成综合医疗保健对话

研究背景自然语言处理(NLP)在放射学等领域显示出将非结构化数据转换为结构化数据的前景,但获取合适的数据集带来了一些挑战,包括隐私问题。具体来说,我们的目标是利用大型语言模型(llm)从救护人员和患者之间的对话中提取医疗信息,以填充紧急协议表单。然而,我们目前缺乏具有已知内容的对话,这些对话可以作为评估的金标准。
数据来源:MIMIC-IV数据库数据。
方法:我们使用量化LLM“Zephyr-7b-beta”设计了一个管道,用于初始对话生成,然后使用OpenAI的GPT-4 Turbo进行优化和翻译。MIMIC-IV数据库提供了相关的医疗数据。评估包括通过检索增强生成(RAG)进行准确性评估和使用多语言模型进行情感分析。
结果:最初的结果显示,“Zephyr-7b-beta”的准确率高达94%,在使用GPT-4 Turbo进行改进后,准确率略微下降至87%。情绪分析表明,在细化后,更积极的情绪发生了质的转变。

结论:这些发现突出了使用llm生成合成医学对话的潜力和挑战,为未来医疗保健领域的NLP系统开发提供了信息。




中国学者文章

4.中国学者文章介绍(四)


文章题目:重症患者甘油三酯-葡萄糖指数和心率与28天全因死亡率的相关性:MIMIC-IV数据库分析
研究背景研究已经确定了甘油三酯-葡萄糖指数(TyG-i)与重症患者死亡风险之间的联系。然而,TyG-i是否通过影响心率(HR)影响死亡率仍不确定。
数据来源:本研究从重症监护医学信息市场(MIMIC-IV)数据库中招募了3,509名重症患者,这些患者在进入ICU时具有甘油三酯、葡萄糖和HR数据。
方法:采用Cox回归模型估计TyG-i和HR对28天全因死亡率(ACM)和28天住院死亡率(IHM)的影响。此外,采用Kaplan-Meier (K-M)生存分析来探讨不同患者组之间的结果差异。通过线性回归分析探讨TyG-i与HR、顺序器官衰竭评估(SOFA)评分和简化急性生理评分(SAPS) II的关系。亚组分析探讨了患者特征之间潜在的相互作用,而敏感性分析衡量了研究结果的稳健性。此外,还进行了中介分析,以评估HR升高是否作为TyG-i与28天ACM和28天IHM之间的中介因素。
结果: 随访28天,全因死亡586例(16.7%),住院期间死亡439例(12.5%)。Cox结果显示,与TyG-i和HR降低的个体相比,TyG-i升高和HR升高的个体具有最高的28天ACM(风险比1.70,p值低于0.001)和28天IHM(风险比1.72,p值低于0.001)。K-M曲线显示低TyG-i和低HR个体28天ACM和28天IHM发生率最低。线性分析结果表明,TyG-i与HR (beta = 3.05, p值低于0.001)独立相关,与SOFA评分(beta = 0.39, p值低于0.001)和SAPS II (beta = 1.79, p值低于0.001)独立相关。亚组分析显示,在没有高血压的参与者中,TyG-i和HR升高的相互作用与28天死亡风险升高密切相关(相互作用p值小于0.05)。此外,HR介导了29.5%的TyG-i与28天ACM之间的连接(p值= 0.002),以及20.4%的TyG-i与28天IHM之间的连接(p值= 0.002)。

结论:对于重症患者,TyG-i与HR显著相关,两者水平升高与28天ACM和28天IHM风险增加密切相关,特别是在无高血压患者中。此外,HR升高介导了TyG-i与28天死亡率之间的联系。



5.中国学者文章介绍(五)


文章题目:MIMIC-IV数据库中甘油三酯-葡萄糖指数对哮喘患者急性呼吸衰竭发生的预测价值。
研究目的:本研究旨在探讨甘油三酯-葡萄糖(TyG)指数与哮喘患者急性呼吸衰竭发生的关系。
数据来源:这项回顾性观察队列研究使用了重症监护医学信息市场IV (MIMIC-IV 2.2)数据库的数据。
方法:主要结局是哮喘患者急性呼吸衰竭的发展。首先运用Boruta算法和SHapley可加展开式,初步确定TyG指数的特征重要度,并构建风险预测模型,评价其预测能力。其次,采用Logistic回归比例风险模型评估TyG指数与哮喘患者急性呼吸衰竭的相关性。最后,进行亚组分析进行敏感性分析,以探讨结果的稳健性。

结果:共有751名哮喘患者被纳入研究。将TyG指数作为一个连续变量,logistic回归分析显示,在未经调整的模型1中,优势比(OR)为2.381 (95% CI: 1.857-3.052;P < 0.001),在模型II中,OR为2.456 (95% CI: 1.809-3.335;P < 0.001),在多变量调整模型中,OR为1.444 (95% CI: 1.029-2.028;P = 0.034)。观察到TyG指数与哮喘患者急性呼吸衰竭风险之间存在一致的关联。TyG指数与各亚组间无显著交互作用(P > 0.05)。此外,机器学习结果表明,TyG指数升高是哮喘患者呼吸衰竭的重要预测特征。基线风险模型的AUC为0.743 (95% CI: 0.679-0.808;P < 0.05),而基线风险模型与TyG指数相结合的AUC为0.757 (95% CI: 0.694-0.821;P < 0.05)。

结论:TyG指数可以作为哮喘患者急性呼吸衰竭的预测指标,尽管这些发现需要更大规模的前瞻性研究来证实。



更多文章如下:

外国学者:无

中国学者:


一个专门做公共数据库的公众号,关注我们


公共数据库与孟德尔随机化
我们专门介绍公共数据库与孟德尔随机化,每周文献周报,呈现精品文献阅读
 最新文章