IF-10.5/Q1 | SHAP可解释深度神经网络-脓毒症患者革兰阴性杆菌耐药风险预测模型

文摘   2024-11-08 20:55   美国  

医学科研新动向

Interpretable machine learning model for new-onset atrial fibrillation prediction in critically ill patients: a multi-center study

JAMA Netw Open

<2024年11月07日>

脓毒症是一种由感染引发的全身性炎症反应综合征,病情进展迅速,常伴有高死亡率。针对脓毒症的抗生素治疗决策至关重要,特别是对多重耐药革兰阴性杆菌(GNB)感染的识别。尽管经验性广谱抗生素治疗可为危重患者争取宝贵的时间,抗生素的过度使用却可能导致耐药菌株的增加,加剧公共卫生危机。为此,精准的耐药风险评估模型应运而生,旨在辅助临床医生区分需使用广谱抗生素的高危患者和适合窄谱抗生素的低危患者。然而,当前多数预测模型基于单中心数据开发,缺乏在多中心环境下的验证与推广,模型在不同医院之间的适用性不足模型泛化能力的不足可能受到患者特征(如共病情况)和局部GNB耐药率差异的影响。鉴于此,本研究提出假设,认为患者的异质性和不同医院的耐药流行情况可能会影响模型预测性能。研究旨在利用深度学习模型,评估耐药性风险预测模型在社区和院内脓毒症患者中的表现,并进一步探讨模型在不同医院和患者亚群中的预测能力差异,从而为未来更具适应性的模型开发提供依据。

研究设计

本研究为回顾性队列研究,严格遵循STROBE(观察性研究的报告规范)准则进行设计和报告,具体包括:

1. 研究对象与数据来源

  • 研究地点:来自密苏里州和伊利诺伊州的10家医院,包括不同规模和患者群体的医院。

  • 入选标准:符合美国疾病控制与预防中心(CDC)脓毒症事件标准的成人患者,包括社区和院内的脓毒症。

  • 数据采集时间:2016年1月至2021年10月。

  • 数据类型:电子健康记录数据,包含患者人口统计信息、既往病史、生命体征、实验室检查、医疗干预和抗生素使用记录等。

2. 耐药性分类

  • 根据药敏测试结果,将GNB耐药性分为三类:对头孢曲松敏感(SS)、对头孢曲松耐药但对头孢吡肟敏感(RS)和对头孢曲松及头孢吡肟均耐药(RR)。未检测到GNB或检测出其他病原体的标本定义为SS,以便模拟临床治疗中的抗生素选择决策。

3. 模型开发与评估

采用深度学习模型和梯度提升模型来预测患者的GNB耐药性风险。

  • 深度神经网络(DNN)模型:以处理复杂和多样化的医疗数据。模型整合了患者的静态数据(如人口统计学特征和共病情况)和动态数据(如生命体征和实验室结果)。静态数据通过全连接层处理,而动态数据使用循环神经网络(RNN)捕捉时间序列的变化。模型中还采用了转换器(Transformer)结构处理ICD编码,以保持疾病代码的层级结构。

  • 训练数据分割:80%用于训练和模型选择(其中10%用于验证),20%作为独立测试集,以确保模型在不同患者上的泛化能力。

  • 评价指标:使用受试者工作特征曲线下面积(AUROC)和精确召回曲线下面积(AUPRC)来评估模型性能,尤其关注AUPRC以衡量模型在耐药菌的识别效果。

4. 亚群分析

  • 按患者特征(如年长、合并症、既往抗生素暴露)进行亚群分层分析,以考察不同医院和患者群体的模型适应性差异。

  • 模型特征选择采用Shapley值解释,分析各特征对耐药风险预测的重要性。

5. 统计分析

  • 连续变量以中位数(IQR)表示,分类变量以频数和百分比表示。使用双侧P值<0.05判定统计显著性差异。

核心结果

1. 人群体特征概述(Table 1
  • 数据集中包含39,893名患者,其中男性21,241人(53.2%)。患者的中位年龄为65岁(IQR 54-74)。医院1、医院2和医院3分别贡献了16,902人(42.4%)、4,132人(10.4%)和4,528人(11.4%)。
  • 不同医院的患者共病情况分布存在显著差异。例如,医院1主要收治了较多血液恶性肿瘤患者(11.6%)和移植患者(8.2%),而COPD和终末期肾病患者更多集中在医院3(分别为30.7%和18.8%)。
  • 病情严重程度指标显示,11.5%的患者发生了脓毒性休克,29.1%的患者接受了气管插管。
  • 标本类型以尿液(39.0%)、呼吸道(25.2%)和血液(13.7%)为主。抗菌耐药性分布显示,GNB感染的患者占19.6%,其中SS、RS和RR菌株分别占88.6%、7.1%和4.3%。

2. 社区与院内脓毒症(Table 2)
  • 43,207例社区脓毒症事件中,SS菌株感染率为94.3%,RS和RR菌株分别占3.9%和1.8%。这表明在社区脓毒症中,GNB的耐药性较低。
  • 终末期肾病(ESKD)和COPD等共病显著增加RS和RR的感染风险。例如,ESKD患者中RS和RR的感染率分别为17.3%和18.1%,COPD患者则分别为28.1%和31.2%。
  • 在42,031例院内脓毒症事件中,SS、RS和RR菌株感染率分别为90.4%、5.7%和3.9%。院内感染的耐药率较高,尤其是呼吸道感染部位耐药菌检出率明显高于社区脓毒症。
  • 院内感染主要以呼吸道标本为主,而尿液标本的RS和RR菌株的检出率相对较低。这表明不同感染途径与耐药性分布存在显著关联。

3. 关键预测特征分析(Fig 1)
  • 梯度提升模型的特征重要性分析显示,在社区脓毒症中,最重要的耐药预测因子包括Pseudomonas aeruginosa感染史、抗生素使用史、既往肺炎史和年龄。
  • 具体来说,既往抗生素暴露显著增加了RS和RR菌株感染的风险;Pseudomonas aeruginosa感染史与较高的RS感染风险关联显著。
  • 在院内脓毒症中,住院时间、年长和Pseudomonas aeruginosa感染史成为关键预测因子。住院时间越长,RR菌株感染风险越高。
  • 抗生素使用历史和多重耐药感染史在院内患者的RR感染风险预测中具有显著作用。这表明在院内情况下,长期住院和广泛抗生素使用对耐药性增加的影响更为显著。

4. 模型表现的医院间差异(Fig 2)
  • 深度学习模型的AUPRC在不同医院之间差异显著,耐药率较高的医院模型表现优于耐药率较低的医院。例如,医院1(学术中心,耐药率高)和医院3(社区医院,耐药率相对较低)的AUPRC差异显著。
  • 不同医院的患者亚群也展现出显著的模型表现差异。对于有抗生素耐药菌感染史的患者,模型表现尤其优秀;无耐药感染史患者的AUPRC相对较低。
  • 对于血液恶性肿瘤患者,模型在不同医院的AUPRC差异大。例如,在社区脓毒症中,医院1的RS和RR耐药率为3.6%,而医院3则为10.3%,表现出模型在不同医院和患者亚群中的适应性差异。
  • 有既往抗生素暴露史的患者在模型中AUPRC最高,达到0.36,反映出该亚群具有显著的耐药预测需求。

5. 耐药率与模型表现的相关性分析(Fig 3)
  • 耐药率与模型的AUPRC表现呈显著正相关(R=0.79, P<0.001),表明模型性能受到RS和RR菌株感染率的显著影响。
  • 在样本量较少的亚群中,例如无既往感染史的患者,AUPRC较低且与样本量无显著相关性。这进一步支持了耐药率在模型表现中的主导作用,而非样本量或患者特征的决定性影响。


1. 患者群体特征

  • 数据集中包含39,893名患者,主要来自不同类型的医疗机构,各医院的患者特征和共病情况差异显著。

  • 学术中心医院的患者往往具有更多的复杂共病(如血液恶性肿瘤和器官移植),而社区医院则有较多的COPD和终末期肾病患者。

2. 社区和医院脓毒症特征

  • 社区脓毒症事件占总病例的50.7%,医院脓毒症则占48.3%。医院脓毒症患者的多重耐药菌株比例更高,特别是在呼吸道感染中,耐药率显著升高。

  • 与社区脓毒症相比,医院脓毒症更常见RS和RR耐药菌株感染。

3. 关键预测特征分析

  • 在社区脓毒症中,Pseudomonas aeruginosa感染史、抗生素使用史、既往肺炎史和年龄是RS和RR感染的显著预测因子。

  • 在医院脓毒症中,住院时间、既往抗生素暴露史以及Pseudomonas aeruginosa感染史成为预测耐药的关键因素。

4. 模型性能的医院间差异

  • 深度学习模型的AUPRC在不同医院之间表现差异显著,耐药率较高的医院模型表现优于耐药率较低的医院。

  • 特定亚群的模型性能表现出差异,例如血液恶性肿瘤患者在不同医院中的耐药率分布不同,对模型性能产生影响。

5. 耐药率与模型性能的相关性

  • 耐药率与模型AUPRC呈显著正相关(R=0.79, P<0.001),表明当地的耐药菌流行情况对模型性能有显著影响。

  • 亚群样本量对AUPRC无显著相关性,进一步支持耐药率是决定模型表现的关键因素。

-END-

文字丨本人点滴积累,如有补充,下方留言即可

(左下角点击阅读原文”即可获取全文

医学科研新动向
每日分享-相关领域包括:MIMIC、NHANES、SEER、GEO、TCGA、CHARLS等公共数据库最新研究成果解读。深入剖析机器学习、生信分析与临床流行病学研究方法。
 最新文章