✦
医学科研新动向
✦
Interpretable machine learning model for new-onset atrial fibrillation prediction in critically ill patients: a multi-center study
JAMA Netw Open
<2024年11月07日>
研
究
背
景
研究设计
本研究为回顾性队列研究,严格遵循STROBE(观察性研究的报告规范)准则进行设计和报告,具体包括:
1. 研究对象与数据来源
研究地点:来自密苏里州和伊利诺伊州的10家医院,包括不同规模和患者群体的医院。
入选标准:符合美国疾病控制与预防中心(CDC)脓毒症事件标准的成人患者,包括社区和院内的脓毒症。
数据采集时间:2016年1月至2021年10月。
数据类型:电子健康记录数据,包含患者人口统计信息、既往病史、生命体征、实验室检查、医疗干预和抗生素使用记录等。
2. 耐药性分类
根据药敏测试结果,将GNB耐药性分为三类:对头孢曲松敏感(SS)、对头孢曲松耐药但对头孢吡肟敏感(RS)和对头孢曲松及头孢吡肟均耐药(RR)。未检测到GNB或检测出其他病原体的标本定义为SS,以便模拟临床治疗中的抗生素选择决策。
3. 模型开发与评估
采用深度学习模型和梯度提升模型来预测患者的GNB耐药性风险。
深度神经网络(DNN)模型:以处理复杂和多样化的医疗数据。模型整合了患者的静态数据(如人口统计学特征和共病情况)和动态数据(如生命体征和实验室结果)。静态数据通过全连接层处理,而动态数据使用循环神经网络(RNN)捕捉时间序列的变化。模型中还采用了转换器(Transformer)结构处理ICD编码,以保持疾病代码的层级结构。
训练数据分割:80%用于训练和模型选择(其中10%用于验证),20%作为独立测试集,以确保模型在不同患者上的泛化能力。
评价指标:使用受试者工作特征曲线下面积(AUROC)和精确召回曲线下面积(AUPRC)来评估模型性能,尤其关注AUPRC以衡量模型在耐药菌的识别效果。
4. 亚群分析
按患者特征(如年长、合并症、既往抗生素暴露)进行亚群分层分析,以考察不同医院和患者群体的模型适应性差异。
模型特征选择采用Shapley值解释,分析各特征对耐药风险预测的重要性。
5. 统计分析
连续变量以中位数(IQR)表示,分类变量以频数和百分比表示。使用双侧P值<0.05判定统计显著性差异。
核心结果
1. 人群体特征概述(Table 1)
数据集中包含39,893名患者,其中男性21,241人(53.2%)。患者的中位年龄为65岁(IQR 54-74)。医院1、医院2和医院3分别贡献了16,902人(42.4%)、4,132人(10.4%)和4,528人(11.4%)。
不同医院的患者共病情况分布存在显著差异。例如,医院1主要收治了较多血液恶性肿瘤患者(11.6%)和移植患者(8.2%),而COPD和终末期肾病患者更多集中在医院3(分别为30.7%和18.8%)。 病情严重程度指标显示,11.5%的患者发生了脓毒性休克,29.1%的患者接受了气管插管。 标本类型以尿液(39.0%)、呼吸道(25.2%)和血液(13.7%)为主。抗菌耐药性分布显示,GNB感染的患者占19.6%,其中SS、RS和RR菌株分别占88.6%、7.1%和4.3%。
2. 社区与院内脓毒症(Table 2)
在43,207例社区脓毒症事件中,SS菌株感染率为94.3%,RS和RR菌株分别占3.9%和1.8%。这表明在社区脓毒症中,GNB的耐药性较低。
终末期肾病(ESKD)和COPD等共病显著增加RS和RR的感染风险。例如,ESKD患者中RS和RR的感染率分别为17.3%和18.1%,COPD患者则分别为28.1%和31.2%。
在42,031例院内脓毒症事件中,SS、RS和RR菌株感染率分别为90.4%、5.7%和3.9%。院内感染的耐药率较高,尤其是呼吸道感染部位耐药菌检出率明显高于社区脓毒症。
院内感染主要以呼吸道标本为主,而尿液标本的RS和RR菌株的检出率相对较低。这表明不同感染途径与耐药性分布存在显著关联。
3. 关键预测特征分析(Fig 1)
梯度提升模型的特征重要性分析显示,在社区脓毒症中,最重要的耐药预测因子包括Pseudomonas aeruginosa感染史、抗生素使用史、既往肺炎史和年龄。
具体来说,既往抗生素暴露显著增加了RS和RR菌株感染的风险;Pseudomonas aeruginosa感染史与较高的RS感染风险关联显著。
在院内脓毒症中,住院时间、年长和Pseudomonas aeruginosa感染史成为关键预测因子。住院时间越长,RR菌株感染风险越高。
抗生素使用历史和多重耐药感染史在院内患者的RR感染风险预测中具有显著作用。这表明在院内情况下,长期住院和广泛抗生素使用对耐药性增加的影响更为显著。
4. 模型表现的医院间差异(Fig 2)
深度学习模型的AUPRC在不同医院之间差异显著,耐药率较高的医院模型表现优于耐药率较低的医院。例如,医院1(学术中心,耐药率高)和医院3(社区医院,耐药率相对较低)的AUPRC差异显著。
不同医院的患者亚群也展现出显著的模型表现差异。对于有抗生素耐药菌感染史的患者,模型表现尤其优秀;无耐药感染史患者的AUPRC相对较低。
对于血液恶性肿瘤患者,模型在不同医院的AUPRC差异大。例如,在社区脓毒症中,医院1的RS和RR耐药率为3.6%,而医院3则为10.3%,表现出模型在不同医院和患者亚群中的适应性差异。
有既往抗生素暴露史的患者在模型中AUPRC最高,达到0.36,反映出该亚群具有显著的耐药预测需求。
5. 耐药率与模型表现的相关性分析(Fig 3)
耐药率与模型的AUPRC表现呈显著正相关(R=0.79, P<0.001),表明模型性能受到RS和RR菌株感染率的显著影响。
在样本量较少的亚群中,例如无既往感染史的患者,AUPRC较低且与样本量无显著相关性。这进一步支持了耐药率在模型表现中的主导作用,而非样本量或患者特征的决定性影响。
小
结
1. 患者群体特征
数据集中包含39,893名患者,主要来自不同类型的医疗机构,各医院的患者特征和共病情况差异显著。
学术中心医院的患者往往具有更多的复杂共病(如血液恶性肿瘤和器官移植),而社区医院则有较多的COPD和终末期肾病患者。
2. 社区和医院脓毒症特征
社区脓毒症事件占总病例的50.7%,医院脓毒症则占48.3%。医院脓毒症患者的多重耐药菌株比例更高,特别是在呼吸道感染中,耐药率显著升高。
与社区脓毒症相比,医院脓毒症更常见RS和RR耐药菌株感染。
3. 关键预测特征分析
在社区脓毒症中,Pseudomonas aeruginosa感染史、抗生素使用史、既往肺炎史和年龄是RS和RR感染的显著预测因子。
在医院脓毒症中,住院时间、既往抗生素暴露史以及Pseudomonas aeruginosa感染史成为预测耐药的关键因素。
4. 模型性能的医院间差异
深度学习模型的AUPRC在不同医院之间表现差异显著,耐药率较高的医院模型表现优于耐药率较低的医院。
特定亚群的模型性能表现出差异,例如血液恶性肿瘤患者在不同医院中的耐药率分布不同,对模型性能产生影响。
5. 耐药率与模型性能的相关性
耐药率与模型AUPRC呈显著正相关(R=0.79, P<0.001),表明当地的耐药菌流行情况对模型性能有显著影响。
亚群样本量对AUPRC无显著相关性,进一步支持耐药率是决定模型表现的关键因素。
-END-
文字丨本人点滴积累,如有补充,下方留言即可
(左下角点击“阅读原文”即可获取全文)