利用临床数据和机器学习进行原发性免疫缺陷疾病的早期诊断

文摘   健康   2024-07-25 00:00   江苏  

深度学习辣汤小组文献阅读学习之一百五十篇

利用临床数据和机器学习进行原发性免疫缺陷疾病的早期诊断

DeepLearning 深度学习辣汤小组

 2024/1/2


2022年,来自芝加哥大学儿科学系的Anoop Mayampurath等人利用电子健康记录(HER, electronic health record)数据中与既往对症治疗相关的元素构建了一个机器学习模型,来预测原发性免疫缺陷疾病(PIDD, Primary immunodeficiency diseases)的发生。并在J Aller Cl Imm-Pract期刊(IF:9.4 医学1区 TOP)上发表题为“Early Diagnosis of Primary Immunodeficiency Disease Using Clinical Data and Machine Learning”的文章。

DOI:

https://doi.org/10.1016/j.jaip.2022.08.041


一、研究背景

PIDD是指涉及免疫系统中的一个或多个重要元素失调的一系列疾病,这些失调病症通常会导致感染的反复发作,严重时甚至可能威胁生命。虽然整体PIDD的发病率较低,但近期的研究发现它们的发病率正在稳步增加。不幸的是,据报告称,PIDD确诊的平均延迟时间达到了6-9年,此状况不仅会造成患者生活质量下降,还可能增加不必要的手术和治疗风险。伴随着这一问题的是显著的医疗资源浪费以及不必要的死亡率。免疫球蛋白替代疗法已被证明可以有效地预防许多PIDD患者的感染,但是早期疾病的预测十分关键。

为了帮助临床医师更快地进行早期诊断,最近的研究已经开始利用EHR数据或机器学习来开发PIDD早期诊断预测算法,然而,对于PIDD早期诊断的机器学习应用探索仍非常有限。本研究利用EHR数据和机器学习技术,开发一种PIDD早期诊断预测算法。

二、数据集

本研究对2009年1月1日至2018年8月31日期间在芝加哥大学医学中心就诊的所有成年及青少年患者进行了观察性病例对照研究。在对构建PIDD病例样本的资格进行评估后,初步确定了435名病患,其中,有182名因不符合入选标准而被排除,余下的247名患有PIDD的患者构成了我们的病例组(见图1)。此外,本研究还发现有42,588位患者符合哮喘队列的入选条件。在此基础上,根据排除标准,剔除了3812位患者。经过与病例组的配对后,共有6175位哮喘患者组成对照组。经过这些筛选后,我们的最终分析队列规模为6422位患者。表1对比了分析队列中病例组和对照组的病人特征以及既往并存病症

三、研究方法

本研究对符合PIDD相关诊断标准、免疫缺陷特异性药物治疗以及免疫球蛋白水平降低的患者进行了回顾性研究。在诊断PIDD之前,考虑并分析并发症、实验室检查结果、用药状况和放射科指令等特征,这些特征均在诊断前被考虑并预计在症状相关治疗中有指示作用。本研究使用了逻辑回归(LR, logistic regression)、弹性网络(EN, elastic nets)和随机森林(RF, random forests)分类器,并使用五倍交叉验证方法进行训练,受试者工作特性曲线下面积(AUC)被用来评估PIDD患者与非PIDD患者的模型区别。最后,本研究分析了表现最好的模型中哪些特征对PIDD诊断最重要。

四、结果与结论

由表2可知,仅使用并发症特征集时,LR模型就已展现出良好的鉴别能力,能将PIDD患者与普通患者区分开来(AUC:0.62 [95%置信区间(CI):0.58-0.65])。通过ETN解决共线性问题并扩展到随机森林模型,其性能并未有显著提升。增加实验室检查结果的存在性确实提高了LR模型的鉴别能力(AUC:0.67对比0.62,P < .001)。当使用所有并发症、实验室检查结果、用药状况和先前放射学操作的数量等全套特征集时,LR模型的性能有了很大提升。使用所有特征时,RF模型相比于LR模型在早期诊断PIDD方面有轻微改善(AUC:0.72对比0.70,P¼.26),但这一差异并未达到统计显著性。总体来看,在保持模型简洁性的同时,使用全部特征的LR模型在最大化PIDD患者区分度的方面表现最佳。如图2所示,用于诊断PIDD的最重要的变量是与先前放射性操作相关的变量,其次是肝测试结果的存在和药物总数。

本研究运用临床数据构建了一种创新预测模型,能够依据患者症状病史对PIDD进行早期诊断。本模型作为一个必要的初始阶段,旨在开发EHR提醒工具以提示医生考虑PIDD的诊断,帮助他们利用免疫球蛋白替代疗法进行及时治疗,进而有可能降低患者的发病率和死亡风险。

图1:诊断PIDD患者的纳入标准流程图

表1:用于开发机器学习模型的病例(PIDD)和对照(匹配哮喘)患者的比较

表2:不同机器学习模型顺序加入特征后的AUC值,置信区间为95%

图2:诊断PIDD的LR模型的特征重要性图


Pepper soup transformed by: Jin Daipeng




  //  

深度学习辣汤AI小组由徐州医科大学以及徐州医科大学附属医院一群热爱人工智能的小伙伴们组成,欢迎大家跟我们交流学习!


扫码关注我们

欢迎加入我们!

成员微信号:cy2011mcu

添加好友时请备注:

您的 单位-科室-姓名-研究方向


深度学习辣汤小组
AI学习日志,阅读相关文献,分享学习感悟,交流学习技巧,记录自我成长!
 最新文章