利用临床数据和机器学习进行原发性免疫缺陷疾病的早期诊断

文摘健康 2024-07-25 00:00 江苏

✦

深度学习辣汤小组文献阅读学习之一百五十篇

✦

利用临床数据和机器学习进行原发性免疫缺陷疾病的早期诊断

DeepLearning 深度学习辣汤小组

2024/1/2

2022年，来自芝加哥大学儿科学系的Anoop Mayampurath等人利用电子健康记录（HER, electronic health record）数据中与既往对症治疗相关的元素构建了一个机器学习模型，来预测原发性免疫缺陷疾病（PIDD, Primary immunodeficiency diseases）的发生。并在J Aller Cl Imm-Pract期刊（IF：9.4 医学1区 TOP）上发表题为“Early Diagnosis of Primary Immunodeficiency Disease Using Clinical Data and Machine Learning”的文章。

DOI：

https://doi.org/10.1016/j.jaip.2022.08.041

一、研究背景

PIDD是指涉及免疫系统中的一个或多个重要元素失调的一系列疾病，这些失调病症通常会导致感染的反复发作，严重时甚至可能威胁生命。虽然整体PIDD的发病率较低，但近期的研究发现它们的发病率正在稳步增加。不幸的是，据报告称，PIDD确诊的平均延迟时间达到了6-9年，此状况不仅会造成患者生活质量下降，还可能增加不必要的手术和治疗风险。伴随着这一问题的是显著的医疗资源浪费以及不必要的死亡率。免疫球蛋白替代疗法已被证明可以有效地预防许多PIDD患者的感染，但是早期疾病的预测十分关键。

为了帮助临床医师更快地进行早期诊断，最近的研究已经开始利用EHR数据或机器学习来开发PIDD早期诊断预测算法，然而，对于PIDD早期诊断的机器学习应用探索仍非常有限。本研究利用EHR数据和机器学习技术，开发一种PIDD早期诊断预测算法。

二、数据集

本研究对2009年1月1日至2018年8月31日期间在芝加哥大学医学中心就诊的所有成年及青少年患者进行了观察性病例对照研究。在对构建PIDD病例样本的资格进行评估后，初步确定了435名病患，其中，有182名因不符合入选标准而被排除，余下的247名患有PIDD的患者构成了我们的病例组（见图1）。此外，本研究还发现有42,588位患者符合哮喘队列的入选条件。在此基础上，根据排除标准，剔除了3812位患者。经过与病例组的配对后，共有6175位哮喘患者组成对照组。经过这些筛选后，我们的最终分析队列规模为6422位患者。表1对比了分析队列中病例组和对照组的病人特征以及既往并存病症。

三、研究方法

本研究对符合PIDD相关诊断标准、免疫缺陷特异性药物治疗以及免疫球蛋白水平降低的患者进行了回顾性研究。在诊断PIDD之前，考虑并分析并发症、实验室检查结果、用药状况和放射科指令等特征，这些特征均在诊断前被考虑并预计在症状相关治疗中有指示作用。本研究使用了逻辑回归（LR, logistic regression）、弹性网络（EN, elastic nets）和随机森林（RF, random forests）分类器，并使用五倍交叉验证方法进行训练，受试者工作特性曲线下面积（AUC）被用来评估PIDD患者与非PIDD患者的模型区别。最后，本研究分析了表现最好的模型中哪些特征对PIDD诊断最重要。

四、结果与结论

由表2可知，仅使用并发症特征集时，LR模型就已展现出良好的鉴别能力，能将PIDD患者与普通患者区分开来（AUC：0.62 [95％置信区间（CI）：0.58-0.65]）。通过ETN解决共线性问题并扩展到随机森林模型，其性能并未有显著提升。增加实验室检查结果的存在性确实提高了LR模型的鉴别能力（AUC：0.67对比0.62，P < .001）。当使用所有并发症、实验室检查结果、用药状况和先前放射学操作的数量等全套特征集时，LR模型的性能有了很大提升。使用所有特征时，RF模型相比于LR模型在早期诊断PIDD方面有轻微改善（AUC：0.72对比0.70，P¼.26），但这一差异并未达到统计显著性。总体来看，在保持模型简洁性的同时，使用全部特征的LR模型在最大化PIDD患者区分度的方面表现最佳。如图2所示，用于诊断PIDD的最重要的变量是与先前放射性操作相关的变量，其次是肝测试结果的存在和药物总数。

本研究运用临床数据构建了一种创新预测模型，能够依据患者症状病史对PIDD进行早期诊断。本模型作为一个必要的初始阶段，旨在开发EHR提醒工具以提示医生考虑PIDD的诊断，帮助他们利用免疫球蛋白替代疗法进行及时治疗，进而有可能降低患者的发病率和死亡风险。

图1：诊断PIDD患者的纳入标准流程图

表1：用于开发机器学习模型的病例(PIDD)和对照(匹配哮喘)患者的比较

表2：不同机器学习模型顺序加入特征后的AUC值，置信区间为95%

图2：诊断PIDD的LR模型的特征重要性图

Pepper soup transformed by: Jin Daipeng

深度学习辣汤AI小组由徐州医科大学以及徐州医科大学附属医院一群热爱人工智能的小伙伴们组成，欢迎大家跟我们交流学习!

扫码关注我们

欢迎加入我们！

成员微信号：cy2011mcu

添加好友时请备注：

您的单位-科室-姓名-研究方向

http://mp.weixin.qq.com/s?__biz=Mzg2NzU5MjUxNQ==&mid=2247487128&idx=2&sn=92005d6d4bbd1e55d41adf52806e00d5

深度学习辣汤小组

AI学习日志，阅读相关文献，分享学习感悟，交流学习技巧，记录自我成长！

最新文章

【一百七十篇】急性肾损伤机器学习风险评分的内部和外部验证

利用临床数据和机器学习进行原发性免疫缺陷疾病的早期诊断

肝移植中的人工智能、机器学习和深度学习

通过眼部图像的深度学习筛选和识别肝胆疾病：一项前瞻性、多中心研究

通过机器学习预测心脏手术后急性肾损伤的发展

利用临床数据和机器学习进行原发性免疫缺陷疾病的早期诊断

肝移植中的人工智能、机器学习和深度学习

通过眼部图像的深度学习筛选和识别肝胆疾病：一项前瞻性、多中心研究

通过机器学习预测心脏手术后急性肾损伤的发展

用于儿科重症监护中急性肾损伤早期预测的机器学习模型

深度学习在脓毒症相关急性肾损伤亚型识别中的应用

拉曼光谱与机器学习相结合在单细胞水平上快速检测食源性病原体

由5项临床指标和肝脏硬度测量组成的机器学习模型可以准确识别与MASLD相关的肝纤维化

目标检测：一种新的用于诊断肝细胞气球样变的人工智能技术

人工神经网络算法预测心肌梗死后一年内死亡率和因心力衰竭入院率的开发和验证：一项全国性人群研究

机器学习用于脓毒症患者急性肾损伤的预测

机器学习方法揭示糖尿病前期和2型糖尿病患者慢性肾病的代谢特征

使用表面增强拉曼光谱结合偏最小二乘回归和人工神经网络对大肠杆菌、金黄色葡萄球菌和鼠伤寒沙门氏菌进行同时定量分析

细菌拉曼光谱识别的尺度自适应深度模型

基于机器学习构建系统性红斑狼疮辅助诊断系统：SIE风险概率指数(SLERPI)

【一百六十四篇】基于SERS光谱深度学习分析的多药耐药肺炎克雷伯菌快速预测

【一百六十三篇】基于深度学习的光谱分析快速鉴定尿路致病菌耐药性

【一百六十二篇】SERS指纹图谱结合机器学习分析用于快速鉴定结核分枝杆菌感染和耐药性

一百六十一篇:拉曼光谱结合深度学习在单细胞水平快速检测黑色素瘤

急性肾损伤危重患者死亡率和主要肾脏不良事件的预测

【一百六十九篇】一种新的基于机器学习的放射组学模型用于诊断肝硬化患者的食管静脉曲张风险

【一百六十八篇】使用基于MELD的模型确定急性静脉曲张破裂出血患者的死亡风险

【一百六十七篇】基于图像的机器学习模型在肝硬化静脉曲张出血预后方面优于临床风险评分

【一百六十六篇】基于机器学习的急诊科分期儿童临床结果预测

【一百六十五篇】使用机器学习识别先天性白内障的实用模型

“2024新文速递二十”套路得人心的IgA肾病的文章，发了一个预警，学习下他的套路！

“2024新文速递十九”火遍全网的大语言模型结合病理图像在NATURE上是如何表现的？与大语言模型相关的概念有哪些？

“2024新文速递十八”你有被肾结石疾病的困扰吗？激光碎石后是否容易再复发？有哪些因素，看看这篇文章吧！

“2024新文速递十七”如何在新辅助化疗赛道抓住热点之二？

【一百六十九篇】一种新的基于机器学习的放射组学模型用于诊断肝硬化患者的食管静脉曲张风险

【一百六十八篇】使用基于MELD的模型确定急性静脉曲张破裂出血患者的死亡风险

【一百六十七篇】基于图像的机器学习模型在肝硬化静脉曲张出血预后方面优于临床风险评分

“2024新文速递十九”火遍全网的大语言模型结合病理图像在NATURE上是如何表现的？与大语言模型相关的概念有哪些？

【一百六十九篇】一种新的基于机器学习的放射组学模型用于诊断肝硬化患者的食管静脉曲张风险

【一百六十八篇】使用基于MELD的模型确定急性静脉曲张破裂出血患者的死亡风险

【一百六十七篇】基于图像的机器学习模型在肝硬化静脉曲张出血预后方面优于临床风险评分

“2024新文速递十八”你有被肾结石疾病的困扰吗？激光碎石后是否容易再复发？有哪些因素，看看这篇文章吧！

“2024新文速递十七”如何在新辅助化疗赛道抓住热点之二？

使用机器学习方法实现肝组织学的定量测量和NASH中的疾病监测

基于NASH患者肝脏活检中的肝细胞气球样变引入持续同源性图像，实现计算机辅助NASH诊断

气球状肝细胞特征识别的复杂性：为基于人工智能的非酒精性脂肪肝成像定义训练图谱

结合人工智能分析的数字病理学为NASH中治疗诱导的纤维化消退提供了更深入的研究

基于深度学习评估肝活检组织的精确肝脂肪变性定量研究

相位染色:利用深度学习对无标签定量相位显微镜图像进行数字染色

在肝活检组织学中利用深度学习技术精准定量评估肝脂肪变性

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉