机器学习“杀疯了”!中国学者挖掘公共数据+9个机器学习模型,直接拿下Cell子刊!
文摘
科学
2024-08-27 18:34
浙江
机器学习法已经发表了好几篇高分文章,今天这又是一篇机器学习的高端玩法!中国学者使用MIMIC-IV数据库以及自有队列数据,建立了9个机器学习模型,构建和评估最佳预测模型,直接拿下Cell子刊!
2024年6月27日,浙江中医药大学的学者用MIMIC-IV 数据库和自有数据,在顶级期刊Cell子刊《iScience》(医学二区,IF=4.6)发表题为:“Risk prediction models for successful discontinuation in acute kidney injury undergoing continuous renal replacement therapy ”的研究论文,研究团队利用LASSO回归选择特征,建立了9个机器学习模型,旨在构建和评估接受连续性肾脏替代治疗(CRRT)干预的危重急性肾损伤(AKI)患者及时停止CRRT的预后模型。
研究结果表明,XGBoost模型在决定CRRT停药方面具有较强的预测能力。
急性肾损伤(AKI)是危重患者中常见的并发症,具有高发病率和高死亡率的特点,在全球范围内造成了极大的疾病负担。据统计,全世界大约20%-50%的重症监护室(ICU)患者会经历AKI,而连续性肾脏替代治疗(CRRT)是AKI常用的治疗方式。机器学习(ML)作为AI的一部分,在医疗领域发挥着重要的作用。在目前的研究中,学者们主要致力于用现有的ML构建针对AKI患者的早期预警和预后模型,缺少对CRRT停药时间的临床风险预测模型的研究。本项研究纳入了MIMIC-IV的数据758名年龄≥18岁、确证为AKI并接受CRRT的符合条件的参与者用于模型开发,并从湖州市中心医院重症监护病房(ICU)纳入320名符合同样条件的参与者用于模型验证,所有人群的平均年龄为(63.79 ± 16.03)岁,SOFA(序贯器官衰竭评估)评分为(11.67 ± 4.25)。主要结局是成功停止连续性肾脏替代治疗(CRRT),即患者在出院时存活且不再需要透析,出院前至少7天无任何形式的RRT。初步分析后发现,1078例患者中有382例(35.44%)成功中止CRRT。在培训队列(35.62%)和外部验证队列(35.00%)之间未观察到CRRT成功中止率的统计学显著差异。
随后,研究团队根据CRRT停药成功或失败将参与者分为两组,即成功组(n= 382)和失败组(n= 696)。基于初步分析的结果,同时考虑到实际的临床背景和专家意见,研究团队得出7个可纳入预测模型开发的特征。研究团队共使用了9个模型,包括最小绝对收缩和选择算子逻辑回归(Lasso-LR),决策树(DT),岭回归(RR),K-最近邻(KNN),光梯度增强机(LightGBM),随机森林(RF),极端梯度增强(XGBoost),支持向量机(SVM)和神经网络(NN)。最终,研究结果表明在训练集中,所有模型的AUROC都超过0.75。在验证集中,XGBoost模型的AUROC最高,为0.798,因此被选为开发临床应用在线计算器的最佳模型。综上所述,研究团队基于MIMIC IV数据库和湖州市中心医院的接受CRRT的阿基危重患者的真实临床数据。在进行了一系列全面的训练和验证程序后,XGBoost模型最终被选为可视化临床风险预测模型。该模型在培训队列和外部验证队列中均表现出良好的分化、校准和临床适用性。想要了解更多发文思路,不妨关注“公共数据库与孟德尔随机化”公众号!在这里你可以了解更多新指标,更多有关机器学习发文的文章! 全国最大的医学统计公众号平台,专注于医学生、医护工作者学术研究统计支持,我们是你们统计助理
我们开展对临床预测模型、轨迹增长模型、医学免费数据库NHANES、GBD数据库、孟德尔随机化方法1对1R语言指导(一年内不限时间,周末、晚上均统计师一对一指导)。
详情联系助教小董咨询(微信号aq566665)