时代变了,“SHAP” 取代“列线图”,成为预测模型文章标题的重点

健康   2024-10-31 07:47   浙江  

2024-2025 课程介绍

可预开发票,郑老师团队2024-25年科研统计课程预告,含机器学习、轨迹模型等

最近,老郑看了很多文献,发现现在预测模型的文章,大多数都在用机器学习来建模和验证了,并且,可以看出,文章的题目已经不再强调“列线图”,现在文章多强调“SHAP”法。

举几个例子。

图1 使用环境挥发性有机化合物暴露识别美国人群心血管疾病风险:基于SHAP方法的机器学习预测模型
图2 糖尿病患者ICU住院期间压力损伤发生预测模型——XGBoost机器学习模型可基于SHAP进行解释
图3 基于SHAP的老年心力衰竭患者1年全因再入院风险预测建模:特征选择和模型解释
图4 解释机器学习模型对糖尿病血糖预测的重要性:使用SHAP进行分析
在机器学习领域中,模型的可解释性一直备受关注,是一个重要的课题。尽管复杂的模型如深度神经网络和集成模型(如XGBoost、LightGBM)在预测性能上表现优异,但通常被视为“黑箱”,难以解释其内部决策过程。
然而,SHAP(SHapley Additive exPlanations)是一种解决这一问题的工具,用来解释机器学习模型预测结果的方法,由Scott Lundberg和Su-In Lee于2017年提出。它基于博弈论中的Shapley值概念,为模型的每个特征分配重要性值,从而解释模型的预测过程。
SHAP支持多种机器学习框架,如XGBoost、LightGBM、sklearn、TensorFlow等,使用SHAP时,通常包括以下步骤:
  • 训练模型:使用数据集训练机器学习模型
  • 计算SHAP值:使用SHAP库计算每个特征的SHAP值
  • 可视化与解释:通过可视化方法展示SHAP值,进行模型解释
在文章中的展示图如下:
1.模型中变量的SHAP值排序
2.摘要图(Summary Plot)
3.力图(Force Plot)
4.依赖图(Dependence Plot)
SHAP作为机器学习模型的解释工具,已经是一项重大突破,通过量化特征对预测的贡献,提供可视化功能。
我们也要跟得上时代的脚步,用上新的方法!

如果您对机器学习预测模型感兴趣的话,来看看我们的机器学习与测模型服务吧,一对一指导!详情可咨询助教,微信号:aq566665

关于郑老师团队及公众号

大型医学统计公众号平台,专注于医学生、医护工作者学术研究统计支持,我们是你们统计助理

郑老师团队开设的医学统计培训课程,各类发文需求都可以满足:


GBD公共数据库挖掘NHANES公共数据库挖掘孟德尔随机化方法

真实世界临床研究(临床回顾性数据分析)临床预测模型

临床试验设计与数据分析重复测量资料分析R语言

量表与中介数据分析结构方程模型Meta分析

郑老师统计课程详情介绍

(目前购买统计课程还可参与发表SCI注明我们平台退课程费用的活动,详情扫描下方二维码添加助教微信咨询详情)

郑老师开发的超便捷免费统计工具了解一下:

www.medsta.cn/software(详情介绍)


详情联系助教小董咨询(微信号aq566665





医学论文与统计分析
本号为高校统计学老师所设,介绍医学论文进展与统计学方法,SPSS分析方法、真实世界研究、R语言与数据挖掘。关注后,发送关键词“33”到公众号就可以获取常见的统计软件比如Spss,sas,PASS(绝对无毒)等
 最新文章