走进“青椒课堂”|综合实训之医疗类项目案例(3)中风患者识别预测

科技   2024-12-27 18:50   北京  

医疗类项目案例


 课程链接 

https://www.qingjiaoclass.com/market/detail/62909

03.

中风患者识别预测





项目背景


中风是因大脑血液供应不足或出血导致脑细胞死亡的疾病,主要分为缺血性和出血性两种类型。这两种情况都会影响大脑的正常功能。

中风的症状可能包括:一侧肢体无力或麻木、言语困难、头晕、视力障碍等,通常在发作时迅速显现。如果症状在一两小时内消失,则可能是短暂性脑缺血发作(TIA),即小中风。出血性中风还常伴有剧烈头痛。中风可能导致永久性损伤和长期并发症,如肺炎或膀胱控制问题。


项目目标


  • 中风患者数据EDA:发掘数据特征和分布情况,揭示数据之间的关联关系,评估数据质量,处理异常检测和相关性分析。

  • 中风预测分析:提高中风的早期诊断率、干预率、挖掘风险因素和预测模式、医生的决策依据。


最终效果


通过构建各个模型放入训练数据进行预测,将最终每个模型的准确率分数存入数组后,绘制图形比对各模型。


数据说明


中风患者数据库(部分):


技术框架


  • 数据分析:Pandas

  • 机器学习:Scikit-learn

  • 科学计算:NumPy

  • 算法模型:LightGBM、Catboost和随机森林

  • 可视化、绘图:Plotly、Matplotlib

  • 超参数优化:Optuna

  • 轻量级管道工具:Joblib(NumPy数组优化)


项目任务


任务1

    理解数据

知晓数据是否有缺失值或重复值,哪些特征是数值型特征,哪些特征是离散型特征。

任务2

    EDA分析

为详细了解数据集情况,可采用探索性数据分析对目标变量分布、特征相关性、缺失值处理、数值特征分布、分类特征分布、特征间相互关系、离群值检测和可视化分析等指标进行统计分析。

任务3

    特征工程

数据集中存在4个离散特征,需将其分类变量做LabelEncoder编码转化为数值型特征,并需对体质指数BMI进行特征创造划分。

任务4

    模型预测

绘制LightGBM、CatBoost和随机森林三个模型分数的对比直方图。

关注“新道工科”公众号,“青椒课堂”平台内容全知道!




新道工科聚焦新IT与工业互联网,涵盖信息安全、工业互联网、大数据、人工智能、区块链、智能网联汽车、智能制造、工业智能等多个专业领域,基于用友集团和新道科技子公司红亚科技的产业与技术优势,不断深化和拓展数智化教学产品和内容,形成覆盖范围更广的课程体系及综合解决方案,为本科、高职、中职院校提供优质教学服务。

扫码关注

新道工科

微信号|hongyaa-2012

新道工科
北京红亚华宇科技有限公司(新道工科)隶属用友集团,是新道科技股份有限公司全资子公司。红亚科技肩负科技使能教育、服务中国教育事业的使命,致力于打造新时代的新工科人才培养新体系,为国内本科、高职、中职院校提供优质的教学服务。
 最新文章