走进“青椒课堂”|综合实训之医疗类项目案例(1)肺癌风险预测

科技   2024-12-24 18:50   北京  

医疗类项目案例


 课程链接 

https://www.qingjiaoclass.com/market/detail/62909

01.

肺癌风险预测





项目背景


肺癌是一种常见的致命恶性肿瘤,早期发现与治疗对于提升患者的生存率至关重要。传统诊断方法通常依赖医生的经验判断、病理检查及医学影像分析等,存在一定的局限性,如主观因素影响、流程复杂以及耗时较长等问题。

机器学习技术结合大规模医学数据的应用展现出了巨大潜力。通过分析患者的临床资料(如性别、年龄、吸烟历史等)和影像学资料(如X光片、CT扫描图像等),机器学习模型能辅助医生更精准地评估罹患肺癌的风险,从而辅助临床决策制定。癌症预测系统不仅降低了检测成本,还能帮助人们更好地理解自身健康状况,并据此采取合适的预防或治疗措施。


项目目标


通过对肺癌调查数据进行数据清洗、加工和特征化处理,然后构建分类与回归模型,实现肺癌患者预测,提前告知患有肺癌的概率,及需进行的预防手段。


数据说明


数据来源于某医疗卫生组织,结合以往肺癌患者患病前出现的习惯和反常情况,组织存在以下症状的人员进行肺癌风险预测调查。此数据集包含诸多字段:

字段名称

含义

GENDER

性别

AGE

年龄

SMOKING

吸烟

YELLOW_FINGERS

黄色的手指

ANXIETY

焦虑

CHRONIC DISEASE

慢性疾病

FATIGUE

疲劳

ALLERGY

过敏症

CHEST PAIN

胸部疼痛

……

……


技术框架


  • Pandas:数据分析处理库。

  • NumPy:科学计算库。

  • Scikit-learn:机器学习库。

  • Matplotlib:绘制可视化图表库。

  • PyEcharts:交互式可视化图表库,是Echarts库的Python封装。

  • Graphviz(Python-Graphviz):图形可视化工具库,Python封装API接口。

  • LightGBM:梯度提升树框架。


项目任务


任务1

    特征工程与EDA分析

为规范后续模型输入数据,首先要对数据特征进行处理,将其转换为模型可接收的数值型特征。读取肺癌患者调查数据集,转换是否患有肺癌标签为数值类型。

任务2

    模型预测与对比

分别构建决策树、随机森林、逻辑回归、LightGBM梯度提升、支持向量机SVM 和K近邻分类模型传入肺癌患者训练样本集进行训练拟合预测,计算交叉验证的分数对比各个模型的准确率,以此选出效率最高最优的分类模型进行肺癌患者预测。

关注“新道工科”公众号,“青椒课堂”平台内容全知道!




新道工科聚焦新IT与工业互联网,涵盖信息安全、工业互联网、大数据、人工智能、区块链、智能网联汽车、智能制造、工业智能等多个专业领域,基于用友集团和新道科技子公司红亚科技的产业与技术优势,不断深化和拓展数智化教学产品和内容,形成覆盖范围更广的课程体系及综合解决方案,为本科、高职、中职院校提供优质教学服务。

扫码关注

新道工科

微信号|hongyaa-2012

新道工科
北京红亚华宇科技有限公司(新道工科)隶属用友集团,是新道科技股份有限公司全资子公司。红亚科技肩负科技使能教育、服务中国教育事业的使命,致力于打造新时代的新工科人才培养新体系,为国内本科、高职、中职院校提供优质的教学服务。
 最新文章