基于python的机器学习与模型可解释及影像组学课程-第二期
课程总体设计
本次课程主要涉及基于python的结构化数据的分析及机器学习模型的构建与模型的可解释性方法。另外,由于传统影像组学提取特征后也是结构化数据的处理,将一并讲授。同时,还会讲解影像组学数据的标注与提取。此部分内容主要基于3D slicer软件。
课程目录
主题 | 课程内容 |
---|---|
第一部分、Python 环境构建、基础语法及常见库应用 | 1. conda及Linux基本语法讲解及python环境构建,包和环境的管理 2.python基础语法 3.python数据结构(数组 字典 元祖 集合的概念和作用)、面向对象思维 类的继承 4.重要库的学习和使用,什么场景下使用?(pandasnumpy matplotlib) 5.pandas 库的数据处理和分析:数据读取、清洗、转换、合并、分组和聚合等 6.numpy 库的数值计算和数组操作:数组创建、索引、切片、运算和统计等 7.Matplotlib 库的基本用法及常见 SCl 图表绘制 |
第二部分、ChatGPT | 1. chatgpt介绍和使用心得 2.利用chatgpt辅助医学论文SCI画图 3.NLP以及Transformer初步认识和介绍 3. 如何用好chatgpt - 提示词工程 - 通过chatgpt接口批量抓取数据和处理 |
第三部分、Python 机器学习与生存分析 | 1. 机器学习基本概念和算法(包括监督学习和无监督学习方法的应用) 2. 特征选择的方法 3. 机器学习常用的模型 4. 生存分析原理基本介绍 5. Python 机器学习的王者-sklearn库的用法详解 6. 最新机器学习算法的低代码版本-PyCaret库用法详解 7. 常规生存分析方法学实现-lifelines 库详解 8. 基于机器学习/深度学习的生存分析算法的集大成者-PySurvial包用法详解 9. 生存分析文献复现实战 |
第四部分、模型可解释 | 1. DeepOmix框架介绍--机器学习及深度学习模型可解释框架 2. DALEX体系-DALEXSHAP/LIME/CAM原理介绍 3. DeepOmix之解释传统机器学习模型 4. DeepOmix之解释深度学习模型 5. 模型可解释性文献复现实战 |
第五部分、影像组学 | 1.影像组学概述和高分文章详解 2.基于 pyradiomics 提取特征 3.影像数据的预处理和标准化 4.5. 特征提取和特征选择 5.影像组学模型构建(10种+机器学习)和评估 |
授课老师
1.华为云计算部门:李老师
既往长期就职于华为人工智能 EI 部门, 在参与华为深度学习平台 ModelArts 的开发,独立承担能够支持 pytorch 的相关 API 的开发、实现算法的优化。遵循 Pytorch 框架的设计原则和 API 规范,确保接口的稳定性和易用性。
研究经历
医学图像分析与抑郁症诊断的 AI 分析,美国(远程合作) 该项目由美国马里兰大学的博士候选人 Naibo Zhang 担任咨询。 PageRank 算法提取脑部特征信息,并应用 KVM、决策树、支持向量机和加权范数算法进行抑郁症诊断。 应用生成对抗网络(GAN)模型扩充数据集,克服了样本量的限制,模型准确率达到 99%。
深度学习模型实践:
在百度网盘的去水印模型比赛时基于 PMRID UNet 设计出创新模型,该模型可以实现仅使用层次化通过调节逆瓶颈的深度参数及可分离卷积操作,并且还采用了多阶段的训练策略,最终实现了水印图像的像素级回归预测,且模型的性能和效果大大提高了,最终带领团队荣获了三等奖。 在百度网盘的文档超分辨率比赛时,在百度的 paddle 深度学习框架下改进了 SwinIR 模型,在不同的训练阶段设计了不同的参数,从而使浅层特征提取和深层特征提取的时间都达到了最快的速度,最后利用 GPU 进行图片的训练和输出,最终取得了优秀奖。 参加了 CVPR 2023 1st foundation model challenge-Track2,用掩码数据建模方法,使用 BEiT-3 预训练模型对Baseline 中的图片编码器进行改进,从而增强了图片与文本之间的匹配能力。该自创模型还使用了 RTMDet 目标检测算法,将车和人分开进行训练,针对其特征进行优化,去除相关无用背景,最终提高了模型跨模态匹配的准确性,拿到了前百分之5的优秀成绩。 在 AI studio 云服务器上部署 Vicuina 模型,并独立编写 Gradio web server 的页面,训练自己的数据集,实现了中英文的回复响应。
主要负责分析服务及授课内容
基于Python的数据科学。 基于Pytorch的医学深度学习的应用。 基于MONAI的医学影像学深度学习的框架应用。