基于R语言的真实世界研究与二分类机器学习实战培训班
正式授课前会有1-3次免费公开课,大家可以按照需求试听。
第一期公开课【真实世界研究公开课-外科学顶刊机器学习方法学分享会(基于mlr3)】 https://www.bilibili.com/video/BV1at4y1o7yz/?share_source=copy_web&vd_source=bb5beaa0d063eec1ae7bdc0314d823b7
第一:培训目标
1,掌握R语言的基本概念与常规操作。 2,能够流程化进行常规真实世界研究及相关统计图表的制作,制作的统计图表可以直接用于发表。 3,可以应用有向无环图(DAG)方法对于混杂因素进行初步判定。 4,能够学会鉴定关键因素的主流方法。 5, 利用倾向性评分进行匹配、加权及回归进行混杂因素的调整。 6,基于mlr3等包,能够利用机器学习算法进行二分类结果的特征工程与模型的建立和验证。
第二:课程目录
第一部分:真实世界介绍
1.真实世界研究的基本概念流流行病学基本知识 2.真实世界研究高分文章简析
第二部分(R语言基础及实用技能)
3.整洁数据的一般要求及数据整理(tidydata) 4.学习R语言的必要性及准备工作(环境构建及包安装) 5.R语言基础(1)-一维变量 6.R语言基础(2)-二维变量及高维变量 7.函数的一般用法介绍及出现报错得解决方案 8.tidyverse体系初探
第三部分(单因素批量分析及变量筛选)
9.组间基线表格快速制作及统计学考量 10.单因素分析批量实现及统计学考虑 11.连续变量截断值选择的方法总结 12.有向无环图的应用及快速实现
第四部分(多因素分析-协变量调整)
13.多因素分析批量实现及调整协变量的敏感性分析 14.关键因素鉴定得一些方法(P值法,机器学习方法,效应值改变法等) 15.倾向性评分匹配实现及实战注意事项(PSM) 16.逆概率加权的实现及解释 17.亚组分析及其森林图的快速绘制(包括交互作用及趋势性检验)
第五部分(二分类预测模型终极解决方案)
18.预测模型总论及思路整理 19.传统二分类预测模型的构建与验证 20.mlr3基础快速掌握 21.基于mlr3的机器学习二分类预测模型的构建与预测(随机森林,决策树,SVM,xgboost,knn,神经网络等) 22.基于mlr3的机器学习算法二分类预测模型ROC曲线,校准曲线与DCA曲线绘制(随机森林,决策树,SVM,xgboost,knn,神经网络等) 23.机器学习模型的可解释性一体化解决方案(DALEX/IML体系,包括shap值计算及可视化)
第三:培训老师
灵活胖子老师,公众号:灵活胖子的科研进步之路博主,医学博士,R语言及Python爱好者,科研方向为真实世界研究,生信分析与人工智能研究。目前以第一/共同一作及通讯作者发表SCI文章10余篇,参与多项真实世界及人工智能研究。
第三:培训时间及形式
总培训时间:20-23小时
初步计划时间:2024年4月19日— 2024年4月21日 远程在线培训
为保证授课质量如果按时无法完成授课内容,会在后续的周末继续完成授课
发文奖励政策:学员应用所学内容发表IF文章可退还学费(具体要求及流程需要咨询助教)
第四:课题内容及部分复现方法学图表
培训费用
(注:可转账、公务卡扫码支付。正规会议通知、发票。)
A类,每人3900元(含培训费、教材费、证书费、资料费)
B类,每人4580元(含培训费、教材费、证书费、资料费)
无证版,如果您不需要证书,可以联系助教老师进行咨询,费用可以进行适当减免(联系方式见最下方)
颁发证书
A类,由中国管理科学研究院颁发的《数字医学技术工程师》(高级)专业人才技能证书,官方网站查询,该证书可作为有关单位专业技术人员能力评价、考核和任职的重要依据。 B类,由工业和信息化部全国工业与信息技术考试管理中心颁发的《人工智能应用工程师》职业技能证书,官方网站官方网站查询或扫描证书上方的二维码查询,证书直接纳入专业人才数据库,该证书可作为企事业单位选拔和聘用专业人才的依据。(加上A类共两本证书)
注:请学员带两寸彩照两张(背面注明姓名)、身份证复印件和学历证明复印件各两张。