上海!陈强老师寒假机器学习及Python应用

科技   2024-12-10 17:01   北京  

机器学习早期为人工智能的分支,后来也有不少统计学家加入,最近一、二十年因为其预测精度迅速提高而走红,并在业界有着广泛的应用。可以预见,在未来三十年,几乎所有行业都会因机器学习的深刻冲击而改变。MIT名誉校长

Eric Grimson曾预言,机器学习会成为像Word一样的工具。而谁先掌握此工具,则可占得先机,成为时代的弄潮儿(至少不会落伍)。


基于机器学习的通用性,2025年寒假“机器学习及Python应用”现场班将面向所有行业与学科的人士、老师与学生(包含经管社科、医学卫生等领域)。

本课程的最大特色在于“一站式服务”,从机器学习的原理、数学推导,到Python命令与经典案例,无不精心设计、丝丝入扣,理论联系实操,让学员们迅速理解机器学习的精髓,并掌握最为流行的数据科学软件Python操作。

特别增设Bonus Lecture:机器学习在经管社科的应用:精读几篇在经管社科顶刊发表的经典机器学习论文~


市面上机器学习的书籍和课程虽然很多,由于各自学科的特点,未必适合渴望学习机器学习的其他学科人群。计算机科学家编写出来的教材或者课程,一般强调算法。统计学家的机器学习教材和课程,偏重数学公式推导。而介绍机器学习实操的书籍或者课程,又变成代码的大杂烩,原理一带而过。这个并不适合咱们经管的老师来学,这也是陈强老师开这门机器学习课程的初衷。


Python师资培训丨机器学习及Python应用

课程提取机器学习的书籍的精髓,包含思想原理+数学精髓+案例讲解

课程信息

培训时间:2025年1月16-19日(四天)

授课安排上午9:00-12:00;下午2:00-5:00;答疑(陈强老师亲自)

培训地点:上海市静安区(提供交通住宿指南)


讲师介绍

陈强教授,获得北京大学经济学学士、硕士,美国Northern Illinois University数学硕士、经济学博士,现为数量经济学博士生导师,在统计学、计量经济学及机器学习领域具有深厚的功底,2010年入选教育部新世纪优秀人才支持计划。陈强老师著有畅销研究生教材《高级计量经济学及Stata应用》(第2版,高教社,2014),以及《机器学习及R应用》(高教社,2020)与《机器学习及Python应用》(高教社,2021)。陈强老师特别擅长深入浅出、直指人心地介绍数据分析原理,深受广大学生们的喜爱,其现场班常常人满为患、好评如潮。


授课大纲

第1讲 机器学习引论

(1)什么是机器学习

(2)机器学习的分类与术语

(3)案例:垃圾邮件过滤;手写体数字识别;图像识别;自动驾驶


第2讲 Python语言快速入门

(1) Why Python?

(2)安装Python与Spyder

(3) Python的模块(module)

(4) Python的对象(str, bool, list, tuple, dict, set)

(5) Python的函数(function)与方法(method)

(6) Numpy (ndarray), pandas(Series, Data Frame)

(7) sklearn(机器学习)与keras(深度学习)

(8) Python画图(Matplotlib, pandas, seaborn)

(9) Python面向对象编程


第3讲 数学回顾

(1)梯度向量
(2) 方向导数

(3)梯度下降

(4)向量微分

(5)最优化


第4讲 线性回归

(1) OLS

(2)过拟合与泛化能力

(3)偏差与方差的权衡

(4)交叉验证

(5) Python案例:多项式回归的过拟合;波士顿房价


第5讲 逻辑回归

(1) Logit

(2)几率比

(3)灵敏度与特异度

(4) ROC与AUC

(5)科恩的kappa

(6) Python案例:泰坦尼克号旅客的存活


第6讲 多项逻辑回归

(1)多项Logit

(2) Python案例:识别玻璃类别


第7讲 惩罚回归

(1)高维回归的挑战

(2)岭回归(Ridge Regression)

(3)套索估计(Lasso)

(4)弹性网估计(Elastic Net)

(5) Python案例:前列腺癌的影响因素


第8讲 K近邻法

(1)回归问题的K近邻法

(2)分类问题的K近邻法

(3) Python案例:摩托车撞击实验数据;鸢尾花品种的归类;威斯康辛乳腺癌的诊断


9讲 决策树

(1)分类树(Classification Tree)

(2)分裂准则(错分率、基尼指数、信息熵)

(3)成本复杂性修枝

(4)回归树(Regression Tree)

(5) Python案例:波士顿房价;葡萄牙银行市场营销


第10讲 随机森林

(1)集成学习(Ensemble Learning)

(2)装袋法(Bagging)

(3)随机森林(Random Forest)

(4)变量重要性(Variable Importance)

(5)偏依赖图(Partial Dependence Plot)

(6) Python案例:波士顿房价;声呐信号的分类


第11讲 提升法

(1)自适应提升法 (AdaBoost)

(2) AdaBoost的统计解释

(3)梯度提升法 (Gradient Boosting Machine)

(4) XGBoost算法

(5) Python案例:波士顿房价;过滤垃圾邮件;识别玻璃类别


第12讲 支持向量机

(1)最大间隔分类器(Maximal Margin Classifier)

(2)软间隔分类器(Soft Margin Classifier)

(3)支持向量机(Support Vector Machine)

(4)核技巧(Kernel Trick)

(5)支持向量回归(Support Vector Regression)

(6) Python案例:模拟数据;过滤垃圾邮件;识别手写数字;波士顿房价


第13讲  人工神经网络

(1)人工神经网络的思想

(2)感知机(Perceptron)

(3) 前馈神经网络(Feedforward Neural Network)

(4)激活函数(Activation Function)

(5)反向传播算法(Back-propagation Algorithm)

(6)随机梯度下降(Stochastic Gradient Descent)

(7)神经网络的过拟合与正则化

(8)卷积神经网络(Convolution Neural Network)

(9)深度学习的发展(循环神经网络、长短记忆模型、变换神经网络及ChatGPT)

(10) Python案例(sklearn与Keras):波士顿房价;过滤垃圾邮件;模拟数据;路透社新闻主题分类,手写数字数据集MNIST


第14讲 (Bonus Lecture) 机器学习在经管社科的应用

精读几篇在经管社科顶刊发表的经典机器学习论文


本次课程干货满满、奇货可居。

更难得可贵的是,主讲老师陈强教授具有丰富的教学经验、激情与魅力,是广大计量学子心目中真正的“计量男神”,尤其擅长化繁为简、直指人心,让学员们迅速上手新知识与技能。

跟着陈强老师,寒假入门机器学习,登堂入室,立竿见影,赶上时代的步伐!

这是一个令人激动的时代。人工智能与机器学习正在深刻地改变着几乎每个行业与学科(包括计量经济学),而机器学习正是未来世界的一块重要柱石。


课程咨询:

尹老师
电话:13321178792
QQ:42884447
WeChat:JGxueshu



机器学习课程FAQ:

Q:为什么机器学习这么“火”?

A:由于机器学习专注于预测,故在业界有很多应用。特别是最近二、三十年,机器学习(包括深度学习)发展很快,预测错误率不断下降(特别在图像识别,自然语言处理领域)。一般来说,机器学习的预测错误率可能比传统的统计或计量方法低一个数量级,比如前者的错误率为1%,而后者的错误率为10%。原因之一是,传统的统计或计量经济学十分强大模型的可解释性(interpretability),故大量使用线性模型,而现实世界存在很多非线性。


Q:既然机器学习的优势在于预测,而我作为经管或社科类的学者,只关心因果推断,有必要学机器学习吗?

A:事实上,因果推断的本质也是预测问题。根据鲁宾的因果模型(Rubin's Causal Model),因果效应通过“潜在结果”(potential outcome)来定义,即政策实施后的“观测结果”(observed outcome)与政策如果未实施的“反事实结果”(counterfactual outcome)之差。显然,反事实结果不可观测,只能在一定假设之下进行估计与预测。


Q:目前机器学习在计量经济学中有哪些应用?未来的发展趋势如何?

A:迄今为止(尤其是最近十年),机器学习已经在计量经济学中掀起了两波应用的浪潮。第一波浪潮为MIT的Chernozhukov教授等将Lasso系列的惩罚回归方法引入计量经济学,提出了post double selection lasso,IV lasso,double machine learning等适用于因果推断的机器学习方法。第二波浪潮为Stanford的Susan Athey教授等将基于决策树(tree-based)的机器学习方法引入计量经济学,提出了causal tree,causal forest,local linear forest与generalized random forest等方法(不少论文刚发表或仍为工作论文)。在可预见的将来,机器学习方法将加速融入计量经济学,成为计量经济学的重要组成部分,尤其在非参数估计与半参数估计领域。这是因为,传统的统计与计量的非参方法主要为基于核(kernel)的局部回归,很难推广到高维(因为存在维度灾难,curse of dimensionality),而机器学习方法(比如基于决策树的随机森林、梯度提升法)在高维空间依然适用,而且预测准确率更高。


Q:作为经管或社科类的学者或学生,我应该学机器学习吗?

A:在几年前,如果你知道Lasso,说明你是先进的;但现在已经很难这么说了。再过几年,如果你还不知道Lasso,则很可能说明你是落后的,因为关于Lasso的知识正在加速普及。类似地,如果你现在就知道随机森林(random forest),说明你是先进的;……。在科研的道路上,抢占先机无疑十分重要。你的选择决定了你究竟是先知先觉,还是后知后觉……


Q:我是文科生,能学会机器学习吗?

A:如果你学过统计学或计量经济学,应该很容易上手机器学习。在某种意义上,机器学习比计量经济学更简单。机器学习主要关心“算法”(algorithm),所用数学基本上就是最优化(optimization),一般并不使用统计学或计量经济学的那些复杂的渐近理论(asymptotics)。而且有些传统的统计与计量方法,也是机器学习的常用方法,比如OLS、Logit、多项Logit等,这些你本来就会啊。


抢先预约陈强老师12月18日独家专题直播:

欢迎转发,来直播间领取专属福利哦:)

以上图文为广告内容

计量与统计
经管之家旗下专业的计量、统计、实证相关学习平台。汇聚计量统计类学习资源、资料、干货、经验、技巧、公开课、答疑、论文发表、学习笔记等强货。提升你的计量统计力!
 最新文章