陈运森,周金泳,彭嘉续.中国上市公司分红的动因研究——基于机器学习的证据[JOL].中国工业经济,2024(05)155-173
引言
数据来源与变量定义
1、数据来源
实证结果与分析
1、不同机器学习方法下模型对分红行为的预测效果
结论与启示
1、结论
【Python 可以说是现在最流行的机器学习语言,而且你也能在网上找到大量的资源。你现在也在考虑从 Python 入门机器学习吗?本教程能帮你成功上手,从 零基础 掌握 Python 机器学习】
第一模块 Python基础知识串讲(4课时) 1、Python编程环境搭建(Anaconda安装;Python之Hello World;第三方模块的安装与使用) 2、Python基本语法(Python变量命名规则;Python基本数学运算;Python常用变量类型的定义与操作;Python程序注释) 3、Python流程控制(条件判断;for循环;while循环;break和continue关键字;嵌套循环与可变循环) 4、Python函数与对象(函数的定义与调用;函数的参数传递与返回值;变量作用域与全局变量;对象的创建与使用) 第二模块 Python科学计算(4课时) 1、Matplotlib的安装与图形绘制(数据可视化设计美学、Matplotlib常用函数简介与使用、设置散点、线条、坐标轴、图例、注解等属性;绘制多图;图的嵌套) 2、科学计算模块库(Numpy常用函数简介与使用;Pandas常用函数简介与使用;Scipy常用函数简介与使用) 3、实操练习 第三模块、Python统计分析与可视化(4课时) 1、统计学基础知识概述(描述统计、统计推断、时空统计) 2、统计数据的描述与可视化(数据的描述性统计:均值、中位数、众数、方差、标准差、极差、四分位数间距等;条形图、直方图、散点图、箱线图等) 3、概率分布与统计推断(离散概率分布:二项分布、泊松分布;连续概率分布:正态分布、均匀分布、指数分布;点估计与区间估计;最大似然估计与贝叶斯估计;假设检验:t检验、卡方检验、F检验;P值与显著性水平等) 4、回归分析(多元线性回归模型;最小二乘法估计;变量选择与模型优化;多重共线性与解决方法;Ridge回归;LASSO回归;ElasticNet回归等) 5、实操练习 第四模块、Python树模型(4课时) 1、机器学习概述、数据预测与预测建模 2、决策树模型(认识树模型;什么是信息熵和信息增益?ID3算法和C4.5算法的区别与联系);决策树除了建模型之外,还可以帮我们做什么事情? 3、随机森林模型(为什么需要随机森林算法?广义与狭义意义下的“随机森林”分别指的是什么?“随机”体现在哪些地方?随机森林的本质是什么?怎样可视化、解读随机森林的结果?) 4、Bagging与Boosting的区别与联系 5、AdaBoost vs. Gradient Boosting的工作原理 6、常用的GBDT算法框架(XGBoost、LightGBM) 7、SHAP法解释特征重要性与可视化(Shapley值的定义与计算方法、SHAP值的可视化与特征重要性解释) 8、部分依赖分析(部分依赖分析的原理、单变量影响分析、双变量交互分析) 9、实操练习 第五模块 因果推断与因果学习(4课时) 1、因果推断概述 2、因果推断范式(潜在因果推断、结构因果推断) 3、因果推断实现(传统方法、机器学习方法) 4、因果机制识别与发现(因果效应估计、非线性因果效应估计、因果作用未来预测) 5、时空因果推断(时空统计概述、时空因果推断、时空因果实现) 6、实操练习 第六模块 Python深度学习(6课时) 1、人工神经网络(人工神经网络概念、底层原理) 2、深度学习模型原理(人工神经网络基础、卷积神经网络、生成对抗神经网络、自编码技术、循环神经网络) 3、深度学习模型实现 4、案例演示与实操 第七模块 典型论文讲解与研究设计复现、答疑与交流(2课时) 1、树模型案例分析与实现 2、深度学习模型案例分析与实现 3、因果学习案例分析与实现 4、课程相关资料拷贝与分享 5、答疑与讨论(大家提前把问题整理好) |
课程特色:
提供ppt讲义+案例+数据+python代码