​机器学习如何预测企业分红?《中国工业经济》这篇文章绝对是机器学习研究的典范之作!

科技   2024-12-28 09:50   四川  
原文信息:陈运森,周金泳,彭嘉续.中国上市公司分红的动因研究——基于机器学习的证据[J/OL].中国工业经济,2024,(05):155-173[2024-12-23].


作者简介


陈运森,中央财经大学发展规划处(学科建设办公室)处长(主任),会计学院教授,资本市场监管与改革研究中心主任。2020年度国家级高层次人才、财政部全国高端会计人才、甘肃省飞天学者讲座教授等。研究成果发表于Journal of Accounting and Public Policy、Journal of Business Finance and Accounting、Journal of Corporate Finance、《经济研究》《管理世界》《经济学(季刊)》《管理科学学报》等期刊。曾获得霍英东教育基金会高校青年教师一等奖、教育部高等学校科学研究优秀成果奖(人文社会科学)著作论文奖二等奖及青年成果奖、北京市哲学社会科学优秀成果奖二等奖、财政部中国会计学会优秀论文一等奖、北京市师德先锋、北京高校青年教学名师、北京市课程思政教学名师、北京高校青年教师教学基本功大赛最受学生欢迎奖等荣誉。

周金泳(中央财经大学会计学院博士生)

彭嘉续(中央财经大学会计学院会计信息化系讲师)


Part01 引言
近年来,中国证券监督管理委员会反复强调要“建设以投资者为本的资本市场”,而“活跃资本市场,提振投资者信心”也是2023年8月中共中央政治局会议对资本市场工作的重要部署。优化和完善分红制度体系建设,也是相应2024年《政府工作报告》强调的“完善中国特色现代企业制度,打造更多世界一流企业”的重要一环。本文的研究目标是评估不同类别公司特征对中国资本市场分红实践的预测能力,进而识别出影响中国特色现代资本市场中上市公司分红行为的重要指标,采用了多种先进的机器学习方法对企业分红动机展开了探索性分析。
   
Part02 贡献
本文主要有以下三点贡献:

一是理论层面。本文深入剖析了多维度公司特征对中国上市公司分红行为预测能力的相对差异,进而识别出最能揭示分红行为背后逻辑的关键指标。这有助于结合现有股利理论,从更加综合的视角理解上市公司分红决策机制。
二是方法论层面。本文创新性地将机器学习方法应用于企业分红行为研究,并对比了不同机器学习方法对预测分红行为这一研究问题的适用性。机器学习出色的拟合能力使其能够精准捕捉变量间的复杂关系,并结合其对变量重要性的深入分析能力以及样本外的泛化能力,能够有效克服多元线性回归在进行高维建模和预测性分析时的局限性。
三是从实践和政策启示的角度。企业分红是从投资端活跃资本市场的重要手段,本文的研究有助于监管部门更具针对性地督促上市公司开展分红,完善上市公司常态化分红机制的目的。也为监管机构在优化完善《关于加强上市公司监管的意见(试行)》《现金分红指引》等分红相关监管政策时提供了更加直接具体的实证依据,为更好地实现“建设以投资者为本的资本市场”目标提供了政策启示。

Part03 研究设计

(一)研究方法

本文旨在比较不同公司特征对于公司分红行为预测能力的差异,属于预测性研究。根据“没有免费午餐定理”,在未经检验的情况下难以得出对于某一研究问题最适宜的研究方法。基于此,本文将全面评估多种主流机器学习方法对公司分红行为的预测效果,采用的有LASSO、决策树、支持向量机、渐进梯度回归树和随机森林等机器学习方法。

(二)模型性能评估方法

本文从解释能力以及预测精度两个维度来综合考量模型性能。本文使用了样本内拟合优度来考察模型的解释能力、使用样本外拟合优度可解释方差考察模型对公司分红行为的预测能力、选取样本外均方误差衡量模型预测值与实际值之间的偏离程度以及使用平均绝对误差绝对中位差评估模型预测公司分红行为时的准确性。

结合与股利理论相关的实证研究以及中国资本市场分红实践,本文尝试探究第一类和第二类代理问题相关特征、生命周期特征、公司税率特征、融资需求特征和投资者情绪特征对公司分红行为预测识别能力的差异。通过归纳整合各类指标,本文能够从一个较为综合的视角分析影响现金分红行为的众多特征,进而着重分析影响公司股利支付行为的关键指标。表1为变量定义。


Part04 实证结果
(一)描述性检验    

(二)不同机器学习方法下模型对分红行为的预测效果
表2第(1)列显示,支持向量机、渐进梯度回归树和随机森林的样本内拟合优度明显高于多元线性回归,说明以随机森林为代表的集成学习方法能够获得比线性研究方法更高的样本内拟合效果;第(2)、(3)列的结果表明,随机森林具有最高的样本外拟合优度和可解释方差,渐进梯度回归树的模型表现也较好;第(4)列的结果显示,集成学习方法在进行样本外预测时的均方误差较低。第(5)列的平均绝对误差和第(6)列的绝对中位差也展现了类似的结果。集成学习方法能够灵活地采用更合适的函数形式对数据进行拟合,从而构造出预测能力更强、精度更高的企业股利分配预测模型

(三)不同类别公司特征对公司现金分红行为预测能力的表现差异 

本文以公司基本面特征作为基准模型,比较在基准模型中加入不同类别公司特征时的模型拟合效果,并以包含所有类别公司特征时的模型(综合模型)结果作为对照,结果如表3所示。生命周期理论特征的加入显著提升了基准模型的表现,而融资需求特征和投资者情绪特征带来的预测性能提升幅度相对较小。这表明以往研究中关注较少的生命周期特征和公司税率特征对公司现金分红行为的影响程度反而较大,而两类代理问题相关特征、融资需求特征和投资者情绪特征对股利支付行为的预测解释能力相对较弱

(四)不同特征变量对公司分红行为预测能力的差异
梯度回归树和随机森林在预测公司分红行为方面展现出了显著的优势,本文基于这两种集成学习算法深入探讨了不同特征变量对公司分红行为预测效果的影响差异。结果如表4所示,表明尽管已有研究发现再融资动机(Refinance)和控股股东股权质押比例(Pledge)等指标对公司股利分配具有一定的解释力,但这些指标的相对重要性较低,说明其对公司股利分配行为的实际预测能力不佳。

考虑到不同类别特征数量的差异可能影响结论,本文选取各自类别中相对重要性最大的一个特征加入基本面特征中,重新训练模型并计算各类别特征的相对重要性。结果表明,尽管随着时间推移,不同类别的公司特征累计相对重要性有所变动,但整体而言,生命周期特征和公司税率特征的相对重要性仍显著高于其他类别的公司特征。结果如附表4所示。


(五)重要特征对公司分红行为的预测模式

本文采用累积局部效应图(Accumulated Local Effects Plot,ALE图)研究单个变量对股利支付水平的预测模式

1.留存收益资产比

由图1得知,随着留存收益资产比的增加,公司股利支付水平呈现出先缓慢增加,然后迅速增加,再恢复缓慢增加的趋势。这表明,公司在成立早期倾向于支付较少的股利,可能是为了留存更多的资金以供自身发展;随着公司逐渐步入成熟期,其发放的股利水平也越来越高;当公司处于成熟期乃至衰退期时,其会选择较为稳健的股利政策并发放较高的股利。这一模式与《现金分红指引》中对于企业不同发展阶段提出的差异化分红政策思路一致,体现了《现金分红指引》相关规定的合理性

2.实际税率和纳税波动性

由图2所示,中国上市公司的实际税率与股利支付水平之间呈现V型关系,意味着实际税负较低或较高的企业更倾向于支付股利。对于税负较轻的企业而言,这种低税负状态不仅意味着企业能够拥有更多的自由现金流来支持股利的支付,而且还可能有助于降低企业的权益资本成本;对于税负较高的企业,尽管高税负会压缩企业的税后利润和现金流,但此时公司也可能通过支付股利尽可能维持与投资者的关系。

由图3可以看到,随着公司纳税波动性增加,公司的股利支付水平会迅速降低,然后呈现出缓慢增加的趋势,这意味着当公司的税后现金流不稳定时,公司会更可能维持一个较低的股利支付水平,从而避免后续因股利支付下降而导致负面市场反应的可能。随着纳税波动性持续处于一个较高的水平,公司可能会逐渐适应这一波动,进而逐渐调整其财务政策,开始提高股利支付水平。

3.其他应收款资产比

其他应收款资产比反映了第二类代理成本。图4的结果表明其他应收款资产比越高,股利支付水平越低,这表明大股东可能通过资金占用等方式侵害中小股东利益,同时也导致了低派现股利政策

4.融资约束程度

本文采用SA融资约束指数衡量公司的融资约束程度,指数为负数,值越小,融资约束程度越大。结果如图5所示,其横轴为经标准化处理后的SA指数。融资约束程度与公司股利支付水平呈现出V型关系:一方面,在公司面临严重融资约束的情况下,公司仍然会维持较高的分红水平,可能是由于此类企业急需融资,而半强制分红政策规定了再融资所需的最低分红比例,这一发现支持了He et al.(2016)的结论;另一方面,当公司的融资约束程度相对较低时,同样会倾向于发放更多的股利,这可能是由于此时企业的现金流较为充裕,公司有足够的资金发放股利。

5.上一期股利支付水平

由图6可以看到,上一期股利支付水平越高,公司当期股利支付水平也越高,这与理论预期一致,说明公司股利支付行为具有一定的持续性和稳定性

6.其余特征变量

结果显示,除虚拟特征变量以及部分连续变量外,其余特征与公司股利支付水平之间的关系呈现出非线性的特点,这表明线性假定不能完全解释特征变量与公司股利水平之间的相关关系,也在一定程度上解释了为何多元线性回归和LASSO等线性研究方法在公司分红行为的预测识别效果方面不如随机森林等非线性研究方法。

完整结果见原文附件

(六)进一步分析

1.股利支付行为在分红政策变更前后的差异

为便于探究分红政策变更前后公司分红行为的差异,本文将样本划分为以下三个子样本,分别为2007年、2008—2011年,2013年及之后。

2.公司分红行为在不同现金流状况企业间的差异

基于自由现金流的行业年度中位数将企业分为现金流状况好与现金流状况差的两组子样本,进而分析这两类企业在公司分红行为方面是否存在差异。结果显示,自由现金流这一指标本身在现金流状况好的企业中具有较高的相对重要性,而其他应收款资产比在现金流状况较差的企业中的相对重要性较高,并且此时自由现金流和其他应收款资产比的累计局部效应与前文结果基本一致。

3.公司分红行为在不同股权性质企业间的差异

结果表明,相比于国有企业,非国有企业中其他应收款资产比对股利支付水平的预测效果更为显著。

4.投资者股利情绪对分红行为的影响

结果显示,相比于现金股利情绪低的年份,其他应收款资产比在现金股利情绪高的年份具有更高的相对重要性,意味着大股东对于公司的资金占用行为在股利情绪高的年份更能影响企业股利支付水平

5.影响公司股利支付意愿的主要特征

以公司是否发放股利作为响应变量,进一步探究影响公司股利支付意愿的关键因素。结果表明,经营活动现金流和分析师跟踪人数对公司发放股利意愿的预测能力较强。分析师跟踪人数更多、经营活动净现金流越高的企业会更倾向于分红。因为分析师的关注有助于提高公司信息透明度,从而推动提高企业进行分红的意愿;而经营活动现金流量高的企业往往具有更强的盈利能力和资金实力,也更有能力进行分红。



(七)稳健性检验

1.变更响应变量

以股利收益率作为替代性响应变量,结果如附表11表明,替换响应变量后的研究结论与主检验一致。

2.变更样本划分方法

结果于附表12,以渐进梯度回归树和随机森林为代表的集成学习方法对于股利支付行为的预测识别能力仍显著高于多元线性回归,本文的研究结论保持不变。

3.关于累计局部效应图的稳健性检验

使用部分依赖图分析特征变量对于响应变量的影响模式,结果显示,部分依赖图与累计局部效应图的图像模式基本一致,进一步增强了结果的稳健性。下列出留存收益资产比的部分依赖图。

4.变更样本期间

将样本起点调整至2007年,结果如附表13,变更样本期间后的结果依旧稳健。


Part05 结论与启示

(一)研究结论

1.渐进梯度回归树和随机森林在预测上市公司股利支付行为方面表现最佳,模型性能显著优于多元线性回归。

2.生命周期特征和公司税率特征对公司分红行为的预测能力最强,而融资需求特征和投资者情绪特征的预测效果相对较差。

3.不同公司特征变量中,上一期股利支付水平、留存收益资产比、实际税率等对股利支付水平的预测能力较强。

4.公司股利支付行为的影响因素在不同政策环境和企业特征间存在异质性。

5.股利迎合策略和投资者的现金股利情绪是影响公司现金分红行为的重要因素。

(二)政策启示

1.监管部门应关注影响公司股利支付行为的关键特征,制定更为精准的股利监管政策。

2.监管机构应对资金占用行为保持警惕,持续打击,以缓解代理问题,为企业创造更健康、公平的分红环境。

3.监管部门可以进一步细化对不同类型企业的分红要求,促进合理分红,防止企业过度占用资金,损害投资者利益。

4.加强对处于不同发展阶段企业的分级监管,推动上市公司分红行为的规范化、透明化,提升资本市场的稳定性和健康性。

5.投资者可以加强对影响企业现金分红水平指标的关注,精准识别出符合自身分红预期的企业,优化投资组合。

顶刊数据展示

高级、永久会员数据展示

向下滑动查看






 

数据皮皮侠
社科数据综合服务中心,立志服务百千万社科学者
 最新文章