文献阅读《数据资产促进了中国企业人力资本水平提升吗?——基于文本分析法的经验证据》【南开管理评论】

学术   2024-09-27 08:03   江西  

大家好!本人是管理学在读博士生。一直想分享读博期间学习和生活的经历和感悟,希望能帮助到更多想要读博和正在读博以及科研工作的朋友们。

坚持每天读高水平的论文是博士生的基本要求,也是写好自己论文的基础。

欢迎大家关注,一起学习,一起进步!

       

          

 

今天分享一篇文章——数据资产促进了中国企业人力资本水平提升吗?——基于文本分析法的经验证据,来自《南开管理评论》2024年9月19日首发。

         

 

作者简介

苑泽明,天津财经大学会计学院教授、博士生导师、博士,研究方向为无形资产与数据资产;

于翔(通讯作者),南开大学商学院博士研究生,研究方向为数据资产与公司治理;

李萌,天津财经大学会计学院博士研究生,研究方向为数据资产与数字化转型;

刘冠辰,天津财经大学会计学院讲师、硕士生导师、博士,研究方向为数据资产、无形资产、企业创新。

   

一、引言

随着数据为企业带来越来越高的经济效益和社会价值,其已经具备在财务报告中确认为资产的条件,即数据资产。截至2023年,中国信息通信研究院云计算与大数据研究所发布的《数据资产管理实践白皮书》已更新至6.0版,标志着“数据资产”概念已得到广泛认可。从会计学角度看,数据资产是指由企业拥有或控制的,能够为企业带来未来经济利益的,以物理或电子方式记录的数据资源。

英国经济学家西尼尔提出人力资本是指企业员工所拥有的知识与技能,可以为企业内部各个环节带来创造性贡献,已经成为企业获取超额绩效和持续竞争优势的关键资源。然而目前中国企业的人力资本水平与发达国家还存在较大差距,使得中国长期陷于自主创新能力不强、市场竞争力较弱、行业重复建设严重、产业集中度低的困境,可见有效促进人力资本水平提升是实现我国经济健康可持续发展的关键一步。

习近平总书记指出,要“以信息流带动人才流,促进资源配置优化,促进全要素生产率提升”。近年来,全球经济不确定性增强、经济下行压力加大,中国企业将数字化发展作为企业突破逆境的首要战略行为,在这一战略实施过程中企业能够借助数据资产的高效流动改变人力资本这一要素在时空中的优化配置,进而提高竞争力,实现企业经济价值的增长。由此可见,数据资产对企业人力资本水平产生的影响,是国内政策制定者与学术界普遍关注的议题。    

         

 

边际贡献:

第一,在数据资产测度上,本文基于“数据资产获取—数据资产处理—数据资产应用”的底层逻辑选取种子词,运用Autophrase方法构建“数据资产”文本词典,同时使用Snownlp技术对文本信息进行情感分析,从而得到企业数据资产指标,为后续开展数据资产的实证研究提供借鉴;

第二,本文研究了数据资产对企业人力资本水平的影响效应,不仅基于人力资本视角拓展了数据资产的经济后果研究,还为人力资本水平的影响因素研究提供了新经验证据;

第三,基于“物质资本生产率与技术产出、知识多元化与信息共享水平、企业市值与企业声誉”的渠道机制,分析并检验了数据资产对人力资本水平的影响路径,部分地打开了数据资产与人力资本水平之间的作用“黑箱”;

第四,在研究拓展上,基于企业员工责任的履行情况,分析并检验了企业数据资产影响人力资本水平的有效边界,有助于明晰上市公司数据资产如何更好地发挥积极效应,为政策治理的差异化提供新思路。

         

 

二、理论分析与假设提出

1.数据资产对人力资本水平的影响

近年来,随着数据被纳入新型生产要素,微观企业的数据资产在经营管理中得到广泛应用,颠覆了传统商业模式和价值创造范式,其很有可能也会通过上述三个方面对企业的人力资本产生巨大影响,即数据资产能够改变企业内部的现有劳动力需求现状且赋能现有劳动力增质,同时吸引外部劳动力市场的人才关注。基于此,本文将围绕“淘汰”效应、“知识”效应以及“虹吸”效应,分析数据资产对企业人力资本水平的影响。    

首先,数据资产通过发挥“淘汰”效应影响企业人力资本水平。随着企业数据资产开发与应用越来越多,对企业员工层次的需求产生了根本性的变化,即对低水平员工的需求减少,高水平员工的需求大幅度提升。这是因为企业能够借助数据资产高效率地完成一系列简单重复性劳动,使得从事重复性工作的低水平员工逐渐被淘汰。同时,企业数据资产也催生了与其相互补的新岗位,这类新岗位会对人力资本提出更高层次的要求。企业大量数据资产的开发与应用使得生产活动离不开高水平知识型员工,数据资产与高水平员工的协同已经成为数据资产应用的关键一环。由此,企业内部高水平员工实现了对低质量员工的挤出,使得企业人力资本水平整体上得到提升。

其次,数据资产通过发挥“知识”效应影响企业人力资本水平。一方面,数据资产能够有效地转化为具有新的广度、深度和高度的内外部信息,为员工内化为知识创造前提条件,再由知识转化为人的智慧,“数据资产-信息-知识-智慧”的传导机制带来了员工综合素养与能力的持续提高,使得人力资本水平得以提升。另一方面,员工在数据资产应用的过程中会不断积累生产经验,使得员工对于数据资产的认知提升,习惯于用数据资产决策,逐渐成为拥有数据应用技能的高质量员工。并且通过组织培训及共享的形式使得这一数据生产经验在组织成员间扩散、溢出,不断扩大知识效应的范围,从而提升企业人力资本水平

最后,数据资产通过发挥“虹吸”效应影响企业人力资本水平    

数据资产能够对传统企业进行全方位、多角度和全链条的改造,通过提高管理效率、降本增效、促进技术创新、改善经营与商业模式、提升客户体验以及精准营销等途径使得经济利益持续流入企业,推动传统企业不断转型和升级,使得企业市场竞争地位提高,树立良好的企业形象,获得社会各界的认可与支持,市场对其未来发展同时持有正面预期。因此企业也会吸引创新型、复合型、高技术、高层次和高质量的人才流入企业,高质量员工在企业劳动力结构中所占的比重随之增加。由此,数据资产吸引了高质量员工流入企业,促进了人力资本水平的提升。

基于此,本文提出假设1

H1:企业数据资产会促进人力资本水平的提升。

         

 

2.数据资产促进人力资本水平提升的具体作用机制

(1)人力筛选机制

数据资产可以促使企业提升“物质资本生产率与技术产出”,进而提升企业人力资本水平。第一,企业利用数据资产能够将设备状态、生产经营、产品销量以及市场占有率等关键业务指标数据以最直观的方式呈现,辅之以“数据+算法”的科学决策模式,企业可以实施定制化生产经营,可以及时、动态地采取相应措施进行优化和改进物质资本配置,提高物质资本生产率。随着物质资本生产率的提升,与可能会带来生产过程中的错误、延误和质量问题的低水平员工相比,企业会倾向于使用物质资本来保证生产过程的低成本、高质量以及稳定性,使得部分低质量员工逐渐被物质资本所替代。第二,企业通过挖掘与分析数据资产中的模式、趋势和洞见,企业准确把握技术前沿和技术开发机会,制定清晰的技术发展路线以及创造良好的技术创新生态,帮助企业能够低成本地获取技术产出的最优路径,增强技术产出水平。而技术的创新与应用要求员工具有较好的专业素养以及丰富的知识储备,会促使企业增加对高质量员工的需求,企业内部低水平劳动占比不断下降,从而提升人力资本水平。基于此,本文提出假设2。    

H2:数据资产通过提高物质资本生产率与技术产出进而提升人力资本水平。

(2)知识吸收机制

数据资产能够提升“企业知识多元化与信息共享水平”,进而提升企业人力资本水平。第一,数据资产有效挖掘和利用转化为具有可实施性、价值性、原创性的知识以及形成可视化的知识图谱,从而增强了企业获取知识的广度和宽度。企业员工不仅能够了解自己领域的知识,还能够掌握其他相关领域的知识,不断拓宽知识储备,进行持续学习和知识更新,使得企业员工的知识水平和综合素养得以增强,从而提升企业人力资本水平。第二,企业通过建立统一且一致的数据资产平台,克服了传统行政管理边界带来的信息阻滞性,员工之间的信息沟通逐渐实现了实时性和精准性。可见,数据资产为企业信息共享创造了有利条件。企业员工由此可以更广泛且直接地接触到新的知识和观点,持续进行知识的讨论,提升个人的综合能力和潜力,从而提高企业人力资本水平。基于此,本文提出假设3。    

H3:数据资产通过提高企业知识多元化与信息共享水平进而提升人力资本水平。

(3)市场吸引机制

数据资产可以提高“企业市值与企业声誉”,从而提升企业人力资本水平。第一,当企业拥有较多数据资产时,搭建基于数据分析的决策模型与管控系统,进而提升决策的精准性与时效性,改善企业信息传递和运营决策,驱动企业财务绩效的增长,企业的市场价值得到提升。第二,数据资产越多的企业向外界传递企业内部更安全、可靠和透明的运营数据信息,树立良好的形象,企业声誉得以提升,契合了国家发展的建设蓝图,提升企业未来的发展潜力,实现高质量发展。当企业市值与企业声誉不断攀升时,会吸引有才华的高端人才加入企业,使得企业人力资本水平提升。基于此,提出假设4。

H4:数据资产通过提高企业市值与企业声誉进而提升人力资本水平。

         

 

三、研究设计

(一)变量设计

1.被解释变量:企业人力资本水平。    

本文将采用企业中本科及以上学历员工人数占比来定义企业人力资本水平(HC)。本科及以上学历员工人数占比越高,企业的人力资本水平越高。

2.核心解释变量:数据资产

本文将依托于机器学习算法,采用“种子词+Autophrase相似词扩+Snownlp情感极性分析”方法,得到“数据资产”文本词典的词频,从而度量企业数据资产水平。构建企业数据资产水平指标的步骤具体如下:

第一,构建底层逻辑并选取种子词。根据数据资产价值链,团队构建了“数据资产获取—数据资产处理—数据资产应用”的底层逻辑,并结合数据资产相关官方文件和研究报告,团队成员从企业年报中手工筛选出能够分别代表“数据资产获取”、“数据资产处理”以及“数据资产应用”三个层面的种子词。

第二,扩展种子词形成“数据资产”文本词典。为了进一步挖掘上市公司年报中能够体现数据资产的高质量词汇,使用Autophrase相似词扩充方法对第一步得到的全部种子词进行扩展,最终形成了“数据资产”文本词典;

第三,计算词频和情感极性分析。采用Python技术计算“数据资产”文本词典中各词汇的词频,同时考虑到中文语言在财经语料下的表达颇为复杂,采用Snownlp技术对年报中出现的每一个“数据资产”文本词典的词汇进行情感级性分析,最终能够得到各词汇经情感极性分析调整后的词频;

第四,构建数据资产指标。考虑到不同上市公司的年报编制在内容展示与页码要求上存在差异,本文将经情感极性分析调整后的正向与中立的各词汇词频之和除以年报总词频,得到企业数据资产指标(DA)。

同时借鉴乔朋华等的思路,为了方便表述,本文将该指标乘以1000。且数值越大,代表企业数据资产水平越高。    

3.控制变量。

企业层面控制了净资产收益率(ROE)、公司规模(Size)、现金净流量(Cashflow)、资产负债率(Lev)、公司年龄(Listage)、资本支出(Capex)以及董事人数(Board)变量。其次,员工特征的平均工资(Lnwage)、劳动生产率(Lnlabpro)和员工人数(Lnperson)作为控制变量。此外,还控制了地区层面和行业层面的影响,选取了经济发展水平(GDP)、教育投入水平(Education)、行业竞争程度(HHI)和行业规模(INS)作为控制变量。 

 

(二)模型设定

为了检验假设1,本文构建了模型(1):

    

 

(三)样本选择与数据来源

本文将2009年—2020年沪深A股上市公司数据作为研究样本,依次剔除了ST和PT状态的公司、保险类和金融类公司以及关键指标缺失的公司,并且对连续型变量进行了1%和99%的缩尾处理,最终得到了27733个观测值。数据资产的相关数据来自深圳和上海证券交易所官方网站,人力资本的相关数据来自Wind数据库,其余数据均来自于CSMAR数据库。

         

 

四、实证分析    

1.基准回归

实证结果如表3所示。首先,当只控制企业固定效应时,第(1)列中数据资产对企业人力资本水平的系数为1.5054,在1%的水平上显著为正;其次,当控制行业、企业和时间固定效应时,第(2)列的结果显示数据资产的系数在1%的水平上显著为正;最后,第(3)列在继续加入控制变量进行回归后,数据资产系数为0.4569,依然在1%的水平下显著为正。

在经济意义上,第(3)列结果显示数据资产的标准差每增加1%,企业人力资本水平相对于其平均值会提升3.1616%。由此,假设1得到了验证。

表4所示,可以发现数据资产能够负向显著影响企业的本科及以下人数占比,正向显著的影响本科人数占比和硕士人数占比,但对于企业的博士人数占比的提升作用并不显著。

         

 

2.数据资产影响企业人力资本水平的机制检验

本文借鉴Aguinis等、文雁兵等以及牛志伟等的研究。首先,补充验证中介变量对被解释变量的影响;其次,展示通过Bootstrap法计算的基于百分比的置信区间。模型如下:    

首先,对于人力筛选机制。本文借鉴Heieh等的方法,将固定资产净额作为物质资本,用营业收入与固定资产净额的比值衡量物质资本生产率(Capital)。且值越大,代表物质资本生产率越高。参考许秀梅的做法,本文选取专利、非专利技术、系统与软件、技术使用权的账面净值汇总数测度技术产出(TC),同时计算了其与总资产的比值并做了标准化处理,以降低量纲差异带来的影响

表5第(2)列中数据资产对物质资本生产率的回归系数为 0.4193,并且通过了 5%的统计显著性检验,第(3)列和第(4)列中物质资本生产率对人力资本水平的回归系数分别为 0.0620、0.0614,通过了 1%的统计显著性检验。这说明数据资产通过提高物质资本生产率,进而促进企业人力资本水平提升。第(6)列中数据资产对技术产出的回归系数为 0.0034,并且通过了 5%的统计显著性检验,第(7)列和第(8)列中技术产出对人力资本水平的回归系数分别为 1.9065、1.8289,均通过了 1%的统计显著性检验。这说明数据资产通过提高企业技术产出,进而促进企业人力资本水平提升。此外,本文还进行了 Sobel 检验和 Bootstrap 检验。其中,Sobel 检验的 Z 值统计量均通过了 1%的统计显著性检验,1000 次 Bootstrap 抽样检验结果可以看出,置信度为95%的中介效应置信区间没有包含 0,分别为[0.0909,0.1302]、[0.0911,0.1325],以上结果再次说明物质资本生产率与技术产出起到了中介效应。由此,假设 2 得到了验证。    

         

 

其次,对于知识吸收机制。本文参考Carnabuci等使用的Teachman熵指数测度企业知识多元化(Knowl)。本文参考宋德勇等的思路,基于上市公司年报进行文本分析,从中获取企业主动披露的信息共享水平(IS),参考胡楠等的做法进行了优化具体步骤为:第一,将“信息共享”作为种子词汇;第二,借助深度学习技术手段与Word2Vec神经网络模型,得到“信息共享”的相似词词集,从而完成词典构建;第三,挖掘上述得到的词集在年度财务报告中出现的词频,并且进行对数化处理。且值越大,代表企业的信息共享水平越高。

表 6 基于“知识多元化和信息共享水平”的路径进行识别检验,结果解释如表5。

最后,对于市场吸引机制。借助个股年收盘价与发行总股数相乘并且对数化处理来衡量企业市值(MV)。借鉴管考磊和张蕊(2019)的研究,对各利益相关者评价企业声誉的12个子指标进行因子分析,从而计算企业声誉总得分,并且将该总得分从低到高依次分为十组,赋值从1到10,得到企业声誉指标(Rep)

表 7 基于“企业市值与企业声誉”的路径进行识别检验。结果解释同上。

4.稳健性检验

(1)PSM—DID 法

2013 年,中国国务院发布了“宽带中国”战略实施方案,分批次选取了 120 个城市作为该战略的示范城市。考虑到“宽带中国”战略分三批实施,本文采用多时点 PSM-DID 模型进行检验。Treat 为政策虚拟变量,值为 1 代表了企业所在城市为示范城市,反之为 0;Post 为时间虚拟变量,值为 1 代表了企业所在城市处于实施该战略的当年或者以后年份,反之为 0,模型见式(6)。   

结果如表 9 第(1)列所示,可以发现 Treat×Post 的系数在 5%的显著性水平下为正,这说明了数据资产可以提升企业人力资本水平,该结论与前文结论一致。

(2)工具变量法

参考肖土盛等的做法,选取的工具变量为同年度同行业剔除自身企业后的数据资产平均值(IV)。回归结果如表 9 第(2)列和第(3)列所示。可以发现本文选取的工具变量通过了弱工具变量检验和不可识别检验,且在第一阶段中,工具变量对企业数据资产水平的影响系数 1%的水平下显著为正,即工具变量能够对企业数据资产水平产生影响,说明工具变量选取良好。在第二阶段回归中,可以看出企业数据资产显著提升了人力资本水平,研究结论仍然成立。

(3)滞后自变量回归法    

本文又检验了核心解释变量的滞后对企业人力资本水平的影响,滞后一期和滞后两期的数据资产对企业人力资本水平的回归系数均显著为正,结论与前文结论一致。

(4)控制地区层面固定效应

在控制了年份、行业与企业固定效应的基础上,本文又分别控制了省份固定效应(Province)与城市固定效应(City),数据资产对企业人力资本水平的系数依然显著为正。

(5)变量度量方式更替

对于被解释变量而言,本文将硕士及博士学历员工比例作为衡量企业人力资本水平的指标,另一方面,根据企业员工类别明细,将技术性人员占比作为人力资本水平测度的替代性指标研究结论仍然成立。

对于核心解释变量而言。将正向情感的各词汇词频之和在年报总词频中的占比作为企业数据资产水平的替代指标,再次进行回归,研究结论仍然成立。

(6)子样本回归

第一,本文将样本期间进一步缩减至 2013―2020 年。。第二,本文剔除了直辖市的数据重新进行子样本检验。第三,数据资产较多的分布于信息技术业、传播与文化产业、综合类以及批发和零售贸易等行业,将这些行业筛选进行实证检验。回归结果仍然成立。

(7)更换聚类稳健标准误的维度

本文又更换了聚类(Cluster)的维度,从基于企业层面的聚类处理变为基于行业层面的聚类处理,出数据资产水平的系数显著为正,研究结论仍然成立。

         

 

五、进一步研究    

1.基于履行员工责任的异质性

参考顾雷雷等的做法,本文使用和讯网发布的员工责任得分度量企业员工责任履行水平(ER),用员工绩效、员工安全、员工关爱得分分别度量企业员工绩效责任履行水平(PS)、员工安全责任履行水平(SS)、员工关爱责任履行水平(ECS)。然后基于员工责任履行总体水平与其所含的三个维度实证检验数据资产影响企业人力资本水平的非对称效果,实证结果如表 13 所示。

回归结果显示,企业数据资产与员工责任履行水平的交互项(DA× ER)、数据资产与员工绩效责任履行水平的交互项(DA×PS)、数据资产与员工安全责任履行水平的交互项(DA×SS)以及数据资产与员工关爱责任履行水平的交互项(DA×ECS)的回归系数均为正且显著,这意味着在越高的员工责任履行水平条件下,数据资产对人力资本水平提升的驱动效力更为明显,且员工责任履行水平的三个维度,即员工绩效责任、员工安全责任与员工关爱责任履行水平同样发挥着正向显著的调节效应。其中,数据资产与员工绩效责任履行水平的交互项(DA×PS)的系数最大,为 0.2230。

   

2.最终经济后果检验

本文参考了刘斌等的方法,选择了范霍恩可持续增长模型度量企业可持续发展能力(SGR)。实证检验结果如表 14 所示,第(1)列中数据资产对可持续发展能力的影响系数为 0.0309,在 5%的水平下显著为正,说明了企业数据资产水平能够显著提升企业的可持续发展能力。此外,第(3)列和第(4)中人力资本水平对可持续发展能力的影响系数在 5%的水平下显著为正,且第(4)中数据资产的系数小于第(1)列中数据资产的系数,这表明人力资本水平在数据资产与可持续发展能力二者之间发挥了部分中介效应。同时也通过了 Sobel 检验和 Bootstrap 检验。

         

 

六、研究结论与启示

(一)研究结论

第一,数据资产是提升企业人力资本水平的有效驱动力,此结论在经过稳健性检验和内生性检验后依然成立。    

第二,数据资产应用能够显著提高物质资本生产率与技术产出、知识多元化与信息共享水平、企业市值与企业声誉,这些影响都有助于企业人力资本水平的提升。

第三,数据资产对员工责任履行水平高的企业的人力资本水平驱动效力最为明显。从员工责任履行的三个维度来看,这一结论依然成立,即对于员工绩效责任、员工安全责任以及员工关爱责任履行水平高的企业而言,数据资产对人力资本水平的提升作用尤为显著。

第四,数据资产能够通过提升企业的人力资本水平,进而提升企业的可持续发展能力。

(二)政策启示

对于企业而言:第一,应当加强开发、分析与应用数据资产,通过业务数据化和数据业务化实现业务模式的优化和升级,发挥知识红利,吸引高质量员工,以促进企业人力资本水平的提升。第二,打通数据资产的传导渠道,构建和完善多元化的企业数字化创新生态,形成企业先进技术与高层次人才匹配机制,助力企业市场价值与企业声誉提升,从而吸引当地的高学历科研人员和技术人员,增强数据资产对企业人力资本的驱动效率。第三,企业应结合员工责任履行现状,实施差异化的数据资产发展战略。

对于政府部门而言:第一,鼓励企业积极参与公开信息共享或市场交换,与高等院校、技术研究机构和数字化信息平台等主体建立联系,消除政府部门间和行业体系间的数据信息孤岛,整合数据资产优势,实现数据资产的有效整合和运用。第二,为了促进微观企业利用数据资产实现高质量发展,政府应迅速建立数据信息财产确权制度,加速制定数据信息交换网络平台的行业规范和监督管理规定,引导数据信息集成公司利用这些网络平台开展数据信息交换,建立一个及时回应供需双方要求的网络平台,以满足企业数据信息交换的需要。第三,相关主管部门应积极地推动“数据资产”会计科目的实施,加速完善上市公司数据资产信息披露制度,以便更好地反映数据成为新型要素的经济效益,并且有效地引导公司数据资产信息披露,尽量减少信息披露的随意性,以增强数据资产度量的可靠性。    

         

 

   

我爱读paper
经济管理类论文推荐与解析;读博生活分享
 最新文章