数据分析 | 面板向量自回归模型 PVAR

文摘   2024-12-08 19:00   马来西亚  

面板向量自回归模型


面板向量自回归(Panel Vector Autoregression, PVAR) 是一种结合面板数据和向量自回归(VAR)模型特性的方法,用于分析多个时间序列变量之间的动态关系,尤其适用于多组个体(如国家、公司、地区)的数据,广泛用于经济学、社会科学和金融领域。


简要介绍


面板向量自回归(PVAR)模型是在传统向量自回归(VAR)模型的基础上发展而来的,它是一种基于面板数据的改进模型。PVAR模型由Holtz-Eakin等于1988年提出,其主要特点是允许存在不可观测的个体异质性及时间效应,同时能有效控制由空间和个体异质性导致的估计偏差。与传统的多元回归模型相比,PVAR模型的优势在于将所有变量视为内生变量,从而避免了因主观决策而导致的模型不确定性,并能够灵活识别变量及其滞后变量之间的动态关系。

PVAR模型具备较高的预测能力,并能够规避多元回归模型中常见的多重约束影响,使建模结果更具科学性。此外,PVAR模型的参数估计过程相对简单,计算难度较低,因此不仅在经济学领域得到了广泛应用,还被广泛运用于环境科学、公共管理、计算机科学和工程学等多个学科。

例如,一些研究结合PVAR模型与其他分析方法,探讨了生态效率、性别不平等与经济增长等问题。这表明,PVAR模型不仅具有广阔的应用前景,也为不同领域的学术研究提供了强有力的工具。


实施步骤


(1)单位根检验,用于检验相关变量的平稳性,以确保其适合PVAR模型;

(2)协整检验,以确定变量之间是否存在长期均衡关系,尽管一些研究可能省略此步骤;

(3)滞后选择,通过选择最佳滞后期来构建PVAR模型,从而捕捉变量的动态特性;

(4)脉冲响应分析,通过脉冲响应函数观察变量之间的动态相互作用,分析一个变量的冲击如何随时间影响其他变量;

(5)方差分解,用于量化一个变量的波动在多大程度上可以通过其他变量的影响来解释,以了解变量间的相对重要性。

此外,一些研究还在这些步骤中加入了Granger因果关系检验,以分析变量之间的因果关系。在实际操作中,学者们通常使用Stata软件完成上述步骤,从而深入研究变量之间的动态关系和相互作用。


设定及分类


Yit为个体 it时期的 M个相互依赖的内生变量组成的 M×1向量,Xit为个体 it时期的 N个外生变量组成的 N×1向量,ϵitM×1的随机扰动向量。短期回归系数分别用 αijβij表示,分别为 M×M矩阵和 M×N矩阵。PVAR模型的基本形式可表示为:



PVAR模型的主要特点:

  1. 动态相互依赖性:所有个体的内生变量滞后项会进入每个内生变量的方程,体现系统内变量之间的动态关系。

  2. 静态相关性:扰动项可能具有横截面相关性,表现为个体之间的静态依赖。

  3. 横截面异质性:回归系数及随机扰动项可能因个体的差异而不同,体现系统的异质性。

根据不同的研究需求和数据特点,PVAR模型可以进一步分类为以下类型:

1. 微观与宏观PVAR模型:基于面板数据的类型,宏观PVAR模型适用于跨国或跨区域的宏观数据,微观PVAR模型则适用于企业或组织等微观层面的时间序列数据。

宏观公式:

微观公式:

当研究范围较小或为岛国时,可以建立不具有动态相关性的PVAR模型,如模型(4)所示:


2. 均质与异质PVAR模型:如果模型的回归系数在所有个体中保持不变,则为均质模型;若随个体变化则为异质模型。

均质模型形式可表示为:

如果PVAR模型的斜率系数随着个体的变化而变化,则该模型称为异质性PVAR模型:



3. 稳定与误差修正PVAR模型:根据伴随矩阵的特征根是否落在单位圆内,若特征根均位于单位圆内,模型为稳定模型;否则为误差修正模型。




PVAR 模型的估计方法

1. 传统估计方法

最小二乘法(LSE):适用于传统参数计量经济模型。  

广义矩法(GMM):在面板数据中广泛应用,但存在单位根问题时受限。  

最大似然估计法(QML):适用于平稳、一阶单整或协整情况下,能提供相容有效的估计。

2.参数数量与数据拟合挑战

参数数量计算公式:  



其中k为内生变量数量, p 为滞后期数,N 为个体数量。  

数据量的增加有助于揭示规律,但参数过多可能导致估计误差增大。

3. 分层贝叶斯方法的应用与改进  

提出背景:为克服LSE、QML和GMM方法的局限,基于贝叶斯原理引入分层贝叶斯方法。  

优势:在不考虑时变系数的情况下,通过蒙特卡洛模拟显示更优的数学性质,特别适用于宏观PVAR模型。  

4. 动态变化场景下的挑战与解决

问题:当PVAR系数随时间变化时,分层贝叶斯方法的估计变得不可行。  

解决方案:结合指数模型和马尔可夫链蒙特卡洛方法,解决层次贝叶斯逼近中的计算难题。

5. 研究与实际应用启示

方法选择应根据数据特性和研究需求。  

分层贝叶斯方法和QML方法在特定情景下展现出显著的优越性,为PVAR模型的进一步研究和应用提供了理论支持。  


PVAR模型案例

教育投资与经济增长的关系


研究背景

某研究者希望分析教育投资和经济增长之间的动态关系,探讨教育支出的变化如何影响经济增长,同时经济增长反过来是否会促进教育投资的增加。

数据构成

  • 研究对象:10个国家的数据。

  • 时间范围:2000年至2020年,共21年。

  • 变量

    • Y1:教育支出占GDP的比例(内生变量)。

    • Y2:人均GDP增长率(内生变量)。

    • X:政府财政收入占GDP的比例(外生变量)。

PVAR模型设定

Yi,t=α+l=1pAl

  • Yi,t:内生变量的向量,包括教育支出比例和人均GDP增长率。

  • Xi,t:外生变量,政府财政收入比例。

  • p:滞后期,设置为2。

研究步骤

1. 单位根检验

检查变量的平稳性,发现所有变量为平稳序列,无需差分处理。

2. 滞后期选择
使用信息准则确定最佳滞后期为2。

3. 脉冲响应分析

结果显示,当教育支出比例提高1个百分点时,人均GDP增长率在第2年有显著提高,第3年效果减弱。

反之,当人均GDP增长率增加时,教育支出比例也在接下来的2年内逐步提高。

4. 方差分解

经济增长的波动约有30%可由教育支出的变化解释。

教育支出比例的波动中,20%来自经济增长的影响。

结论

通过PVAR模型,研究发现教育投资对经济增长具有正向影响,同时经济增长也能反作用于教育支出的增加。这表明两者之间存在显著的动态相互关系,政策制定者应关注二者的联动效应。


应用场景


1. 宏观经济与政策分析

动态因果关系:分析GDP、通货膨胀率、失业率等经济指标之间的互动。

政策冲击评估:研究货币政策或财政政策对经济体的多期影响。

2. 金融与市场分析

金融市场互动:探讨股票、汇率、利率之间的动态关系。

风险溢出效应:研究一国金融危机对其他市场的传导。

3. 企业与行业研究

企业绩效分析:如研发投入对未来销售额的滞后影响。

行业溢出效应:技术创新对整个行业生产率的影响。

4. 社会与公共政策

健康与教育:分析健康政策或教育支出对社会指标的动态作用。

环境与能源:评估环保政策对能源使用和碳排放的影响。

5. 科技与社会

数字化与消费行为:研究科技创新对企业和消费者行为的影响。

社交媒体:分析舆情传播对公众行为的动态影响。



END






小琳的读博笔记
海外在读博士分享学习日常与科研工具,陪伴式进行科研分享,与大家共同进步
 最新文章