vgets:VAR模型设定和筛选-T240

文摘   2024-11-20 22:00   中国  

👇 连享会 · 推文导航 | www.lianxh.cn

🍓 课程推荐:2024 机器学习与因果推断专题
主讲老师:司继春 (上海对外经贸大学) ;张宏亮(浙江大学)
课程时间:2024 年 11 月 9-10 日 ;16-17日
课程咨询:王老师 18903405450(微信)

课程特色 · 2024机器学习与因果推断

  • 懂原理、会应用。本次课程邀请了两位老师合作讲授,目的在于最大限度地实现理论与应用的有机结合。为期四天的课程,分成两个部分:第一部分讲解常用的机器学习算法和适用条件,以及文本分析和大语言模型;第二部分通过精讲 4-6 篇发表于 Top 期刊的论文,帮助大家理解各类机器学习算法的应用场景,以及它们与传统因果推断方法的巧妙结合。
  • 以 Top 期刊论文为范例。目前多数人的困惑是不清楚如何将传统因果推断方法与机器学习结合起来。事实上,即便是 MIT 和 Harvard 的大牛们也都在「摸着石头过河」。为此,通过论文精讲和复现来学习这部分内容或许是目前最有效的方式了。张宏亮老师此前在浙江大学按照这一模式教授了「因果推断和机器学习」课程,效果甚佳:学生们能够逐渐建立起研究设计的理念,并在构造识别策略时适当地嵌入机器学习方法。

温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」。或直接长按/扫描如下二维码,直达原文:

作者:吕媛 (北京大学)
邮箱:ly1562495qy@163.com

编者按:本文主要摘译自下文,特此致谢!
Source:Asali M. vgets: A command to estimate general-to-specific VARs, Granger causality, steady-state effects, and cumulative impulse–responses[J]. The Stata Journal, 2020, 20(2): 426-434. -PDF- -Link-


目录[

  • 1. 研究背景

  • 2. VAR 模型原理与应用

    • 2.1 VAR 模型估计原理

    • 2.2 VAR 模型的应用

  • 3. 案例分析

  • 4. 总结

  • 5. 相关推文



1. 研究背景

我们常常同时关注几个经济 (和非经济) 变量的预测问题,比如 GDP 增长率和失业率。一种方法是用单位变量时间序列的方法对每个变量分别作预测。另一种方法则是将这些变量放在一起,作为一个系统来预测,以使得预测相互自洽 (mutually consistent),这称为 "多变量时间序列" (multivariate time series)。

Sims (1980) 提出的 "向量自回归" (Vector Autoregression,简记 VAR) 正是这样一种方法。自 Sims (1980) 推广以来,向量自回归 (VAR) 模型已被证明是分析经济 (和非经济) 时间序列数据的最成功模型之一。具体来看,向量自回归 (VAR) 模型可用于脉冲响应分析和方差分解分析,动态分析,预测,结构推断、描述性分析和政策分析等。但是,由于存在多个变量,因此高阶 VAR 往往会被过度参数化 (Asali,2020)。

2. VAR 模型原理与应用

2.1 VAR 模型估计原理

向量自回归模型是由多元时间序列变量组成的自回归模型,主要用于预测及分析随机扰动变量。模型每个变量是其他内生变量的滞后值,因此其可以探究各种经济冲击对经济变量形成的影响。向量自回归模型 (VAR) 实质上是自回归模型和协整回归模型的结合。

假设有两个时间序列变量 分别作为两个回归方程的被解释变量,而解释变量为这两个变量的 阶滞后值。上述方程构成一个二元 (bivariate) 的 VAR() 系统,即:

其中, 均为白噪声过程 (不存在自相关),但允许两个方程的扰动项之间存在 "同期相关性" (contemporaneous correlation),即当 时,,否则

在进行 VAR 建模时,需要确定变量的滞后阶数,以及 VAR 系统中包含几个变量。具体来看:

2.1.1 滞后阶数的选择

  • 方法一:使用 AIC() 和 BIC() 信息准则;
  • 方法二:检验最后一阶系数的显著性 (类似于由大到小的序贯 规则)。假设要确定使用 VAR() 还是 VAR(-),则可以检验原假设:
  • 方法三:检验 VAR 模型的残差是否为白噪声,即是否存在自相关。如果真实模型为 VAR(),但被错误地设置为 VAR(-),则解释变量的最后一阶滞后 被纳入扰动项 ,导致扰动项出现自相关。更糟糕的是,由于 的相关性,导致包含 的扰动项 将与解释变量 相关,使得 OLS 估计不一致。

2.1.2 变量个数的选择

通常来讲,VAR 系统中包含的变量个数越多,则需要估计的系数越多。待估系数过多使得样本容量过小,则会增大估计误差,降低预测精度。因此,VAR 模型通常仅包含为数不多的几个变量。当然,如果 VAR 模型太小,则可能存在遗漏变量偏差。

在设定VAR模型时,主要应根据经济理论来确定哪些变量应在 VAR 模型中,比如,经济理论认为通货膨胀率、失业率、短期利息互相关联,因此可以构成一个三变量的 VAR 模型。如果 VAR 模型包含不相关的变量,则会增大估计量方差,降低预测能力。另外,可以在 VAR 系统中引入其他外生变量,比如 等与扰动项不相关变量。

2.2 VAR 模型的应用

2.2.1 脉冲响应分析

由于 VAR 模型包含许多参数,而这些参数的经济意义很难解释,故集中研究脉冲响应函数。脉冲响应函数研究单个变量变化所带来的扰动项是如何传播到各个变量,并且从动态上解释了各个变量之间关系。

2.2.2 方差分解分析

VAR 模型的用途之一是预测,VAR 模型中 Cholesky 分解次序对方差分解具有重要影响。对于 VAR() 模型 ,在得到参数估计后,很容易进行向前一期的预测 (one-step-ahead forecast)。

3. 案例分析

接下来,我们介绍一个具体案例,其中命令、数据、以及 do 文档通过以下方式获得:

net install st0602, replace //安装命令
net get st0602, replace //获取数据和 do 文档

首先,我们可以了解一下案例数据「intifada_extended_data」。该数据反映了巴勒斯坦和以色列的冲突死亡人数,本节需要关注的被解释变量为 pal_totisr_tot。此外,VAR 模型中 exog variable 为 Period2-Period7completedsunday-friday

  . net get st0602, replace     //获取数据和 do 文档
. use intifada_extended_data.dta, clear

. des
Contains data from intifada_extended_data.dta
obs: 2,665
vars: 19 21 Jul 2019 06:45
-------------------------------------------------------------
value
variable name label variable label
-------------------------------------------------------------
date
pal_tot Total Palestinian fatalities
isr_tot Total Israeli fatalities
period periodlbl Period
completed Length of separation barrier (km)
Period2
Period3
Period4
Period5
Period6
Period7
Period8
dayofweek
sunday
monday
tuesday
wednesday
thursday
friday
-------------------------------------------------------------
Sorted by: date
. *模型分析
. vgets pal_tot isr_tot if date>=14882 & date<=16451, maxlag(14) t(1) exog(Period2-Period7 completed sunday-friday) format(%9.3f)
FULL Specification

| pal_tot | isr_tot
| isr_tot | pal_tot
-------------+-----------+-----------
GC | 24.952 | 17.974
(pv) | 0.035 | 0.208
LR | 1.320 | 0.094
se | 0.435 | 0.042
(pv) | 0.002 | 0.026
CIR | 1.615 | 0.179
se | 0.655 | 0.096
(pv) | 0.014 | 0.062

GETS Specification

| pal_tot | isr_tot
| isr_tot | pal_tot
-------------+-----------+-----------
GC | 21.519 | 13.332
(pv) | 0.011 | 0.064
LR | 1.233 | 0.084
se | 0.408 | 0.041
(pv) | 0.003 | 0.042
CIR | 1.523 | 0.158
se | 0.582 | 0.089
(pv) | 0.009 | 0.075

GC 指的是格兰杰因果关系,因此,在完整的说明中,以色列死亡是由格兰杰造成的巴勒斯坦人死亡。也就是说,以色列对暴力做出反应,暴力程度达到5% (pv = 0.035),而巴勒斯坦人对暴力没有反应 (pv = 0.208)。但是,一旦考虑了 GETS (AAB) 规范,我们就会看到双方分别以 0.011 和 0.064 的 值做出反应。报告的 值与原始研究中显示的 值之间的细微差异原因是,vgets 命令使用更有效的系统估计方法 (看似无关的估计),而不是逐等式的普通最小二乘法 (OLS)。

LR 是指 LR 效果。在当前情况下,以色列反应职能的 LR 效应是指以色列每丧生一个以色列人造成的巴勒斯坦人死亡人数。在完整的规范中,该值为 1.32,在 GETS 规范中,该值为 1.233,两者在统计上都非常重要。最后,CIR 是指一方对另一方的暴力行为的回应,并考虑了另一方的回应。这些数据在统计上也很重要,在完整的和 GETS 规范中,以色列的反应功能分别为 1.615 和 1.523。

在末尾添加选项诊断程序的命令行如下,分析结果和未添加选项诊断程序分析相同。

vgets pal_tot isr_tot if date>=14882 & date<=16451, maxlag(14) t(1) exog(Period2-Period7 completed sunday-friday) format(%9.3f) diagnostics

4. 总结

VAR 模型已被证明是描述时间序列数据动态,提供准确的预测和结构推断,并为政策分析提供有用的基础模型。尽管如此,文献仍主张通过应用  parsimonious 理论来实现更简约、更准确的规范,而不受到过度参数化的影响。

同时,使用 GETS 方法进行 VAR 分析非常重要,因为其可以得到更准确的推断。本文介绍的命令 vget 简化了使用 VAR 和 GETS VARs,以及从这些模型进行统计推断的过程,例如研究不同变量的 Granger 因果关系及其稳态 LR 效应和 CIR。它还提供统计检验,其结果可能会使所发现的格兰杰因果关系具有真实性。

5. 相关推文

Note:产生如下推文列表的 Stata 命令为:
lianxh VAR Granger, m
安装最新版 lianxh 命令:
ssc install lianxh, replace

  • 专题:Stata命令
    • gcrobustvar:基于VAR的稳健性Granger因果检验
  • 专题:面板数据
    • Stata面板:Granger-因果检验
  • 专题:时间序列
    • TVP-VAR:时变参数向量自回归模型
    • Stata:VAR-中的脉冲响应分析-(IRF)
    • Stata: VAR (向量自回归) 模型简介
    • Stata: VAR - 模拟、估计和推断
  • 专题:文本分析-爬虫
    • VaR 风险价值: Stata 及 Python 实现

🍓 课程推荐:2024 机器学习与因果推断专题
主讲老师:司继春 (上海对外经贸大学) ;张宏亮(浙江大学)
课程时间:2024 年 11 月 9-10 日 ;16-17日
课程咨询:王老师 18903405450(微信)

尊敬的老师 / 亲爱的同学们:

连享会致力于不断优化和丰富课程内容,以确保每位学员都能获得最有价值的学习体验。为了更精准地满足您的学习需求,我们诚挚地邀请您参与到我们的课程规划中来。请您在下面的问卷中,分享您 感兴趣的学习主题或您希望深入了解的知识领域 。您的每一条建议都是我们宝贵的资源,将直接影响到我们课程的改进和创新。我们期待您的反馈,因为您的参与和支持是我们不断前进的动力。感谢您抽出宝贵时间,与我们共同塑造更加精彩的学习旅程!https://www.wjx.cn/vm/YgPfdsJ.aspx# 再次感谢大家宝贵的意见!

New! Stata 搜索神器:lianxhsongbl  GIF 动图介绍
搜: 推文、数据分享、期刊论文、重现代码 ……
👉 安装:
. ssc install lianxh
. ssc install songbl
👉  使用:
. lianxh DID 倍分法
. songbl all

🍏 关于我们

  • 连享会 ( www.lianxh.cn,推文列表) 由中山大学连玉君老师团队创办,定期分享实证分析经验。
  • 直通车: 👉【百度一下: 连享会】即可直达连享会主页。亦可进一步添加 「知乎」,「b 站」,「面板数据」,「公开课」 等关键词细化搜索。


连享会
连玉君老师团队分享,主页:lianxh.cn。白话计量,代码实操;学术路上,与君同行。
 最新文章