vgets：VAR模型设定和筛选-T240

文摘 2024-11-20 22:00 中国

👇 连享会 · 推文导航 | www.lianxh.cn

🍎 Stata：Stata基础 | Stata绘图 | Stata程序 | Stata新命令
📘 论文：数据处理 | 结果输出 | 论文写作 | 数据分享
💹 计量：回归分析 | 交乘项-调节 | IV-GMM | 时间序列 | 面板数据 | 空间计量 | Probit-Logit | 分位数回归
⛳ 专题：SFA-DEA | 生存分析 | 爬虫 | 机器学习 | 文本分析
🔃 因果：DID | RDD | 因果推断 | 合成控制法 | PSM-Matching
🔨 工具：工具软件 | Markdown | Python-R-Stata
🎧 课程：最新专题 | 计量专题 | 关于连享会

🍓 课程推荐：2024 机器学习与因果推断专题
主讲老师：司继春 (上海对外经贸大学) ；张宏亮（浙江大学）
课程时间：2024 年 11 月 9-10 日；16-17日
课程咨询：王老师 18903405450（微信）

课程特色 · 2024机器学习与因果推断：

懂原理、会应用。本次课程邀请了两位老师合作讲授，目的在于最大限度地实现理论与应用的有机结合。为期四天的课程，分成两个部分：第一部分讲解常用的机器学习算法和适用条件，以及文本分析和大语言模型；第二部分通过精讲 4-6 篇发表于 Top 期刊的论文，帮助大家理解各类机器学习算法的应用场景，以及它们与传统因果推断方法的巧妙结合。
以 Top 期刊论文为范例。目前多数人的困惑是不清楚如何将传统因果推断方法与机器学习结合起来。事实上，即便是 MIT 和 Harvard 的大牛们也都在「摸着石头过河」。为此，通过论文精讲和复现来学习这部分内容或许是目前最有效的方式了。张宏亮老师此前在浙江大学按照这一模式教授了「因果推断和机器学习」课程，效果甚佳：学生们能够逐渐建立起研究设计的理念，并在构造识别策略时适当地嵌入机器学习方法。

温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」。或直接长按/扫描如下二维码，直达原文：

作者：吕媛 (北京大学)
邮箱：ly1562495qy@163.com

编者按：本文主要摘译自下文，特此致谢！
Source：Asali M. vgets: A command to estimate general-to-specific VARs, Granger causality, steady-state effects, and cumulative impulse–responses[J]. The Stata Journal, 2020, 20(2): 426-434. -PDF- -Link-

目录[

1. 研究背景
2. VAR 模型原理与应用

2.1 VAR 模型估计原理
2.2 VAR 模型的应用

3. 案例分析
4. 总结
5. 相关推文

1. 研究背景

我们常常同时关注几个经济 (和非经济) 变量的预测问题，比如 GDP 增长率和失业率。一种方法是用单位变量时间序列的方法对每个变量分别作预测。另一种方法则是将这些变量放在一起，作为一个系统来预测，以使得预测相互自洽 (mutually consistent)，这称为 "多变量时间序列" (multivariate time series)。

Sims (1980) 提出的 "向量自回归" (Vector Autoregression，简记 VAR) 正是这样一种方法。自 Sims (1980) 推广以来，向量自回归 (VAR) 模型已被证明是分析经济 (和非经济) 时间序列数据的最成功模型之一。具体来看，向量自回归 (VAR) 模型可用于脉冲响应分析和方差分解分析，动态分析，预测，结构推断、描述性分析和政策分析等。但是，由于存在多个变量，因此高阶 VAR 往往会被过度参数化 (Asali，2020)。

2. VAR 模型原理与应用

2.1 VAR 模型估计原理

向量自回归模型是由多元时间序列变量组成的自回归模型，主要用于预测及分析随机扰动变量。模型每个变量是其他内生变量的滞后值，因此其可以探究各种经济冲击对经济变量形成的影响。向量自回归模型 (VAR) 实质上是自回归模型和协整回归模型的结合。

假设有两个时间序列变量、分别作为两个回归方程的被解释变量，而解释变量为这两个变量的阶滞后值。上述方程构成一个二元 (bivariate) 的 VAR() 系统，即：

其中，与均为白噪声过程 (不存在自相关)，但允许两个方程的扰动项之间存在 "同期相关性" (contemporaneous correlation)，即当时，，否则。

在进行 VAR 建模时，需要确定变量的滞后阶数，以及 VAR 系统中包含几个变量。具体来看：

2.1.1 滞后阶数的选择

方法一：使用 AIC() 和 BIC() 信息准则；
方法二：检验最后一阶系数的显著性 (类似于由大到小的序贯规则)。假设要确定使用 VAR() 还是 VAR(-)，则可以检验原假设：

方法三：检验 VAR 模型的残差是否为白噪声，即是否存在自相关。如果真实模型为 VAR()，但被错误地设置为 VAR(-)，则解释变量的最后一阶滞后被纳入扰动项，导致扰动项出现自相关。更糟糕的是，由于的相关性，导致包含的扰动项将与解释变量相关，使得 OLS 估计不一致。

2.1.2 变量个数的选择

通常来讲，VAR 系统中包含的变量个数越多，则需要估计的系数越多。待估系数过多使得样本容量过小，则会增大估计误差，降低预测精度。因此，VAR 模型通常仅包含为数不多的几个变量。当然，如果 VAR 模型太小，则可能存在遗漏变量偏差。

在设定VAR模型时，主要应根据经济理论来确定哪些变量应在 VAR 模型中，比如，经济理论认为通货膨胀率、失业率、短期利息互相关联，因此可以构成一个三变量的 VAR 模型。如果 VAR 模型包含不相关的变量，则会增大估计量方差，降低预测能力。另外，可以在 VAR 系统中引入其他外生变量，比如等与扰动项不相关变量。

2.2 VAR 模型的应用

2.2.1 脉冲响应分析

由于 VAR 模型包含许多参数，而这些参数的经济意义很难解释，故集中研究脉冲响应函数。脉冲响应函数研究单个变量变化所带来的扰动项是如何传播到各个变量，并且从动态上解释了各个变量之间关系。

2.2.2 方差分解分析

VAR 模型的用途之一是预测，VAR 模型中 Cholesky 分解次序对方差分解具有重要影响。对于 VAR() 模型，在得到参数估计后，很容易进行向前一期的预测 (one-step-ahead forecast)。

3. 案例分析

接下来，我们介绍一个具体案例，其中命令、数据、以及 do 文档通过以下方式获得：

net install st0602, replace //安装命令
net get st0602, replace     //获取数据和 do 文档

首先，我们可以了解一下案例数据「intifada_extended_data」。该数据反映了巴勒斯坦和以色列的冲突死亡人数，本节需要关注的被解释变量为 pal_tot 和 isr_tot。此外，VAR 模型中 exog variable 为 Period2-Period7、completed、sunday-friday。

  . net get st0602, replace     //获取数据和 do 文档
. use intifada_extended_data.dta, clear

. des
Contains data from intifada_extended_data.dta
  obs:         2,665                          
 vars:            19                          21 Jul 2019 06:45
-------------------------------------------------------------
                value
variable name   label      variable label
-------------------------------------------------------------
date                       
pal_tot                    Total Palestinian fatalities
isr_tot                    Total Israeli fatalities
period          periodlbl  Period
completed                  Length of separation barrier (km)
Period2                    
Period3                    
Period4                    
Period5                    
Period6                    
Period7                    
Period8                    
dayofweek                  
sunday                     
monday                     
tuesday                    
wednesday                  
thursday                   
friday                     
-------------------------------------------------------------
Sorted by: date

. *模型分析
. vgets pal_tot isr_tot if date>=14882 & date<=16451, maxlag(14) t(1) exog(Period2-Period7 completed sunday-friday) format(%9.3f)
FULL Specification

             |  pal_tot  |  isr_tot  
             |   isr_tot |   pal_tot 
-------------+-----------+-----------
          GC |    24.952 |    17.974 
        (pv) |     0.035 |     0.208 
          LR |     1.320 |     0.094 
          se |     0.435 |     0.042 
        (pv) |     0.002 |     0.026 
         CIR |     1.615 |     0.179 
          se |     0.655 |     0.096 
        (pv) |     0.014 |     0.062 

GETS Specification

             |  pal_tot  |  isr_tot  
             |   isr_tot |   pal_tot 
-------------+-----------+-----------
          GC |    21.519 |    13.332 
        (pv) |     0.011 |     0.064 
          LR |     1.233 |     0.084 
          se |     0.408 |     0.041 
        (pv) |     0.003 |     0.042 
         CIR |     1.523 |     0.158 
          se |     0.582 |     0.089 
        (pv) |     0.009 |     0.075

GC 指的是格兰杰因果关系，因此，在完整的说明中，以色列死亡是由格兰杰造成的巴勒斯坦人死亡。也就是说，以色列对暴力做出反应，暴力程度达到5％ (pv = 0.035)，而巴勒斯坦人对暴力没有反应 (pv = 0.208)。但是，一旦考虑了 GETS (AAB) 规范，我们就会看到双方分别以 0.011 和 0.064 的值做出反应。报告的值与原始研究中显示的值之间的细微差异原因是，vgets 命令使用更有效的系统估计方法 (看似无关的估计)，而不是逐等式的普通最小二乘法 (OLS)。

LR 是指 LR 效果。在当前情况下，以色列反应职能的 LR 效应是指以色列每丧生一个以色列人造成的巴勒斯坦人死亡人数。在完整的规范中，该值为 1.32，在 GETS 规范中，该值为 1.233，两者在统计上都非常重要。最后，CIR 是指一方对另一方的暴力行为的回应，并考虑了另一方的回应。这些数据在统计上也很重要，在完整的和 GETS 规范中，以色列的反应功能分别为 1.615 和 1.523。

在末尾添加选项诊断程序的命令行如下，分析结果和未添加选项诊断程序分析相同。

vgets pal_tot isr_tot if date>=14882 & date<=16451, maxlag(14) t(1) exog(Period2-Period7 completed sunday-friday) format(%9.3f) diagnostics

4. 总结

VAR 模型已被证明是描述时间序列数据动态，提供准确的预测和结构推断，并为政策分析提供有用的基础模型。尽管如此，文献仍主张通过应用 parsimonious 理论来实现更简约、更准确的规范，而不受到过度参数化的影响。

同时，使用 GETS 方法进行 VAR 分析非常重要，因为其可以得到更准确的推断。本文介绍的命令 vget 简化了使用 VAR 和 GETS VARs，以及从这些模型进行统计推断的过程，例如研究不同变量的 Granger 因果关系及其稳态 LR 效应和 CIR。它还提供统计检验，其结果可能会使所发现的格兰杰因果关系具有真实性。

5. 相关推文

Note：产生如下推文列表的 Stata 命令为：
lianxh VAR Granger, m
安装最新版 lianxh 命令：
ssc install lianxh, replace

专题：Stata命令

gcrobustvar：基于VAR的稳健性Granger因果检验

专题：面板数据

Stata面板：Granger-因果检验

专题：时间序列

TVP-VAR：时变参数向量自回归模型
Stata：VAR-中的脉冲响应分析-(IRF)
Stata: VAR (向量自回归) 模型简介
Stata: VAR - 模拟、估计和推断

专题：文本分析-爬虫

VaR 风险价值: Stata 及 Python 实现

🍓 课程推荐：2024 机器学习与因果推断专题
主讲老师：司继春 (上海对外经贸大学) ；张宏亮（浙江大学）
课程时间：2024 年 11 月 9-10 日；16-17日
课程咨询：王老师 18903405450（微信）

尊敬的老师 / 亲爱的同学们：

连享会致力于不断优化和丰富课程内容，以确保每位学员都能获得最有价值的学习体验。为了更精准地满足您的学习需求，我们诚挚地邀请您参与到我们的课程规划中来。请您在下面的问卷中，分享您 感兴趣的学习主题或您希望深入了解的知识领域 。您的每一条建议都是我们宝贵的资源，将直接影响到我们课程的改进和创新。我们期待您的反馈，因为您的参与和支持是我们不断前进的动力。感谢您抽出宝贵时间，与我们共同塑造更加精彩的学习旅程！https://www.wjx.cn/vm/YgPfdsJ.aspx# 再次感谢大家宝贵的意见！

New！ Stata 搜索神器：lianxh 和 songbl GIF 动图介绍
搜：推文、数据分享、期刊论文、重现代码 ……
👉 安装：
. ssc install lianxh
. ssc install songbl
👉 使用：
. lianxh DID 倍分法
. songbl all

🍏 关于我们

连享会 ( www.lianxh.cn，推文列表) 由中山大学连玉君老师团队创办，定期分享实证分析经验。
直通车： 👉【百度一下：连享会】即可直达连享会主页。亦可进一步添加「知乎」,「b 站」,「面板数据」,「公开课」等关键词细化搜索。

http://mp.weixin.qq.com/s?__biz=Mzk0MDI1NTgyOQ==&mid=2247581926&idx=1&sn=a0ac4ac15d7cdfb968ca8ac0e86c65d0

连享会

连玉君老师团队分享，主页：lianxh.cn。白话计量，代码实操；学术路上，与君同行。

最新文章

vgets：VAR模型设定和筛选-T240

CCC-GARCH：常值条件相关系数模型

TVP-VAR：时变参数向量自回归模型

调节效应是否需要考虑对控制变量交乘？

medsem-中介效应：基于结构方程模型SEM的中介效应分析

Stata：因果中介分析大比拼-T323

Stata：合成控制法介绍-synth2

严格外生性假设检验方法与应用

IV-面板内生性：严格外生性如何检验？

RDD断点回归：多个断点多个分配变量如何处理

Stata+R：一文读懂精确断点回归-RDD

RDD：离散变量可以作为断点回归的分配变量吗？

Stata：一行代码绘制平行趋势图-eventdd

Stata：事件研究法的稳健有效估计量-did_imputation

DID最新进展：异质性处理条件下的双向固定效应DID估计量 (TWFEDD)

Stata：IV估计新方法-ivreg2m

Stata：无需工具变量的IV估计-kinkyreg-

ivreghdfe-高维固定效应IV估计：错误信息处理-817 lines skipped

异质性分析！异质性分析！

FE！FE！面板固定效应模型：你用对了吗

Stata绘图：面板数据可视化-panelview

Stata：系数稳定性分析 - psacalc

Stata：堆叠回归及组间差异联合检验

控制变量越多越好吗？

Stata：输出LaTeX表格

Stata结果输出：用esttab命令绘制LaTeX表格

Stata：定制论文中表1-table1

Stata：R-squared有用吗？

Stata小白编程：暂元及macrolists命令

Stata：投资组合有效边界

Stata：通过数据框进行数据横向合并-framerge

Stata绘图：一套高效绘图命令-plottabs

Stata绘图：COVID-19数据可视化-山脊图

Stata：手动计算置信区间

Stata数据处理：缺失值类型及应对方法

Stata数据处理：缺失值填充-autofill-carryforward

明天开课！连享会：机器学习与因果推断

交乘项困惑：交互模型中的控制变量如何选择？

Stata：一文读懂事件研究法Event Study

Stata：事件研究法的编程实现

用因子模型克服遗漏变量偏误：论文复现和解读

距离开课仅余1天！机器学习与因果推断

连玉君Stata33讲：面板数据模型简介-FE和RE有何区别？

Stata-Python交互：如何安装Python宏包

从 Stata 到 R：如何使用 tag() 和 if_else() 标记分组中的首个观测

Stata错误信息-stacktrace not available：安装路径中不要包含中文字符和空格

聊聊Stata中的profile文件-第二季

Stata2R：那些 R 中的 _N 和 _n 替代技巧

距离开课仅余3天！机器学习与因果推断

Stata：自己动手做组间系数差异检验-bootstrap-bdiff

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉