Stata:面板分位数模型估计及内生性初探

文摘   教育   2024-10-31 22:01   山西  

👇 连享会 · 推文导航 | www.lianxh.cn

🍓 课程推荐:2024 机器学习与因果推断专题
主讲老师:司继春 (上海对外经贸大学) ;张宏亮(浙江大学)
课程时间:2024 年 11 月 9-10 日 ;16-17日
课程咨询:王老师 18903405450(微信)

 课程特色 · 2024机器学习与因果推断

  • 懂原理、会应用。本次课程邀请了两位老师合作讲授,目的在于最大限度地实现理论与应用的有机结合。为期四天的课程,分成两个部分:第一部分讲解常用的机器学习算法和适用条件,以及文本分析和大语言模型;第二部分通过精讲 4-6 篇发表于 Top 期刊的论文,帮助大家理解各类机器学习算法的应用场景,以及它们与传统因果推断方法的巧妙结合。
  • 以 Top 期刊论文为范例。目前多数人的困惑是不清楚如何将传统因果推断方法与机器学习结合起来。事实上,即便是 MIT 和 Harvard 的大牛们也都在「摸着石头过河」。为此,通过论文精讲和复现来学习这部分内容或许是目前最有效的方式了。张宏亮老师此前在浙江大学按照这一模式教授了「因果推断和机器学习」课程,效果甚佳:学生们能够逐渐建立起研究设计的理念,并在构造识别策略时适当地嵌入机器学习方法。


作者: 武翰涛 (南京邮电大学)
Email: ht_wu@foxmail.com


目录

  • 1. 引言

  • 2. 面板分位数回归模型

    • 2.1 随机效应模型

    • 2.2 固定效应模型

    • 2.3 固定效应模型估计

  • 3. Stata 范例

  • 4. 参考资料

  • 5. 相关推文



温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」。或直接长按/扫描如下二维码,直达原文:

1. 引言

在前叙推文中,我们介绍了 Stata 的分位数回归应用。分位数回归估计作为一种模型估计方法,能够较为准确描述解释变量 对于被解释变量 的变化范围以及条件分布形状的影响。其中,分位数回归方程可以定义为:


其中, 表示被解释变量的第 个条件分位数, 表示解释变量在第 个分位数下的回归系数估计,其中 。若要得到 的参数估计,需要求解加权绝对残差和最小化问题,即:


随着面板数据的广泛使用,面板分位数回归也随之出现。结合分位数回归与面板数据,采用分位数回归的方法对面板数据变量的参数进行估计,不仅能够更好的控制个体的异质性,以缓解遗漏变量导致的内生性问题;还够分析在特定的分位数处自变量对因变量的边际效应,使我们得以从多个维度进行分析。

接下来我们将介绍面板分位数回归模型的两种形式,并主要展示固定效应面板分位数回归模型的估计。

2. 面板分位数回归模型

类似于通常面板数据的处理,分位数回归同样可以通过固定效应、随机效应分别进行估计。

2.1 随机效应模型

随机效应面板分位数回归模型的形式如下所示:


上式中, 分别表示第 截面在第 时期解释变量、被解释变量的观测值, 表示不可观测的个体固定效应, 为误差项。

2.2 固定效应模型

进一步地,控制个体效应的固定效应模型的设定形式如下:


接下来,本文将对固定效应面板分位数回归模型的估计过程进行进一步分析。

2.3 固定效应模型估计

当横截面单元数达到无穷大时,每个横截面单位的观测数是固定的,估计量将不一致。Koenker ( 2004)借鉴高斯随机效应估计运用到固定效应的惩罚最小二乘中的基本思想,将其进一步拓展到分位数回归中,参数估计方法如下:


其中, 是第 分位数的权重, 表示第 个分位数对固定效应的贡献。 是损失函数, 表示示性函数, 是惩罚因子,当 ,惩罚项消失,为固定效应模型;当 ,固定效应消失,为混合回归模型。考虑主观性对权重赋值的影响,通常的做法是,定义权重 ,即对所有指标赋相同的权重,从而降低主观性带来的影响。

3. Stata 范例

我们可以使用 qregpd 命令来实现面板分位数回归模型,这里我们利用系统自带数据库进行范例演示。

//下载外部命令
. ssc install qregpd
. ssc install moremata
. ssc install amcmc

//下载系统自带数据
. webuse nlswork.dta, clear

接下来考察该面板数据下,聘期 (tenure) 和是否加入工会 (union) 这两个变量与对数工资的关系:

. qregpd ln_wage tenure union, id(idcode) fix(year)
Nelder-Mead optimization
initial: f(p) = -298.32357
rescale: f(p) = -1.2889814
Iteration 0: f(p) = -1.2889814
Iteration 1: f(p) = -1.2889814
……
Iteration 22: f(p) = -.00164654
Iteration 23: f(p) = -.00164654


Quantile Regression for Panel Data (QRPD)
Number of obs: 19010
Number of groups: 4134
Min obs per group: 1
Max obs per group: 12
-----------------------------------------------------------------------
ln_wage | Coef. Std. Err. z P>|z| [95% Conf. Interval]
---------+-------------------------------------------------------------
tenure | .0207086 .0018158 11.40 0.000 .0171497 .0242676
union | .0922885 .0122959 7.51 0.000 .068189 .116388
-----------------------------------------------------------------------
No excluded instruments - standard QRPD estimation.

估计结果表明,在 1% 显著性水平上,tenure 与 union 与对数工资正相关。

进一步地,考虑到 tenure 可能存在内生性,因此我们使用工具变量法处理内生变量,并利用马尔科夫链蒙特卡洛方法 (MCMC) 估计结果。


. qregpd ln_wage tenure union, id(idcode) fix(year) ///
optimize(mcmc) noisy draws(1000) burn(100) ///
arate(.5) instruments(ttl_exp wks_work union)

Adaptive MCMC optimization
........................................... 50: f(x) = -123.527581
........................................... 100: f(x) = -120.682312
...
........................................... 950: f(x) = -120.251358
........................................... 1000: f(x) = -118.942834


Quantile Regression for Panel Data (QRPD)
Number of obs: 19010
Number of groups: 4134
Min obs per group: 1
Max obs per group: 12


ln_wage Coef. Std. Err. z P>z [95% Conf. Interval]
-----------------------------------------------------------------------
tenure .0312079 .0005661 55.13 0.000 .0300984 .0323175
union .0807607 .0065461 12.34 0.000 .0679305 .0935908

Excluded instruments: ttl_exp wks_work


MCMC diagonstics:
Mean acceptance rate: 0.192
Total draws: 1000
Burn-in draws: 100
Draws retained: 900
Value of objective function:
Mean: -119.0795
Min: -125.4123
Max: -117.0153
MCMC notes:
*Point estimates correspond to mean of draws.
*Standard errors are derived from variance of draws.

利用 ttl_expwks_work 两个工具变量重新估计,解决 tenure 内生性后,可以发现 tenure 对工资的正向影响有所增加,且同样在 1% 水平上显著。

4. 参考资料

温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」

Source:Koenker, Quantile regression for longitudinal data

  • Powell, David. 2015.  Quantile Regression with Nonadditive Fixed Effects.  RAND Labor and Population Working Paper. -Link-,内附 PDF 原文和代码。
  • Powell, David. 2016.  Quantile Treatment Effects in the Presence of Covariates. RAND Labor and Population Working Paper. -Link-
  • Powell, David. 2014b.  Did the Economic Stimulus Payments of 2008 Reduce Labor Supply?  Evidence from Quantile Panel Data Estimation. RAND Labor and Population Working Paper 710-3. -Link-

5. 相关推文

Note:产生如下推文列表的命令为:
lianxh 分位数, m
安装最新版 lianxh 命令:
ssc install lianxh, replace

温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」

  • 专题:回归分析

    • Stata+R:分位数回归一文读懂
    • Stata:分位数回归简介
  • 专题:内生性-因果推断

    • Stata:分位数回归中的样本自选择问题



🍓 课程推荐:2024 机器学习与因果推断专题
主讲老师:司继春 (上海对外经贸大学) ;张宏亮(浙江大学)
课程时间:2024 年 11 月 9-10 日 ;16-17日
课程咨询:王老师 18903405450(微信)


尊敬的老师 / 亲爱的同学们:

连享会致力于不断优化和丰富课程内容,以确保每位学员都能获得最有价值的学习体验。为了更精准地满足您的学习需求,我们诚挚地邀请您参与到我们的课程规划中来。请您在下面的问卷中,分享您 感兴趣的学习主题或您希望深入了解的知识领域 。您的每一条建议都是我们宝贵的资源,将直接影响到我们课程的改进和创新。我们期待您的反馈,因为您的参与和支持是我们不断前进的动力。感谢您抽出宝贵时间,与我们共同塑造更加精彩的学习旅程!https://www.wjx.cn/vm/YgPfdsJ.aspx# 再次感谢大家宝贵的意见!




New! Stata 搜索神器:lianxh 和 songbl  GIF 动图介绍
搜: 推文、数据分享、期刊论文、重现代码 ……
👉 安装:
  . ssc install lianxh
  . ssc install songbl
👉  使用:
  . lianxh DID 倍分法
  . songbl all



🍏 关于我们

  • 连享会 ( www.lianxh.cn,推文列表) 由中山大学连玉君老师团队创办,定期分享实证分析经验。
  • 直通车: 👉【百度一下: 连享会】即可直达连享会主页。亦可进一步添加 「知乎」,「b 站」,「面板数据」,「公开课」 等关键词细化搜索。


连享会
连玉君老师团队分享,主页:lianxh.cn。白话计量,代码实操;学术路上,与君同行。
 最新文章