在计量圈社群的微信群中,群友们分享了一些非常有趣的内容,深受启发,决定整理一下这些信息,以帮助初入实证研究的学者迅速了解全貌,同时也为那些在学术界摸爬滚打多年的学者提供巩固和提升的机会。
这篇文章将全面探讨内生性检验、稳健性检验、异质性检验和机制检验,让读者能够彻底弄懂这些重要的研究方法和概念。
内生性检验
内生性问题是指在回归模型中,解释变量(自变量)与误差项之间存在相关性。这种相关性会导致估计结果的偏差,从而影响模型的有效性和可靠性。
关于内生性问题,参看:1.讲座视频: 模型内生性分类, 检验与处理,2.全能的内生性问题处理方法ERMs, 强烈安利一下!3.补救实证中内生性问题的21种方法, 来自国际顶级期刊的要求!4.前沿: 解决内生性问题的无工具变量推断法,5.你的内生性解决方式out, CMP已一统天下而独领风骚!6.不强调内生性, 用极简截面数据和交互项, 就将经济学故事讲到领域Top刊!7.六种定量方法解决内生性问题, 附stata代码操作,8.天下回归, 无内生性不破, 唯此神文不破, 练就内生性处理的终极大法!9.搞懂因果推断中内生性问题解决方法必读的书籍和文献已搜集好!10.实证研究中自选择基础上的内生性问题回顾, 建议和纠正措施!11.简洁的内生性问题处理思维流程图, 并且还附上检验的代码!12.内生性问题: 微观和宏观经济学研究中的关键因果识别问题,13.控制变量的内生性需要处理吗?如何处理呢?理呢? 1.用"因果关系图"来进行因果推断的新技能,2.因果推断专题:因果图,3.因果推断专题:有向无环图DAG,4.confounder与collider啥区别? 混淆 vs 对撞,5.三张图秒懂, 混淆, 中介, 调节, 对撞, 暴露, 结果和协变量的复杂关系,6.中介效应检验流程, 示意图公布, 不再畏惧中介分析,7.图灵奖得主Pearl的因果推断新科学,Book of Why?8.前沿: nature刊掀起DAG热, 不掌握就遭淘汰无疑!因果关系研究的图形工具!9.前沿: 卫星数据在实证研究中的应用, 用其开展因果推断的好处!10.7大因果推断大法精选实证论文, 可用于中国本土博士课堂教学!11.随机分配是什么, 为什么重要, 对因果关系影响几何?12.应用计量经济学现状: 因果推断与政策评估最全综述,13.疫情期计量课程免费开放!面板数据, 因果推断, 时间序列分析与Stata应用,14.Python做因果推断的方法示例, 解读与code,15.内生转换模型vs内生处理模型vs样本选择模型vs工具变量2SLS,16.不用IV, 基于异方差识别方法解决内生性, 赐一篇文献等等。
1. x 和 y 互为因果
定义:在这种情况下,x和y之间存在双向因果关系。这意味着x不仅影响y的值,同时y也会反过来影响x。这种关系使得我们很难确定哪个是因,哪个是果。 示例:假设x代表教育水平,y代表收入。教育水平提高可能导致收入增加(x影响y),而收入增加也可能使人们有更多的资源和时间去接受更高的教育(y影响x)。在这种情况下,如果不恰当地控制这种双向关系,可能会导致误导性的结果。
2. 遗漏变量
定义:遗漏变量问题指的是在回归模型中没有包括所有可能影响y的变量。虽然我们可能只控制了3-5个变量,但实际上可能还有其他重要的因素没有被考虑,这会导致模型的估计结果偏差。 示例:假设我们在研究教育对收入的影响时,仅控制了教育年限和工作经验,但忽略了其他重要变量,如家庭背景、地区经济状况等。这些遗漏变量可能与教育和收入都相关,从而导致我们对教育影响的估计不准确。
3. 样本选择偏差
定义:样本选择偏差发生在样本中的观察数据不是随机选择的,而是根据某些特征或条件选择的。这种偏差会导致研究结果不具备代表性,从而影响结论的有效性。 示例:假设在研究求职者的工资时,仅使用了已经找到工作的求职者的工资数据,这样就可能忽视那些未找到工作的求职者的工资状况。这会导致对整体工资水平的误估,因为未找到工作的求职者可能有不同的特征和工资水平。
4. 测量误差
定义:测量误差指的是在收集数据过程中,变量的真实值与观测值之间存在偏差。这种误差可以源于多种原因,例如调查问卷设计不当、回答者的理解错误、工具的精度不足等。 示例:如果我们在研究人们的锻炼频率时,依赖于自我报告的数据,受访者可能会高估自己的锻炼时间,这种测量误差将导致我们对锻炼对健康影响的估计不准确。
1. 工具变量法(IV)
定义:工具变量法用于处理内生性问题,特别是当自变量x与误差项存在相关性时。通过引入一个工具变量z来替代x,这个工具变量应与x高度相关,但不直接影响因变量y。 示例:假设我们研究教育(x)对收入(y)的影响,但教育与收入之间的关系受到未观察到的因素(如能力)的影响。我们可以使用“距离最近大学的距离”(z)作为工具变量。这个变量与教育相关(距离近可能导致受教育年限长),但不直接影响收入。
2. 双重差分法(DID)
定义:双重差分法通过比较处理组和非处理组在政策实施前后的变化,来控制时间固定效应和组间差异。它有助于消除内生性问题,特别是在自然实验或政策评估中。 示例:假设我们研究某项教育政策对学生成绩的影响。我们可以将实施政策的学校作为处理组,未实施政策的学校作为非处理组。比较两组在政策前后的成绩变化,以评估政策的实际影响。
3. 倾向性得分匹配(PSM)
定义:倾向性得分匹配用于解决样本选择偏差的问题。它通过计算每个观察值接受处理的概率(倾向性得分),然后将具有相似倾向性得分的处理组和对照组进行匹配,以控制混杂因素。 示例:在研究某种培训对就业的影响时,我们可以计算每个求职者接受培训的概率,并将接受培训的求职者与相似的未接受培训的求职者匹配,比较他们的就业率。
4. 动态面板回归法
定义:动态面板回归法通过引入滞后变量(如x的滞后值)来控制内生性问题,尤其是当期自变量与因变量之间存在相互影响时。这个方法在找不到合适的工具变量时特别有用。 示例:假设我们研究某种政策对经济增长的影响。如果经济增长在不同时间段之间存在滞后效应,可以在模型中加入之前的经济增长值(L.growth),以消除当前政策影响的混淆。
稳健性检验
实证研究中,基准回归分析提供了初步的结论,但为了确保这些结论的可靠性和稳健性,研究者需要进行进一步的验证。
①实证应用经济学中的稳健性检验是什么? 怎么做?哪些策略呢?,②稳健性检验如何做? 有哪些稳健性检验常用思路?③RDD经典文献, RDD模型有效性稳健性检验,④审稿人质问: 通篇都基于OLS估计, 却把它放到稳健性检验或进一步讨论中!⑤如何量化因果推断的稳健性?6️⃣实证研究中稳健性检验思路指南
1. 替换被解释变量或核心解释变量
定义:通过使用不同的变量度量方式来检验研究结论的稳健性。这样可以评估结论是否依赖于特定的变量选择。 示例:如果原本研究“学习时间对考试成绩的影响”时使用的是“每天学习小时数”,可以尝试用“每周学习小时数”来代替,看看结论是否一致。如果替换后结论不变,说明模型的稳健性较强。
2. 更换固定效应
定义:在模型中考虑不同层级的固定效应,以控制可能影响因变量的不可观测因素。 示例:在研究“天气对冰淇淋销量的影响”时,不仅要考虑天气,还要控制不同城市的影响(城市固定效应),甚至不同时间(如节假日)的影响,这样可以更准确地评估天气的作用。
3. 补充变量法
定义:在模型中增加额外的控制变量,以排除潜在的混杂因素,增强模型的解释力。 示例:在研究“天气”和“冰淇淋销量”之间的关系时,可以担心广告活动的影响。此时,可以在模型中加入“广告活动”这个控制变量,检查其对结果的影响,从而提高结果的稳健性。
4. 剔除特殊样本
定义:剔除样本中可能存在显著经济差异的特殊数据,以避免这些异常样本对研究结果的影响。 示例:在考察政治对企业债务融资的影响时,可以剔除北京地区的企业样本,因为该地区的经济环境和政策可能与其他地区存在显著差异,这样可以更准确地分析结果。
5. 缩尾或截尾
定义:通过去除或调整异常值,以减少其对回归结果的影响,确保结果更加可靠。 示例:在研究“学生身高”时,可能存在几个极端的高个子学生。通过缩尾操作,可以去除这些异常值,避免它们对整体分析结果的影响。
6. 更换回归模型
定义:使用不同类型的回归模型进行分析,以检验结果的稳健性。 logit回归:适用于被解释变量为分类变量的情况。 Tobit回归:适用于被解释变量受限于某个上下限的情况。 PSM:用于减少内生性或样本不平衡带来的偏误。 负二次项回归:适用于被解释变量是计数变量或事件发生概率不一致的情况。 Poisson回归:适用于数据满足泊松分布或事件发生彼此独立的情况。
7. Heckman两阶段模型
定义:用于解决样本选择偏差的问题,尤其是在某些观察缺失时。 示例:在研究“教育对收入的影响”时,部分人群因为未接受教育而数据缺失,使用Heckman模型可以纠正这种偏差,确保估计结果的有效性。
8. 更换研究样本
定义:在得出结论后,使用不同的数据库或样本进行检验,以确认结果的一致性和稳健性。 示例:如果使用某个特定的调查数据得出结论,随后可以通过使用其他相关数据库的样本进行相同的分析,确保结果的一致性。
9. Bootstrap重抽样
定义:通过多次抽样生成多个样本数据集,分别进行分析,并比较结果的稳健性。 示例:可以通过重复抽样(如1000次)来生成新的样本集,然后对每个样本进行回归分析,以评估参数估计的稳定性。
10. 聚类稳健标准误差
定义:考虑数据中存在的群组效应,使用聚类标准误差来调整标准误差估计。 示例:在研究“班级大小对学习成绩的影响”时,同一班级的学生可能受到相似的影响。使用聚类标准误差可以更准确地估计模型参数的稳健性。
11. 排除其他理论依据或假说
定义:在面对与他人研究结果不一致的情况时,可以使用数据实证来检验和推翻对方的假说,从而提升自身结论的稳健性。 示例:如果你的研究结果与已有理论相悖,可以通过实证数据证明自己的观点,从而增强研究的说服力和可信度。
异质性检验
一、概念
定义:异质性分析是用于考察不同群体或条件下研究结果差异的实证研究方法。研究对象的不同特性(如性别、年龄、地区等)可能导致对同一问题的不同反应,因此通过异质性分析,研究者可以更深入地理解这些差异。 示例:例如,在药物效果研究中,发现药物对男性和女性的疗效不同。这提示研究者不能简单地将男女患者的数据混合分析,而应分别建立模型,以更精确地评估药物对各性别的影响。
二、目的
更全面地了解研究对象的多样性:通过识别和分析不同群体之间的差异,研究者能够更全面地理解研究对象的多样性,从而提高研究的有效性和适用性。 确定研究结果的局限性,提供更针对性的建议:了解不同特性群体的影响,可以帮助研究者识别研究结果可能适用的特定条件或环境,从而为政策建议或实践应用提供更精准的指导。 发现新的研究问题,提供新方向:通过分析不同反应模式,研究者能够发现潜在的新研究问题,从而推动更深入的研究探索,拓宽研究领域。
三、常用方法
分组回归
引入交叉项(Chow检验):用于检验不同组之间的回归系数是否相等。 基于似无相关模型的检验(suest):检验不同组的回归模型系数是否有显著差异。
费舍尔组合检验:用于比较不同组的回归结果的一致性。
优点:通过加入交互项,研究者可以更容易获得显著的结果,且不需要单独进行组间的差异性检验。 缺点:交互项的回归假设较为严格,可能增加模型复杂性,导致结果的解释性降低。
关于交互项,参看:1.交互项! 交互项! 固定效应回归模型中的交互项!2.未引入交互项主效应为正, 引入后变为负, 解释出来的故事特别好, 主效应符号确实增强了故事性,3.异质性分析用来检验中间传导机制, 分组回归或交互项就可以完成机制分析,4.交互项有什么用?为啥要做异质性分析? 5.不强调内生性, 用极简截面数据和交互项, 就将经济学故事讲到领域Top刊! 6.计量社群里关于使用交互项还是中间效应分析开展机制研究的讨论,7.DID中行业/区域与时间趋势的交互项, 共同趋势检验, 动态政策效应检验等,8.空间计量和交互项如何使用, 将空间计量进行到底,9.交互项模型的发现, 多大程度上可信呢? 10.交互项中主效应不显著, 交互项显著可怕吗? 11.交互项与分组回归的区别是什么? 异质性分析,12.面板数据中去中心化的交互项回归什么情况,13.内生变量的交互项如何寻工具变量, 交互项共线咋办,14.计量经济学中"交互项"相关的5个问题和回应,15.计量回归中的交互项到底什么鬼? 捎一本书给你
四、常见分组方式(什么才是一个好的调节变量或分组变量? TOP5如是说)
地区特征
地区分布:例如,研究可以根据东部、中部和西部地区进行分组,以考虑地域经济、文化差异对研究结果的影响。 城市发展水平:城市的经济发展程度可能影响研究对象的行为或反应。 金融发展水平:不同地区的金融环境差异可能影响经济行为。 信息基础建设:信息技术的普及程度可能对研究结果产生影响。 市场化程度:市场化程度高的地区可能与低市场化地区在经济行为上存在差异。 营商环境:营商环境的优劣会直接影响企业的决策与绩效。
劳动密集型、技术密集型、资本密集型:不同类型的行业在劳动力、技术和资本的使用上存在显著差异,可能导致对研究问题的不同反应。 行业集中度:行业集中度高的行业与低集中度行业在市场行为上可能表现不同。 环境监管力度:环境政策的强度可能影响企业的经营决策。 污染水平:不同行业的环境影响可能导致政策效果的异质性。
产权性质:国有企业与非国有企业在经营目标和政策响应上可能存在差异。 企业规模:大型企业与中小企业在资源获取和市场策略上可能有不同的表现。 生命周期:企业在不同发展阶段(成长期、成熟期、衰退期)对外部环境的响应可能不同。 技术水平:高新技术企业和传统企业在市场创新和反应上存在显著差异。 融资约束:融资约束的不同会影响企业的投资决策与发展策略。 内部控制水平:内部控制水平高的企业在管理效率和风险应对上可能优于内部控制水平低的企业。
机制检验
1. 概念
2. 目的
揭示因果路径:了解变量之间的因果关系是如何通过特定路径发生的。 增强理论框架:机制检验有助于建立和完善理论框架,使研究结果更具解释力。 政策建议:通过识别有效机制,研究者可以为政策制定提供针对性的建议,强调哪些因素可以被干预以实现预期结果。
3. 常用方法
Method 1:先用Y对X做回归,然后再用M对X进行回归,至于M对Y的影响,需要借助文献进行说明。①中国学界F4发表AER一篇! 知识青年上山下乡与农村教育问题!
Method 2:先用Y对X做回归(也有文献同时用M对X做回归),然后再用Y对X和M做回归,此时,X的系数需要变小或变大,或显著性下降甚至不显著。①我最近看到AER, JPE文章, 人家用的就是类似中介效应三步走方法,②机制分析做到极致的JPE趣文, 身高与收入
Method 3:先用M对X进行回归,然后再用Y对M进行回归,这个就是对X——M——Y两部分的影响分开进行回归。①实证机制分析那些事,机制分析什么鬼?
Method 4:用X与M的交互项进行回归;或用M进行分组回归,即用异质性进行机制检验。①异质性和机制检验都用交互项做会被审稿人质疑么? ②异质性分析用来检验中间传导机制, 分组回归或交互项就可以完成机制分析
关于机制分析,参看,1.又被拒稿了!机制检验除了中介效应还有其他方法吗?2.实证中如何做竞争性假说的检验?AER范本的方法还能当机制分析用,3.这种机制分析方法受到经济学认可, 曾出现在经济学TOP5期刊上!4.计量社群里关于使用交互项还是中介效应分析开展机制研究的讨论,5.关于影响机制的分析思路和实操策略, 我们能够做的就只有这么多了!6.学习机制分析应该阅读的经典材料有哪些?7.上双一流大学能多赚多少钱? 学习断点回归RDD, 机制分析的经典文章!8.Top5最新: 为什么富有的父母有富有的孩子? 一篇学好机制分析的佳作!9.必读, 宗教是如何阻碍经济发展的? 基于DID, IV和各种机制分析的AER量化史分析!10.期刊明确规定: 机制检验是本刊十分看中的实证内容, 是不可或缺的,11.整理了34篇关于中介, 调节和机制分析的文章! 揭开事务间的机理就靠它了! 12.QA: 平方项的IV, 加时间固定符号相反, 滚动窗口回归, 面板分位数输出图, 机制分析中IV, pre5显著咋办?13.一篇满足我所有DID幻想的最新AER, 交叠, 连续DID, 调节, 机制分析等范文!14.主回归与机制分析中的控制变量可以不同吗?15.在机制分析中必须是正向的中间影响路径吗?负向的影响路径可以吗?16.这种机制分析方法受到经济学认可, 曾出现在经济学TOP5期刊上!17.计量社群里关于使用交互项还是中介效应分析开展机制研究的讨论,18.必读, 宗教是如何阻碍经济发展的? 基于DID, IV和各种机制分析的AER量化史分析!
4. 实例
教育是否提升了女性的工作技能? 受教育女性是否更倾向于选择高收入工作? 教育是否影响了家庭对子女教育的投资,从而间接提升了家庭收入?
*可以到社群进一步交流讨论相关学术议题。 1️⃣有意思的实证计量讨论帖, 熬夜肝完了一直的计量困惑!2️⃣QA: 平方项的IV, 加时间固定符号相反, 滚动窗口回归, 面板分位数输出图, 机制分析中IV, pre5显著咋办,3️⃣主回归不显著, 分组回归却异常显著的研究来了!4️⃣城市*年份联合的FE与他们分开的FE有什么区别? FE如何从一维进化到二维, 三维的? 5️⃣审稿人: 你这个文章实证结构已经过时了!过时了!6️⃣当把交互项加入后, 主项的系数符号竟变相反了, 这是咋回事? 如何处理呢?7️⃣DID可以有2个处理组和1个对照组么? 有相关的参考文献吗? 8️⃣12年试点, 15年推广到全国的政策, 回归时是否包括16和17年数据?
一些讨论,1️⃣七大常见计量问题讨论汇总, 涉及控制,异质,机制,DID,DDD,调节,固定,平行,安慰等,2️⃣关于双重差分DID政策评估中的控制变量选取标准?3️⃣在平行趋势检验中对政策前后系列年份进行缩尾处理?4️⃣使用异方差稳健而不是聚类稳健标准误, 在固定效应模型中能接受吗?5️⃣平行趋势通不过, 该采取什么方法来更好地满足平行趋势呢?6️⃣QA: 基尼太美, 农业数据, 机制检验, 组间差异, 博士论文创新, 控制函数, FM回归 7️⃣审稿人: 你2SLS-IV回归中为啥R方是负数呢?
7年,计量经济圈近2000篇不重类计量文章,
可直接在公众号菜单栏搜索任何计量相关问题,
Econometrics Circle