检验模型是否靠谱 1

文摘 2024-08-10 08:00 英国

Putting Quantitative Models to the Test: An Application to Trump’s TradeWar

众所周知

“all models are wrong, but some are useful”

不过问题是，我们怎么知道模型是不是有用的？Rodrigo Adão，Arnaud Costinot，Dave Donaldson 2024 回答了这个问题。

首先需要定义一下有用的模型：指的是能够回答我们关心的问题的模型。而关心的问题一般是某些特定shock对于某些特定变量的因果影响，比如关税对于福利的影响。

一个经常用到的方法是，建完模型后首先使用模型模拟一下之后几年或者之前几年的数据，然后与没有用与模型估计的其他数据做一个对比。如果模型预测数据和实际数据差不多，那就继续之后的counterfactual的分析。或者说，与untargeted moment做个对比。

不过是否可以说如果模型预测和实际数据差别大，就说明模型没办法回答我们关心的问题呢？实际情况是，模型中我们感兴趣的shock可能只有一种，但是实际数据反应的shock有无数个。那么模型预测与实际数据的差值就会来自于两部分，一部分是我们关心的shock的影响，一部分是所有其他shock的影响。比如如果模型发现关税增加导致福利下降2%，但是实际数据计算发现关税增加前后福利上升1%，此时不能说模型是错的，因为可能没有考虑的shock导致了同时间福利上升，但是关税增加的影响本身依然是下降2%福利。

模型是否能够回答我们关心的问题，本质上是在问，模型对于我们关心的shock的影响的估计是否准确。实际上其他shock的影响是什么样的我们并不关心。因此即使实际数据和预测值差别很大，我们也不能断定这个模型回答不了关心的问题，因为差值有可能来自于其他shock。

文章使用IV方法判断模型是否有用。即找到一些与其他可能的shock无关的IV，如果说模型给出的shock的影响就只是这个shock实际的因果效应，那么实际数据与模型给出的结果的差就只会来自于其他shock的影响。那么根据IV的定义，这个差值与IV的相关性就是0.通过判断这个相关性是否为0，就可以知道模型给出的shock的影响是否是实际的因果效应。

设定

研究者模型： 研究者构建了一个模型，其包含 n 个内生变量，以及两组shock

其中，表示一组内生变量。比如每个地区的价格，需求等。表示我们关心的一组shock，这个shock在行业 k 层面。表示其他所有的可能shock。比如需求冲击，技术进步等。

问题： 求解我们关心的shock 对于一些变量的影响，如welfare。

研究者模型估计： 上述研究者模型直接去估计将会非常的复杂，因为有general equilibrium的影响，任何行业的shock都会影响所有地区所有变量，也就是说有多少行业和地区，那么自由度就至少估计行业乘以地区数量。如果使用non-parametrically去估计，能用到的variation只来自时间层面，数据量几乎不支持将f估计出来。如果假设是最简单的线性形式，参数数量也至少是自由度的数量。因此一般情况下研究者都是写好消费者问题，生产者问题，将模型简化到有限的结构参数就可以估计。也就是说此时的f是基于一堆模型函数假设，推导后的结果，他和真实的模型一般是有区别的。

真实模型： 记真实世界的模型为

指标都用表示。这个模型是我们永远观测不到的，不过我们要研究的实际因果效应是这个模型给出的结果。我们的问题在于，怎么检验这两个模型给出的因果效应是否相同。

因果效应： 根据定义，使用研究者模型得到的的因果影响为

使用真实模型得到的为

我们关心的结果是福利影响，而福利是价格需求等的一系列加权平均：

我们的问题就在于使用研究者模型得到的这个W和真实世界模型得到的W是否相同。

实际数据差别： 实际上我们看不到真实模型中的因果影响，我们只能看到真实世界在所有shock下的结果，那么就有

这里可以看到实际数据的差值由两部分组成，一部分为我们关心的shock的影响，另一部分来自其他shock的影响。那么将研究者模型得到的预测值与实际数据差值作差就有

这里就可以看到研究者模型的预测值与实际数据的差异虽然一部分来自真实的因果效应，但是也来自于其他所有shock的影响，而这部分影响很难为0.所以直接比较数据变化和模型预测并不是很靠谱。

Exact hat： 很多模型使用exact hat来作counterfactual，这本质上是假设研究者模型就是实际模型的基础上（），将观测到的 y 的变化用于识别实际的其他shock的变化影响。

IV识别： 那么有什么办法识别是否？，只需要一个与其他shock无关的一个IV 即可。因为根据数据和模型，我们可以计算得出，如果，那么，即只是由其他shock影响的部分，根据IV我们有与不相关。

直观表示： 在两个变量情况下，将以上变量画为向量图如下

实际数据的变化来自两部分，与。模型识别的shock效果为，可以看到与相差甚远。但是这并不意味着识别的效果就是错的，相反识别的是没有任何问题的。使用IV检测也很直接，找到一个垂直于其他shock的IV向量，然后检验与在方向上的投影是否相同。

上述是相同的情况，对于不同的情况，比如图b，虽然此时与似乎更接近了，但是可以看到识别的效果根本不是实际的因果影响。使用IV可以直接检测出来，与在方向上的投影是不同的。

检验统计量： 基于以上原理，可以构造检验统计量如下

在本文的所有分析中，shock的形式为行业层面的政策shock ，均值为0

为了讨论这个统计量的性质，需要给一点假设：

假设 A1: 政策shock与其他shock无关

假设 A2： IV是sihft share形式

这个share 可以是 t 时期与政策和其他shock有关的变量。

假设 A3：

基于以上三个假设，那么就有以下的性质用于假设检验：

Proposition 1： 任何满足 A1 和 A2 的工具变量。如果 A3 成立，那么。

Proposition 2： 满足一系列条件下（ref 原文），服从分布

http://mp.weixin.qq.com/s?__biz=Mzk0ODMxMjQ5Mw==&mid=2247492568&idx=1&sn=b9bd6c03391dbd85b7dce0c217758c1f

一名搬砖工的日常

个人树洞，记录学习和生活，脚踏实地，迷途未远，来者可追。

最新文章

基础推导-Quadratic utility function

理论模型与实证分析-最优政策

GPT - 生成视频

理论模型与实证分析

检验模型是否靠谱 3

检验模型是否靠谱 2

检验模型是否靠谱 1

Geography, trade, and internal migration in China

Mechanics of Spatial Growth - 区域知识外溢

Ricardian model - DFS (1977)

经济分析史- 看点经济学发展史

数学工具 - 用概率证明存在性

Close model - 一般均衡条件

Melitz (2003) / Chaney (2008)

毕业了

dynamic spatial model- 模型分析-洪水与基础设施投资 3

dynamic spatial model-counterfactual 洪水与基础设施投资 2

动态规划 Day 12 - Continuous Time

dynamic spatial model-洪水与基础设施投资 1

动态规划 Day 11 - Abstract Dynamic Programming

动态规划 Day 10 - Recursive Decision Processes

动态规划 Day 9 - Nonlinear Valuation

New Trade Models, Same Old Gains?

动态规划 Day 8 - Stochastic Discounting

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉