Geography, trade, and internal migration in China
Lin Ma, Yang Tang 2020 发表在 Journal of Urban Economics 的 Geography, trade, and internal migration in China,在城市层面构建spatial model,分析人口流动对流入地人们的福利影响。
模型本身为标准的spatial model框架,CES效用加上Melitz生产,相比于其他分析中国区域经济的文章,如Tombe and Zhu (2019)与caliendo et al. (2024) ,要简化一些。核心的影响机制是文献中经常提到的congestion以及melitz下的资源重新分配。不过相比于其他文章在省份层面分析,其在城市层面的calibration值得一看。
Model
地理空间: 中国N个城市和一个世界其他国家ROW
时间: 这是一个静态模型
人口: 没有增长,中国内部可流动,不可跨国
市场框架: 垄断竞争
商品种类: 两个行业,tradable 和 nontradable。 每个地区每个行业商品种类内生。
消费者
效用: CD-CES形式
congestion: 这里C表示人口越多越拥挤带来的负面效用:
这里congestion的形式在文献中也经常也经常以Amenity外部性的形式出现。
需求: CES结论得到
这里 表示在tradable上的总花费。
价格: CES结论得到
preference shock: 在每个地区的效用还需要加上一个idiosyncratic preference,服从T1EV。
流动比例: 人口流动需要成本 ,根据T1EV结论有
厂商
这部分为Melitz框架。
生产函数: 使用劳动力,tradable和nontradable作为投入,tradable来自所有地区商品,nontradable只来自本地商品:
生产率: 每个地区厂商生产率服从pareto:
Tradable,可以在地区间贸易,因此可以选择出口到所有市场
单位成本: 成本最小化得到
每个市场利润最大化: 如果在 i 地区厂商出口到市场 j,利润则为
价格: 垄断厂商,给定需求函数和生产函数,FOC利润最大化得到价格为
利润函数: 带入价格得到利润为
出口成本: 出口到每个市场需要成本,利润大于成本才会出口:
截止生产率:
总利润: 所有市场利润加总
生产决策: 是否进入市场生产也取决于进入市场成本 ,需要未来预期利润大于0才会进入市场:
对于nontradable,这些厂商只能卖到当地市场,与tradable类似的结论,只不过不需要进行 的市场进入决策了。
价格:
利润:
截止生产率:
生产决策: 由总利润和进入成本决定:
均衡
商品市场出清:
劳动力市场出清:
这里写的比较简便,实际计算时需要带入劳动力流动比率得到每个地区劳动力。然后结合消费者于生产者的FOC进行数值求解。
Quantification
要求解以上模型,需要得到模型中的所有参数。
贸易成本: 由于不存在中国城市层面双边贸易,区域间贸易成本在中国城市层面计算会比较复杂。文章采用的是Allen and Arkolakis (2014)方法。
首先得到每种交通方式(公路,铁路,水路)的地理距离(这里的距离指的是交通时间成本的意思,但是为了和模型中的成本区分,这里用距离的概念)。方法为根据Sino Map Press 2005年的交通路线图(4431-4371像素块),对于每个有对应交通方式的像素点赋值,表示该交通方式的地理距离,然后使用FMM算出每两个城市的像素块之间的最短交通距离。
将地理距离转化为成本:使用离散选择模型,即每种方式的成本为 每个地区选择最小成本的方式,给定shock分布,那么每种方式的运输比例为
这里每个交通方式的参数可以使用每个地区的每种方式运输比例来进行估计。
从2005统计年鉴得到每个城市每种交通方式比例,不过这是总的比例,并不知道每个城市对之间的贸易比例,那么可以将离散选择模型的贸易比例在城市层面加总得到对应的moment:
之后使用non-linear least squares,是的模型得到的每个城市每种方式贸易比例与数据匹配即可得到每个方式a和b的值。
得到每个方式的值后,根据离散选择模型,总的成本为
因此这里还需要知道贸易弹性,文章argue,这个弹性中国和美国有理由差不多,因此直接借用了美国的:
不过这里应该可以用已有的中国数据进行估计,使用可获得的2002-2007中国区域投入产出比表的省份贸易值,在省份层面进行gravity回归。
以上过程得到了中国内陆的成本,还需要进出口的成本。文章做法是只算出中国每个港口海运的平均距离。然后使用该距离和同样的弹性计算总成本。不过这里应该也可以直接使用城市层面双边贸易值,进行model inversion直接得到模型贸易成本。
以上方式得到了地理距离引起的成本,将其转化为贸易成本,还需要进行以下标准化以及其他成本的设定:
在Allen and Arkolakis (2014)中,这里还包括其他原因导致的成本,如地区间语言相似度等,这里把该部分简化为了只有国内和出口成本不同,来自border effect,不考虑其他因素引起的成本了。
上述式子中只有两个参数需要进行估计,理论上只需要两个moment就行了,文章使用的相关moment是世界银行发布的平均城市间贸易占GDP比例以及总进出口占GDP比例。
人口流动成本: 使用与贸易成本一样的思路,将流动成本写为这里的 表示流入地由于户口限制导致的成本。不过文章argue如果地区太多,这个参数不好用SMM估计了,所以只假设北上广深有该成本,然后counterfactual也只针这几个的户口成本。
由于人口流动数据在人口普查中是可以获得的,这里的moment就很多了,可以算出每个城市流入人口比例,流出人口比例等。文章使用了留在当地的人的比例,并且按照城市大小分为4组,每组算出平均比例以及standard deviation。同样的算出每个城市流入人的比例,分为4组,算出均值和standard deviation。
进入成本 : 中国最大的20个城市平均厂商数量。
congestion : 中国城市分布的pareto tail index
SMM moment如下:
得到参数估计如下
其它参数: 从2002投入产出表得到生产参数,从文献得到其他参数
进入市场成本: melitz下还需要求解出出口到每个市场的成本,这个并没有很好的估计,文章采用di Giovanni and Levchenko (2012)类似的方法。使用每个地区人口中企业家的比例作为 ,对于出口到其他市场的计算,直接采用 。然后标准化使得所有的分析中的厂商数量合理。