●前沿文献第107期推送
题目:The Distributional Impacts of Transportation Networks in China
作者:Lin Ma; Yang Tang
来源:Journal of International Economics, Volume 148, 2024
关键词:Regional trade; Migration; Welfare; Economic geography
01
研究概述
文章记录了中国道路和铁路的质量随时间和空间的显著变化,并且忽视这些变化会错误估计交通网络的分配影响。为了考虑中国道路和铁路的质量差异,作者构建了一个新的面板数据集,并使用设计速度来近似地对质量进行度量,这些设计速度因年代、类别和地形在像素级别上有所不同。然后,作者构建了一个动态空间一般均衡模型,用于多种模式、交通路线和前瞻性(forward-looking)迁移决策。文章的发现表明,忽视质量差异会导致在估计地级市实际工资增长率时的中位数偏差约为31%。此外,这种偏差是非随机的,并且与地级市的初始条件相关,导致在预测交通网络的分配效应时出现重大错误。
02
中国的交通网络
在这一部分,我们概述了中国交通网络面板数据集的构建。我们简要讨论了在测量道路和铁路质量时的潜在不一致性。然后,我们描述了这一时期中国交通网络演变的基本模式以及考虑质量变化的重要性。
我们的数据集的时间覆盖范围因交通方式而异。对于铁路和高速公路,我们追踪了每一条铁路(1881-2017年)和高速公路(1988-2017年)的演变。我们将分析限制在1994-2017年之间,对于被称为“一级道路(First-rated Roads)”的低层级(Lower-tiered)道路,因为缺乏其在年鉴和编年史中建设的清晰文档。
测量二元连通性。 编制数据集的起点是收集每年发布的交通地图集。我们通过图书馆、旧书商和地图收藏家等几个渠道获取实体地图。数字化的国家地图尺寸为宽度12669像素、高度8829像素,因此每个像素大约为500米长。在24年中,我们获得了10年的国家地图。为了确定每条道路段的建设年份,并填补空白年份,我们交叉参考了年度省级交通地图集、交通和铁路年鉴以及中国交通建设的出版编年史。在这个阶段结束时,我们的数据集确定了每个地理参考段的建设年份,从而可以追溯按交通方式的连通性演变。
2.1 测度质量
质量变化发生在时间和空间两个维度上。随着土木工程领域的能力迅速发展,中国政府多年来大幅提高了公路和铁路建设标准。这使得1988年建造的“高速公路”可能只适合按照2014年的标准被分类为“一级道路”。此外,质量也在空间上变化。例如,在1988年的标准下,东部平原地区的高速公路设计速度为120公里/小时,而山区的设计速度为60公里/小时。因此,如果新建成的高速公路集中在山区,假设质量不变将大大高估连通性带来的改进。
我们使用它们的“设计速度”来衡量道路和铁路的质量。设计速度是理想的选择,有两个原因。首先,其他道路和铁路工程标准与设计速度相关。例如,设计速度更高的道路通常建造有更多的车道、更直的距离和更强的支撑材料。因此,这个单一变量足以反映道路的质量;其次,从设计速度出发,可以直接计算穿越像素的时间成本,进而计算地图上任何两个像素之间的旅行时间成本。然后旅行时间成本就可以方便地纳入到定量贸易和迁移模型中,如第2节所讨论的。在这一部分,我们简要讨论道路和铁路质量测量。
道路。表1(a)总结了按建设地形和年份划分的道路设计速度。这些规定设计速度基于中国交通部发布的《公路工程技术标准》。从1951-2014年,共有九次修订,其中四次与我们的采样期相关:1988年、1997年、2003年和2014年。每次修订都定义了不同等级道路(高速公路、一级、二级和三级道路)的设计速度。我们只关注前一步中确定的高速公路和一级道路。有了建设年份和基础地形的信息,我们可以确定每个道路像素的设计速度。
大多数道路网络的质量变化来自空间维度。在早期标准中,所有道路的设计速度都取决于地形。多年来,交通部逐渐减少了高速公路对地形的依赖,同时仍然保持了低等级道路对地形的依赖。
铁路。表1(b)总结了混合使用铁路的设计速度,按建设地形和年份划分。与公路工程标准类似,铁路设计取决于预期用途、铁路等级(国家I-IV、工业I-III)和基础地形。在这一部分,我们强调了几个特定于测量铁路质量的问题。
首先,铁路系统的质量变化来自时间和空间两个维度。与道路系统类似,丘陵和山区的铁路限制了旅行速度。然而,与道路系统不同,铁路的设计速度随着时间的推移发生了显著变化。
其次,现有铁路的运营速度也随着发动机和路线设计的改进而随时间变化。铁道部在现有铁路网络上实施了六次提速,这些提速在某些情况下将旧网络的速度提高了30%。我们通过参考年鉴将这些改进纳入数据集中。
最后,铁路设计按预期用途不同,分为三类:仅客运、仅货运和混合使用。仅客运铁路,包括高速铁路(HSR)系统,强调旅行速度,但不能承受重载。仅货运铁路优先考虑载重能力而非速度。大多数铁路属于最后一类,即混合使用铁路。我们参考年鉴和铁路建设编年史来确定每条铁路的用途。
水路。为了确保交通方式的一致性,我们也通过速度来衡量水路运输的质量。由于在抽样期间航行速度没有显著改进,我们为所有年份的所有水路像素分配了22.8公里/小时的航行速度。
数据集结构。我们最终构造了一个面板数据集,记录了每年在像素级别上按交通方式的设计速度的演变。图1使用一个假想的铁路作为例子来说明数据集的结构。
数据集的最外层是一个“路径(Path)”,一组形成已知道路或铁路的分段(Segment)。例如,“路径”可以指形成北京-上海高速公路的一组分段。除了名称外,路径在“等级(Rate)”和“用途(Usage)”上有所不同。在道路数据集中,路径的等级可以是“高速公路”或“一级道路”。在铁路数据集中,一条路径可以被分类为“国家I、II...”。我们使用道路和铁路的等级来确定分段级别的适用设计规范。铁路的使用也因路径级别而异,可以是仅客运、仅货运或混合使用。所有的道路路径都是混合使用的。
在“路径”下面的一层是“分段”。在一条路径内,分段在建设年份上有所不同。一条路径通常在多年内建成,我们记录了分段级别的变化。建设年份决定了适用的技术标准修订。例如,在图1中,1996年建成的分段受到1985年铁路线路设计规范的修订,而2001年和2004年建成的两个分段受到1999年的修订。
数据集的最底层是形成每个分段的“像素(Pixels)”。在一个分段内,像素在基础地形上有所不同。结合来自数据集上层的等级、用途和建设年份,可以依次确定每个像素的设计速度。图1中像素的颜色表示地形,每个像素中的数字表示单位为“公里/小时”的设计速度。请注意在同一分段内由于地形、设计速度不同,在同一地形类型内由于适用的技术标准的变更,道路的设计速度也不同。
2.2 质量的重要性
在评估结构模型中质量变化的重要性之前,我们通过几个reduced-form来演示考虑质量的重要性。我们首先重新计算地级市之间的旅行时间,假设道路和铁路的质量是不变的。具体来说,我们计算了三组“统一质量”旅行时间。第一组称为“统一高质量”,我们假设所有基础设施都是按照最新工程标准中平原上可能的最高设计速度建造的。第二组称为“统一低质量”,采用最早的工程标准中山地区域可能的最低设计速度。最后一组称为“统一质量”,取早期和最新工程标准中LRH和山丘上的设计速度的中位数。在其余部分,我们专注于最后一组“统一质量”,并将基于我们基准度量的存在质量调整的结果与没有质量变化的统一度量结果进行比较。详见附录中的图A.3和表A.5以及A.6,了解与“统一高(低)质量”度量相关的结果。
旅行时间的变化。图5展示了2017年与1994年地级市间旅行时间比率的对比,无论是在考虑质量差异的基准设置中,还是在假设质量和时间空间统一的设置中。图(a)描述了道路连通性的改善,可以看到如果没有质量差异,将会导致对这些改善的高估。虽然基准显示道路旅行时间的中位数减少了32%,但统一质量则显示了一个显著更高的减少,为39%。这种大约22%的高估可以归因于新建成的高速公路通常位于中国山区,那里需要一个更低的设计速度。
相比之下,假设铁路段的质量不变会低估铁路连通性的改善,如图中(b)和(c)所示。例如,基准案例显示货运运输的中位数减少了37%,客运运输减少了59%。然而,在质量不变的情况下,货运和客运旅行时间的减少分别只有20%和23%,分别低估了46%和61%。与表现出有限时间变化的高速公路设计规范不同,铁路的设计速度随时间显著提高。忽视这些时间变化将导致低估。
与初始条件的相关性。忽视质量变化所引入的测量误差并非随机的。相反,它们与地点的初始条件相关。为了强调这一点,我们首先测量由忽视质量引入的偏差,作为
基准和“统一质量”情景之间的测量误差倾向于对道路网络上初始偏远、人口较少和较贫穷的地方更大。如表3的前两列所示,与两个地点都位于中心位置的参考组相比,有一个偏远地点在城市对中会增加大约2.4%的测量误差;当两个地点都偏远时,测量误差增加到3.8%-4.1%。城市对的平均人口和GDP较低,也倾向于得到更大的测量误差。测量误差还与铁路网络上的初始条件高度相关,尽管与道路网络出现了一些相反的模式。例如,客运铁路网络上的测量误差在更中心的地级市对中更高。这可能是因为HSR系统和六次速度调整主要改善了连接主要人口中心的网络,而不是边缘地区。我们将在第5节中展示,在定量分析中,这些旅行时间的测量误差导致实际工资、产出和人口预测的增长速度出现重大偏差。
使用时刻表数据进行外部验证。时刻表数据涵盖了公路和铁路网络上的客运。我们数字化了出版的时刻表汇编(Tong Xin, 1999),它提供了1999年中国所有主要地级市出发的长途客车的旅行时间。铁路时刻表数据来自中国铁路的官方网站www.12306.cn。铁路时刻表包含了2002年和2010年的旅客服务的每个站点的到达和出发时间。从这些信息中,我们测量了2002-2010年之间地级市之间在铁路系统上的旅行时间变化。
为了研究质量调整的影响,我们对地级市之间的可观测的旅行时间进行了回归,以估计包含和不包含质量调整的旅行时间;如果我们的数据集包含质量调整能够反映旅行速度的改进,我们期望在控制未调整的旅行时间时,调整的旅行时间的系数显著为正。表4报告了结果。
质量调整的旅行时间估计比未调整的估计能更好地解释公路和铁路网络上观察到的旅行时间的变化。在公路系统上,两种旅行时间估计都与长途客车的记录旅行时间高度相关,如第(1)和(2)列所示。然而,当我们在第(3)列中同时控制未调整和调整的旅行时间,并在两种度量之间进行比较时,未进行质量调整的估计不再显著,而质量调整旅行时间的系数几乎没有受到影响。在铁路系统上的结果也类似。当我们将2002年到2010年之间的旅行时间变化对基准和统一旅行时间估计的变化进行回归时,只有质量调整的系数显著为正。我们将这些结果解释为外部有效性的验证,即我们的数据集包含质量调整,能够捕捉到公路和铁路网络上实际的旅行速度变化,因此在横截面和时间序列上能更好地匹配观察到的旅行时间分布。
03
3.1 个体和迁移决策
经济体包含大量工人个体
迁移。在每个时期结束时,个体需要决定他们下一时期的位置,这受到迁移摩擦的限制,取决于当时的政策壁垒和交通网络。我们将迁移摩擦中的政策元素解释为中国的户籍制度(hukou system),它作为进入地点
我们假设从
(1)
其中
记
给定时间
(2)
其中
与 Caliendo et al. (2019) 中的动态迁移框架相比,我们在两个方面有所不同。首先,Caliendo et al. (2019) 假设迁移成本是不变的,我们允许迁移成本随时间变化,以捕捉交通网络和政策壁垒的变化。其次,我们将 Allen and Arkolakis (2022) 中的路线选择问题嵌入到动态迁移模型中,因此我们模型中的个体不是选择一个目的地地级市,而是同时选择目的地和路线。尽管优化问题发生了变化,但我们展示的动态迁移问题采用了与 Caliendo et al. (2019) 类似的解决方案,因此该模型可以使用标准的迭代算法求解。
设
(3)
其中,
(4)
(7)
(9)
引力模型。将上述方程 (8) 对
(10)
上述方程也意味着地点
(11)
3.3 均衡
定义不随时间变化的基本要素(Fundamentals)为
序贯竞争均衡(Sequential competitive equilibrium)。在给定
1.个体通过选择一系列地点来最大化他们的终身效用(公式(3)),使得公式 (5) 和 (6) 成立;
2.企业在每个时期最大化他们的利润并实现贸易平衡,使得公式 (11) 成立。
稳态(Steady State)。经济体的稳态是均衡状态,其中经济基本要素和内生变量都是不随时间变化的。
04
量化
我们将ROW建模为一个单一地点,
我们按照以下方式模拟ROW和中国地级市之间的贸易成本。首先使用中国海关交易数据库确定直接从国际市场进口和出口的沿海地级市,并指定这些地级市为“港口城市”。假设任何港口城市与ROW之间有相同且对称的冰山贸易成本,并记为
我们从文献中选择了以下参数的值。集聚弹性
政策壁垒,
4.3 估计和联合校准
我们首先描述在GMM中
我们首先从贸易平衡条件中反推基本生产率
我们从1995年(t=1)的数据中恢复基础的愉悦(Amenity)。从数据中推断基础愉悦(Amenity)需要未来
平均货物运输成本
最后两个参数,
外层的参数
矩。第一组矩是跨地级市每年通过道路和铁路网络的交通量平均份额。相对交通份额有助于识别
我们可以计算模型中与交通网络和内生贸易和迁移矩阵相关的平均交通份额的对应项。记
第二组矩是每年各地级市总货运和客运交通量的变化系数(Coefficient of Variation,CV)。这些矩识别
识别和结果。与结构估计中常见的情况一样,所有矩条件共同确定了参数。尽管如此,我们仍然可以将每个参数的识别映射到特定子集的矩条件。简而言之,按模型计算的平均交通使用份额主要确定了与道路和铁路运输相关的成本,而交通量在空间上的变化识别了弹性参数,
表5的面板 (b) 总结了估计结果。我们对货运和客运运输成本的时间弹性的估计与文献大体一致。对于货运和客运运输,道路网络比铁路系统更便宜,这反映在
05
定量结果
本节将根据上一节中估计的参数呈现定量结果。首先简要评估整个时期交通网络改进的福利和分配影响。然后强调模型预测,特别是与分配影响相关的模型预测,对基础设施质量度量的变化很敏感:忽视质量变化可能导致模型预测中的重大且持续的偏差。
我们通过比较“基准”和“无变化”两组模拟,来评估交通网络的影响。两种模拟都从1995年的初始人口分布开始,求解50年后直到2044年的转换路径。在“基准”模拟中,
为了进一步通过贸易和迁移分解交通网络的影响,我们还模拟了另外两个反事实转换路径,“仅
总体影响。交通网络的扩张在长期内显著提高了总体福利,大约提高了57%。图6总结了交通网络对总体福利的影响。在这张图中,我们绘制了四种反事实模拟的总体福利的转换路径,并将1995年的初始水平标准化为1。在“无变化”案例中,总体福利增长了4.7%——这是我们比较所有其他反事实案例的基准。基准案例中的总体福利增长了7.4%,比“无变化”案例高出7.4/4.7 - 1 ≈ 57%。总体回报来自贸易和迁移两个渠道。从贸易渠道来看,更好的基础设施允许更高的贸易收益。同时,降低的迁移摩擦促进了人口流向更有生产力的地区。
对总体福利的影响意味着交通网络投资的回报率在3.0%到6.8%之间。利用基准和没有交通网络扩张的反事实经济体之间的GDP增长率差异,我们估计到2017年,投资已经产生了92.2%的累积回报,或者3.0%的年化回报。将核算范围扩展到2044年,50年内的累积回报为2242%,即每年6.8%。这一发现与Wu et al.(2021)的估计相似,他们使用公司层面的数据估计基础设施投资的回报率为6%。
交通网络的长期影响主要来自贸易自由化。图6中的两条虚线报告了“仅
分配影响。我们遵循 Barro and Sala-i-Martin (1992)使用实际工资的收敛性来衡量空间不平等,这在宏观经济学文献中通常被称为“
交通网络的扩张显著减少了空间不平等。在图7的第一个面板所示的基准案例中,以实际工资衡量的经济活动分布表现出强烈的收敛性,因为β参数显著为负,达到-0.0114。与此形成鲜明对比的是,如果没有交通网络的变化,空间不平等将基本保持1995年的水平:“无变化”案例中的收敛参数仅为-0.0023。换句话说,中国大约1 - 0.0023/0.0114 ≈ 80%的实际工资收敛来自交通网络的变化。
减少内部贸易摩擦是区域收敛的主要驱动力。为了研究区域收敛的来源,我们再次将影响分解为“仅
5.2 质量的影响
在这一部分,我们评估了随时间和空间测量基础设施质量的重要性。为此,我们使用假设基础设施质量和时间空间统一的旅行时间估计,进行了另一组反事实模拟,与图5中使用的相同。比较“统一”反事实与基准结果的模型预测,突显了质量变化的影响。我们在表6和图8中总结了结果。
表6(a)总结了由于忽视质量变化而导致的地级市层面实际工资、产出和人口增长率的相对误差。具体来说,我们定义了地级市i在时间t的变量x的相对误差为
忽视质量变化会导致关键模型预测中的重大偏差,如表6的顶部面板所示。例如,实际工资增长率的中位数误差在T=10时为33%,并且在稳态时持续为19%。相对误差在误差分布的右侧显著增加。在第90百分位数,相对误差在33%到67%之间。最大误差可能高达7030%。即使我们通过排除误差分布顶部1%的异常值来排除误差分布中的异常值,第99百分位数的相对误差仍然在175%到542%之间。预测产出和人口增长率的中位数相对误差较小,在3%到7%之间。然而,误差分布的右侧尾部显示出与实际工资相似的幅度。例如,在第99百分位数,产出的相对误差在268%到359%之间,人口增长率的相对误差在76%到293%之间。
更引人注目的是,由于忽视质量变化导致的测量误差并非随机的;相反,它们与地级市的初始条件相关。图8绘制了由于忽视质量在稳态时对实际工资、产出和人口增长率的测量误差与这些变量的初始值之间的关系。在所有三个变量中,测量误差在初始条件较低的地级市更为明显。换句话说,忽视质量变化往往会高估那些起初较小和较不发达地点的增长率。这种负相关的原因是直接的:最初较贫困的地点更有可能位于崎岖的地形上,因此其周围的交通网络往往比东部平原地区的设计速度低。假设统一质量会高估靠近贫困地区的基础设施质量,从而高估此类基础设施的效益。
测量误差的非随机性有两个含义。首先,实证研究者不应将这些误差视为经典测量误差,因此不应期望典型的解决方案,如工具变量,来解决由质量变化引起的测量误差;其次,相关性也意味着交通网络的分配影响特别容易受到质量变化的影响。表6的面板(b)通过比较基准模型和"统一"反事实中实际工资空间不平等的变化来强调这一点。在两种结果中,更好的连通性总是降低空间不平等。然而,幅度有相当大的差异。例如,在T=10时,基准模型中的
06
结论
本文提供了一个全面的面板数据集,记录了中国交通网络的扩张。我们的数据集与现有度量相比,能够一致地在时间和空间上测量道路和铁路的质量。基于这个数据集,我们通过一个动态空间一般均衡模型评估了交通网络的影响,该模型具有前瞻性迁移决策、货运和客运的模式和路线选择,以及城市间和国际贸易。我们传达了几个主要信息。
我们展示了基础设施投资如何显著促进了中国的经济增长,贸易和迁移自由化的回报表现出丰富的动态。我们还表明,在中国的情况下,交通网络的扩张是实际工资区域收敛的主要甚至唯一驱动因素。更好的连通性的均衡效应主要来自促进国内贸易,因为它为偏远地区提供了更好的市场准入。
此外,我们认为,考虑时间和空间上的质量变化是重要的。忽视质量变化会导致对地级市层面增长率的模型预测产生相当大的偏误。这些偏误是非随机的,并且与地级市的初始条件相关。因此,忽视质量差异可能导致在理解交通网络的分配影响方面产生大的偏差。
本文仅作学术交流,版权归原作者及原发刊所有,如需转载本文,请联系授权
往期回顾
--END--
全球价值链研习社
全球价值链研习社由对外经济贸易大学吕越教授研究团队创办,我们长期跟踪全球价值链(GVC)研究,致力于打造专注价值链、产业链、供应链的公益性学术分享平台。公众号将每周为大家推送国内外前沿文献、团队最新成果以及学术资讯,欢迎更多学术同仁关注和加入我们。