【Cities】
中国城市间人口流动空间格局——以腾讯迁移数据中的国庆加中秋节为例
01
摘要
人口迁移、社交签到、车辆导航和其他空间行为大数据已成为表征用户空间行为的重要载体。“腾讯迁移”大数据可以通过 LBS 设备实时、动态、完整、系统地记录人口流动路线。本文通过收集“腾讯迁移”中 2017 年“国庆-中秋节”(NDMAF) 假期期间(9 月 30 日至 10 月 8 日)中国 299 个城市的居民日常流动性,定义“出行期、出行期、返乡期”三个时段,从人口日常出行分布水平的角度分析和探索日常流动出行城市的特点和空间格局。 流向分布层 网络聚合、流向网络空间格局和复杂结构的特点。结果表明,“腾讯迁移”大数据清晰地揭示了 NDMAF 期间中国人口流动的时空格局。人口净流入量在每个时期呈菱形,具有交叉框架支撑,菱形的四个节点为北京、上海、广州和西安。主要的交通集结中心分布在京津冀、长三角、珠三角和成渝等城市群,这些中心与这些城市等级具有很强的一致性。大多数城市在人口流动中处于“相对均衡”状态,可以识别出清晰的等级结构和层次区分。人口流动的空间模式呈现明显的核心-边缘结构。Dali-Hegang 线在边界划分方面表现出显著的空间差异网络。在此背景下,城市网络的空间分布可以概括为“东西密集、西稀”,城市网络的核心联系可以描述为“东西平行、西串联”。全网呈现出典型的“小世界”网络特征,可见 NDMAF 期间我国城市人口流网具有较高的连通性和可达性。该网络在当地具有独特的“社区”结构,包括 2 个国家社区、2 个区域社区和 3 个地方级社区。
02
研究结果
1.双节期间城市间人口流动的时空格局
为简化分析,以直辖市、省会城市、香港、澳门(共 33 个城市)为单位,制作了 2017 年双节期间日净流入人口时序分布图(图 1)。图 1 显示了人口流动的以下特点。首先,人口流动呈现出随时间规律性变化的特点。在研究期间,人口流动的总体趋势是先流出后流入,除香港、澳门和西宁外,其他城市均在 10 月 3 日或 4 日出现人口净流入的拐点。随后,人口净流入开始由负转正。10 月 7 日或 8 日,人口净流入开始下降。根据这一显著规律,我们将 9 月 30 日至 10 月 2 日定义为 “出行期”,10 月 3 日至 10 月 6 日定义为 “旅游期”,10 月 7 日至 10 月 9 日定义为 “返回期”。其次,不同城市的人口净流入量存在明显差异。例如,10 月 6 日和 10 月 4 日,香港和澳门的人口净流入由正转负,这是因为香港和澳门是双节期间中国内地居民的旅游和购物目的地,而双节期间只有一小部分本地人口前往中国内地城市。西宁仅在研究后期的 10 月 9 日出现负净流入,其他时间均为正流入,净流入高峰出现在 “旅游期”。造成这一结果的原因是,双节期间是青海省全年旅游的主要时段。西宁市虽然是青海省旅游的重要节点,但由于地理位置相对偏远,交通相对不便。因此,游客多为长途旅游者,从而导致人口净流入时间较长。城市人口的净流入和净流出高峰出现在不同的日期。北京和上海的净流出高峰出现在 9 月 30 日,而其他城市的净流出高峰出现在 10 月 1 日。在人口净流入方面,兰州、呼和浩特、杭州、广州、福州、上海和北京在 10 月 8 日人口净流入最多,而其他大多数城市在 10 月 7 日人口净流入最多。
图1 2017 年“国庆-中秋节假期”期间主要城市净移民人口线图
图2是双节期间地级及以上城市居民日均净流入量的分级图。图中箭头表示流入方向,线条的粗细和颜色表示净流入规模的差异。图 2 表示双节期间人口流动的总体格局。与春运期间客流的 “两横三纵 ”网络格局不同,出行期、返程期和回程期的净流入量均呈十字形结构支撑的菱形分布。菱形的四个顶点包括京津冀、长三角、珠三角、成渝四大城市群,以武汉为中心,两轴连接南北、东西,将菱形的四个顶点串联起来。在国家和区域范围内,存在着明显的核心-外围结构。大理-鹤岗是人口流动空间强度的分界线,东部的城市网络强度大于西部,分界线以西的人口流动多为串联结构,其中大部分城市依赖于与人口流动网络相关的特定门户城市。分界线东侧的人口流动网络呈平行结构,城市间的人口流动性更大。主要的人口流动路线位于 “胡焕庸线”的东南侧。自 1978 年以来,中国已进行了四次全国人口普查。根据县域数据,研究表明 “胡焕庸线 ”两侧人口分布高度稳定,因此 “胡焕庸线 ”表明了中国人口空间分布格局的相对稳定性,但也在一定程度上表明了全国城市间人口流动的相对稳定性。除 “钻石 ”核心区外,还有三条主要线路突破了 “胡焕庸线”:从兰州经河西走廊到新疆,从成都经四川到西藏,从四川成都经贵州到云南。这三条线路是双节期间主要的长途旅游线路,反映了双节期间人口流动的特点。与以往利用春节期间百度迁徙数据的研究结果相比,四大城市群在辐射范围上缺乏明显的边界,中心城市的辐射范围缺乏明显的空间邻近特征。这种差异是由于国庆-中秋节和春节的典型特征不同还是由于数据采集方法的差异造成的,还需要进一步研究。
图2 “国庆-中秋节假期”城市净移民流的路线和强度
2.城市净流入人口特征
具体到城市,不同时期的城市人口净流入量差异很大。在旅游期间人口净流入前十位的城市中(表 1),没有一个是省会城市或副省级特大中心城市。这些城市均位于华东地区,且多为临近大城市的中小旅游城市,如郑州市附近的周口市、上海市附近的盐城市、南宁市附近的玉林市、贵港市和茂名市等。在净流量排名前 50 的城市中,只有一个中心城市,即香港。香港是中国最重要的国际金融中心,也是节假日旅游和购物的重要目的地。其余城市均为中小城市。从人口迁移路线来看,也体现了短途旅游集中的特点。但在旅途中,城市人口的净流入情况较为复杂。总体表现为周边城市向中心城市聚集。大部分中心城市人口净流入出现逆转,但也有不少优秀旅游城市排名靠前,如苏州(第 9 位)、青岛(第 18 位)、厦门(第 31 位)、绵阳(第 37 位)等。在回归期内,所有直辖市和省会城市都进入了城市人口净流入的前 50 名,最低的是西宁(47 名)。虽然仅凭腾讯迁徙的数据无法判断人口出行的目的,但通过出行期与返程期人口净流入的对比,我们发现两者之间存在很大差异,反映出国庆、中秋假期人口流动的特点。
表1 净流入人口排名前 10 的城市
3.城市人口每日迁移水平
主要城市在双节第一阶段出现人口净流出,这些城市的人口更倾向于选择其他城市作为旅游目的地。表 2 列出了不同时间段人口流量分布前十名的城市和流动路线。如表 2 所示,其他两个时段的出行时间与人口净流入方向之间存在对称关系。出行时段净流入强度排名前十的线路均由行政级别较高的中心城市向周边城市扩散,而后两个时段则多由周边城市向中心城市扩散。此外,与其他两个时期相比,第一时期的净流入空间跨度较小,强度明显较大。统计分析显示,双节期间的人口流动具有以下特点。首先,北京、上海、广州、深圳、重庆、成都、武汉、南京、西安 9 个城市位居各时段人口流入前十名,这些城市均为副省级及以上城市,行政级别较高,经济发达,基础设施完善,这些城市是最重要的人口流动中心。然而,这些城市并不在列出的前十名城市之列,而且根据本研究,天津在三个时期都不在前十名之列。
表2 人口流动和分布层面排名前 10 的城市和流向路线
此外,Liu 和 Shi(2016)根据多个时段的人口分布榜单,将苏州、东莞、佛山等城市列入前十名,因为这些城市具有重要的转移功能。然而,在本研究中,这三个城市均未进入前十名(苏州在三个时段中分别排在第 14、11 和 13 位,东莞排在第 13、12 和 15 位,佛山排在第 16、15 和 26 位)。出现这些结果的原因是,春节和其他长假期间出行的人口比例较大,而东莞、苏州和其他城市作为重要的中转地,外出务工被认为是农民工迁移的主要功能。这些城市具有重要的集散功能,其程度甚至超过了大多数行政城市。然而,在国庆节和中秋节期间,人们倾向于旅游观光,并前往旅游资源丰富的地区。因此,中心城市(如西安和成都)自然成为重要的人口分布节点。排名前十的城市也是以下城市群的核心城市: 京津冀(北京)、中原(郑州)、关中(西安)、长三角(上海、南京和杭州)、珠三角(深圳和广州)、长江中游(武汉)和成渝(成都和重庆)。此外,从日分配总量来看,一些西部城市在双节期间非常重要,其人口流动排名大大超过了其经济总量或人口在全国的排名。例如,兰州在出行时段排名第 32 位,昆明第 22 位,贵阳第 30 位,咸阳第 36 位,绵阳第 48 位。这些城市要么是主要的区域交通枢纽,要么是拥有丰富自然和文化旅游资源的核心城市。近年来,由于高铁、机场等各类交通基础设施的建设和改造,游客输送能力大大增强。在各个时期,前十位城市的人流量占所有城市总流量的分布比例相对稳定,出行期、旅途期、返程期的比例分别为 28.07%、28.75%、31.14%。在这三个时段中,人口迁移的前十条路线大多是在同一省份的城市之间或附近两个不同省份的城市之间。不过,也有一些分布路线距离较远,如上海与重庆之间、北京与上海之间、北京与重庆之间、成都与深圳之间。
人口研究的一个重要特征是人口迁移的方向性。区域间的定向流动与区域间的交通方式、地理位置和经济条件密切相关。识别网络中人口流动的方向性并获取节点之间的拓扑结构是复杂网络分析的重要组成部分。城市间人口流入和流出的度数不同,因此流入度值和流出度值可以反映网络中不同节点的重要性。我们发现,10 天内,299 个城市共有 7545 条定向路线,共运送了 5.66 亿人次。在这些路线中,有 32 条路线的人口密集度大于 100 万。这些线路所承载的人口强度占总强度的 8%。利用复杂网络分析软件 Gephi,我们计算了 299 个城市的人口流动网络度。但由于篇幅有限,表 3 仅列出了省会城市和副省级城市的度值。图 3是根据流入度和流出度值以及城市序列生成的。图4显示了流入度值和流出度值的分级(采用自然断裂分级法)。
表3 各种类型城市的流入度、流出度值和排名
图3 人口流动网络流入度和流出度的等级散点图
图4 人口流网络流入度和流出度分类图
图3中的两条曲线分别代表各城市流出度和流入度值的曲线图。由于两组数据具有较强的相对一致性,得到了显著的正相关关系,因此图3中两条线的走势较为一致,说明城市节点的流入度和流出度在一定程度上是相对平衡的。在人口流动方面,相对平衡表明人口可以在城市间自由流动。大多数城市不存在阻碍人口流动的单向约束力。流入度与流出度值相差小于 10 的城市多达 250 个,流入度与流出度值相同的城市有 40 个。此外,流入度值和流出度值两条曲线并不完全重合。原因是我国 299 个城市的人口流动规模差异较大,统一用一条曲线表达会造成两条曲线看似重合的错觉。而且在研究期间,个别城市的人口流入度和流出度数值相差较大。例如,成都相差 64,苏州相差 53,西安和长春相差 52。
城市间的网络状况差异较大。行政级别越高的城市,人口流动网络的地位越高。表2显示,网络的总度值一般遵循以下趋势:直辖市>副省级城市>普通省会城市>其他地级市。四个直辖市的平均总度值(2173)是副省级城市(909)的 2.4 倍,是普通省会城市(394)的 5.5 倍,是普通地级市(231)的 9.4 倍,网络区位优势明显。
所有直辖市、副省级城市和四个普通地级市(苏州、东莞、佛山和咸阳)的总值均进入前 30 名。北京以 1761 的流入度值和 1742 的流出度值排名第一,比排名第二的重庆高出近 1000,显示出北京对其他城市的绝对吸引力和影响力。保山、克拉玛依、石河子和儋州的网络状况值最低(小于 130),这四个城市位于边境地区,旅游资源相对匮乏。根据城市对人口的吸引力(流入度)和影响力(流出度),前 30 个城市的排名完全相同,因此流入度和流出度之间有很强的相关性。图3还显示了流入度和流出度之间的相对平衡。利用 SPSS 软件检验了流入度与流出度数值之间的相关性,皮尔逊相关系数为 0.999,sig 值小于 0.05,从而验证了流出度与流入度之间存在显著的正相关关系。根据统计分析,289 个城市的流入度值与流出度值的绝对差值小于或等于 30,占总数的 96.66%,说明城市节点的流入度值与流出度值相对均衡,人口在城市间的流动相对自由,因此大多数城市不存在限制人口流动的单向障碍。也有少数城市的流入度和流出度不平衡。例如,流入度盈余值较大的城市包括长春、上海、哈尔滨、天津、北京、西安、福州等大城市,以及苏州、乐山、眉山、咸阳、榆林等中小旅游城市,这些城市在吸引人口流入方面具有较大优势。外度值节点多为成都、重庆、杭州、深圳、广州等区域中心城市,在人口流动网络中发挥辐射控制作用,也有哈密、绥化、上饶、富阳等中小城市作为区域交通枢纽。
此外,城市人口流动的层次和等级在双节期间也非常突出。利用詹克斯自然分点优化法,我们将 299 个城市划分为五个等级(表 4)。自然分点分类法既能增加同一级别和等级的同质性,又能扩大不同级别和等级的差异性。根据表 4,在全国网络副中心以上的 10 个城市中,有 3 个是西部城市(重庆、成都和西安)。在 20 个区域网络城市中,一些边缘城市(如昆明、长春、咸阳和兰州)在网络中也处于较高位置。此外,漳州、绵阳、金华、南充、临沂等经济地位不高的城市,咸阳、桂林、泰安、秦皇岛等经济地位不高的城市,也在双节流动人口网络中占据了较高的位置、 由于本地人口和外来务工人员基数大、旅游资源丰富或交通区位重要等原因,咸阳、桂林、泰安、秦皇岛等旅游城市,以及东莞、佛山、温州、中山等劳动密集型城市的经济地位较低。这些结果与传统的人口迁移规律并不一致),因为正常的人口迁移主要是由于迁移人口的目的地与来源地之间存在显著的经济差异。但双节期间,假期时间有限,人口流动一般以短途旅行为主,旅行方式也有限。人们选择周边大城市作为首选旅游目的地,或通过区域交通枢纽流动,前往旅游景点。因此,一个城市在假日期间的日常移动网络中的等级地位是由其经济发展和人口规模以及周边旅游资源和交通状况等因素决定的。
表4 网络中城市的层次结构系统
节点中介性的中心性反映了人口流动网络中的城市交通和融合能力。具有更大中介中心性的城市充当了连接区域人口流动网络的桥梁。从双节期间城市人口流动性较高的城市的排名统计和分级 (图5a) 中间中心性较高的节点主要集中在东部发达地区和中西部地区的省会城市。总体上,城市的中心性与总度值呈正相关,因为中心性较高的城市具有相对较高的度值,即人口流动性大的城市也是能够吸引和传播旅游资源的城市。在不同类型的城市中,具有高中心性和高度值的城市是北京、上海、深圳、广州、重庆、成都、武汉、天津、杭州、南京和习。此外,中心性高、度值低的枢纽城市为澳门、拉萨、郑州、昆明、合肥和厦门。中心性低、度值高的城市为太原市、乌鲁木齐市、鄂尔多斯市、兰州市、呼和浩特市、呼伦贝尔市、西宁市和包头市。
图5 中介中心性和聚类系数的分类图
值得注意的是,在根据中介的中心性与总度值比较排名后,我们发现两者之间的大部分差异与旅游城市有关,并且存在两极分化的趋势。中间中心性排名高于度值的城市包括日喀则、张家界、漳州、景德镇、林芝、舟山、白山、威海、丽水、随州和三亚。例如,日喀则的总度值仅排名第 286 位,其中介中心性排名第 79 位。这些城市及其周边地区拥有高质量的旅游资源,但它们主要受地形和地貌的影响,或者由于地处偏远而难以进入。因此,中心城市自然在转移游客和与其他城市建立联系方面发挥着重要作用。在移除上述城市后,该省的一些城市成为孤立的节点。相比之下,其他旅游城市的排名远高于其中间中心性排名,如酒泉、张掖、乐山、玉林(广西)、玉林(陕西)、眉山和嘉峪关。例如,居间的中心性仅排名酒泉市(著名的县级敦煌市所在地)的第 280 位,但其整体度值在全国排名第 59 位。这些旅游城市拥有许多高质量的旅游资源,但城市周围或附近的景点并不紧密,尽管交通普遍便利,游客可以通过各种交通方式到达核心地区。
全国城市间人口流动网络的平均聚类系数为 0.54,由此可见该网络的聚集程度较高。我们构建了城市聚类系数的等级图(图5b),发现聚类系数与程度值之间存在负相关关系。聚类系数最大的城市,节点的度值都很低,而聚类系数最小的城市,节点的度值都很高。与间度中心度的分布(图5a)相比,城市间度中心度的空间分布相对集中,尤其是在北京、成都、广州和上海围成的菱形空间内。相比之下,城市聚类系数的空间分布更为均衡。
如果一个网络中的大部分节点都可以通过其他任何一点以少量关联到达,则该网络被称为小世界网络,其效果通常由聚类系数和平均最短路径决定。如果网络的平均聚类系数明显高于相同节点数产生的聚类系数,且网络的平均最短路径接近随机网络,则认为该网络具有小世界特征。平均聚类系数反映了网络中节点的整体分组趋势,表明节点嵌入邻近点的程度。平均最短路径是两个节点之间的平均网络距离。
经计算,整个城市网络的平均聚类系数为 0.54,远高于节点数相同的随机网络系数。经计算,网络中的路径长度为 1.986,这表明整个网络节点中的大部分路径都是直接连接的,没有经过第三方节点,路径只需要一个中介,整个网络具有较高的可达性和运行效率。因此,人口流动网络具有小世界的特征,所以该网络被定性为 “社群 ”结构。群落结构网络是一个较为复杂的系统,其中的群落根据特定的规则与其他群落联系在一起。平均聚类系数高的网络具有群落结构特征。通过使用 Gephi 软件中的模块化聚类算法,我们根据双节期间每天的人口流动情况,得到了中国城市网络中的 7 个群落结构(图6)。根据城市数量和社区的空间覆盖范围,社区可分为国家级 2 个、地区级 2 个和地市级 3 个(表 5)。两个国家级社区结构为北方社区,包括北京、天津、济南、青岛等 62 个城市;南方社区,包括广州、深圳、长沙、昆明等 57 个城市。两个地区级社区结构是由武汉、郑州、沈阳和长春等 50 个城市组成的中原-东北社区,以及由西安、兰州、银川和乌鲁木齐等 34 个城市组成的西北社区。
图6 中国的城市网络社区结构
表5 城市网络中社区的统计表
同一社区的城市之间关系密切。如图6所示,同一群落中的城市一般在空间上相互连接或接近,从而表明基于两节期间人口流动的城市紧凑性仍然受到地理空间效应的制约。但也有少数相对特殊的 “群落”,如川藏-海南-江苏群落和中原-东北群落,其空间跨度较大,呈现跳跃式分布特征,分别分布在三个和两个独立的空间中。在流动空间的背景下,一些潮流在节日期间克服了空间障碍。由于中国高铁、机场等大量不同类型基础设施的建设和普及,传统意义上的时空距离较以往大大缩短。人口在大尺度地理空间的高强度流动将成为未来的发展趋势。
03
研究结论
在这项研究中,大数据是从基于LBS技术的腾讯移民服务中获得的,该技术以完整、动态、瞬时和直观的方式记录了城市之间人口的每日流动轨迹。 我们使用腾讯迁移数据平台收集了国庆节和中秋节之间299个城市的每日移动数据,并确定了三个时间段:旅行期、行程期和返回期。 通过复杂的网络分析方法,我们从人口流动分布的角度分析了分布式网络系统的分层聚类、人口流动的空间模式、网络的空间特征、每日流动特征以及不同时间段的人口空间模式。 我们的主要结论如下。
(1)在国庆节-中秋节期间,腾讯迁移数据包含不同的特征和模式。人口流动随着时间的推移呈现规律性变化,10月3日或10月4日是净流入的转折点。与春节期间客运流量中发现的“两个水平和三个垂直”网络模式相比,国庆节加上三个时期的中秋节的净流入都具有菱形分布,由十字形结构支撑。在钻石中,四个高点是四个主要城市群,包括北京-天津-河北地区、长三角、珠江三角洲和成都-重庆。武汉位于中心,两条轴从北到南和从东到西交叉,连接菱形的四个顶点。主要人口流动路线位于湖环涌线东南侧,兰州-河西走廊-新疆、成都-西藏、北京-天津-东北和成渝-贵州-云南是突破菱形模式的四个主要人口流线。大理-河岗线是人口流动强度空间分布的重要分界线。根据这一边界,城市网络的特点是东部的强度比西部的强度更大,东部是平行连接,西部是串联。
(2)每个时期的主要人口流动收集和分配中心都非常相似。排名前十的城市都是渤海环地区、东海岸、南部海岸以及中部和西部地区的主要城市群的核心城市。一些西部城市在双重节日中发挥了重要作用,就总经济产出或人口规模而言,其人口流动性排名大大超过了全国排名。大多数主要流动线位于中心城市之间,彼此靠近,但一些分布路线也有较大的空间跨度。
(3)城市在人口流动网络中的地位差异很大,并且有独特的等级制度。当城市的行政级别更高时,网络的价值程度会更高,反之亦然。假期期间,每个城市在日常流动网络中的等级地位取决于其经济发展和人口规模,以及旅游资源和交通状况。城市之间人口的流入和流出相对平衡。
(4)在国庆节-中秋节期间,城市人口迁移网络略显国际化,一些地方的特色“社区”结构很明显,包括两个国家级社区、两个区域级社区和三个区域级社区。
论文信息
标题:Spatial pattern of population mobility among cities in China: Case study of the National Day plus Mid-Autumn Festival based on Tencent migration data
作者:Jinghu Pan, Jianbo Lai
时间:5 June 2019
DOI:https://doi.org/10.1016/j.cities.2019.05.022
本文只是笔者对论文的浅薄理解,不代表原论文观点。如果您感兴趣,请点击文末【阅读原文】阅读文献
来源:景观及规划前沿