利用Twitter数据了解英国在COVID-19大流行之前和期间的国内迁移 (Understanding internal migration in the UK before and during the COVID-19 pandemic using Twitter data)
Yikang Wang, Chen Zhong, Qili Gao & Carmen Cabrera-Arnau
本文利用Twitter数据来调查COVID-19大流行之前和期间英国国内迁移模式的变化。研究发现,复杂的社会过程伴随着空间和时间的变化而发生。特别是,大流行病和封锁政策显著降低了迁移率。此外,本文还发现了一种趋势,即在大流行高峰之前和期间,人们从大城市迁移到附近的农村地区,如果有的话,还会搬到联合城市(conjunctive cities)。到 2020 年,向农村地区迁移的趋势变得更加明显,且大多数迁出人口在 2021 年底仍未返回。作者认为,尽管使用Twitter的人群可能存在代表性偏差,但 Twitter 数据对于迁移趋势分析仍然非常有价值。
引用
Wang, Y., Zhong, C., Gao, Q. et al. Understanding internal migration in the UK before and during the COVID-19 pandemic using twitter data. Urban Informatics 1, 15 (2022).
https://doi.org/10.1007/s44212-022-00018-w
鉴于COVID-19大流行极大地影响了人们居住地点的选择,而现有数据在时间粒度、更新频率、数据采集和计算成本方面无法满足捕捉全国居民迁移模式的需求。本文利用Twitter数据调查了COVID-19大流行之前和期间英国的国内迁移模式的变化。通过 Twitter 地点属性的地理编码和用户家庭位置的估计,本文提出了五个指标来描述迁移模式。
研究数据:(1)这项研究基于通过Twitter Developer API 收集的自2019年1月到2022年12月在英国发布的 1.82 亿条推文所构建的的匿名数据集。数据集中的每条推文都包含一个属性列表:推文 ID、用户 ID、时间、推文内容、互联网协议 (IP) 地址和估计位置。(2)地方当局管辖区 (Local Authority District, LAD) 规模的人口普查和人口流动数据。(3)来自英国政府的COVID-19 数据,包括每日新增 COVID-19 病例数和自大流行以来英国第一剂疫苗接种率。
研究单元:本研究的空间单位是英国国家统计局 (ONS) 使用的人口普查和行政登记单元——地方当局管辖区 (LAD)。
研究方法:首先,通过地理编码将与每条推文关联的地点属性与相应的 LAD 相匹配。然后,使用推文位置估计每个用户的家庭位置,并通过比较两个非重叠时间段内用户的家庭地址来量化迁移。最后,通过定义五个指标来探索迁移和分析迁移模式,并使用线性回归评估它们与人口密度的相关性,以评估对不同规模城市影响的变化。
研究指标:本研究定义了以下指标,以评估COVID-19大流行之前和期间的居民迁移模式。
迁移率:迁移次数除以在两个月内成功检测到家庭位置的 Twitter 用户总数。
城市迁移指数:属于大城市的 LAD 的进/出迁移数除以迁移总数。
净迁移指数:LAD 的净迁移数(流入减去流出)除以人口普查人口。
迁移份额:从选定城市迁移到每个 LAD 的迁移数量除以来自该城市的迁移总数。
恢复指数:LAD 在 2021 年的迁移总数(流入加流出)除以 2020 年的相应数量。
结果与分析:研究结果表明,(1)居民在大流行期间搬出了大城市,这种模式在第一次和第二次封锁期间尤为明显。(2)有联合城市的大城市居民具有相似的迁往联合城市和农村地区的意愿;若无联合城市,他们主要是迁往农村地区。在大流行期间,他们更倾向于迁移到农村地区。(3)尽管大城市的复苏速度更快,但封城后进入城市的人数远少于封城期间迁出城市的人数。
图 1展示了在大流行之前(2019 年 2 月至 2019 年 5 月)、第一波迁出潮(2020 年 2 月至 5 月)和第二波迁出潮(2020 年 10 月至 2021 年 1 月)期间迁出这些城市的人们的居住地。在图中,来源城市用红色标记,其他 LAD 根据他们在流动人口中所占的比例(迁移份额)用蓝色标记。
图1. 大流行之前、第一波和第二波城市迁出浪潮中搬出英格兰和威尔士人口最多的 10 大城市的迁移目的地分布图。
细粒度、实时和经济的迁移监测无疑将有助于更好地了解人类流动和迁移行为。本研究开发了一个数据驱动的工作流程,用于从 Twitter 数据中提取迁移矩阵,并通过 COVID-19 大流行之前和期间的英国案例研究展示其应用前景。通过描绘基于LAD尺度的每月居民迁移模式,本研究展示了 Twitter 数据在人类流动性研究中的潜力。观察到的迁移趋势清楚地反映了大流行措施的影响,基于 LAD 尺度的结果与英国政府的年度国内迁移流量数据一致。
王亦康,英国伦敦大学学院(UCL)高级空间分析中心博士研究生。研究兴趣包括基于地理空间大数据和机器学习的人口流动分析。
https://yikang.site/钟晨,英国伦敦大学学院(UCL)高级空间分析中心副教授。研究兴趣包括空间数据分析、机器学习、城市建模,以及城市和交通规划的数据驱动方法。
https://imzhongchen.wordpress.com/高琦丽,英国伦敦大学学院(UCL)高级空间分析中心博士后。研究兴趣包括时空数据挖掘,大数据分析,以及面向可持续智慧城市的人口移动性和社会均等性研究等。
https://www.gaoqili.cn/Carmen Cabrera-Arnau,英国利物浦大学地理与规划系讲师。研究领域是开发建模框架以揭示城市化背景下新数据形式展示的时间和空间模式,尤其是建立分析工具以解释跨时间和空间尺度和人口群体的人类移动模式的可变性。
https://www.liverpool.ac.uk/environmental-sciences/staff/carmen-cabrera-arnau/END
编辑:乔思、刘乃瑜
审核/指导:王亦康、刘信陶、曹瑞