论文标题:Long-term Detection and Monitory of Chinese Urban Village Using Satellite Imagery
作者:Yuming Lin*, Xin Zhang*, Yu Liu, Zhenyu Han, Qingmin Liao, Yong Li
发表:Proceedings of the Thirty-Third International Joint Conference on Artificial Intelligence(IJCAI 2024)
论文链接:https://doi.org/10.24963/ijcai.2024/813
代码链接:https://github.com/tsinghua-fib-lab/LtCUV
导读
城中村是中国城市中一种具有明显农村特征的区域,通常以临时建筑为主,多由城市中经济较脆弱的群体居住。在可持续发展目标(SDGs)的指引下,中国政府启动了城中村更新改造项目,提出对其进行精确的识别和制图。卫星图像技术在识别城中村及其变化方面具有显著的效率优势,但传统方法往往忽略了城中村在季节性、形状、大小、密度和空间布局等方面的多样性,使其在长期、广泛的监测任务中难以达到理想效果。为了解决这一问题,我们设计了一种专门方案,通过基于地理第一定律的课程学习方法,针对城中村的形态多样性进行建模,并半自动生成其边界。具体而言,我们使用少量手动标注的数据作为初始训练数据,对预训练的语义分割模型进行增量微调,并结合地理第一定律的指导对模型进行优化。通过在五个具有代表性的城市中开展实验,我们验证了该方法的有效性和鲁棒性。最终结果覆盖了过去十年中中国的265,050个城中村,进一步分析显示了不同区域和城市规模下的发展不均衡现象。我们还考察了城中村在城市内部的空间分布,并发现了与多个社会经济因素相关的标度规律。该方法能够在全国范围内推广,为城市再开发提供依据,并助力实现可持续发展目标11.1,即提供负担得起的住房并改善贫民窟生活条件。
背景
截至2020年,全球约有11亿城市居民居住在非正式定居点。在中国,这类定居点通常称为“城中村”,它们是大规模且复杂的城市区域,特征包括非规划建设的临时性住房结构、缺乏正式土地使用权,并可能面临基础设施和公共服务的不足。城中村通常居住着社会边缘化和经济脆弱的群体,他们长期面临贫困与社会不平等,这对社会公正和人权带来了严峻挑战。尽管中国政府近期启动了城中村改造项目,但数据匮乏成为这一工作的重要障碍。无序的城市扩张导致城中村边界变化频繁,给政府识别和更新这些区域带来了巨大困难,进而阻碍了联合国可持续发展目标(SDGs 11)的实现,即创建“包容、安全、韧性和可持续”的城市。
利用高分辨率卫星影像、街景图像和社会感知数据(如兴趣点、车辆轨迹及社交媒体签到记录)可有效地识别城中村的边界。然而,卫星影像质量的差异导致数据主要集中于大城市或特定区域,限制了跨地区的全面识别能力。此外,城中村的形态多样性受地理条件、气候影响和历史发展等因素的影响,给长期监测带来显著挑战,尤其是在训练和推断阶段存在特征不匹配的情况下。
为应对形态多样性问题,本文设计了一种基于地理邻近性的半自动化工作流程,通过地理第一定律的启发,以更全面和可靠的分割方法对城中村进行边界识别。我们采用了先进的语义分割模型,以卫星图像进行预训练,并通过课程学习方案在地理相近的城市上进行标注迁移。在五个代表性城市的实验结果表明,该方法在不同城市背景下均表现出色。这一方法的成功实施,为未来城中村的再开发和政策制定提供了关键洞见,有助于在数据匮乏的背景下支持脆弱群体,并推动可持续发展目标的实现。
方法
图1 所提模型的流程框架
1.预训练:为增强分割模型在多年份卫星图像中捕捉特征的能力,我们采用对比学习(SimCLR)对整个卫星图像数据集进行预训练。具体而言,对每张图像应用多种数据增强操作,模型学习到在不同变换条件下保持一致的卫星图像特征表示,从而有效提取卫星图像的特征。预训练后的模型参数 为分割任务提供了强大的初始特征表示。
2.基于地理学第一定律的半监督方法:在预训练模型的基础上,根据托布勒地理学第一定律,地理相近城市的形态可以假定更具相关性。因此,在每次迭代中选择邻近城市的伪标签,逐渐扩大范围。这个迭代过程逐步整合了地理多样性,通过类似课程的学习确保了模型的稳定性。
微调预训练模型:用标注数据微调预训练模型,以获得新的参数。 伪标签生成:利用对未标注数据 进行分割,生成伪标签和置信度分数。 扩充种子数据:选择高置信度的伪标记样本来扩充种子数据 ,并再次微调预训练模型以获得新的参数。 迭代更新:将替换为新的模型参数,并在每次迭代中添加更多高置信伪标签。如此循环,逐步完成一个完整的半监督迭代过程,提升模型在不同地理区域上的分割能力。
实验结果
✦
模型表现
表1 模型表现
✦
城市规模的差异
图2 历年城中村的面积和数量
城市规模通常会显著影响城中村的分布,而人口的快速流入则是城中村形成的关键因素之一。我们进一步分析了不同规模城市(小至中等城市、大城市和超大城市)在各个年份的城中村面积和数量变化趋势。
对于小至中等城市(如图2(a)所示),我们观察到在2020年之前,城中村的面积和数量迅速增加,分别达到2600平方公里和超过31000个单位,与当时的城镇化扩展趋势一致。对于大城市,尽管也经历了“增长-减少”模式,但自2017年以来城中村拆除速度显著加快,总面积从峰值减少了约120平方公里,数量减少了超过11%。其中,2020年至2023年是大城市城中村数量减少的主要时期,这一趋势表明大城市在更早期就已达到城镇化的高峰,并随后进行更大幅度的拆除。
对于人口超过500万的超大城市,由于城镇化水平相对较高和土地资源有限,地方政府倾向于优先将城中村重新开发为适宜的建设用地。我们的分析显示,超大城市的财力和资源配置使其能够更高效地处理大规模的城中村,而小至中等城市往往缺乏相应的资源支持。这一差异可能引发公平性问题,弱势群体在小城市中获得重建机会的难度更大,若缺乏政策上的关注,未来这种不公平现象可能会进一步恶化。
✦
城市内部分布
图3 历年城市内部的城中村分布情况
另一个值得关注的问题是城中村在城市内部的分布。经济模型表明,由于重建成本与预期收益的差异,城中村通常集中在城市中心附近。以深圳的岗厦村为例,这些位于市中心的城中村往往具有更高的建筑密度和人口规模,同时也更可能被列为优先重建项目。
在我们的研究中,我们以城中村到城市中心的距离作为其分布的度量指标。图4中显示了随距离变化的城中村面积累积分布情况。大部分城中村集中在距离市中心10公里以内,总面积达到3430平方公里,而2公里范围内的城中村相对较少,仅为425平方公里。相比之下,距离市中心超过30公里的区域内,城中村面积仅有207平方公里。这种远离市中心的区域面积迅速减少的趋势,与城市规模的自然边界相吻合。
城市内部的分布特征对未来更新项目的规划具有重要意义。在中心城区进行重建尽管成本较高,但预期收益也更大,而在城市边缘进行翻新则成本较低但收益有限。我们的分析方法提供了精确的城中村位置和边界信息,使得对城市内部分布的微观分析成为可能,为选址决策和重建优先级的确定提供了可靠依据。
✦
社会经济因素和标度律
图4 各城市的城市物理基础与城中村面积之间的关系
参考文献
[2] Chen B, Feng Q, Niu B, et al. Multi-modal fusion of satellite and street-view images for urban village classification based on a dual-branch deep neural network[J]. International Journal of Applied Earth Observation and Geoinformation, 2022, 109: 102794.
[3] Cascante-Bonilla P, Tan F, Qi Y, et al. Curriculum labeling: Revisiting pseudo-labeling for semi-supervised learning[C]//Proceedings of the AAAI conference on artificial intelligence. 2021, 35(8): 6912-6920.