论文解读 |【IJCAI 2024】基于卫星图像识别的城中村识别与监测

文摘   2024-11-07 22:29   北京  

论文标题:Long-term Detection and Monitory of Chinese Urban Village Using Satellite Imagery

作者:Yuming Lin*, Xin Zhang*, Yu Liu, Zhenyu Han, Qingmin Liao, Yong Li    

发表:Proceedings of the Thirty-Third International Joint Conference on Artificial Intelligence(IJCAI 2024)


论文链接:https://doi.org/10.24963/ijcai.2024/813

代码链接:https://github.com/tsinghua-fib-lab/LtCUV

导读

城中村是中国城市中一种具有明显农村特征的区域,通常以临时建筑为主,多由城市中经济较脆弱的群体居住。在可持续发展目标(SDGs)的指引下,中国政府启动了城中村更新改造项目,提出对其进行精确的识别和制图。卫星图像技术在识别城中村及其变化方面具有显著的效率优势,但传统方法往往忽略了城中村在季节性、形状、大小、密度和空间布局等方面的多样性,使其在长期、广泛的监测任务中难以达到理想效果。为了解决这一问题,我们设计了一种专门方案,通过基于地理第一定律的课程学习方法,针对城中村的形态多样性进行建模,并半自动生成其边界。具体而言,我们使用少量手动标注的数据作为初始训练数据,对预训练的语义分割模型进行增量微调,并结合地理第一定律的指导对模型进行优化。通过在五个具有代表性的城市中开展实验,我们验证了该方法的有效性和鲁棒性。最终结果覆盖了过去十年中中国的265,050个城中村,进一步分析显示了不同区域和城市规模下的发展不均衡现象。我们还考察了城中村在城市内部的空间分布,并发现了与多个社会经济因素相关的标度规律。该方法能够在全国范围内推广,为城市再开发提供依据,并助力实现可持续发展目标11.1,即提供负担得起的住房并改善贫民窟生活条件。


背景

截至2020年,全球约有11亿城市居民居住在非正式定居点。在中国,这类定居点通常称为“城中村”,它们是大规模且复杂的城市区域,特征包括非规划建设的临时性住房结构、缺乏正式土地使用权,并可能面临基础设施和公共服务的不足。城中村通常居住着社会边缘化和经济脆弱的群体,他们长期面临贫困与社会不平等,这对社会公正和人权带来了严峻挑战。尽管中国政府近期启动了城中村改造项目,但数据匮乏成为这一工作的重要障碍。无序的城市扩张导致城中村边界变化频繁,给政府识别和更新这些区域带来了巨大困难,进而阻碍了联合国可持续发展目标(SDGs 11)的实现,即创建“包容、安全、韧性和可持续”的城市。


利用高分辨率卫星影像、街景图像和社会感知数据(如兴趣点、车辆轨迹及社交媒体签到记录)可有效地识别城中村的边界。然而,卫星影像质量的差异导致数据主要集中于大城市或特定区域,限制了跨地区的全面识别能力。此外,城中村的形态多样性受地理条件、气候影响和历史发展等因素的影响,给长期监测带来显著挑战,尤其是在训练和推断阶段存在特征不匹配的情况下。


为应对形态多样性问题,本文设计了一种基于地理邻近性的半自动化工作流程,通过地理第一定律的启发,以更全面和可靠的分割方法对城中村进行边界识别。我们采用了先进的语义分割模型,以卫星图像进行预训练,并通过课程学习方案在地理相近的城市上进行标注迁移。在五个代表性城市的实验结果表明,该方法在不同城市背景下均表现出色。这一方法的成功实施,为未来城中村的再开发和政策制定提供了关键洞见,有助于在数据匮乏的背景下支持脆弱群体,并推动可持续发展目标的实现。


方法


图1 所提模型的流程框架


现有的语义分割模型通常在具有丰富内容信息的自然图像上进行训练,这限制了其在卫星图像中特征识别的有效性。此外,由于城中村的形态多样性,仅依赖标注数据进行分布外推断面临较大挑战。为了解决这些问题,我们提出了一种结合预训练与课程学习的策略。


1.预训练:为增强分割模型在多年份卫星图像中捕捉特征的能力,我们采用对比学习(SimCLR)对整个卫星图像数据集进行预训练。具体而言,对每张图像应用多种数据增强操作,模型学习到在不同变换条件下保持一致的卫星图像特征表示,从而有效提取卫星图像的特征。预训练后的模型参数 为分割任务提供了强大的初始特征表示



2.基于地理学第一定律的半监督方法:在预训练模型的基础上,根据托布勒地理学第一定律,地理相近城市的形态可以假定更具相关性。因此,在每次迭代中选择邻近城市的伪标签,逐渐扩大范围。这个迭代过程逐步整合了地理多样性,通过类似课程的学习确保了模型的稳定性。

  • 微调预训练模型:用标注数据微调预训练模型,以获得新的参数
  • 伪标签生成:利用对未标注数据 进行分割,生成伪标签和置信度分数。
  • 充种子数据:选择高置信度的伪标记样本来扩充种子数据 ,并再次微调预训练模型以获得新的参数
  • 迭代更新:替换为新的模型参数,并在每次迭代中添加更多高置信伪标签。如此循环,逐步完成一个完整的半监督迭代过程,提升模型在不同地理区域上的分割能力。

实验结果

模型表现


表1 模型表现


首先,我们的方法在检测和分割任务中表现优异,成功适应了城中村的多样化形态特征。具体而言,检测精度达到0.900,F1分数为0.830,分割IoU为0.665。预训练与课程式标注组合带来了整体119%的性能提升,验证了方法在分布外场景中的适用性。性能提升主要得益于预训练和第一轮伪标签标注的贡献。其次,第二轮伪标签标注虽然带来的提升相对较小,但仍对检测精度和分割效果分别有2.4%和1.4%的增益。大多数城中村边界能够被准确检测,且与专家标注高度吻合,表明该方法在不同城市和时间段上具备稳健性。最后,尽管部分小城市的数据存在缺失,但我们的结果为中国城中村的更新与改造提供了可靠的基础。

城市规模的差异


图2 历年城中村的面积和数量


城市规模通常会显著影响城中村的分布,而人口的快速流入则是城中村形成的关键因素之一。我们进一步分析了不同规模城市(小至中等城市、大城市和超大城市)在各个年份的城中村面积和数量变化趋势。

对于小至中等城市(如图2(a)所示),我们观察到在2020年之前,城中村的面积和数量迅速增加,分别达到2600平方公里和超过31000个单位,与当时的城镇化扩展趋势一致。对于大城市,尽管也经历了“增长-减少”模式,但自2017年以来城中村拆除速度显著加快,总面积从峰值减少了约120平方公里,数量减少了超过11%。其中,2020年至2023年是大城市城中村数量减少的主要时期,这一趋势表明大城市在更早期就已达到城镇化的高峰,并随后进行更大幅度的拆除。


对于人口超过500万的超大城市,由于城镇化水平相对较高和土地资源有限,地方政府倾向于优先将城中村重新开发为适宜的建设用地。我们的分析显示,超大城市的财力和资源配置使其能够更高效地处理大规模的城中村,而小至中等城市往往缺乏相应的资源支持。这一差异可能引发公平性问题,弱势群体在小城市中获得重建机会的难度更大,若缺乏政策上的关注,未来这种不公平现象可能会进一步恶化。


城市内部分布


图3 历年城市内部的城中村分布情况


另一个值得关注的问题是城中村在城市内部的分布。经济模型表明,由于重建成本与预期收益的差异,城中村通常集中在城市中心附近。以深圳的岗厦村为例,这些位于市中心的城中村往往具有更高的建筑密度和人口规模,同时也更可能被列为优先重建项目。

在我们的研究中,我们以城中村到城市中心的距离作为其分布的度量指标。图4中显示了随距离变化的城中村面积累积分布情况。大部分城中村集中在距离市中心10公里以内,总面积达到3430平方公里,而2公里范围内的城中村相对较少,仅为425平方公里。相比之下,距离市中心超过30公里的区域内,城中村面积仅有207平方公里。这种远离市中心的区域面积迅速减少的趋势,与城市规模的自然边界相吻合。


城市内部的分布特征对未来更新项目的规划具有重要意义。在中心城区进行重建尽管成本较高,但预期收益也更大,而在城市边缘进行翻新则成本较低但收益有限。我们的分析方法提供了精确的城中村位置和边界信息,使得对城市内部分布的微观分析成为可能,为选址决策和重建优先级的确定提供了可靠依据。


社会经济因素和标度律


图4 各城市的城市物理基础与城中村面积之间的关系


如前所述,城中村的形成与城镇化和重建过程密切相关,社会经济因素在这一过程中发挥了重要作用。我们进一步采用城市标度律的视角来分析这些物理关系。城市标度律描述了城市中多种因素的幂律关系,通常表示为,其中表示人口等基础特征,为与城市相关的各类指标。
城市的开发面积和人口规模是影响城中村发展的重要属性。图4右侧展示了城市开发面积与城中村面积的关系(双对数坐标),其中各点表示三种不同规模的城市,虚线为固定效应模型的线性回归结果。由于城中村面积是城市面积的一部分,两者呈现出显著的正相关关系(R²=0.516, p=0.000),并且回归斜率为0.863,表明城市开发面积的增长与城中村面积的增加在不同城市类型间影响相对一致。这与理论推测相符,支持了基础设施相关因素与城市规模之间存在次线性增长的关系。
此外,图4左侧展示了城中村面积与城市人口的关系(双对数坐标),同样显示出正相关性(R²=0.31, p=0.0007)。回归结果表明,城中村面积增长率低于城市人口的增长率(斜率约为0.794),即城中村面积的增加呈现次线性增长。尤其是在小至中等城市中,该系数显著低于总体平均值(约为0.704),表明相较于大城市,小城市的城中村扩展速度更慢。
我们的分析揭示了城中村与社会经济因素之间的密切关联,并在城市标度律框架下进一步探讨了这种关系。累积优势机制表明,“长尾”群体在发展过程中获得持续增长的机会,从而形成了宏观层面的标度律分布。我们的结果表明存在一个类似的机制,导致城中村现象持续存在并加剧了公平性问题,使得部分群体的生活条件未能获得相应改善。这一机制的存在表明,针对弱势群体的政策干预可能有助于缓解这些不平等现象,并为促进城中村居民的社会公平提供依据。 

参考文献

[1] Zhang X, Liu Y, Lin Y, et al. Uv-sam: Adapting segment anything model for urban village identification[C]//Proceedings of the AAAI Conference on Artificial Intelligence. 2024, 38(20): 22520-22528.


[2] Chen B, Feng Q, Niu B, et al. Multi-modal fusion of satellite and street-view images for urban village classification based on a dual-branch deep neural network[J]. International Journal of Applied Earth Observation and Geoinformation, 2022, 109: 102794.


[3] Cascante-Bonilla P, Tan F, Qi Y, et al. Curriculum labeling: Revisiting pseudo-labeling for semi-supervised learning[C]//Proceedings of the AAAI conference on artificial intelligence. 2021, 35(8): 6912-6920.

数据科学与智能实验室
本公众号为清华大学电子系数据科学与智能实验室的公众账号,主要推送实验室重要通知、日常活动、文章导读、前沿分享等资讯,敬请关注。
 最新文章