最新进展 | 融合多模态数据的城市土地利用识别和不确定性分析

文摘 2024-05-15 10:21 湖北

摘要

通过融合多模态数据可以更准确地识别城市土地利用模式。然而，许多研究仅考虑地块内的社会经济和物理属性，忽略了地块之间的空间交互作用和多模态数据引起的不确定性。基于此，本研究通过构建多模态数据融合模型（MDFNet）提取“自然物理-社会经济-空间交互”属性，并结合广义加性模型和可学习权重模块构建了不确定性分析框架，以定量解释数据驱动的不确定性。实验结果显示，MDFNet在测试精度和Kappa系数上均优于其他对比方法，分别达到了0.882和0.858。不确定性分析揭示了遥感影像、社会感知数据和轨迹数据对土地利用识别的贡献程度依次递减，分别为0.361、0.308和0.232。此外，本研究还阐释了不同土地利用类别中多模态数据的协同作用机制，为城市空间分布模式的识别提供了一种准确且具有解释能力的方法。

引言

受人类活动和城市化进程的影响，城市土地利用变得复杂多样，不同用地类型之间的空间交互关系也变得错综复杂。因此，有必要设计一种高效、自动的方法来识别土地利用模式，以服务城市规划和促进可持续发展。

以往的研究主要存在两方面的不足：（1）尽管多模态数据融合已被证明可以有效识别城市土地利用类型，但大多数研究仅考虑地块内的属性，忽略地块外部空间交互关系。而地块之间的空间上下文信息对理解城市空间结构至关重要，有必要进一步将空间交互特征引入研究中；（2）缺少对于土地利用识别中多源数据导致的结果不确定性的定量分析，难以解释不同数据源对土地利用影响机制和贡献度。

针对这些问题，我们提出了一个基于深度学习的土地利用识别框架，该框架全面表征土地利用的“自然物理-社会经济-空间交互”属性，并探索数据驱动的不确定性机制，以克服先前研究的局限。本研究的主要贡献为：（1）提出了一种多模态深度学习网络，通过表征土地利用的多重属性，解决现有研究在属性融合中空间关系挖掘方面的不足；（2）提出了一种考虑多模态数据特征的土地利用不确定性分析框架，通过定量分析各数据源的影响，解决了不同数据特征对土地利用识别结果影响分析的不足。

研究区和数据

本研究以广东省深圳市作为示范研究区（图1）。根据《城市用地分类与规划建设用地标准》（GB50137-2011），初步剔除了与研究无关的湖泊、裸地、耕地等区域。然后根据深圳市地块尺度的实际土地利用情况对样本进行标注，并将土地利用类别分为居住、商业、工业、公共服务设施、物流仓储和绿地等六个类别。

图1. 研究区概况

如表1所示，本研究使用三种类型的数据集作为输入数据，包括遥感影像（HSR）、腾讯时序人口数据（RTUD）和出租车轨迹数据（TTD）。基于前人研究结论，本研究采用480 m × 480 m的格网尺度进行实验，并将HSR和RTUD裁剪成相同大小的影像块以用于模型输入。将TTD映射至网格内和其他数据进行空间匹配。以同一辆出租车的上车地点和下车地点为依据作为不同网格的交互关系，构建图网络，并将网格之间的交互次数作为边权重。计算网格内的平均瞬时速度、上车次数和下车次数，作为当前节点的属性值。

表1. 本研究所使用的多模态数据源

方法

本研究所使用的方法流程图如图2所示。该方法采用基于深度学习的多模态数据融合网络来绘制城市土地利用图。研究过程包括三个主要部分：（1）构建多模态数据融合模型，并选择特定的分支网络从多模态数据中提取多种属性，以用于土地利用识别；（2）利用不确定性分析框架定量研究多模态数据对结果的影响机制；（3）基于模型结果绘制城市土地利用分布模式并分析研究区的空间格局。

图2. 方法流程图

结果

5.1 模型精度验证

图3显示各模型的训练结果。融合三种数据源的MDFNet性能最优（测试精度为0.882，Kappa为0.858）。在单一数据源中，基于HSR的ResNet-based模型测试精度为0.806，Kappa为0.752，远高于其他两种数据源。模型5和6将HSR与RTUD或TTD结合，测试精度分别达到0.862和0.851，比仅用HSR方法提高6.9%和5.5%。对比模型5和7可分析空间交互效应。结果显示，考虑TTD的多模态数据融合精度提升了2.3%。

图3. 模型性能及混淆矩阵

通过混淆矩阵，我们观察到在数据融合后，大多数类别的准确性显著提升。对于住宅和绿地类别，单一数据源已经获得较高精度，数据融合进一步提高或保持准确性。对于公共服务设施和仓库类别，单一数据源的表现较差，最高准确率分别仅为54%和76%。但通过多模态数据融合后，这两个类别的准确率分别提升至78%和88%，这表明所提出的模型能够自适应地学习不同数据源的特征，从而提高了识别精度。

5.2 模型消融分析

MDFNet包括特征提取和注意力机制等多个模块，需要进行消融分析来验证各模块重要性。消融实验结果如表2所示，移除BiLSTM或FCN（即模型2和模型3）会导致性能下降，这强调了提取RTUD中代表土地利用的长短期时序社会活动特征的重要性。在验证基线模型ResNet时，我们尝试删除HSR特征提取模块的iAFF，并用VGG16替换ResNet，形成模型4和模型5。实验结果均表明模型精度有所降低。通过这些消融分析实验，证实了MDFNet模型中各个模块对于实现最佳识别结果的必要性。

表2. 消融分析结果

此外，我们发现，改变模型结构对性能提升的影响相对较小（最高仅为3.6%），而数据融合则突破了模型结构的限制，提升了9.4%。以数据为中心的人工智能（Data-centric AI）已被证明是有效的，这意味着未来的研究应该集中在多模态数据融合方法上。

5.3 典型区域结果分析

我们选取了几个典型区域进行误差分析。RTUD和HSR的融合能够弥补以正确识别那些缺乏显著社会经济属性或自然物理特征的区域。例如，ResNet模型能够提取出显著的建筑结构（如规整建筑、运动场等）进行精确识别，以避免RTUDNet的错误分类。而RTUD能够识别出在视觉上容易混淆但时序特征明显的区域，例如图4(C)中的商业游乐园，其丰富的绿化和布局可能被错误地判断为公共服务设施，但其在RTUD呈现节假日人流量明显高于工作日，使得模型能够得出正确的识别结果。

融合空间交互信息可以更准确地识别土地利用结果。如图4(E)中，在HSR上具有公共服务设施（篮球场）的典型特征。再加上RTUD表现为工作日人流少和周末人流较多，这种模式与公共设施使用情况一致，导致难以获得正确结果。而引入TTD提取空间上下文信息可以有效识别这些复杂样本。

图4. 土地利用分类结果误差分析。红色表示分类正确，黑色表示分类错误。

5.4 不确定性分析

多模态数据中的深层语义差异会导致结果的不确定性，但现有研究多数只生成，并未阐明决策机制。本研究采用可解释性技术，从ante-hoc和post-hoc两个方面分析数据和结果之间的关系，量化不同数据源对土地利用识别的影响。在ante-hoc，基于多分类可解释模型（MC-EBM）计算不同数据源的总体贡献。在post-hoc，从可学习权重模块中提取了更新的特征向量，以进一步分析多模态数据在不同土地利用类别中的贡献程度。

基于MC-EBM的结果表明，HSR、RTUD和TTD在总体任务中的贡献程度依次降低，分别为0.361、0.308和0.232。通过可学习权重进一步发现，HSR在大多数具有突出建筑属性的类别（如工业用地、仓储用地和绿地）中发挥重要作用，W_HSR值约为0.4，证实了遥感影像在总体任务以及在多数类别中占主导地位。RTUD能够用于有效作用域社会经济活动明显的商业和公共服务设施（W_RTUD为0.408和0.404）。TTD则对于空间交互频繁的住宅用地至关重要（W_TTD为0.4）。

5.5 土地利用制图与分析

基于训练好的MDFNet进行制图。研究发现，以绿地为主的非建成区用地占总面积的51.1%，与城市建设统计年鉴（https://www.mohurd.gov.cn/）中表述的结论相符。城市建成区中，工业用地和仓储用地分别占12%和10.4%，集中在郊区和沿海地区，这些地方租金成本低且海陆运便利。住宅用地、公共服务设施和商业用地分别占15.5%、7.8%和3.2%，呈现出混合分布模式，符合“15分钟社区生活圈”规划方案。

图5. 土地利用空间分布模式和典型区域。(A)机场，(B)大学城，(C)政府，(D)工业区，(E)贸易港。

结论

本研究构建了一种新型的城市土地利用识别框架，通过融合遥感影像、腾讯时序人口数据和出租车轨迹数据，提取“自然物理-社会经济-空间交互”等属性以全面了解土地利用模式。该方法在深圳进行了验证，结果表明该模型优于其他方法，测试精度达到0.882，证明了多模态数据融合的必要性。本研究的另一个重要贡献是构建了不确定性分析框架，阐明了多模态数据在整体任务中的作用，并量化了多源数据对各土地利用类别的贡献程度。为今后相关研究制定数据融合方案提供了一个有效框架。

参考文献

Yan, X., Jiang, Z., Luo, P., Wu, H., Dong, A., Mao, F., ... & Yao, Y*. (2024). A multimodal data fusion model for accurate and interpretable urban land use mapping with uncertainty analysis. International Journal of Applied Earth Observation and Geoinformation, 129, 103805.

点击“阅读原文”跳转UrbanComp官网阅读和下载原文。

你可能感兴趣

论文 | 通过时间序列社交媒体数据挖掘中国县域尺度城市功能模式

论文 | 基于兴趣点语义嵌入的城市功能区分布估计

论文 | 时序电力数据可以用于城市功能结构识别吗？

论文 | 基于多源大数据和互相关语义信息挖掘的城市功能识别

论文 | 基于路网和复杂图论的多层次城市社区发现和功能区识别

http://mp.weixin.qq.com/s?__biz=MzI2MDYwNzQzMQ==&mid=2247487319&idx=1&sn=6c261db6dc9db1bc10c50a492a3e91e6

UrbanComp位置智能和城市感知

中国地质大学（武汉）地理与信息工程学院姚尧老师课题组，UrbanComp@HPSCIL的科研发布公众号。研究方向为地理位置智能、时空数据挖掘和可计算城市科学。团队主页：https://www.urbancomp.net。

最新文章

最新进展 | 共享单车出行背景下地铁站的异质可达性对土地利用变化的影响

最新进展 | 艾滋病防控新视野：时空分析揭示中国疫情发展关键节点

最新进展 | 基于心梗风险和医疗资源优化的自动体外除颤器（AED）位置选址

数据发布 | CN-MSLU-100K：地块（社区）尺度全国土地利用类别数据集

最新进展 | DCAI-CLUD：以数据为中心的土地利用数据集构建框架

最新进展 | 基于街景数据的老年人视觉绿地与抑郁的关系研究

最新进展 | UrbanCLIP: 基于街景图像的零样本城市功能推断框架

代码开源 | UrbanVCA（Python版）开源

公益讲座 | 地理空间智能（GeoAI）学术研讨会及编程工作坊 | 5.25 武大徕卡厅

Python地理空间Workshop | 基于多源数据融合的土地利用分类模型

Python地理空间Workshop | 面向复杂城市系统的大规模物流优化算法

Python地理空间Workshop | 基于街景图像的城市绿化空间分析

最新进展 | 融合多模态数据的城市土地利用识别和不确定性分析

学术讲座 | GeoAI 2024系列在线讲座

会议通知 | 第三届社会遥感地理计算暨中国遥感应用协会社会遥感地理计算专业委员会学术年会

最新进展 | 土地覆盖变化矢量元胞自动机模型的适用性及敏感性分析

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉