RS DL
论文介绍
题目:A multi-view graph neural network for building age prediction
期刊:ISPRS Journal of Photogrammetry and Remote Sensing
论文:https://www.sciencedirect.com/science/article/pii/S0924271624003885
创新点
提出了一种多视角图神经网络(BAPN)框架,用于建筑年龄预测,综合考虑了空间自相关、空间异质性和语义相似性。 基于空间分组的异质性感知图卷积网络(HGCN)创新性地捕获了空间异质性特征。 综合利用建筑footprints数据与高分辨率(VHR)遥感影像,通过多层次深度特征提取与融合,提升模型预测能力。
数据
1. 建筑footprints数据
来源:北京市测绘研究院提供的实地调查数据。 内容:描述建筑的几何形态和属性,主要包括:
周长:建筑物外边界的总长度。 面积:建筑的占地面积。 高度:建筑的总高度。 地上/地下层数:建筑的层数信息。 建筑功能:如住宅、商业、工业用途等。 建筑材料:如砖木结构、钢筋混凝土等。
分布:
海淀区:包含约30,000个建筑记录,年代较新,多为1980年后的建筑。 东城区:包含约150,000个建筑记录,多为1950年以前的历史建筑。 西城区:包含约160,000个建筑记录,与东城区类似,建筑年代较为久远。 时间范围:数据覆盖建筑年代从 1900年到2020年,并分为8个时间段(1950年前、1950-1960等)。
2. 高分辨率(VHR)遥感影像数据
分辨率:影像分辨率为 1米。 用途:
通过影像提取建筑顶层及周围环境的纹理和光谱特征。 提供与建筑footprints数据互补的物理环境信息。
处理:
使用建筑footprints的掩膜进行裁剪,确保影像与建筑对应。 为解决高层建筑部分超出掩膜的问题,添加10米缓冲区捕捉建筑的完整形态。
方法
总体流程
多视角特征提取
建筑footprints特征提取:
利用多层感知机(MLP)提取建筑footprints的属性特征,如面积、周长、高度、地上/地下层数、功能和材料。
对连续变量进行标准化处理,对离散变量采用独热编码,确保模型能更好地学习多样化的特征。
遥感影像特征提取:
使用预训练的ResNet50模型对高分辨率遥感影像提取视觉特征。
对建筑的顶层及周边环境进行分析,提取影像中隐藏的光谱和纹理信息。
特征融合:
将建筑footprints特征和遥感影像特征结合,通过线性层和激活函数实现多模态特征的融合,为后续的图神经网络建模提供输入。
2. 多视角图神经网络建模
为了解决建筑年龄预测中存在的空间效应和语义关系建模问题,提出了一种由三个模块组成的多视角图神经网络(BAPN)框架:
空间自相关模块(SA):
利用邻近建筑的属性特征,建模建筑间的空间关联性。 引入距离权重,重点关注建筑之间的空间衰减效应,即邻近建筑对目标建筑的影响更大,远离建筑的影响逐渐减弱。
空间异质性模块(SH):
核心组件HGCN,动态调整图卷积的权重,使模型能够适应建筑在形态和分布上的多样性。 针对建筑分布的不均匀性,采用基于特征的空间分组技术,将建筑分为多个具有相似属性的子群。 模型可以对不同子群中的建筑应用不同的学习参数,从而更精准地捕获建筑在空间上的差异性。
语义相似模块(SS):
在空间距离之外,建模建筑间的语义相似性。例如,地理上相距较远但功能、材料或建筑风格相似的建筑可能有相近的建造年代。 通过构建语义图,挖掘属性空间中的潜在关系。
结果预测
多视角特征整合:将三个模块提取的特征进行整合,通过全局平均池化层提取目标建筑的多视角综合特征。
分类和回归任务:
分类:将建筑划分为8个时间段,预测建筑所属的建造年代范围。
回归:通过加权预测的方式进一步得到建筑的具体建造年份。
实验与分析
精度对比
可视化对比
建筑年龄的时空分布特征
更多图表分析可见原文
公众号欢迎优秀作者投稿!可加入优秀论文作者群:欢迎加入AI遥感优秀论文作者群!
欢迎关注
分享遥感与深度学习领域的技术、论文、书籍、新鲜事。
欢迎加入遥感与深度学习交流群(点此加入)。