第1074篇|文献研读|Sus. Cit. Soc.|通过 XGBoost 模型探索城市热环境的尺度效应

文摘   2024-10-22 16:59   河南  

2024

10/22



[通过 XGBoost 模型探索城市热环境的尺度效应]



●●●




PART.01

  研究背景  



在全球变暖的背景下,城市发展正在加剧,促使人们更加关注城市热环境。城市热环境受多种因素的综合影响,包括 2D 或 3D 元素,例如城市蓝色和绿色空间的景观模式、建筑物高度、建筑密度、道路密度和人口密度。在热环境影响的相关性研究中,关系可分为线性关系和非线性关系。城市热环境与影响因素之间存在尺度效应。研究城市热环境的尺度效应可以阐明其在不同尺度上的动态,为城市规划提供精确指导。各种影响因素对城市热环境的影响在空间上是非平稳的,需要考虑不同地理位置的影响。

目前,热环境影响因素的研究主要在单一尺度上进行,通常由网格划分。在单尺度研究中,网格大小的选择通常受研究区域大小的影响,影响因素的选择在不同尺度上有所不同。选择太小的网格大小可能会导致生成大量数据。关于城市热环境研究的尺度效应,大多数学者选择不同的网格大小对同一城市进行研究,而很少有学者将他们的研究扩展到城市的不同空间尺度。

结合现有文献的不足,本文分析了不同尺度上影响因素对热环境的非线性影响,在考虑空间效应的同时,考察了电位因素在各个空间水平上对地表温度的综合影响。具体来说,本研究解决了有关城市热环境的三个关键问题:(1) 在城市尺度和中心城区尺度上,影响城市热环境的因素的重要性有何差异?(2) 在城市尺度和中心城区尺度上,影响城市热环境的各种因素的贡献有哪些空间差异?(3)各影响因素与城市热环境有什么样的非线性关系?本研究的新贡献主要包括三个方面:(1)对城市和中心城区城市热环境影响因素的重要性进行了排序。(2)将空间因子纳入分析模型,探究影响因子与城市热环境之间的复杂空间关系。(3) 采用 XGBoost 模型和解释模型分析了城市尺度和中心城区尺度上影响因素与城市热环境的非线性关系。



PART.02

  数据与方法  



1.数据来源

本研究中使用的主要数据集包括人口数据、夜间灯光数据、道路数据、建筑数据、兴趣点 (POI) 数据、遥感数据和不透水表面数据。人口数据来自第七次全国人口普查数据和统计年鉴数据,而道路数据则经历了双线性到单线性处理。夜间灯光数据来自年度 VNL V2 数据集。建筑数据来自 CBRA 数据集,不透水表面数据来自全球 30 m 不透水面动力学数据集。来自 AMAP 的 POI 数据是通过 API 获取的,随后进行过滤和分类。Landsat 8 遥感影像拍摄于当地时间 2015 年 8 月 3 日和 2020 年 8 月 16 日上午 10:24 左右。

2.研究方法

(1)非线性解析模型

XGBoost 参数调整的灵活性允许在非线性拟合中获得更好的结果。目标函数可以分为两部分:第一部分表示预测值与真实值之间的差异,第二部分是正则化项。目标函数表示如下:

当第一部分的损失函数是平方误差时,损失函数可以改写为以下形式:

正则化部分的计算方式如下:

(2)解释模型

XGBoost 模型被认为是黑盒模型,但 SHAP 模型和部分依赖图模型能够实现机器学习结果的可视化和变量非线性效应的分析。SHAP 通过计算特征对所有可能的特征组合的预测输出的贡献的加权总和来量化该特征的重要性。

(3)模型评估参数

模型评估参数可用于评估机器学习的有效性,选择均方误差 (MSE)、决定系数 (R2) 作为模型训练目标,进行 10 倍交叉验证以搜索超参数的最佳组合,并将 80% 的样本作为训练集,将 20% 的样本作为测试集。

其中 n 是样本数,𝑦^i是第 i 个样本的预测值,并且𝑦i是第 i 个样本的真实值。


PART.03

  重要图表  








PART.04

  研究结论  



该研究在两个空间尺度上探讨了各种因素对城市热环境的影响:上海市地区的 3 公里网格和中心城区的 1 公里网格。使用 Landsat 8 遥感影像对地表温度进行反演和分类,计算地表温度等级的变化量。从社会经济活动、建筑环境和蓝绿空间格局 3 个角度选择了 16 个指标,并量化了它们的变化。采用 XGBoost 模型、 SHAP 模型和 Partial Dependency Plot 模型分析不同尺度上每个因素与城市热环境之间的非线性关系及其空间变化。研究的主要发现总结如下:

(1)对上海城市热环境的分析表明,在市内,地表温度等级上升的区域主要集中在浦东新区和市中心区,而地表温度等级下降的地区主要集中在南部郊区。在中心城区,西部地表温度等级上升,而北部和东部的地表温度等级下降。

(2)各因子对城市热环境的影响在不同的空间尺度上有所不同。在城市尺度上,影响顺序为:蓝色空间景观百分比、绿色空间百分比、蓝色空间斑块密度、绿色空间景观形状指数、蓝色空间景观形状指数。相反,在中心城市尺度上,顺序为:景观绿地百分比、人口密度、绿地景观形状指数、绿地平均邻接指数、道路密度。蓝绿空间模式的变化在城市尺度上的贡献更大,而社会经济和建筑环境的变化在中心城市尺度上的贡献更大。

(3)在城市尺度上,不同因素对城市热环境的贡献存在明显的南北差异,而在中心城市尺度上没有观察到明显的模式。大多数特征变量与城市热环境表现出复杂的非线性关系。在上海市尺度和中心城市尺度上,不同特征变量对城市热环境的贡献并不完全一致,在一定范围内存在相反趋势的情况。

(4)在不同的空间尺度上,有必要为城市热环境量身定制的缓解策略。推荐措施包括强调城市尺度蓝绿空间格局的变化、中心城区尺度增加绿地、加强蓝色空间边界保护、增强设施多样性、控制城市建设强度。



PART.05

  小编说  



该文章题目为“Exploring the scale effect of urban thermal environment through  XGBoost model”,于2024年发表在Sustainable Cities and Society期刊,IF=10.5。

引用:Jingjuan He, Yijun Shi, Lihua Xu, Zhangwei Lu, Mao Feng, Junqing Tang, Xiaodong Guo,Exploring the scale effect of urban thermal environment through XGBoost model,Sustainable Cities and Society,Volume 114,2024,105763.



  文献声明  



欢迎转载、转发本号发布的内容,可留言或后台联系小编进行授权。未经授权允许的,请勿在其他渠道或平台转载转发。文中部分来源于网络的图片,以及转述他人的内容,如涉及作品版权和其他问题,请留言联系小编处理。

本期编辑:肖文文

本期文案:肖文文




<<<  END >>>








知天象
关注地球科学和物理学相关的理论、方法和前沿研究进展。
 最新文章