这篇文章在传统的基尼系数和洛伦兹曲线图的基础上增加了随机森林(RF)和Shapley Additive Explanations(SHAP)方法来分析影响起不公平的因素。
研究目的
研究方法
1.环境绅士化区域识别:
使用双变量空间自相关分析来识别武汉市主城区的环境绅士化区域。通过分析城市公园面积和房价之间的空间自相关性,确定环境绅士化区域。
2.改进的Multi-G3SFCA方法:
3.Gini系数和Lorenz曲线:
4.随机森林(RF)和Shapley Additive Explanations(SHAP)方法:
使用RF模型构建非线性模型,分析建成环境和街道活力的影响因素。 使用SHAP算法解释机器学习模型的结果,确定每个特征对模型预测的贡献。
5.数据来源和预处理:
城市公园数据:从百度地图API提取,结合遥感图像和实地调查。 住宅社区数据:从安居客网站获取,包括位置、坐标、价格、户数、建筑年代和容积率。 旅行时间数据:使用高德地图路线规划API获取从每个住宅社区到公园入口的旅行时间。
结果
1. 城市公园可达性不均分析
- Multi-G3SFCA方法应用结果
: 文章通过改进的三步浮动捕获区域(Multi-G3SFCA)方法,得出了不同城市公园级别的可达性地图。这些地图展示了基于观察到的旅行行为得出的相对可达性值,使用自然断裂法进行分类,并用连续的颜色梯度表示。深色红色表示高可达性,而深色蓝色表示低可达性。
2. 环境绅士化区域城市公园可达性不均
- Gini系数和Lorenz曲线分析结果
: 使用Gini系数和Lorenz曲线分析,文章量化了环境绅士化区域的整体城市公园可达性不均。Gini系数为0.765,表明城市公园可达性存在显著的空间不均衡,超过80%的人口只能访问20%的城市公园资源,显示了公园资源和人口分布之间的严重空间错配。
3. 城市公园可达性不均的原因分析
多元共线性测试: 在模型选择前,文章对所有自变量进行了多元共线性测试,发现一些变量的VIF值超过10,表明存在显著的共线性。因此,文章认为传统的回归模型可能不适用,因为它们可能受到共线性的影响。
模型评估和选择: 文章比较了五种预测模型(OLS、SVM、RF、GLM和XGBoost)的有效性,通过R^2^、MAE、MSE和RMSE等指标进行评估。结果显示,随机森林(RF)模型表现最佳,具有最高的R^2^值和最低的MAE、MSE和RMSE值,表明其拟合效果最好。
SHAP分析结果: 文章通过SHAP值分析,识别了影响城市公园可达性不均的主要因素。物理空间因素对可达性不均的贡献为63%,远大于社会经济因素的37%。特别是轨道交通接近度和商业中心接近度对可达性不均的贡献分别为38%和22%,是主要的决定因素。尽管社会经济因素总体影响较小,但特定个体社会经济因素的影响显著,例如收入水平对可达性不均的贡献达到了16%。
讨论
- 研究方法的改进
:通过使用高德API获取实际旅行时间数据,考虑多种出行模式,以及基于公园实际入口估算可达性,提高了研究的准确性。 - 主要发现和对现有工作的贡献
:研究揭示了武汉市环境绅士化区域城市公园可达性的不均衡性,强调了物理空间因素的重要性,并发现了社会经济因素与物理空间因素的相互作用。 - 对公园规划和管理的影响
:建议在城市规划中平衡公园资源的供需,特别是在人口密集地区增加公园供应,并考虑不同年龄群体的出行偏好和服务需求。