还不会分析地理数据的空间变化规律?教你可解释的地理加权集成学习方法GWRBoost

文摘   2024-12-16 18:50   北京  


本活动来自和鲸社区与 GISphere 联合举办的 Python x GIS Workshop 第四期,了解往期活动:
基于机器学习的城市内涝热点区域预测
2022 年飓风伊恩期间人员疏散和流动性分析
探究城市二氧化碳不确定性的影响因素:以福建省晋江市为例


地理加权回归(GWR)是解析地理现象与驱动因素关系的利器,但当面对复杂的大规模非线性数据时,常会陷入“心有余而力不足”的窘境,难以兼顾拟合精度和空间解释能力。
本次 Workshop 将带你探索基于梯度提升的地理加权集成学习方法,通过模拟实验,揭秘这一方法如何突破传统 GWR 的局限,既提升性能,又保留空间变化的可解释性。

点这里免费报名学习


 · 学习背景 ·  

地理加权回归(Geographically weighted regresion, GWR)是估计依赖变量和独立变量之间的关系在地理背景下的空间变化的重要工具,在诸多科学领域都有着广泛的应用。然而,GWR 存在一个问题,即构成 GWR 模型的经典线性回归更容易出现拟合不足的情况,特别是对于大规模和复杂的非线性数据,导致性能较差。一些先进的模型,如决策树和支持向量机,可以更有效地学习复杂数据的特征,但它们无法提供对局部关系的空间变化的可解释性量化。

在本课程中,我们将实现一种基于梯度提升的地理加权集成学习方法。并在空间网格上根据人为设定的变量依赖关系生成模拟数据集,以进行算法实现的应用与性能测试。同时和 GWR 基准模型进行对比。该方法应用了局部加法模型和梯度提升优化方法来减轻拟合不足问题,并保留了地理位置变量之间空间变化的可解释性量化能力。


 · 学习目标 · 

· 了解线性回归和地理加权回归的原理并实现,识别其不足之处

· 了解 GWRBoost 的原理并实现

·  在模拟数据集上进行性能测试


<gif. 教案预览>



 · 主办方 · 

GISphere 致力于实现全球地理信息科学 (GIS) 教育的民主化。由一群富有远见的中国学生和学者于 2019 年创立,其使命是促进 GIS 教育的信息自由,加强学术交流与合作,并为学术界和工业界做出重大贡献。


 · 特邀导师 · 

王晗 香港大学博士生。个人主页:https://hanwgeek.github


 · 学习大纲 · 

    1. 背景介绍

    1. 简介
    2. 学习目标
    3. 问题概述
    4. 解决办法
    5. 空间异质性

    2. 数据集概述

    3. 基于地理加权的多元线性回归
  1. 多元线性回归实现

  2. 地理加权回归实现

4. 基于梯度提升的地理加权集成学习方法

  1. GWR 的问题

  2. 梯度下降提升方法

5. 结论

6. 作业

基础:理解线性回归,GWR 和 GWRBoost 的流程。将模型包装为函数后在所有的 100 个模拟数据集上完成性能验证并对比结果
进阶:尝试进行多重实验,实现检查和控制过拟合的方法


<fig1. GWR现存问题1>


<fig 2. GWR现存问题2>


<fig.3 GWRBoost>


    

 · 活动日程安排 · 
·  即日起开放报名:点击免费报名学习
·  12 月 5 日开始:查看教案,在线运行调试
·  2025 年 1 月 16 日 12:00 前:完成作业,提交
·  2025 年 1 月中旬(具体日期待定):参加讲解交流会(会议具体信息,请关注活动页面上的通知)



 · 报名 · 
活动页面
https://www.heywhale.com/u/29c8f4
(复制这个链接,使用电脑浏览器打开)
小程序

 · 活动交流群 · 
扫描下方二维码,添加社区官方小助手微信
回复 GIS 即可接收邀请,进入交流群



地学万事屋
分享先进Matlab、R、Python、GEE地学应用,以及分享制图攻略。
 最新文章