关注⬆️ 设为星标🌟
澳大利亚科廷大学张泽华博士、宋泳泽博士发表了稳健交互探测器模型,解决了在空间数据存在极端异常值的情况下仍可以进行稳健的多变量空间交互,得到最强空间交互组合影响。
摘要:
继稳健地理探测器 (Robust
geographical detector - RGD)之后,我们又进一步开发了稳健交互探测器(Robust interaction detector - RID)。RGD模型将Y变量和X变量之间的关联 [Y, X],转换成通过重新排序X变量数值大小的Y变量的一维近似时间序列的数据[Y] (sorted by X),之后将这个时间序列输入信号处理的变化点检测算法中,就可以找到遍历所有组合的最优分区。RGD 主要针对factor
detector可以显著提升Y和X之间的q值,并保证q随spatial strata数目的增加而增加。论文引用:
Zhang, Z., Song, Y., Karunaratne, L. and Wu, P., 2024. Robust interaction detector: A case of road life expectancy analysis. Spatial Statistics, p.100814.
近期在 ‘Spatial Statistics’期刊发表RID模型,在使用优化算法的情况下,利用地理探测器的特性,依然可以找到多因子交互情况下的最优分区。算法步骤:1. RGD检测Y~X单因子关联并按照大小排序,同时记录各个因子的RGD分层3. 强关联的X分层保持不动,逐一添加相对弱关联因子的RGD空间分层,这样也就保证了q依然可以随spatial strata数目的增加而增加。算法测试在了西澳大利亚州道路局测量的真实数据中,我们研究道路预期寿命和一些相关X变量(交通,海拔高度,夜间灯光,道路本身物理特性,现有道路裂缝状况)之间的关联。结果显示,与交通和海拔高度相关的交互作用与道路预期寿命关联更强。RID可以保证q的数值大小可以随spatial strata数目的增加而增加。文末补充了模拟实验,进一步实例佐证RID的功能。附录设计了一组模拟实验,来观测RID在检测线性和非线性变量之间的交互情况。RID 找到的空间分层可以捕捉到非线性增强的交互情况(X1∩X2>X1+X2),而且同等数量分区情况下,RID发现的空间关联优于OPGD交互探测器。
团队发表的地理空间分析理论和方法:
https://yongzesong.com/methods/