论文解读 | 【KDD2024】CDGON: 一种用于灾后城市人口流动性恢复预测的物理启发神经常微分方程

文摘   2024-09-19 19:35   北京  

【论文标题】Physics-informed Neural ODE for Post-disaster Mobility Recovery

【论文链接】https://doi.org/10.1145/3637528.3672027(点击文末“阅读原文”即可跳转阅读)

【代码和数据】https://github.com/tsinghua-fib-lab/CDGON-KDD24


导读 / Introduction 




随着城市化进程的不断加快,各类极端事件(灾害)在世界各地频繁发生,对城市居民的生命安全造成了不可忽视的影响。

台风后的城市


对于一个城市而言,其韧性代表了该城市从极端事件的冲击中快速恢复其功能的能力,其中城市地区内的人员流动发挥了关键作用[1,2]。一方面,城市的人口流动性反映了城市居民从居住区到其他功能区获取必需资源(如食物、金钱)的行为,是衡量居民获取生活必需品满意度的关键指标[1]。另一方面,城市出行与交通设施、办公楼等城市基础设施的正常运行有着千丝万缕的联系,从而反映了城市基础设施的恢复状况[2]。韧性较差的城市往往需要更长的时间才能恢复正常的城市人口流动,从而对城市居民的生活造成更大的影响和更大的经济损失。因此,准确预测灾后城市的人口流动的恢复过程有助于发现高风险的城市社区,设计更好的应急响应策略,最终建设更加智能和有弹性的城市[3]


图1. 2019年9月飓风多里安发生前后,南卡罗莱纳州不同的县域的县域内人口流动曲线


预测城市人口流动的灾后恢复过程是一项艰巨的任务,它面临以下挑战。首先,城市人口流动的灾后恢复具有复杂的模式,这和不同的灾害情况及不同的城市规模有关。例如,可以从图1中发现,在飓风发生后,南卡罗莱纳州的不同的县域的县域内人口流动有着不同的恢复速率以及显著的波动。这些现象很大程度上是由于不同地区复杂的灾害情况以及灾前正常活动水平的固有差异造成的。然而,其潜在机制仍不清楚,并且仅使用可观察数据很难准确建模。其次,不同城市地区的恢复进程是相互依存的。区域间的相互作用(以区域间人口流动为特征)对区域内的人口流动的恢复过程具有重大影响。人口净流入较大的城市地区,由于新输入了一部分活跃人口,其区域内人口流动的恢复速度会相对较快,从而有利于城市的重建和恢复进程[4]。此外,这些区域之间的相互作用也是高度动态的,并进一步放大了有效建模和预测其动态的复杂性[5]

图2. 不同城市之间的人口流动交互


现有的建模方法大都是Model-based的方法,依赖较为明确的物理解释来实现对灾后城市人口流动性恢复的建模。例如,Li et al.[1] 提出了Spatiotemporal Decay Model(ST Decay Model)来捕捉多种灾害后城市的人口流动性的异质变化的潜在时空模式,揭示了这些变化中潜在的一致性。在该式子中,时间衰减表示随着时间推移,人类移动行为的变化幅度会逐渐减小并最终消失。而表示灾难t时刻在区域i的强度,因此,空间衰减表示目标区域周围的区域的灾难强度的加权和,代表在空间上距离灾难中心越远,该区域的人口流动受灾难的影响程度越小。于是,整个式子说明,灾难发生后降到低点的城市人口流动会随着时间的衰减和空间上的衰减逐渐恢复到常态下的城市人口流动



图3. 时空衰减模型 (ST Decay Model)


可以发现,无论是发生疫情,野火,寒潮,还是热带风暴,ST Decay Model都能够很好地拟合包括人们不在家的时间工人数量在区域内流动人口数流出区域的人口数流入区域的人口数在内的五种人口流动性指标在灾难之后的变化模式。


图4. 五种人口流动性指标在四种自然灾害下的变化模式同ST Decay Model所描述的变化模式之间的贴近程度


然而,尽管这些模型提供了有关灾后城市人口流动性恢复的宝贵知识且拟合结果和真实情况之间的一致性较高,但这些模型的参数量有限依赖于过度简化的假设从而导致了它们的准确率较低,无法充分地捕捉灾后城市人口流动性的多样且复杂的恢复模式。从图4种也可以发现,在各种实验结果中的 也没有十分接近1,因此ST Decay Model在建模灾后城市人口流动恢复时的准确性欠佳。此外,所有这些模型都未能有效地建模区域间人口流动对区域内人口流动的恢复过程的影响。


于是,在本文中,我们提出了一种深度学习框架来预测灾后城市人口流动性的恢复过程,称为耦合动态图 ODE 网络(Coupled Dynamic Graph ODE Network,CDGON)。首先,针对城市人口流动恢复动态的复杂多样性,该网络利用采用物理启发的机器学习思想来构建由ST Decay Model引导的神经 ODE 函数,以实现对不同地区内多样化复杂化且高度波动的城市内人口流动性恢复过程的有效建模。其次,针对城市之间的人口交互对城市人口流动的影响,我们引入另一个神经常微分函数来描述城市间人口流动的动态,该函数会形成动态图中的边来表征复杂的灾后城市间的人口流动性。这两个神经ODE函数构成的耦合神经常微分方程将联合对区域内和区域间的人口流动进行建模,即对动态图中节点和边的共同演化过程进行建模,从而有效解决了第二个挑战。


受ST Decay Model启发的耦合动态神经网络 




如图5所示,CDGON主要包括三个模块,一个编码器以编码灾难来临时的城市人口流动图,以将之作为初始状态,同时编码一个常态城市内人口流动图以供神经常微分方程求解器使用;常微分方程求解器将结合初始状态和常态人口流动图编码来求解一个ST Decay Model启发的Neural ODE,从而得到未来恢复期内的多天的城市人口流动状态;最后,通过一个解码器,我们可以得到恢复期内该城市群的每天的人口流动图。


图5. CDGON的架构


我们在此主要介绍ST Decay Model启发的Neural ODE中包含的两个主要模块:物理启发动态模块(Physics-informed Dynamic Module,PIDM)点边交互模块(Node-Edge Interaction Module,NEIM)

其中PIDM主要认为ST Decay Model中的空间衰减同时间衰减一样也是会随着时间减弱的,从而将整个时空衰减项假设为一个负指数对数函数,再经过求导后得到一个关于城市人口流动恢复动态的常微分方程:


然后再通过在形式上接近来设计这个常微分方程:

NEIM则通过额外设计关于区域间人口流动的常微分方程,并添加边和点之间的信息交互模块,从而成功建模区域间人口流动对区域内人口流动恢复过程的影响。最终我们所设计的ST Decay Model启发的Neural ODE主要公式如下:

除此之外,CDGON还有许多设计细节,如感兴趣,请阅读我们的文章以了解更多。

最后,在训练时,我们设计的LOSS函数也同时兼顾了点和边的预测准确性。

图6. 模型损失函数

实验结果




实验场景:我们选择了2019年发生的飓风Dorian作为目标灾害场景,该台风对美国东南部的佛罗里达州南卡罗莱纳州乔治亚州造成了非常严重的损害,因此佛罗里达州、南卡罗莱纳州,乔治亚州为我们的主要研究目标。

数据集:Dorian发生时期内这三个州内的人口流动数据主要由Safegraph完成了收集,原始数据主要表示CBG之间的人口流动,而由于CBG的空间跨度范围过小,城市人口流动恢复现象只有在更为宏观的层面才能观察到,因此,我们将这些CBG之间的人口流动聚合到了County内的人口流动以及County之间的人口流动,分别以此作为人口流动图上的点的特征和边的特征。同时,由于只有受到台风充分影响的地区才大概率会发生人口流动的大幅降低和恢复现象,因此,我们还根据各个州的气象条件筛选那些受到台风影响剧烈的地区,然后仅对这些地区的恢复过程展开预测。


图7. 根据气象条件构造闭包进行州筛选的结果


根据我们的观察发现,各个州的大部分County需要花费4天时间才能彻底从灾难来时的最低人口流动恢复到灾难前的人口流动水平。据此观察,我们开展了以下三个实验来测试我们的模型。


实验一:Performance Evaluation

对于每一个州,我们将这四天的人口流动图切分成两部分,前半部分(3天)用于模型训练,后半部分(1天)用于模型测试。主要评估模型使用来自同一个州的人口流动数据开展训练和测试的表现情况,由图7可以发现,相比于包括LSTM, AGCRN, NDCN, CG-ODE, STG-NCDE和CDGON在内的6个基线模型,CDGON可以在包括MAE, NRMSE, R2在内的指标上实现全方位的领先性能。


图8. 模型表现验证


图9. 同STG-NCDE相比带来的预测性能提升


实验二:Generalization

为了测试CDGON的迁移泛化性能,我们将每一个州都分别作为了源城市群,将源城市群恢复期内全部真实数据都用来训练模型,在分别训练好了对应的模型后,利用训练好的模型预测其他两个州的人口流动恢复的过程,所得到的预测表现如图10所示,可见相比于其他传统的时空序列预测模型,在预测灾后城市人口流动性恢复过程上,得到Physics-based 知识启发后的CDGON具有更好的迁移泛化的能力。

图10. 模型迁移泛化性能测试

图11. 使用佛罗里达州的数据训练的模型在南卡罗莱纳州八个人口最多的County上的恢复预测曲线


实验三:Ablation Study

通过开展消融实验,我们所设计的网络模块的有效性都得到了充分的证明。

图12. 消融实验


参考文献




[1] Weiyu Li, Qi Wang, Yuanyuan Liu, Mario L Small, and Jianxi Gao. 2022. A spatiotemporal decay model of human mobility when facing large-scale crises. Proceedings of the National Academy of Sciences 119, 33 (2022), e2203042119.


[2] Takahiro Yabe, P Suresh C Rao, Satish V Ukkusuri, and Susan L Cutter. 2022. Toward data-driven, dynamical complex systems approaches to disaster resilience. Proceedings of the National Academy of Sciences 119, 8 (2022), e2111997119.


[3] Ruoxi Wang, Qi Wang, and Nan Li. 2023. Percolation transitions in urban mobility networks in America’s 50 largest cities. Sustainable Cities and Society 91 (2023), 104435


[4] Takahiro Yabe, P Suresh C Rao, and Satish V Ukkusuri. 2021. Resilience of interdependent urban socio-physical systems using large-scale mobility data: Modeling recovery dynamics. Sustainable Cities and Society 75 (2021), 103237.


[5] Jingtao Ding, Chang Liu, Yu Zheng, Yunke Zhang, Zihan Yu, Ruikun Li, Hongyi Chen, Jinghua Piao, Huandong Wang, Jiazhen Liu, et al. 2024. Artificial Intelligence for Complex Network: Potential, Methodology and Application. arXiv preprint arXiv:2402.16887 (2024).


数据科学与智能实验室
本公众号为清华大学电子系数据科学与智能实验室的公众账号,主要推送实验室重要通知、日常活动、文章导读、前沿分享等资讯,敬请关注。
 最新文章