论文解读 | 【KDD2024】CDGON: 一种用于灾后城市人口流动性恢复预测的物理启发神经常微分方程

文摘 2024-09-19 19:35 北京

【论文标题】Physics-informed Neural ODE for Post-disaster Mobility Recovery

【论文链接】https://doi.org/10.1145/3637528.3672027（点击文末“阅读原文”即可跳转阅读）

【代码和数据】https://github.com/tsinghua-fib-lab/CDGON-KDD24

导读 / Introduction

随着城市化进程的不断加快，各类极端事件（灾害）在世界各地频繁发生，对城市居民的生命安全造成了不可忽视的影响。

台风后的城市

对于一个城市而言，其韧性代表了该城市从极端事件的冲击中快速恢复其功能的能力，其中城市地区内的人员流动发挥了关键作用^[1,2]。一方面，城市的人口流动性反映了城市居民从居住区到其他功能区获取必需资源（如食物、金钱）的行为，是衡量居民获取生活必需品满意度的关键指标^[1]。另一方面，城市出行与交通设施、办公楼等城市基础设施的正常运行有着千丝万缕的联系，从而反映了城市基础设施的恢复状况^[2]。韧性较差的城市往往需要更长的时间才能恢复正常的城市人口流动，从而对城市居民的生活造成更大的影响和更大的经济损失。因此，准确预测灾后城市的人口流动的恢复过程有助于发现高风险的城市社区，设计更好的应急响应策略，最终建设更加智能和有弹性的城市^[3]。

图1. 2019年9月飓风多里安发生前后，南卡罗莱纳州不同的县域的县域内人口流动曲线

预测城市人口流动的灾后恢复过程是一项艰巨的任务，它面临以下挑战。首先，城市人口流动的灾后恢复具有复杂的模式，这和不同的灾害情况及不同的城市规模有关。例如，可以从图1中发现，在飓风发生后，南卡罗莱纳州的不同的县域的县域内人口流动有着不同的恢复速率以及显著的波动。这些现象很大程度上是由于不同地区复杂的灾害情况以及灾前正常活动水平的固有差异造成的。然而，其潜在机制仍不清楚，并且仅使用可观察数据很难准确建模。其次，不同城市地区的恢复进程是相互依存的。区域间的相互作用（以区域间人口流动为特征）对区域内的人口流动的恢复过程具有重大影响。人口净流入较大的城市地区，由于新输入了一部分活跃人口，其区域内人口流动的恢复速度会相对较快，从而有利于城市的重建和恢复进程^[4]。此外，这些区域之间的相互作用也是高度动态的，并进一步放大了有效建模和预测其动态的复杂性^[5]。

图2. 不同城市之间的人口流动交互

现有的建模方法大都是Model-based的方法，依赖较为明确的物理解释来实现对灾后城市人口流动性恢复的建模。例如，Li et al.^[1] 提出了Spatiotemporal Decay Model（ST Decay Model）来捕捉多种灾害后城市的人口流动性的异质变化的潜在时空模式，揭示了这些变化中潜在的一致性。在该式子中，时间衰减表示随着时间推移，人类移动行为的变化幅度会逐渐减小并最终消失。而表示灾难t时刻在区域i的强度，因此，空间衰减表示目标区域周围的区域的灾难强度的加权和，代表在空间上距离灾难中心越远，该区域的人口流动受灾难的影响程度越小。于是，整个式子说明，灾难发生后降到低点的城市人口流动会随着时间的衰减和空间上的衰减逐渐恢复到常态下的城市人口流动。

图3. 时空衰减模型 (ST Decay Model)

可以发现，无论是发生疫情，野火，寒潮，还是热带风暴，ST Decay Model都能够很好地拟合包括人们不在家的时间、工人数量、在区域内流动人口数，流出区域的人口数，流入区域的人口数在内的五种人口流动性指标在灾难之后的变化模式。

图4. 五种人口流动性指标在四种自然灾害下的变化模式同ST Decay Model所描述的变化模式之间的贴近程度

然而，尽管这些模型提供了有关灾后城市人口流动性恢复的宝贵知识且拟合结果和真实情况之间的一致性较高，但这些模型的参数量有限且依赖于过度简化的假设，从而导致了它们的准确率较低，无法充分地捕捉灾后城市人口流动性的多样且复杂的恢复模式。从图4种也可以发现，在各种实验结果中的也没有十分接近1，因此ST Decay Model在建模灾后城市人口流动恢复时的准确性欠佳。此外，所有这些模型都未能有效地建模区域间人口流动对区域内人口流动的恢复过程的影响。

于是，在本文中，我们提出了一种深度学习框架来预测灾后城市人口流动性的恢复过程，称为耦合动态图 ODE 网络（Coupled Dynamic Graph ODE Network，CDGON）。首先，针对城市人口流动恢复动态的复杂多样性，该网络利用采用物理启发的机器学习思想来构建由ST Decay Model引导的神经 ODE 函数，以实现对不同地区内多样化复杂化且高度波动的城市内人口流动性恢复过程的有效建模。其次，针对城市之间的人口交互对城市人口流动的影响，我们引入另一个神经常微分函数来描述城市间人口流动的动态，该函数会形成动态图中的边来表征复杂的灾后城市间的人口流动性。这两个神经ODE函数构成的耦合神经常微分方程将联合对区域内和区域间的人口流动进行建模，即对动态图中节点和边的共同演化过程进行建模，从而有效解决了第二个挑战。

受ST Decay Model启发的耦合动态神经网络

如图5所示，CDGON主要包括三个模块，一个编码器以编码灾难来临时的城市人口流动图，以将之作为初始状态，同时编码一个常态城市内人口流动图以供神经常微分方程求解器使用；常微分方程求解器将结合初始状态和常态人口流动图编码来求解一个ST Decay Model启发的Neural ODE，从而得到未来恢复期内的多天的城市人口流动状态；最后，通过一个解码器，我们可以得到恢复期内该城市群的每天的人口流动图。

图5. CDGON的架构

我们在此主要介绍ST Decay Model启发的Neural ODE中包含的两个主要模块：物理启发动态模块（Physics-informed Dynamic Module，PIDM）和点边交互模块（Node-Edge Interaction Module，NEIM）。

其中PIDM主要认为ST Decay Model中的空间衰减同时间衰减一样也是会随着时间减弱的，从而将整个时空衰减项假设为一个负指数对数函数，再经过求导后得到一个关于城市人口流动恢复动态的常微分方程：

然后再通过在形式上接近来设计这个常微分方程：

而NEIM则通过额外设计关于区域间人口流动的常微分方程，并添加边和点之间的信息交互模块，从而成功建模区域间人口流动对区域内人口流动恢复过程的影响。最终我们所设计的ST Decay Model启发的Neural ODE主要公式如下：

除此之外，CDGON还有许多设计细节，如感兴趣，请阅读我们的文章以了解更多。

最后，在训练时，我们设计的LOSS函数也同时兼顾了点和边的预测准确性。

图6. 模型损失函数

实验结果

实验场景：我们选择了2019年发生的飓风Dorian作为目标灾害场景，该台风对美国东南部的佛罗里达州、南卡罗莱纳州，乔治亚州造成了非常严重的损害，因此佛罗里达州、南卡罗莱纳州，乔治亚州为我们的主要研究目标。

数据集：Dorian发生时期内这三个州内的人口流动数据主要由Safegraph完成了收集，原始数据主要表示CBG之间的人口流动，而由于CBG的空间跨度范围过小，城市人口流动恢复现象只有在更为宏观的层面才能观察到，因此，我们将这些CBG之间的人口流动聚合到了County内的人口流动以及County之间的人口流动，分别以此作为人口流动图上的点的特征和边的特征。同时，由于只有受到台风充分影响的地区才大概率会发生人口流动的大幅降低和恢复现象，因此，我们还根据各个州的气象条件筛选那些受到台风影响剧烈的地区，然后仅对这些地区的恢复过程展开预测。

图7. 根据气象条件构造闭包进行州筛选的结果

根据我们的观察发现，各个州的大部分County需要花费4天时间才能彻底从灾难来时的最低人口流动恢复到灾难前的人口流动水平。据此观察，我们开展了以下三个实验来测试我们的模型。

实验一：Performance Evaluation

对于每一个州，我们将这四天的人口流动图切分成两部分，前半部分（3天）用于模型训练，后半部分（1天）用于模型测试。主要评估模型使用来自同一个州的人口流动数据开展训练和测试的表现情况，由图7可以发现，相比于包括LSTM, AGCRN, NDCN, CG-ODE, STG-NCDE和CDGON在内的6个基线模型，CDGON可以在包括MAE, NRMSE, R2在内的指标上实现全方位的领先性能。

图8. 模型表现验证

图9. 同STG-NCDE相比带来的预测性能提升

实验二：Generalization

为了测试CDGON的迁移泛化性能，我们将每一个州都分别作为了源城市群，将源城市群恢复期内全部真实数据都用来训练模型，在分别训练好了对应的模型后，利用训练好的模型预测其他两个州的人口流动恢复的过程，所得到的预测表现如图10所示，可见相比于其他传统的时空序列预测模型，在预测灾后城市人口流动性恢复过程上，得到Physics-based 知识启发后的CDGON具有更好的迁移泛化的能力。

图10. 模型迁移泛化性能测试

图11. 使用佛罗里达州的数据训练的模型在南卡罗莱纳州八个人口最多的County上的恢复预测曲线

实验三：Ablation Study

通过开展消融实验，我们所设计的网络模块的有效性都得到了充分的证明。

图12. 消融实验

参考文献

[1] Weiyu Li, Qi Wang, Yuanyuan Liu, Mario L Small, and Jianxi Gao. 2022. A spatiotemporal decay model of human mobility when facing large-scale crises. Proceedings of the National Academy of Sciences 119, 33 (2022), e2203042119.

[2] Takahiro Yabe, P Suresh C Rao, Satish V Ukkusuri, and Susan L Cutter. 2022. Toward data-driven, dynamical complex systems approaches to disaster resilience. Proceedings of the National Academy of Sciences 119, 8 (2022), e2111997119.

[3] Ruoxi Wang, Qi Wang, and Nan Li. 2023. Percolation transitions in urban mobility networks in America’s 50 largest cities. Sustainable Cities and Society 91 (2023), 104435

[4] Takahiro Yabe, P Suresh C Rao, and Satish V Ukkusuri. 2021. Resilience of interdependent urban socio-physical systems using large-scale mobility data: Modeling recovery dynamics. Sustainable Cities and Society 75 (2021), 103237.

[5] Jingtao Ding, Chang Liu, Yu Zheng, Yunke Zhang, Zihan Yu, Ruikun Li, Hongyi Chen, Jinghua Piao, Huandong Wang, Jiazhen Liu, et al. 2024. Artificial Intelligence for Complex Network: Potential, Methodology and Application. arXiv preprint arXiv:2402.16887 (2024).

数据科学与智能实验室

本公众号为清华大学电子系数据科学与智能实验室的公众账号，主要推送实验室重要通知、日常活动、文章导读、前沿分享等资讯，敬请关注。

论文解读 |【WWW 2024】Health CLIP：利用卫星和街景图像中的健康特征预测抑郁率

论文解读 |【WWW 2024】基于模态纠偏提升多模态推荐公平性

会议总结 | 第47次技术研讨会 Physic-informed AI for Complex Systems 成功召开

活动预告 |【第47次技术研讨会】Physics-informed AI for Complex Systems

论文解读 |【ICWSM 2024】基于多角色合作大模型智能体的立场检测

论文解读 |【NeurIPS 2024】基于混合语言模型的科学文本引用预测

活动预告 |【第46次技术研讨会】Spatial Embodied Intelligence

论文解读 |【IJCAI 2024】从像素看发展：基于卫星图像的欠发达区域路网识别与社会经济关联性分析

论文解读｜【Nature Communications】复杂网络韧性的深度学习预测方法

论文解读 |【IJCAI 2024】脆弱度地图VulnerabilityMap：刻画美国城市弱势群体脆弱度的开放框架

收集20+时空数据集，超1.3亿样本点，清华研究团队基于生成式AI，提出3种城市复杂系统建模方法

城市科学与计算研究中心近期活动速览来啦!

【会议回顾】CNCC | 第三届“AI+复杂系统”技术论坛：赋能科学应用

玩转「智能体魔方」！清华推出AgentSquare模块化搜索框架，开启AI智能体高速进化时代

论文解读 |【IJCAI 2024】基于卫星图像识别的城中村识别与监测

活动预告 |【第45次技术研讨会】Reinforced LLM Reasoning

论文解读 |【SIGIR 2024】建模用户疲倦的序列推荐

论文解读 |【KDD 2024】UniST：基于提示学习的通用城市时空预测模型

论文解读 |【KDD 2024】基于重整化群的复杂网络长时动力学预测

虚幻5加持，清华发布首个「真实开放环境具身智能平台」与基准测试集EmbodiedCity！

论文解读 |【KDD 2024】基于拓扑与动力学生成式数据增强的复杂网络系统韧性预测

AI能否让复杂系统变简单｜CNCC第三届“AI+复杂系统”技术论坛

论文解读 |【KDD 2024】基于预训练语言模型“群体-个体”微调端测适配的用户意图预测

城市科学与计算研究中心九月活动速览来啦！

【会议回顾】研究中心多项研究成果在KDD 2024发表

活动预告 |【第44次技术研讨会】World Model

清华城市科学与计算研究中心招募AI方向科研实习生

论文解读 | 【KDD2024】CDGON: 一种用于灾后城市人口流动性恢复预测的物理启发神经常微分方程

论文解读 |【KDD 2024】OpenDiff：基于公开数据与扩散模型的移动网络流量生成

论文解读 | 【ACL 2024】EconAgent : LLM智能体驱动的宏观经济模拟

选课通知｜清华-美团联合课程《大数据技术的应用与实践》课程号：80231143

喜迎新学期，欢聚新起点——城市科学与计算研究中心八月活动速览来啦！

论文解读 |【KDD 2024】ReStruct: LLM驱动的异质图元结构发现

精彩回顾 | 第二届国际城市科学大会在清华大学成功举办

ADL153《时空数据智能》开启报名

活动预告 | 第二届城市科学大会注册通知

活动预告 |【第43次技术研讨会】LLM for Interdisciplinary Research

活动预告 |【第42次技术研讨会】Agent and Embodied AI

前沿导读 | 大模型通用推理

活动预告 |【第41次技术研讨会】AI for Urbanization and Sustainable Development

WWW 2024 Tutorial 报告: 基于大模型智能体的社会模拟仿真

活动预告 |【第40次技术研讨会】Multi-modal Large Language Model

论文解读 |【ICLR 2024】基于扩散模型参数生成的时空少样本学习

仅需 5% 训练样本达到最优性能，清华大学研究团队发布条件去噪扩散模型 SPDiff，实现长程人流移动模拟

活动预告 |【第39次技术研讨会】LLM for Computational Social Science

论文解读 |【SIGSPATIAL 2023】融合多尺度人类移动动力学增强传染病空间传播预测

论文解读 |【SIGSPATIAL 2023】基于知识增强扩散模型的城市人流量生成

城市科学与计算研究中心十二月活动速览来了~

论文解读 |【SIGSPATIAL 2023】通过街景卫星图像识别建成环境疾病传播风险

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉