论文解读 |【SIGSPATIAL 2023】融合多尺度人类移动动力学增强传染病空间传播预测

文摘其他 2024-01-13 22:14 江苏

融合多尺度人类移动动力学增强传染病空间传播预测

针对传染病传播的建模和预测，研究者们已经提出了许多基于微观用户接触图或宏观人口流动图的人类移动动态预测传染病的空间传播的方法。然而，现有的纯宏观和纯微观模型在建模能力或保护用户隐私方面存在局限性。因此，本文提出了一种用于预测传染病空间传播的多尺度疾病空间预测网络MSDNet，结合人口流动图中宏观信息和用户接触图中微观信息的时空特征，采用宏微观协同的方式预测传染病的传播。

·文章题目：Enhancing Spatial Spread Prediction of lnfectious Diseasesthrough Integrating Multi-scale Human Mobility Dynamics

·作者：唐寅洲，王寰东，李勇

·会议：ACM SIGSPATIAL 2023

·DOI: https://doi.org/10.1145/3589132.3625586

·论文链接：https://dl.acm.org/doi/pdf/10.1145/3589132.3625586

·开源代码：https://github.com/tsinghua-fib-lab/MSDNet

PART/ 01 介绍

对于流行病学的测量、建模和监测可以帮助公共卫生专家了解流行病的特性、帮助政府管理人员制定防控决策、为普通民众提供基本信息[1]。利用先进的定位和移动通信技术收集的移动轨迹数据，已经提出了许多基于人类移动动力学的方法来预测传染病的空间传播。根据建模粒度的不同，流行的传染病预测模型可分为微观模型和宏观模型[2]。

微观模型采用微观用户接触图，以用户为节点，用户之间的接触为边，在用户层进行建模和预测[3-4]。然而，这些模型需要与个体层面的用户感染信息状态相关联的细粒度用户移动轨迹，而由于隐私问题和通用数据保护条例等监管要求，这些数据难以获取。

宏观模型利用人口流动图建模和预测区域间的传染病传播。然而，尽管宏观建模的数据具有高度标准化和稳定性，但是存在忽略个体层面变化、过度简化现实、使用不完整或不精确的数据的缺点[5-6]。

在宏观层面上对传染病传播进行建模时，现有方法面临诸多挑战：首先，在对传染病参数进行建模时，由于先验知识的泄露和可能的病原体固有的可变性，传播能力和病原体特征是不确定的。因此，使用恒定参数描述传染病传播的整个过程是具有挑战性的。其次，传染病的区域传播模型受到传染病本身和人类流动的影响。然而，宏观层面的数据仅对区域之间的人口流动密度进行建模，缺乏对与传染病传播相关的人类流动的描述。这使得目前的模型难以准确预测传染病的传播。

为此，我们提出了MSDNet，利用宏微观协同信息在宏观层面建模预测传染病的传播。为了克服现有宏观模型在纳入细粒度人类移动动态方面的局限性，使用池化模块从微观用户接触图中提取信息，并将其与区域之间的人口流动数据相结合，用于模型中的传染病预测。此外，提出一种基于传染病传播动力学和传染病参数的损失函数，将复杂观测数据中的参数与人类移动性分离，实时预测传染病参数。

PART/ 02 方法概述

MSDNet由两个主要组件组成:池化模块和预测模块

2.1 池化模块

区域微观图的作用在于捕捉个体之间联系的信息，但是由于其稀疏性，所以需要消耗大量的计算资源和时间。为了解决这个问题，MSDNet提出了一个池化模块，通过以某种方式粗化图来从图中提取必要的微观信息。具体而言，我们使用DIFFPOOL模型以端到端的方式学习图表示，通过对每个区域的图学习一个独特的图表示，可以得到每个区域独特的嵌入，从而用于后续预测。

具体来说，在MSDNet的池化模块中，我们堆叠L层GNN模块，层l使用层l-1中生成的池化嵌入，并学习将节点分组到层l中的集群中。GNN用于提取对图回归有用的节点嵌入，并提取对层次池化有用的节点嵌入。

总的来说，MSDNet通过池化模块提取必要的微观信息来抽象区域微观图。所提方法提高了预测模型的准确性，使复杂传染病传播动力学分析成为可能。

2.2 预测模块

预测模块旨在实现宏观与微观信息的协同，利用神经网络预测传染病传播。为了实现这一点，我们将大小为的宏观信息矩阵和大小为的池化微观信息矩阵结合起来，得到协同信息矩阵。

然后，我们使用GAT基于宏观图结构将时空信息提取到图嵌入中。随后，我们将这些图嵌入输入到GRU中，以提取时间信息来预测传染病的趋势。此外，我们通过多种约束实现了对预测的不同方面的建模。为了约束长期预测，我们通过预测宏观感染人数实现了对传染病传播动态的约束。为了解耦人类移动模式与传染病特征之间的关系，以在人类移动模式改变的情况下仍实现传染病参数的稳定预测，我们对传染病参数也实施了约束。

总体而言，预测模块利用宏观和微观信息协同预测传染病传播动力学，同时结合约束条件以提高预测精度。这种方法能够实现即使存在复杂动态(如人类移动模式改变)的情况下仍能准确预测传染病趋势和参数。

2.3 传染病趋势和参数预测的双输出

当MSDNet使用历史窗口的宏微观协作数据进行预测时，我们将得到以下两个输出: 首先可以得到传染病的动态参数。传统SIS模型假设传播率和康复率随时间不变，仅反映传染病病毒的内在特征。然而，在现实中，人类流动性的变化-无论是由于政策变化还是自发减少-都可能使这些参数时变。因此，参数不再仅仅反映传染病的特征。因此，MSDNet引入了传播动力学约束损失项来分离人体运动和传染病参数，使和具有不受人体运动影响的稳定值。其次还可以得到感染数的日增量。对于第t个历史窗口，可以根据前天的信息预测未来天的传染病趋势。

2.4 具有疾病传播动力学约束和参数预测约束的损失函数

MSDNet模型旨在预测短期和长期的疾病传播动态，以及传染病的参数。为了实现这一点，该模型纳入了一种考虑到传输动力学的多预测任务的损失函数机制，利用对短期和长期预测性能的评估来联合更新参数，确保跨所有时间尺度的准确预测。此外，为了将人类流动性与传染病特征分离，引入了传染病参数预测的约束项。这种约束保证了预测的参数在人类移动模式发生变化时基本保持不变，从而使参数仅反映传染病特征。通过将此约束纳入MSDNet模型，可以准确预测疾病传播模式，同时有效分离人类移动对疾病传播的影响。MSDNet使用具有三个方面的Loss函数：第一个损失是传染病趋势预测损失。传染病趋势预测损失项用于衡量MSDNet对短期的预测，表示为模型对未来天传染病传播动态的直接预测与真实值的MSE，可由如下公式计算：

第二个损失项是传播动力学约束损失。利用MSDNet模型中的损耗项对传输速率和恢复速率进行长期预测优化。然而，由于和的信息内容有限，维度较小，我们没有直接计算这些参数的MSE。相反，我们利用和对未来天的预测产生的疾病趋势来计算损失。具体来说，在使用预测和之后，我们采用基于动态的预测方法，其中包括使用公式和当前时刻的初始动态迭代计算疾病传播动力学(, )。然后，我们可以通过计算基于动态的预测和基本事实之间的损失来优化和。基于动态的预测表示为:

该损失衡量了基于传输动力学的预测的均方误差，并有助于确保预测与长期趋势保持一致。最后一个损失项是人类移动损失。单独使用传播动力学约束损失来约束参数的预测会导致不准确的结果。这是由于人类流动的变化，如政府政策对旅行的限制，对传染病传播动态的潜在影响。如果我们直接使用动态方程拟合真实世界的疾病趋势，因为人类的移动，得到的参数将会包含人类移动模式的信息。因此，提取的参数可能不再仅仅反映疾病的固有特征。因此，我们需要一个损失项来区分传染病和人类运动的特征。为此，我们训练了一个MLP，该MLP能够输出与的微观信息相关的特征MLP ()，使其与参数线性相关，从而允许将人体运动与传染病特征分离。其中，仅反映传染病特征的参数记为和，同时反映传染病和人体运动特征的参数记为和。我们假设，人类移动与传染病之间的关系是一个简单的乘法，即。因此，每个时刻的传染病参数可以表示为，由于这应该是一个随时间的常数，我们计算两个时间步之间的参数之差，应使其收敛到0。也有类似的表示。基于上述假设，我们构建人类移动损失，其公式如下:

PART/ 03 实验结果

3.1 总体性能

表1 不同模型的性能对比

实验结果表明，MSDNet在所有条件下均取得了比基线模型更高的准确率，并随着的增加保持稳定的性能。具体而言，在短期预测阶段，虽然所有模型的预测性能都相当，但时空模型STAN和MSDNet由于其捕获空间信息的能力更强，表现出更高的精度。在中期预测中，由于时间周期较长，所有模型的预测性能都较差。在长期预测阶段，只有时空模型STAN和MSDNet保持了较高的精度，而空间模型GCN和GAT未能捕获复杂的时空相互作用。MSDNet在所有预测窗口长度上都优于STAN，在RMSE方面有15%-20%的改进，在SMAPE方面有15%-30%的改进。MSDNet的出色表现可以归因于其三方面的能力：基于多尺度的图表示捕获宏观和微观信息；通过池化模块得到区域图表示来建模区域之间的相互作用；以及使用GRU时序建模捕获相对于时间序列和空间模型的疾病-时间相关性。

3.2 参数预测

表2 对于传染病参数的预测性能对比

从结果可以看出，MSDNet在预测参数时可以实现更小的误差，即只要传染病保持不变，无论人类移动如何变化，它都可以实现传染病参数的稳定预测。因此，MSDNet可以有效地将人类移动特征与传染病特征分离。

PART/ 04 结论

文中提出了一种融合宏观和微观信息的多尺度空间疾病预测网络MSDNet，以实现准确的疫情趋势预测。该模型融入了对传染病传播动力学的约束，将人类流动性的影响从传染病传播特征中分离出来。我们通过不同模型的在不同长度时间窗上的对比实验证实了MSDNet的优越性和鲁棒性；并且通过改变人类移动模式的情况下进行预测证实了算法可以很好地分离人类移动和传染病参数。

参考文献

[1] Batistela, Cristiane M., et al. "SIRSi compartmental model for COVID-19 pandemic with immunity loss." Chaos, Solitons & Fractals 142 (2021): 110388.

[2] Yu, Linyun, et al. "From micro to macro: Uncovering and predicting information cascading process with behavioral dynamics." 2015 IEEE international conference on data mining. IEEE, 2015.

[3] Kerr, Cliff C., et al. "Covasim: an agent-based model of COVID-19 dynamics and interventions." PLOS Computational Biology 17.7 (2021): e1009149.

[4] Silva, Petrônio CL, et al. "COVID-ABS: An agent-based model of COVID-19 epidemic to simulate health and economic effects of social distancing interventions." Chaos, Solitons & Fractals 139 (2020): 110088.

[5] Bailey, Norman TJ. "Macro-modelling and prediction of epidemic spread at community level." Mathematical Modelling 7.5-8 (1986): 689-717.

[6] Eichenbaum, Martin, Sergio T. Rebelo, and Mathias Trabandt. "Epidemics in the neoclassical and new-Keynesian models." (2020).

数据科学与智能实验室

本公众号为清华大学电子系数据科学与智能实验室的公众账号，主要推送实验室重要通知、日常活动、文章导读、前沿分享等资讯，敬请关注。

论文解读 |【WWW 2024】Health CLIP：利用卫星和街景图像中的健康特征预测抑郁率

论文解读 |【WWW 2024】基于模态纠偏提升多模态推荐公平性

会议总结 | 第47次技术研讨会 Physic-informed AI for Complex Systems 成功召开

活动预告 |【第47次技术研讨会】Physics-informed AI for Complex Systems

论文解读 |【ICWSM 2024】基于多角色合作大模型智能体的立场检测

论文解读 |【NeurIPS 2024】基于混合语言模型的科学文本引用预测

活动预告 |【第46次技术研讨会】Spatial Embodied Intelligence

论文解读 |【IJCAI 2024】从像素看发展：基于卫星图像的欠发达区域路网识别与社会经济关联性分析

论文解读｜【Nature Communications】复杂网络韧性的深度学习预测方法

论文解读 |【IJCAI 2024】脆弱度地图VulnerabilityMap：刻画美国城市弱势群体脆弱度的开放框架

收集20+时空数据集，超1.3亿样本点，清华研究团队基于生成式AI，提出3种城市复杂系统建模方法

城市科学与计算研究中心近期活动速览来啦!

【会议回顾】CNCC | 第三届“AI+复杂系统”技术论坛：赋能科学应用

玩转「智能体魔方」！清华推出AgentSquare模块化搜索框架，开启AI智能体高速进化时代

论文解读 |【IJCAI 2024】基于卫星图像识别的城中村识别与监测

活动预告 |【第45次技术研讨会】Reinforced LLM Reasoning

论文解读 |【SIGIR 2024】建模用户疲倦的序列推荐

论文解读 |【KDD 2024】UniST：基于提示学习的通用城市时空预测模型

论文解读 |【KDD 2024】基于重整化群的复杂网络长时动力学预测

虚幻5加持，清华发布首个「真实开放环境具身智能平台」与基准测试集EmbodiedCity！

论文解读 |【KDD 2024】基于拓扑与动力学生成式数据增强的复杂网络系统韧性预测

AI能否让复杂系统变简单｜CNCC第三届“AI+复杂系统”技术论坛

论文解读 |【KDD 2024】基于预训练语言模型“群体-个体”微调端测适配的用户意图预测

城市科学与计算研究中心九月活动速览来啦！

【会议回顾】研究中心多项研究成果在KDD 2024发表

活动预告 |【第44次技术研讨会】World Model

清华城市科学与计算研究中心招募AI方向科研实习生

论文解读 | 【KDD2024】CDGON: 一种用于灾后城市人口流动性恢复预测的物理启发神经常微分方程

论文解读 |【KDD 2024】OpenDiff：基于公开数据与扩散模型的移动网络流量生成

论文解读 | 【ACL 2024】EconAgent : LLM智能体驱动的宏观经济模拟

选课通知｜清华-美团联合课程《大数据技术的应用与实践》课程号：80231143

喜迎新学期，欢聚新起点——城市科学与计算研究中心八月活动速览来啦！

论文解读 |【KDD 2024】ReStruct: LLM驱动的异质图元结构发现

精彩回顾 | 第二届国际城市科学大会在清华大学成功举办

ADL153《时空数据智能》开启报名

活动预告 | 第二届城市科学大会注册通知

活动预告 |【第43次技术研讨会】LLM for Interdisciplinary Research

活动预告 |【第42次技术研讨会】Agent and Embodied AI

前沿导读 | 大模型通用推理

活动预告 |【第41次技术研讨会】AI for Urbanization and Sustainable Development

WWW 2024 Tutorial 报告: 基于大模型智能体的社会模拟仿真

活动预告 |【第40次技术研讨会】Multi-modal Large Language Model

论文解读 |【ICLR 2024】基于扩散模型参数生成的时空少样本学习

仅需 5% 训练样本达到最优性能，清华大学研究团队发布条件去噪扩散模型 SPDiff，实现长程人流移动模拟

活动预告 |【第39次技术研讨会】LLM for Computational Social Science

论文解读 |【SIGSPATIAL 2023】融合多尺度人类移动动力学增强传染病空间传播预测

论文解读 |【SIGSPATIAL 2023】基于知识增强扩散模型的城市人流量生成

城市科学与计算研究中心十二月活动速览来了~

论文解读 |【SIGSPATIAL 2023】通过街景卫星图像识别建成环境疾病传播风险

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉