论文解读 |【SIGSPATIAL 2023】融合多尺度人类移动动力学增强传染病空间传播预测

文摘   其他   2024-01-13 22:14   江苏  


融合多尺度人类移动动力学增强传染病空间传播预测  


针对传染病传播的建模和预测,研究者们已经提出了许多基于微观用户接触图或宏观人口流动图的人类移动动态预测传染病的空间传播的方法。然而,现有的纯宏观和纯微观模型在建模能力或保护用户隐私方面存在局限性。因此,本文提出了一种用于预测传染病空间传播的多尺度疾病空间预测网络MSDNet,结合人口流动图中宏观信息用户接触图中微观信息的时空特征,采用宏微观协同的方式预测传染病的传播。
·文章题目:Enhancing Spatial Spread Prediction of lnfectious Diseasesthrough Integrating Multi-scale Human Mobility Dynamics
·作者:唐寅洲,王寰东,李勇 
·会议:ACM SIGSPATIAL 2023
·DOI: https://doi.org/10.1145/3589132.3625586
·论文链接:https://dl.acm.org/doi/pdf/10.1145/3589132.3625586
·开源代码:https://github.com/tsinghua-fib-lab/MSDNet


PART/ 01 介绍


对于流行病学的测量、建模和监测可以帮助公共卫生专家了解流行病的特性、帮助政府管理人员制定防控决策、为普通民众提供基本信息[1]。利用先进的定位和移动通信技术收集的移动轨迹数据,已经提出了许多基于人类移动动力学的方法来预测传染病的空间传播。根据建模粒度的不同,流行的传染病预测模型可分为微观模型和宏观模型[2]。
微观模型采用微观用户接触图,以用户为节点,用户之间的接触为边,在用户层进行建模和预测[3-4]。然而,这些模型需要与个体层面的用户感染信息状态相关联的细粒度用户移动轨迹,而由于隐私问题和通用数据保护条例等监管要求,这些数据难以获取。
宏观模型利用人口流动图建模和预测区域间的传染病传播。然而,尽管宏观建模的数据具有高度标准化和稳定性,但是存在忽略个体层面变化、过度简化现实、使用不完整或不精确的数据的缺点[5-6]。
在宏观层面上对传染病传播进行建模时,现有方法面临诸多挑战:首先,在对传染病参数进行建模时,由于先验知识的泄露和可能的病原体固有的可变性,传播能力和病原体特征是不确定的。因此,使用恒定参数描述传染病传播的整个过程是具有挑战性的。其次,传染病的区域传播模型受到传染病本身和人类流动的影响。然而,宏观层面的数据仅对区域之间的人口流动密度进行建模,缺乏对与传染病传播相关的人类流动的描述。这使得目前的模型难以准确预测传染病的传播。
为此,我们提出了MSDNet,利用宏微观协同信息宏观层面建模预测传染病的传播。为了克服现有宏观模型在纳入细粒度人类移动动态方面的局限性,使用池化模块从微观用户接触图中提取信息,并将其与区域之间的人口流动数据相结合,用于模型中的传染病预测。此外,提出一种基于传染病传播动力学和传染病参数的损失函数,将复杂观测数据中的参数与人类移动性分离,实时预测传染病参数。


PART/ 02 方法概述


MSDNet由两个主要组件组成:池化模块和预测模块

2.1 池化模块

区域微观图的作用在于捕捉个体之间联系的信息,但是由于其稀疏性,所以需要消耗大量的计算资源和时间。为了解决这个问题,MSDNet提出了一个池化模块,通过以某种方式粗化图来从图中提取必要的微观信息。具体而言,我们使用DIFFPOOL模型以端到端的方式学习图表示,通过对每个区域的图学习一个独特的图表示,可以得到每个区域独特的嵌入,从而用于后续预测。
具体来说,在MSDNet的池化模块中,我们堆叠L层GNN模块,层l使用层l-1中生成的池化嵌入,并学习将节点分组到层l中的集群中。GNN用于提取对图回归有用的节点嵌入,并提取对层次池化有用的节点嵌入。
总的来说,MSDNet通过池化模块提取必要的微观信息来抽象区域微观图。所提方法提高了预测模型的准确性,使复杂传染病传播动力学分析成为可能。

2.2 预测模块

预测模块旨在实现宏观与微观信息的协同,利用神经网络预测传染病传播。为了实现这一点,我们将大小为的宏观信息矩阵和大小为的池化微观信息矩阵结合起来,得到协同信息矩阵
然后,我们使用GAT基于宏观图结构将时空信息提取到图嵌入中。随后,我们将这些图嵌入输入到GRU中,以提取时间信息来预测传染病的趋势。此外,我们通过多种约束实现了对预测的不同方面的建模。为了约束长期预测,我们通过预测宏观感染人数实现了对传染病传播动态的约束。为了解耦人类移动模式与传染病特征之间的关系,以在人类移动模式改变的情况下仍实现传染病参数的稳定预测,我们对传染病参数也实施了约束。 
总体而言,预测模块利用宏观和微观信息协同预测传染病传播动力学,同时结合约束条件以提高预测精度。这种方法能够实现即使存在复杂动态(如人类移动模式改变)的情况下仍能准确预测传染病趋势和参数。

2.3 传染病趋势和参数预测的双输出

当MSDNet使用历史窗口的宏微观协作数据进行预测时,我们将得到以下两个输出: 首先可以得到传染病的动态参数。传统SIS模型假设传播率和康复率随时间不变,仅反映传染病病毒的内在特征。然而,在现实中,人类流动性的变化-无论是由于政策变化还是自发减少-都可能使这些参数时变。因此,参数不再仅仅反映传染病的特征。因此,MSDNet引入了传播动力学约束损失项来分离人体运动和传染病参数,使具有不受人体运动影响的稳定值。其次还可以得到感染数的日增量。对于第t个历史窗口,可以根据前天的信息预测未来天的传染病趋势。

2.4 具有疾病传播动力学约束和参数预测约束的损失函数

MSDNet模型旨在预测短期和长期的疾病传播动态,以及传染病的参数。为了实现这一点,该模型纳入了一种考虑到传输动力学的多预测任务的损失函数机制,利用对短期和长期预测性能的评估来联合更新参数,确保跨所有时间尺度的准确预测。此外,为了将人类流动性与传染病特征分离,引入了传染病参数预测的约束项。这种约束保证了预测的参数在人类移动模式发生变化时基本保持不变,从而使参数仅反映传染病特征。通过将此约束纳入MSDNet模型,可以准确预测疾病传播模式,同时有效分离人类移动对疾病传播的影响。MSDNet使用具有三个方面的Loss函数:第一个损失是传染病趋势预测损失。传染病趋势预测损失项用于衡量MSDNet对短期的预测,表示为模型对未来天传染病传播动态的直接预测与真实值的MSE,可由如下公式计算:

第二个损失项是传播动力学约束损失。利用MSDNet模型中的损耗项对传输速率和恢复速率进行长期预测优化。然而,由于的信息内容有限,维度较小,我们没有直接计算这些参数的MSE。相反,我们利用对未来天的预测产生的疾病趋势来计算损失。具体来说,在使用预测之后,我们采用基于动态的预测方法,其中包括使用公式和当前时刻的初始动态迭代计算疾病传播动力学(, )。然后,我们可以通过计算基于动态的预测和基本事实之间的损失来优化。基于动态的预测表示为:



该损失衡量了基于传输动力学的预测的均方误差,并有助于确保预测与长期趋势保持一致。最后一个损失项是人类移动损失。单独使用传播动力学约束损失来约束参数的预测会导致不准确的结果。这是由于人类流动的变化,如政府政策对旅行的限制,对传染病传播动态的潜在影响。如果我们直接使用动态方程拟合真实世界的疾病趋势,因为人类的移动,得到的参数将会包含人类移动模式的信息。因此,提取的参数可能不再仅仅反映疾病的固有特征。因此,我们需要一个损失项来区分传染病和人类运动的特征。为此,我们训练了一个MLP,该MLP能够输出与的微观信息相关的特征MLP (),使其与参数线性相关,从而允许将人体运动与传染病特征分离。其中,仅反映传染病特征的参数记为,同时反映传染病和人体运动特征的参数记为。我们假设,人类移动与传染病之间的关系是一个简单的乘法,即。因此,每个时刻的传染病参数可以表示为,由于这应该是一个随时间的常数,我们计算两个时间步之间的参数之差,应使其收敛到0。也有类似的表示。基于上述假设,我们构建人类移动损失,其公式如下:


PART/ 03 实验结果


3.1 总体性能



表1 不同模型的性能对比

实验结果表明,MSDNet在所有条件下均取得了比基线模型更高的准确率,并随着的增加保持稳定的性能。具体而言,在短期预测阶段,虽然所有模型的预测性能都相当,但时空模型STAN和MSDNet由于其捕获空间信息的能力更强,表现出更高的精度。在中期预测中,由于时间周期较长,所有模型的预测性能都较差。在长期预测阶段,只有时空模型STAN和MSDNet保持了较高的精度,而空间模型GCN和GAT未能捕获复杂的时空相互作用。MSDNet在所有预测窗口长度上都优于STAN,在RMSE方面有15%-20%的改进,在SMAPE方面有15%-30%的改进。MSDNet的出色表现可以归因于其三方面的能力:基于多尺度的图表示捕获宏观和微观信息;通过池化模块得到区域图表示来建模区域之间的相互作用;以及使用GRU时序建模捕获相对于时间序列和空间模型的疾病-时间相关性。

3.2 参数预测

表2 对于传染病参数的预测性能对比
从结果可以看出,MSDNet在预测参数时可以实现更小的误差,即只要传染病保持不变,无论人类移动如何变化,它都可以实现传染病参数的稳定预测。因此,MSDNet可以有效地将人类移动特征与传染病特征分离。


PART/ 04 结论


文中提出了一种融合宏观和微观信息的多尺度空间疾病预测网络MSDNet,以实现准确的疫情趋势预测。该模型融入了对传染病传播动力学的约束,将人类流动性的影响从传染病传播特征中分离出来。我们通过不同模型的在不同长度时间窗上的对比实验证实了MSDNet的优越性和鲁棒性;并且通过改变人类移动模式的情况下进行预测证实了算法可以很好地分离人类移动和传染病参数。
参考文献
[1] Batistela, Cristiane M., et al. "SIRSi compartmental model for COVID-19 pandemic with immunity loss." Chaos, Solitons & Fractals 142 (2021): 110388.
[2] Yu, Linyun, et al. "From micro to macro: Uncovering and predicting information cascading process with behavioral dynamics." 2015 IEEE international conference on data mining. IEEE, 2015.
[3] Kerr, Cliff C., et al. "Covasim: an agent-based model of COVID-19 dynamics and interventions." PLOS Computational Biology 17.7 (2021): e1009149.
[4] Silva, Petrônio CL, et al. "COVID-ABS: An agent-based model of COVID-19 epidemic to simulate health and economic effects of social distancing interventions." Chaos, Solitons & Fractals 139 (2020): 110088.
[5] Bailey, Norman TJ. "Macro-modelling and prediction of epidemic spread at community level." Mathematical Modelling 7.5-8 (1986): 689-717.
[6] Eichenbaum, Martin, Sergio T. Rebelo, and Mathias Trabandt. "Epidemics in the neoclassical and new-Keynesian models." (2020).



数据科学与智能实验室
本公众号为清华大学电子系数据科学与智能实验室的公众账号,主要推送实验室重要通知、日常活动、文章导读、前沿分享等资讯,敬请关注。
 最新文章