综述 | 时空图神经网络模型在时间序列预测和分类中的应用

科技 2024-11-12 08:30 中国

点击名片

关注并星标

#TSer#

扫下方二维码，加入时序人学术星球

参与算法讨论，获取前沿资料

（280+篇专栏笔记，已有270+同学加入学习）

近年来，GNNs因其处理图结构数据的能力而广受欢迎。这进而促使时间序列分析领域近年来开发出时空GNNs，以模拟变量之间以及跨时间点的依赖关系。本文介绍一篇系统性文献综述，该综述探讨了时空图神经网络（GNNs）模型在不同领域时间序列分类和预测问题中的应用。

【论文标题】

A Systematic Literature Review of Spatio-Temporal Graph Neural Network Models for Time Series Forecasting and Classification

【论文地址】

https://arxiv.org/abs/2410.22377

综述引言

近年来，图神经网络（GNNs）作为一类强大的人工神经网络模型出现，用于处理可以表示为图的数据。

GNNs可用于三种不同的问题类别：图级、边级和节点级。在图级问题中，目标是基于整个图的结构预测图的一个属性，而不是基于单个节点或边。例如，样本中的一个分子可以表示为一个图，并且可以从与样本相关的整个结构的数据中推断出该分子的全局属性。在边级问题中，目标是预测节点对之间是否存在边。例如，这项任务可以用于推荐系统，以预测基于过去交互的用户和项目之间的潜在连接。在节点级问题中，目标是预测图中每个节点的身份或角色，以解决分类或回归任务。值得注意的是，回归任务可以是“自回归”，即它们可以包含时间。

因此，本综述检查了GNNs在时间序列相关任务中的特定用途，特别关注时间序列分类和预测。使用GNNs解决时间序列问题的想法是，GNNs能够同时捕捉变量间（多变量序列内不同变量之间的连接）和时间上的（不同时间点之间的依赖性）的复杂关系。这导致了一种时空GNN方法，其中空间维度与多变量框架相关，时间维度与数据的时间性质相关。也就是说，时空GNNs是一类旨在同时处理空间和时间维度的数据的GNN模型。在这种情况下，时空图中的每个节点或边中的数据可以随时间演变，挑战在于模拟随时间变化的动态交互。

在本综述中，将提出两组问题。第一组问题的答案旨在提供该领域出版物的一般概述，而第二组问题的答案则关注于所提议的GNNs模型的特定方面。

第二组具体问题（SQ）包括：

SQ1）应用：时空GNNs的最常见应用是什么？不同应用领域的方法和结果是否存在差异？
SQ2）图构建：图结构是预先确定的吗？如果不是，研究人员是如何定义它的？
SQ3）分类法：在各种分类法中，哪些是最常见的？是否存在一些重复出现的机制？
SQ4）基准模型：最常见的基准模型是什么？它们是经典的机器学习模型还是也是GNNs模型？
SQ5）基准数据集：最常见的基准数据集是什么？
SQ6）建模范式：最常见的范式是什么？是建模复杂的交互系统，还是建模具有多个交互量的系统？具体来说，图是否通常浓缩了多个实体之间的关系，还是描述了同一实体的不同方面？换句话说，图结构是同质的还是异质的？
SQ7）指标：用于评估给定模型准确性的最常见指标是什么？

该综述的篇章结构如下：

第2节介绍了收集论文的方法
第3节提供了出版物概览
第4节图神经网络。介绍了一些在研究具有时空图神经网络的时间序列时的基础定义和概念
第5节是这篇综述的核心，探讨了选定论文中提出的时空GNN模型在确定领域中的应用
第6节提供了研究结果的讨论和对上述研究问题的答复。
第7节提出了限制、挑战和未来的研究方向
第8节总结了综述
附录A提供了这次SLR包括的所有期刊论文的列表，以及它们的出版年份、所属组、案例研究和任务性质（例如，分类或预测）。

本文篇幅有限，仅着重分享第4、5、6、7节内容，其他具体细节内容，感兴趣的朋友可自行查阅原文。

图神经网络

定义与概念

定义1：时间序列（Time series）：

时间序列是按时间顺序索引的一系列数据点（这里假设是定期采样，即等间隔的）。一个长度为T的等间隔单变量时间序列是在时间上收集的一系列标量观测值，表示为向量。一个长度为T的等间隔多变量时间序列是在时间上收集的一系列D维向量观测值，表示为向量。

定义2：图（Graph）：

图是一个有限集合对，其中是一个包含n个节点（也称为顶点）的集合，是边的集合。在无向图中，每条边都是一个无序的节点对，而在有向图中，边有方向，对应于有序对。当边或存在时，节点和被称为相邻的。

定义3：时空图（Spatio-temporal graph）：

时空图是一个四元组，其中是一组包含个时间戳 t 的集合，是一组包含个节点的集合，代表时间 t 时的空间实体，是一组包含条边的集合，代表时间t时节点之间的关系，是与节点和边在时间 t 时相关联的属性集合。节点和边的集合以及属性集合都可以随时间变化。

定义4：邻接矩阵（Adjacency matrix）：

一个具有个节点的图的邻接矩阵是一个n × n的方阵，其中表示从节点到节点的连接数量，对于i, j = 1,...,n。这里假设图中任意两个节点之间不能有超过一条边，因此，根据是否存在连接，只能是0或1。

定义5：度矩阵（Degree matrix）：

图的度矩阵是一个对角矩阵，其对角线上的元素表示每个节点的度，即与该节点相连的边的数量。用公式表示为：

图神经网络概述

给定一个图，GNNs模型（不一定是随时间变化的，即时空模型）旨在为图中的每个节点生成一个嵌入（即一个实值向量）。整体图嵌入的目标是将图表示为一个可能具有不同维度的空间，同时保留其结构信息。

GNN的概念最初由Gori等人在2005年提出，并由Scarselli等人进一步完善，作为一种实现将具有n个节点的图G映射到m维欧几里得空间的函数架构。在参考文献[160]中，目标节点的嵌入是通过首先在图中以迭代方式在固定权重下传播邻居信息，直到达到稳定的不动点（其存在性在某些假设下由巴拿赫不动点定理保证），然后跨图反向传播目标误差来学习的。

节点嵌入的计算通常相当复杂，随着时间的推移，已经开发了许多其他方法。这些方法基于不同的架构和复杂的机制。基于这些聚合机制，已经定义了具有不同类别的GNN模型的分类法。在本综述中，采用与Chen等人在参考文献[18]中提出的类似的分类法来讨论时空GNN。

时空图神经网络及其分类

时空图神经网络的研究主要集中在多变量时间序列上，这些时间序列可以自然地抽象成时空图。

在时空图中，节点代表特定时间步的变量，边表示变量之间的关系，这种表示假设节点的特征信息依赖于其自身的历史值以及其邻居节点的历史数据。

设计时空GNNs模型有两种主要方法：一种是在不同的模块中分别处理空间和时间子结构，另一种是将这两个子结构集成在一起处理。

根据信息在图中的传播机制，时空GNNs可以分为三类：

递归GNNs：通过迭代传播邻居信息直到达到稳定状态。
卷积GNNs：在每个更新步骤中使用不同的参数，通过堆叠多个图卷积层来提取节点嵌入。
注意力GNNs：使用注意力机制来聚合节点特征。

时空GNNs的模块化结构：

时空GNNs通常由一系列空间、时间或混合模块堆叠而成，每个模块都有其独特的角色。
空间模块负责在节点间传播信息，分析不同变量之间的相互依赖性。
时间模块关注数据随时间的演变，独立于节点间的横截面交互。

当不同的模块堆叠在一起时，空间和时间信息被同时使用，尽管它们在不同的模块中被处理，这使得模型能够有效地同时捕获空间关系和时间动态。

图结构的确定

在处理时间序列问题的时空图神经网络时，一个关键问题是图结构的确定，即节点的连接性。具体来说，一些时间序列数据集本身具有预定义的图结构（例如，道路网络），而另一些则没有。当存在自然的预定义图结构时，它有助于模型更好地捕捉系统的潜在动态。当预定义图结构不直接可用时，用户必须以某种方式定义它（基于领域知识或某些指标），通过某些算法确定它，或由模型本身学习得到。

一旦确定了图结构，就需要定义加权图的邻接矩阵，这是图邻接矩阵的推广，其元素由图的边权重给出。边权重可以由用户事先定义，或者再次基于预定义的架构由模型本身学习得到。在第一种情况下，边权重的分配基于用户选择的一些预定义指标或标准（例如，站点之间的空间距离或相似性度量）。在后一种情况下，随着模型从数据中学习，权重在训练过程中不断调整。

GNN模型应用

能源领域

能源预测对于电网的稳定性和运行效率至关重要。准确的负荷和发电预测能够确保供应满足实时需求，防止停电和不稳定情况的发生，并保持电力的可靠供应。此外，有效的预测能够实现发电厂和能源资源的最优调度，降低运营成本，提高整体系统效率。大多数计量经济和机器学习模型往往侧重于单个地点的时间序列，或者虽然考虑了多个地点，但没有明确捕捉它们之间的关系。基于GNNs的模型可能是解决能源相关问题的一种创新和有效的方法。

对所选论文的概述显示，从2022年开始，GNN在能源领域的应用引起了显著的研究兴趣，特别是在风能和太阳能预测方面，这些是具有间歇性的可再生能源。多数相关论文发表在《Applied Energy》和《Frontiers in Energy Research》等期刊上，且大部分通讯作者来自中国和美国的研究机构。

数据集：

能源领域的研究通常使用特定数据集，这些数据集通常与研究者所在地区或大学校园相关，且并非所有数据集都公开可用。

提出的模型：

在提出的GNN模型中，大多数使用卷积GNN，也有部分使用注意力GNN。这些模型的图结构描述通常较为简略，有些基于地理位置，有些基于时间序列的相似性或相关性。用于训练模型的最常见的损失函数是均方误差（MSE）。许多论文提到了编程语言Python和Matlab，但其中只有少数几篇提到了用于实现GNN模型的Python库PyTorch和TensorFlow。

基准模型：

能源领域的基准模型包括传统的机器学习模型和一些基本的统计和数学模型，如ARIMA、LSTM、CNN等。

结果和性能评估：

论文中提出的GNN模型普遍声称优于基准模型，但因为缺乏共同的数据集，很难比较不同模型的准确性。

环境领域

“环境”组别中包含了大量精选论文（156篇中的27篇），这表明在该领域应用GNNs的研究兴趣相当浓厚。然而，该组别高度分散，因为它包含了大量与环境数据研究相关的子领域和应用。预测环境数据对于理解人类活动对环境的影响、追踪气候变化的进程以及预警极端天气现象等至关重要。

预测环境数据的方法通常分为数值模型、统计模型和机器学习方法三类。数值方法基于大气模型，旨在量化不同大气变量之间的相互作用。这些模型的准确性取决于数据的可用性，而获取预测结果的数学模拟可能需要数天甚至数周的时间，从而限制了它们进行良好短期预测的能力。

线性统计方法通过使用类似回归的模型来利用记录数据中的长期依赖性。然而，它们无法捕捉数据集中的非线性关系，这限制了它们的效力。另一方面，机器学习模型通常是线性统计方法的一种泛化，能够捕捉数据中更复杂和非线性的关系。

数据集：

环境领域的研究通常使用特定的数据集，包括公开数据集和一些需要预处理的数据集，如插值缺失数据、去除异常值和归一化。

提出的模型：

大多数论文提出了基于卷积GNN的模型，也有部分使用了注意力GNN和混合架构。图结构的定义在论文中描述不一，有些基于空间距离，有些基于时间序列的相关性或相似性。

基准模型：

环境领域的基准模型包括传统的机器学习模型和一些GNN模型，如LSTM和GRU，这些模型因其能够捕捉时间依赖性而被广泛使用。

结果和性能评估：

论文中提出的GNN模型普遍优于基准模型，但因为缺乏共同的数据集，很难进行跨研究的准确性比较。

金融领域

“金融”是另一个新兴的研究领域，尽管尚未得到广泛探索，但在精选的156篇论文中有9篇涉及该领域。金融数据预测的难度是一个公认的事实。这源于市场本身的复杂性、地缘政治事件对市场的影响，以及人类行为（通常是非理性和难以预测的）的不确定性。这种复杂性使得金融时间序列具有高度波动性，因此准确预测和数据建模对于制定有效的交易策略至关重要。GNN被用于建模变量之间的相互依赖关系以及序列动态。

数据集：

金融领域的研究通常使用股票市场指数数据集，如中国A股、CSI 100指数、S&P 100和S&P 500指数等，这些数据集通常包含市场数据、事件和新闻等外生变量。

提出的模型：

在提出的GNN模型中，有一半使用注意力机制，另一半使用卷积GNN。这些模型通常基于公司和股票之间的关系预定义图结构，或者让模型自己学习图结构。

基准模型：

金融领域的基准模型包括传统的机器学习模型和一些GNN模型，如LSTM和GCN，这些模型因其在处理长期信息方面的效果而被广泛使用。

结果和性能评估：

论文中提出的GNN模型在分类任务中的准确性通常使用准确率、精确度和F1分数来评估，而在预测任务中则使用交易模拟来评估模型对投资回报稳定性的影响。

健康领域

健康领域（Health）的研究在156篇出版物中占8篇，这些论文重点关注健康监测、疾病建模和诊断工具的关键方面，尤其强调疾病的传播和诊断。所有处理功能性磁共振成像（fMRI）数据的论文都被排除在分析之外，因为这些数据集是以图像序列的形式生成的，而不是时间序列。这种数据结构上的关键差异使它们与本综述的时空焦点不太相关。

疫情预测是健康领域中最常见的研究主题之一，尤其是COVID-19大流行期间，研究者致力于研究和预测病毒的传播。流行病的季节性变化、强度和持续时间的不确定性，以及偶尔的大流行对已建立模式的干扰，使得预测任务变得更加困难。

数据集：

健康领域的研究使用了多个公共数据集，包括COVID-19数据、eICU数据、MIMIC-IV数据集和Parkinson's Progression Markers Initiative数据集等。

提出的模型：

提出的GNN模型包括纯卷积GNN、纯注意力GNN和混合卷积-注意力架构，这些模型用于定义图结构，有些基于地理位置分布，有些则直接学习图结构。

基准模型：

在健康领域，基准模型包括传统的统计和机器学习模型，如ARIMA和LSTM，但没有特别突出的GNN基准模型。

结果和性能评估：

论文中提出的GNN模型声称优于基准模型，但由于缺乏共同的数据集，无法进行不同模型间的准确性比较。

移动出行领域

通过查询确定出的论文数量最多的主题（在156篇中占39篇）是“移动性”，它关注的是人的移动。这一主题包括城市交通、航空旅行和自行车需求等应用。鉴于该组文章数量众多，因此可以对基准、模型和结果进行更详细的比较。

早期交通预测对于提高交通系统的效率、帮助驾驶员更有效地规划行程以及预防城市交通拥堵至关重要。智慧城市基础设施和交通系统的出现有助于从道路传感器中收集丰富的数据，这些数据可用于交通预测。然而，由于交通模式随时间和空间不断变化，以及天气状况和特殊事件等外部因素的影响，准确进行交通预测具有挑战性。与经典统计和机器学习模型不同，GNN能够模拟空间和时间域中的复杂关系，因此在交通预测方面特别有效。该组中每年发表的论文数量不断增加，既反映了该领域日益增长的研究兴趣，也反映了人们对GNN模型的信心日益增强。最常研究的领域涉及城市交通，尤其是城市交通流量和城市交通速度。

数据集：

论文中提到了多个公共数据集，如PeMS数据集和METR-LA数据集，这些数据集包含了大量的传感器信息，用于交通预测模型的训练和测试。

提出的模型：

提出的模型中，大部分是基于卷积GNN，其次是注意力GNN和混合卷积-注意力架构。这些模型在定义图结构时有多种方法，包括基于道路网络结构、实际人流或时间序列相似性等。

基准模型：

基准模型包括数学和统计方法（如ARIMA和历史平均值模型），传统机器学习模型（如LSTM和XGBoost），以及GNN模型（如STGCN、DCRNN和ASTGCN）。

结果和性能评估：

论文普遍声称提出的GNN模型优于其他基准模型，但不同论文关注的预测时间窗口不同，使得模型比较变得复杂。常用的性能评估指标包括MAE、RMSE和MAPE。

预测性监测

预测性监测是一项任务，它涉及对系统的持续观察和分析，以预测其未来状态，并验证预测结果是否符合特定标准。这项预测性监测任务至关重要，因为它能显著提高工业操作的效率、可靠性和成本效益。相关方法包括多种技术，如异常检测、故障诊断和剩余使用寿命（RUL）估算。

尽管该领域的特殊性，但在156篇论文中仍有16篇涉及预测性监测的主题。这包括异常检测、故障诊断和RUL估算。在这些分析中采用GNNs是合理的，因为需要使用一种能够捕捉系统中众多传感器之间时空相关性的模型。

数据集：

论文中使用了多个公共数据集，其中最流行的是C-MAPSS和N-CMAPSS，这两个数据集由NASA提供，用于RUL预测。

提出的模型：

提出的GNN模型中，一半属于纯卷积模型，其次是注意力GNN和混合模型。这些模型通常包含图学习模块，因此图结构很少由研究者预先定义。

基准模型：

基准模型包括传统的机器学习模型，如CNN和LSTM，以及一些专门为RUL预测开发的GNN模型，如层次注意力图卷积网络（HAGCN）和时空融合注意力（STFA）。

结果和性能评估：

提出的GNN模型在预测性监测任务中表现出色，尤其是在C-MAPSS数据集上，其中综合动态结构GNN（CDSG）和卷积图注意力网络（ConvGAT）模型表现最佳。

通用领域

“通用”（Generic）类别涵盖了24篇论文，这些论文不特定于某个具体领域，而是探讨了GNNs在多变量时间序列预测中的更广泛方法和框架。

数据集：

论文中使用了多个公共数据集，包括电力消耗、汇率、太阳能和交通数据集，这些数据集在不同的研究中被广泛认为是基准数据集。

提出的模型：

在24篇“通用”论文中，大多数使用了纯卷积GNN方法，还有部分使用了纯注意力模型和混合模型。这些模型通常具有自学习能力，能够自动确定图结构。

基准模型：

基准模型包括数学和统计方法（如ARIMA和GP），传统机器学习模型（如LSTM和TPA-LSTM），以及GNN方法（如DCRNN和MTGNN）。

结果和性能评估：

使用常见的性能评估指标，如平均绝对误差（MAE）、相关系数（CORR）、均方根误差（RMSE）和平均绝对百分比误差（MAPE）等，来评估模型的性能。

其他领域

这一部分包括20篇论文，它们不属于前面讨论的主要领域，这些案例研究包括蜂窝流量预测、用户偏好推荐系统以及其他预测或分类问题。鉴于论文的异质性，这里仅提供一般概述，并未对比各种方法或讨论基准。

由于GNNs最近获得了相当大的关注度，许多近期论文聚焦于与迄今为止讨论类别不相关的应用。论文涉及的主题包括蜂窝流量预测、用户偏好推荐、以及其他分类或预测问题，如加密流量分类、城市时空事件预测、运营流程质量预测等。这些论文使用了不同的数据集和方法，由于它们的处理方式各异，包括预处理技术、选定的时间窗口或训练/测试数据集的分割比例，因此不同论文的结果难以直接比较。

数据集：

部分论文使用了共享数据集，例如调制分类的RML2016.10a和RML2016.10b数据集，以及用于蜂窝流量预测的Telecom Italia Big Data Challenge数据集。

研究结果的讨论

研究者在引言中定义的两组研究问题：一般性问题和特定问题。针对特定问题的讨论如下：

SQ1（应用）

三个最受研究的领域分别是“移动性”、“环境”和“通用”。关于前两个组，它们的数据集可以自然地转化为图，这解释了为什么它们随着时间的推移被更广泛地研究。相比之下，“通用”组最近因其在更广泛背景下的适用性而获得了显著的兴趣。至于不同领域之间的差异，主要与图的定义有关，这并不总是明确的，以及基准的选择，通常与特定社区的思维模式有关。在不同应用之间比较结果并确定最有希望的领域并不容易。“通用”组中的研究在广泛的领域中显示出希望。

SQ2（图构建）

大多数选定的论文侧重于预定义的图结构（当可用时），目标是提取最大数量的信息并增强模型的可解释性。然而，最近对模型的兴趣日益增加，这些模型学习图结构和边权重本身，预计这种趋势在未来将变得更加普遍。

SQ3（分类）

设计时空GNNs有两种主要方法：一种在单独的模块中处理空间和时间组件，另一种将它们集成并一起处理。对收集的论文的分析表明，最常见的方法是单独模块。具体来说，研究人员通常独立地处理问题的空間和时间方面，并分别关注每个模块。所提出的GNN模型的分类只涉及空间组件，综述表明卷积和注意力方法是普遍的。大约62%的模型纯粹是卷积的，25%纯粹是注意力的，8%是混合卷积-注意力的。关于时间组件，广泛使用的是GRU的递归结构和注意力机制。

SQ4（基准模型）

就基准模型而言，有许多选项可用，其选择取决于具体应用。在能源、金融、健康和预测性监测等领域，倾向于关注更简单的统计和传统机器学习基准，只有有限的使用GNN基准。在“通用”组中，许多基于Transformer架构的最新机器学习基准模型已经出现。值得注意的是，在“移动性”、“环境”和“通用”组（这也是研究最多的领域）中，有许多参考GNN基准模型。最普遍的基准是图卷积神经网络与长短期记忆网络（GC-LSTM）、时空图卷积网络（STGCN）、基于注意力的时空图卷积网络（ASTGCN）、扩散卷积递归神经网络（DCRNN）、时空图卷积网络（STGCN）和多变量时间序列预测与图神经网络（MTGNN）。

SQ5（基准数据集）

选定论文中提到的数据集与具体的案例研究密切相关。尽管在“通用”组中列出了一些基准数据集，但整个GNN研究社区并没有共同的标准数据集。希望研究社区能够就一些最常用的数据集达成一致，并开始采用它们，例如交通数据集，目标是为整个研究社区开发共享的基准数据集。希望这篇综述能够通过提供不同数据集上模型结果的全面表格来促进这一点，以便于比较不同的时空GNN模型。