今天给大家分享一篇最近出版在Journal of Cleaner Production 的一篇文章。该杂志为环境类期刊,主要关注清洁生产、可持续发展和环境科学等领域。
准确预测城市道路车辆的碳排放是当前城市交通领域面临的挑战。本文提出了一种新的SAGE-GSAN(图样本和聚合-图空间注意网络)模型来解决这一问题。它将图神经网络与街景特征和路网结构相结合,对街道层面的交通一氧化碳排放进行预测。该方法以武汉市街景图像、5075个路网结构和19个街道视觉元素作为输入特征,以行驶轨迹获取的一氧化碳排放量作为预测数据。该方法在预测街道出租车一氧化碳排放量方面的实验精度为81.4%。本研究还比较了传统神经网络的预测结果,并分析了不同街道级特征和图卷积层对预测精度的影响。我们的研究揭示了自行车和交通标志等街道视觉特征对CO排放预测的重要影响。这项研究为精细化城市空气质量管理和可持续交通规划提供了新的数据驱动方法,对于缓解城市碳排放具有重要意义。研究结果表明,图神经网络和注意机制技术可以有效地解决城市街道层面的细粒度碳排放预测问题。
HighLights
重点
1. 利用微观环境因子计算城市出租车CO排放量
2. 提出了一种新的SAGE-GSAN模型(图样本和聚合图)空间注意网络
3. 利用图神经网络预测街道碳排放水平
主题词:图神经网络;路网结构;街景图像;碳排放;出租车轨迹
ref: Chen Z, Zou T, Xu Z, et al. SAGE-GSAN: A Graph-Based Method for Estimating Urban Taxi CO Emissions Using Street View Images[J]. Journal of Cleaner Production, 2024: 143543.
2015年签署的《巴黎协定》提出将全球变暖限制在比工业化前水平高2°C以内,并努力将气温上升限制在1.5°C以内,以确保儿童的茁壮成长。2020年9月22日,在第75届联合国大会上,中国提出了2030年前达到碳达峰和2060年前实现碳中和的目标,并将其定位为国家发展战略。实现这些目标需要减少多方面的碳排放。城市碳排放量是全国碳排放总量的重要组成部分,交通相关排放是导致城市碳排放的重要因素。出租车作为城市中最重要的交通方式之一,在城市碳排放中起着至关重要的作用。尽管城市地区有各种类型的车辆,但由于出租车在城市交通中起着至关重要的作用,因此本研究侧重于出租车。出租车不仅数量最多,而且通常覆盖的区域更大,全天运营时间更长,这使得其废气排放成为城市空气质量的重要贡献者。因此,准确预测出租车的碳排放对于实现城市碳中和具有重要意义。通过预测城市街道上出租车的碳排放量,我们可以更好地了解城市交通中的碳排放量,这将有利于政府制定有针对性的政策和措施来减少碳排放。一氧化碳(CO)污染物是道路上常见的主要碳排放污染物,机动车排放的一氧化碳污染物是所有车辆中排放量最大的。一氧化碳对环境和人类健康有害,在空气中发生氧化反应,转化为二氧化碳(CO2),这将加剧温室效应,影响达到碳达峰和实现碳中和的过程。因此,本研究结合城市街景特征和路网结构实现街道城市出租车CO排放水平的预测具有重要意义。
现有方法大致可分为微观方法和宏观方法,这取决于预测过程作用的对象。从微观层面来看,一些物理模型已经可以用于计算单个机动车的相关CO排放。这类方法充分考虑了多个微观因素对排放因子的影响,并在车辆本身的维度上测量CO排放,因此被归类为微观层面的方法。目前,机动车的微观模型相对成熟。机动车微排放模型主要用于通过模拟机动车排放的特性并用机动车本身的使用特性代替它们来确定机动车的排放。一些研究者使用计算机程序计算道路运输排放模型来计算住宅区附近个别道路的CO排放量。有研究发现,乘用车(主要是柴油车)占城市总里程的80.7%,是道路运输污染排放的主要贡献者。一些学者研究了绿色交通的可行性,使用综合模态排放模型来计算车辆在给定速度和负载条件下的燃料消耗和碳排放量。还有研究使用模型来反演出租车行驶轨迹中轨迹点的二氧化碳排放。一些研究者对武汉市机动车的污染物排放进行本地化研究,并计算了不同车型的排放因子。还有研究结合出行需求预测了大都会区的CO排放量。此外,一些学者尝试通过深度学习来预测车辆的瞬态排放,并取得了更好的结果。从宏观角度来看,一些研究人员使用传统模型或深度学习方法来预测更大规模的总体CO排放量,例如在城市或国家层面。有研究提出了新的分数灰色里卡提模型来预测美国、中国和日本的碳排放水平。一些研究使用扩展的STIRPAT模型来确定CO2排放与不同驱动因素之间的关系,以预测某个城市的碳排放峰值。还有研究开发了使用人工神经网络的模型来预测多个国家的碳排放强度。一些学者使用优化的算法来预测中国的二氧化碳排放量。有研究基于三层感知器神经网络预测了整个城市的实时和细粒度交通碳排放。一些研究使用优化的通用回归神经网络来预测中国将能够在2030年之前实现其碳达峰承诺。还有研究使用深度序列学习来预测街道的温室气体排放。虽然这些研究在街道尺度上进行了预测,但他们没有考虑道路网络结构。一些学者提出了基于遥感影像的碳排放识别方法,使用卷积神经网络模型提取了该地区的碳排放特征。虽然可以使用多种方法来预测交通的碳排放量,但在路段层面简单而有效地预测CO排放量仍然很少见。此外,以前的大多数研究都集中在通过传统的基于排放因子的方法或传统的神经网络方法来预测碳排放。很少有方法结合了道路网络的结构来预测街道层面的CO排放。造成这种情况的基本原因可能是,将碳排放数据与道路拓扑、街景影像等各种信息相结合相对困难,这需要复杂的数据处理和要素提取工具。城市环境复杂,与碳排放相关的因素存在显著的空间异质性。道路网络的拓扑结构在一定程度上影响了交通流向,这些信息对于预测交通量的碳排放至关重要。城市地区表现出影响碳排放的多种因素,例如不同的交通密度、土地利用和交通基础设施。这些因素导致碳排放的空间变化,强调在预测建模中需要对城市环境进行细致入微的理解。此外,道路网络的拓扑结构显著影响城市的交通流量和排放模式。整合道路网络拓扑对于准确的碳排放预测至关重要,因为它会影响交通流量和排放分布。此外,街景图像可以真实地捕捉城市环境,从而为模型提供更丰富的上下文信息。本研究旨在无缝集成道路网络拓扑和街道层面的视角。通过利用图神经网络等技术,该研究模型旨在提供整体理解,捕捉这些因素之间的复杂相互作用。这种综合策略对于在城市环境中实现精确的街道级碳排放预测至关重要。近年来,由于图神经网络(GNN)对拓扑结构的支持,地理信息在空间分析领域具有巨大的潜力,如社会功能分类、交通预测和地理知识表示与推理。GNN可以发现城市交通碳排放中包含的空间相关性和特征,从而预测和优化城市交通的碳排放和效率。目前,许多学者已经在城市交通领域使用了GNN,常见的有交通流预测和乘客需求预测,但GNN在CO排放研究中的应用仍然相对有限。本研究通过使用GNN和从街景图像中提取视觉特征的方法,为精细预测城市地区路段的CO排放提供了一种可靠的方法。它根据从城市街景数据中提取的要素和道路网络结构构建输入数据,并将每条街道的道路CO排放分类为不同的级别。此外,该研究为环境保护、城市规划和交通管理提供了重要参考,并可能为实现碳中和和碳达峰的努力提供支持,促进深度学习在城市交通碳排放领域的应用和发展。
总之,这项研究的贡献如下:1)本研究提出了一种在道路层面而不是以城市或区域为基础的细粒度CO排放预测方法。它结合了从街景图像和道路网络结构中提取的要素,以估计每条道路的CO排放水平。2)本研究设计了一种新的SAGE-GSAN模型,该模型可以更好地考虑路网拓扑和街道之间对CO排放的影响,自适应地学习街道特征之间的关系,对这些关系进行编码以提高预测的准确性。3)本研究从环境角度分析了与高CO排放相关的街道视觉特征。它以量化的方式描述了街道环境,可以帮助我们更好地理解碳排放与城市环境之间的关系。
图. 该研究的整体研究框架
该研究使用了路网结构、街景特征和出租车GPS轨迹数据进行获取、转化与整合,基于COPERT模型和DeeplabV3+共同生成了城市街道出租车碳排放数据集。
图. 街道出租车碳排放数据集制作核心流程
该数据集包含56461张街景图像和5075个交通路段,基于COPERT 模型将所有的街道划分为低排放街道、较低排放街道、标准排放街道、较高排放街道、高排放街道、最高排放街道和极高排放街道等7类。
图. 街道出租车碳排放数据集制作结果示意
此外基于语义分割的方法将街景影像划分为 19 类特征,包括汽车、道路、建筑物、墙壁、栅栏、树木、草坪、标志、公共汽车、摩托车、卡车、天空、电线杆、灯光、行人、骑自行车者、火车、自行车和人行道等。由于每条道路都存在多个街景图像,本研究将每条道路的每个视觉对象类别的平均值总结并归一化为道路的整体视觉特征。此外,本研究设计了一个图神经网络模型—图采样与聚合-空间注意力网络(Graph SAmple and aggreGatE - Graph Spatial Attention Network,SAGE-GSAN),基于街道尺度的视觉特征来估算城市街道机动车的碳排放情况。图神经网络(GNN)是一种广泛应用于各个领域的深度学习算法,特别适合处理空间和网络数据。GNN的优势在于能够捕捉复杂的空间关系,已被用于城市规划、交通研究和环境建模等领域。GNN模型有多种类型,包括图卷积网络(GCN)、图注意力网络(GAT)和图样本聚合(SAGE)等。本研究使用SAGE模型来预测街道级的CO排放,将道路网络结构转换为大规模图结构。SAGE通过采样邻居节点来捕获图的结构信息,计算效率高,适用于大规模地理数据集。SAGE-GSAN模型使用DGL框架构建,包含两层SAGEConv来提取图数据特征,并在两层之间引入空间注意力模块(GSAN)。GSAN结合位置和特征信息,动态调整节点特征权重,更好地利用节点间的空间关系。模型的聚合函数选择了长短期记忆(LSTM),以捕捉数据中可能存在的时间相关性。模型聚合了每个节点两跳范围内邻居的信息,以全面理解节点周围的局部信息。GSAN网络利用高效的图消息传递机制,结合位置和特征信息来增强图表示学习。它计算节点间的物理距离,动态调整相邻节点特征的权重,从而更准确地捕获空间相关性。通过这些机制,SAGE-GSAN模型有效结合了位置和特征信息,很好地适应节点空间关系,同时保持结构完整性,实现了高效的信息传输。这种方法为城市街道CO排放的精确预测提供了新的可能。在SAGE-GSAN模型中,模型输入的图结构为上节得到的路网结构,图结构每个节点输入的特征为提取的道路街景特征,模型的标签值为通过出租车GPS轨迹数据得到的碳排放数据集。
图. SAGE-GSAN模型详细结构
采用SAGE-GSAN模型的武汉市街道出租车碳排放估算实验结果的估算值与真值对比如下图所示。通过估算值与真值的对比统计,估算正确的街道数量占街道总数量的81.4%,具有较高的估算精度,实验结果充分证明了使用SAGE-GSAN模型对估算街道出租车碳排放量的可行性 。
图. SAGE-GSAN模型估算结果对比
在 19 种类型的街道特征中,汽车类型特征比例较高的街道特征具有较高的 CO 排放水平,这表明汽车相关特征是模型中的重要预测因子。此外,道路密集区域的预测偏差相对较小,其误差范围通常在一个级别内,而对于道路稀疏的区域,预测的偏差相对较大,这可能是由于图结构的性质,节点(即街道)的相邻节点较少,并且包含的区域内街道环境特征和单个道路的特征相对较少。缺失特征的存在将对预测产生一些影响。此外,可以看出,道路越长,其产生的预测偏差就越大,这可能是由于缺乏环境特征,因为这项研究只关注街景特征和路网结构,忽略了道路的长度、交通流量等现实特征,导致对较长街道的 CO 排放预测不合理, 可以增加它以提高道路长度和其他特征的准确性。也可以看到,城市环路的 CO 排放水平相对较高,这是因为环路通常连接城市的核心区、商业中心、居民区和工业区等重要区域,这些区域对交通的需求较高,因此,环路的 CO 排放水平也相应较高。此外,城市外环路的 CO 排放水平高于内环路,这主要是因为外环路通常是城市的主要交通动脉之一,负责连接城市的不同区域以及与周边地区的相关交通。外环路往往具有较大的道路容量和高速容量,并且随着城市的不断扩张和发展,人口和经济活动逐渐向城市的外围地区扩散。外环路通常穿过这些快速发展的城市边缘地区。
本研究将SAGE(GraphSAGE)层与其他常见的图神经网络模型层进行了对比,实验中所有模型超参数设置的学习率为0.001~0.005之间,权重衰减系数为5e-5。选择模型推理过程中最高精度的估算结果,同时展示了各项评估指标的结果。具体数值见下表。
根据 MSE、RMSE、MAE、MAPE、ME 和 MSL,可以看出 SAGE-GSAN 模型在大多数指标上的表现优于所有其他模型。 在下图中可以观察到更直观的结果(为了便于图形表示,ME 指标都乘以 0.1)。
GCN、GAT、GATV2、Edge、SG、Cheb、DGN 和 TAG 模型的性能相对相似,它们的最佳准确率在 81.1% 到 81.5% 之间,并且它们的误差指标相对较接近。其中,TAG 模型的 MSE、RMSE、MAE、MAPE 和 MSL 值仅次于 SAGE-GSAN 模型,但其最佳精度低于 SAGE-GSAN 模型。此外,这项研究对所有 11 个模型进行了 多轮 epoch 的运行,以测试其预测的准确性,训练损失的变化如下图所示。
图. 不同模型的训练损失曲线
当使用 SG 模型时,开始时训练损失较低,这表明该模型已经具有良好的不训练即可提取特征的能力。PNA 收敛速度最快,评价指标结果最好,但准确率最低。一些模型的性能始终优于其他模型;例如,SAGE-GSAN、Edge 和 TAG 的损失值始终低于其他值,这表明它们在本研究的实验中更擅长缩小预测值和实际值之间的差异。同时,这些模型的收敛速度比其他模型快。模型在大约 20 个持续时间(epoch)后收敛,而 GCNII 和 Cheb 模型甚至在大约 100 个持续时间后收敛。总的来说,大多数 GNN 模型具有低损耗值和高准确率。结果表明,GNN 模型具有良好的泛化能力,能够准确预测城市街道出租车的 CO 排放水平。
此外,为了研究道路特征中的哪一类对象对预测的影响最显着,我们通过从 19 个类别中逐一删除类特征来进行消融实验。实验中使用的 SAGE-GSAN 模型作为标准,结果如下表所示。
结果表明,消融实验时模型精度变化波动很小,模型预测武汉出租车CO 排放的性能良好。所有特征类别达到的最佳精度范围为 81.4% 至 82.0%,其中 MSE 范围为 0.292 至 0.334,RMSE 范围为 0.54 至 0.578,MAE 范围为 0.224 至 0.247,MAPE 范围为 0.152 至 0.2,MSL 范围为 0.037 至 0.041。除 “天空” 外,所有特征的 ME 均为 4.0。其中,“交通标志”特征的 MSE、RMSE、MAPE 和 MSL 最小,说明模型在失去该特征后与数据拟合得更好。这表明 “交通标志” 特征与模型的准确性呈负相关。这一观察很容易被以下事实所证明:交通标志的数量反映了该地区交通状况的复杂性,更多的交通标志表明更复杂的道路交通,以及更高的交通量,这在逻辑上会导致 CO 排放量的增加。但是,当 “汽车” 特征的比例较低时,这可能会导致判断错误和模型准确性降低。相反,“自行车” 特征具有最大的 MSE、RMSE、MAPE 和 MSL,这表明在丢失此特征后,模型和数据之间的拟合较低。由于自行车是非机动车辆,不会产生 CO 排放,因此自行车在交通流中的普遍性越高,CO 排放量往往就越低。
本研究提出了一种新颖的应用图神经网络预测CO排放水平的方法,通过提取和量化影响排放潜力的街道级环境属性。具体来说,构建了一个两层SAGE-GSAN网络来预测武汉市街道上出租车一天的CO排放量,输入包括用DeepLabV3提取的街景特征和道路网络结构。引入道路网络结构将道路间的互连信息纳入CO排放估算考虑。与之前依赖宏观统计的区域研究方法不同,本研究聚焦于细粒度的道路级CO排放预测,充分利用了图神经网络的优势,并从街景分析的角度研究CO排放的影响。这种方法不仅提高了预测精度和空间粒度,还为城市碳排放的微观理解和管理开辟了新途径。实验结果表明,图神经网络模型在预测城市出租车CO排放方面具有高度准确性,SAGE-GSAN模型在综合指标方面表现最佳,训练损失收敛性更好。此外,消融实验显示,自行车和交通标志对实验结果有一定影响。这项研究展示了使用机器学习和地理空间技术解决城市复杂环境问题的潜力。它为街道级碳排放监测和缓解提供了有价值的工具,为设计针对性减排措施提供了有用见解,对城市规划和空气质量管理具有重要意义,是朝向可持续城市发展和环境管理迈出的关键一步。研究也存在一些局限性和不足。首先,数据集可能不够全面,需要更多数据来训练模型以提高预测准确性。其次,从比较图中可以推断,加入道路长度和交通流量特征可能会产生更准确的预测,研究方法在某些地区的预测仍存在偏差,这可能与该地区的环境特征有关,需要进一步探索。
更多阅读:
空间结构如何影响心理恢复?一种基于图神经网络和街景图像的方法
物理-社会空间交互的视角:实现用户下一位置预测的异构图融合网络
是高还是低?使用机器学习和街景图像探索视觉特征下的校园空间注意力恢复效果
一种基于街景图像从建筑环境特征推断社会经济环境的序列到序列方法
知识与拓扑: 基于时间序列街景图像识别城市功能的双重空间依赖图神经网络
迈向以人为本的数字孪生:利用计算机视觉和图模型预测户外舒适度