摘要
半干旱地区山洪暴发和水资源短缺的威胁日益增加,因此需要使用基于过程或数据驱动的模型进行高质量的径流预测。然而,水文模式的时间异质性和罕见的洪水事件给准确的径流预测带来了挑战。为了解决这个问题,我们提出了一种有效的建模方法,该方法将一种新的数据分割方法BPX与基于注意力的深度学习(DL)模型相结合。BPX集成了Bai-Perron分析和XGBoost,可以从过去和未来的水文气象变量中准确识别干湿期。DL模型在时序卷积网络(TCN)中引入了注意机制,以增强其处理异构时序数据的能力。我们证明了我们的方法的有效性,使用近20年的水文气象数据从中国渭河流域。比较了各种建模方法,包括两种基于过程的模型(Xinanjiang和GR 4J)和四种DL模型(经典的RNN,GRU,LSTM和TCN),无论是否有注意力模块。通过系统的基准测试,发现BPX分割和注意力机制都能提高深度学习的径流预报效果。在各种建模方法中,BPX-TCN在整个预测期间表现出最佳的整体性能,实现了0.91的最高Kling-Gupta效率(与其他模型的0.45-0.88相比),而BPXTCN-attention提供了更准确的洪水预测和多步预测。在半干旱地区的类似应用中,我们的方法可以作为一个有价值的参考,时间异质性是显着的,并提出了挑战,传统的建模方法。
数据分割方法
(a)Bai-Perron分析法。
Bai-Perron分析是一种广泛使用的方法,用于检测经济时间序列中由重大外部事件引起的变化点。本研究中利用此方法,将年径流序列划分为三个区段,以找出年内干、湿周期之间最显著的两个变化点。
(b)XGBoost算法
Bai-Perron分析不能同时考虑径流和气象序列的变化,缺乏未来预测能力。为了解决这个问题,通过XGBoost来增强Bai-Perron分析。XGBoost是梯度提升决策树方法的改进实现。
模型构建
TCN在时间序列分析中的表现优于RNN。本研究中,TCN被用来作为适合于河川流量预测的DDM,并加入自我注意机制以进一步提升其效能。与图像识别中通常使用的相同或有效填充卷积相反,TCN采用因果扩张Conv 1D来从时间序列数据中提取信息。扩张的因果Conv 1D通过以固定间隔跳过输入值,在大于其长度的区域上应用滤波器,从而允许网络仅用几层就能实现大的感受野。剩余连接将中间输入链接到一组卷积块的输出,从而促进更平滑的梯度流,并确保重要特征在不向网络增加计算负载的情况下被携带到最终层。为了防止过拟合,采用了层归一化和空间丢弃。自我注意机制在自然语言处理领域产生了重大影响。当作为层添加到输入层之后时,它可以从全局序列中提取项目之间的关系。在TCN模型中加入了自注意层,以充分利用TCN的局部感知能力和自注意的全局加权特性。
图1.TCN-注意力模型架构图
结果和讨论
1、整个预测期内的模型性能
对于不使用数据分割或注意力机制的基本DL模型,我们观察到TCN>LSTM>GRU> RNN的不同性能。如果在LSTM或TCN中加入注意机制,模型性能将得到进一步的改善,特别是对于LSTM。如果我们分别用干湿期数据对基本的DL模型(经典的RNN、GRU、LSTM和TCN)进行微调,可以观察到显著的改善。对于LSTM/TCN模型,似乎与通过包含BPX方法实现的增强相比,引入注意力机制的改进较少。BPXTCN模型的综合性能最好,可作为半干旱地区径流预报的一种较好模型。
2、模型在干湿期的性能
为了更好地了解模型在关键的湿润期的性能,本研究进一步分析和比较了三个不同的洪水事件。BPX-TCN-Attention的性能与TCN-Attention相似,而BPX-TCN与TCN相当。这表明,注意机制可能有助于更多的改善TCN的性能比BPX方法在潮湿的时期。注意机制的全局观有助于洪水预报中的模型拟合和偏差校正。然而,由于缺乏可供训练的历史样本,在TCN中添加注意机制仍然可能低估极端径流,这可以通过提高训练数据的数量和多样性来解决。
3、基于TCN模型的多步预测性能
多步预测的性能不如前面的子部分中那样令人满意,在所有四个方法中,BPXTCN> BPX-TCN-Attention > TCN>TCN-Attention的趋势。TCN和TCN-Attention之间的比较与以前的结果一致,其中注意力的增加为TCN带来了实质性的预测改善。然而,BPX-TCN和BPX-TCNAttention都优于标准TCN模型。值得注意的是,BPX-TCN不再保持明显的优势,甚至在第5天之后表现不佳。这些发现与洪水过程线结果一致,表明在更具挑战性的任务中,包括注意力可以改善结果。具体而言,BPX-TCN-Attention在多步预测中表现出增强的性能。
4、流域响应时间和模型选择
在训练DDM时,输入持续时间会显着影响模型性能。同样,这种滞后时间也反映在XAJ模型的校准中。多个分析共同验证了在使用模型的性能和选择方面真实世界物理模型的一致性。
5、所提出的模型捕捉气象-径流关系的能力
标准TCN主要优先考虑径流,降水和温度作为预测的关键特征,特别强调过去三天内的信息。注意机制的引入使得模型提高了前一天气温和地表温度的重要性。此外,它加强了蒸散和相对湿度的重要性,从而放大了耗水因子对最终径流预测的影响。但是,它降低了降水量的重要性,从而影响了TCN-注意的预测稳定性。在进一步的模型改进中,BPX-TCN-attention调整了其他特征的重要性,并将其重点转移到降水上。此外,它还在雨季和旱季实施了不同的战略。总的来说,TCN-注意力和BPX-TCN-注意力模型,在不同程度上,偏离TCN的重点径流,提供更深入的了解气象特征和径流之间的关系。
结论
(1)与水文研究中广泛使用的LSTM等DDM和XAJ等PBM相比,TCN为半干旱地区的RR建模提供了更有效的解决方案。
(2)BPX分割和注意力模块都提高了径流预报的性能,有利于更深入地探索客观物理规律。
(3)在各种建模方法中,BPX-TCN在整个预测期间表现出了上级性能,达到了0.91的Kling-Gupta效率,而其他模型的效率为0.45-0.88,而BPXTCN-attention提供了更准确的洪水预测和多步预测。