第一作者:Subin Lin
通讯作者:Seoktae Kang
DOI:https://doi.org/10.1016/j.watres.2023.119665
文字摘要
在水处理中,确定混凝剂剂量是一个耗时的过程,涉及非线性数据关系和众多因素。该研究提供了一种深度学习方法,使用 2011 年至 2021 年之间的长期数据来确定混凝剂剂量和/或经处理后沉淀的水的浊度,并且考虑各种天气条件的影响。开发了一种图注意多元时间序列预测 (GAMTF) 模型来确定混凝剂剂量,并将其与传统的机器学习和深度学习模型进行了比较。GAMTF 模型 (R 2 = 0.94,RMSE = 3.55) 优于其他模型 (R 2 = 0.63 - 0.89,RMSE = 4.80 - 38.98),并成功同时预测了混凝剂剂量和沉淀水浊度。GAMTF 模型通过考虑特征之间的隐藏相互关系和特征的过去状态来提高预测准确性。结果表明,多元时间序列深度学习模型,特别是基于图注意的先进模型首次成功应用,使用长期数据为水处理过程中的决策支持系统提供服务。
图片摘要
Highlights
首次将深度学习应用于序列数据,以预测水处理过程中的混凝剂用量。
首次利用长期数据进行深度学习的适当训练。
基于图注意力机制的方法能够从输入数据中识别相关信息。
多变量时间序列方法提升了深度学习的性能。
Keywords:
Coagulant;Prediction model;Deep learning;Attention-based mechanism;Time series;Big data
基于图注意力机制的多变量时间序列预测模型
图2.基于图注意的多元时间序列预测模型(GAMTF)结构
图 3. DWTP中混凝剂用量预测模型的概念结构
- 多元线性回归
- 随机森林
- 门控循环神经网络
原水水质数据显示,过去 11 年来发生了显著变化(图 4)。浊度值普遍较低,平均为 3 NTU,由于原水取自湖泊深水,受湖泊稀释作用影响,水质比较稳定,因此没有出现严重变化。夏季雨季原水浊度较高,尽管其值与降雨量并不成正比。原水浊度的变异系数明显较高(训练数据和测试数据分别为 2 和 1.16),2011 年 8 月急剧上升至约 92 NTU(图 4)。2016 年、2020 年和 2021 年夏季也出现了浊度大幅上升,峰值低于 55 NTU。这种浊度变化只能在长期数据集中看到。.
图4. WTP混凝过程数据特征的时间序列
相关性结果(图5)显示,在训练和测试数据中,混凝剂投加量与原水浊度的相关性最高,分别为0.77和0.88。然而,每年的混凝剂投加量与原水浊度之间的相关性从0.007到0.92不等。每年浊度较高的数据都显示出较高的相关性。
添加了沉淀水的浊度作为输入。每个模型的预测结果(图 6 e-h 和7 e-h)与上一节中的预测结果类似。GAMTF 能够跟踪混凝剂用量和沉降水浊度的趋势(图 6i、j)。在处理低浊度原水时,预测的混凝剂用量值在 7 月中旬之前低于实际用量,但在处理高浊度原水时,预测的混凝剂用量值高于实际用量,而沉降水浊度保持在 1 NTU 以下。这表明,基于长期数据实施模型预测可以降低处理低浊度水的化学成本,同时增加处理高浊度水的混凝剂量,以确保沉降水浊度符合指导方针。与单输出模型的结果相反,该模型表现出对混凝剂用量的改进预测,特别是在极高用量需求的情况下(图 7i)。这种建模方法通过根据原水质量和之前的用量以及预测的沉降水浊度来建议混凝剂用量,提供了更好的决策支持系统。
点击“原文链接”,查看论文
声明:本公众号分享的前沿学术成果来源于各学术网站,不依法享有其所有权。若原作者发现本次分享中的文字及图片涉及侵权,请立刻联系公众号后台或发送邮件,我们将及时修改或删除!
邮箱:environmodel@sina.com
若您认为有用,欢迎
将Environmodel设为星标,或
点击“在看”或“分享”给他人