一种改善污水处理厂实时出水质量预测的混合深度学习方法

文摘   2024-09-30 18:22   新加坡  
               
点击订阅公众号 | 前沿学术成果每日更新               

           

第一作者:Yifan Xie

通讯作者:Hailong Yin

DOIhttps://doi.org/10.1016/j.watres.2023.121092



                 

                 

                 

                 

                 

                 

     

             
图文速览

               

文字摘要:污水处理厂(WWTP)因其进水明显波动和污水处理过程的非线性,运行管理通常较为复杂。对污水处理厂出水水质进行有效地建模可以提供宝贵的决策支持,以促进其运营和管理。在这项研究中,我们通过结合时间卷积网络(TCN)模型和长短期记忆(LSTM)网络模型,开发了一种新型混合深度学习模型,以改进对污水处理厂出水中总氮(TN)时均浓度的模拟。该开发模型在中国江苏省的一个污水处理厂进行了测试,将混合TCN-LSTM模型的预测结果与单一深度学习模型(TCN和LSTM)及传统机器学习模型(前馈神经网络,FFNN)的结果进行了比较。与单一TCN或LSTM模型相比,混合TCN-LSTM模型的准确度提高了33.1%,与传统的FFNN模型相比,其准确度提高了63.6%。与独立的TCN、LSTM和FFNN模型相比,开发的混合模型对污水处理厂出水TN的多个时间步长(在未来八小时内)的预测能力也更加出色。最后,通过使用Shapley加法解释的模型解释方法来识别影响污水处理厂出水水质行为的关键参数,发现去除不对模型输出有贡献的变量可以进一步提高建模效率,同时优化监测和管理策略。                         

图片摘要:

Highlights: 

· 开发了一种新颖的混合深度学习方法 (TCN-LSTM) 用于污水处理厂预测

· 所开发的模型可以防止特征退化和过度拟合的发生

· 与TCN、LSTM和FFNN相比,TCN-LSTM 表现出了更好地预测效果

· TCN-LSTM能够对污水处理厂出水进行提前8小时预警

· 模型解释还可以识别影响污水处理厂行为的关键参数

关键字:Wastewater treatment plant;Machine learning;Hybrid modeling;Temporal convolutional network;Long-short term memory;Total nitrogen

               

               

               

               

               

               

               
研究背景

                   

1960年代,研究人员就开始开发动力学污泥生长模型来模拟污水处理过程。到了1980年代,相关机构提出了活性污泥模型(ASM),该模型此后成为模拟污水处理过程中最广泛使用的机理模型。然而,机理模型需要复杂的参数校准过程,这要求相关人员详细了解WWTP系统参数和专业知识

目前,随着人工智能的发展,机器学习已成为预测污水处理厂出水水质的有前途的替代方案。典型的深度学习模型包括卷积神经网络(CNN)网络(TCN),循环神经网络(RNN),门控循环单元(GRU),以及长短期记忆(LSTM)。这些模型可以处理不同类型的数据来预测WWTP进水和出水的水质,这可以进一步利用机器学习方法的力量来帮助WWTP规范。基于单一算法的预测模型可能只包含对象的部分信息。将个别深度学习模型组合生成基于混合深度学习算法的预测,可以包括关于数据的更全面的信息以提高预测精度。基于单一算法的预测模型可能只包含对象的部分信息。将个别深度学习模型组合生成基于混合深度学习算法的预测,可以包括关于数据的更全面的信息以提高预测精度该文作者开发了一种混合时域卷积神经网络(TCN)-LSTM模型来模拟WWTP的每小时出水TN浓度该文作者首次探索混合TCN-LSTM模型模拟WWTP运行的可行性,并将混合模型的性能与独立机器学习模型的性能进行了比较。此外,还对混合模型进行了可解释性分析,以识别直接影响模型性能的最具影响力的参数。

               

               

               

               

               

               

               
主要研究方法

                   

WWTP系统及数据收集

如图1,该WWTP系统污水处理过程包括预处理(格栅)、沉砂池和活性污泥系统,其中包括水解酸化、前缺氧、厌氧、缺氧和好氧池。生物处理系统后接次级澄清池,然后经过絮凝、沉淀、V型砂滤和氯化处理,最终作为最终出水排放。该污水处理厂的总水力停留时间为25.4小时。

图1 WWTP系统的废水处理流程和在线仪器所在位置

该文作者收集了4270组数据以建立深度学习模型,这些数据有以下三类:

1.WWTP进水流量和水质数据,包括:进水流量、COD、NH3-N、TN、TP和pH;
2. WWTP出水水质数据,包括:COD、NH3-N、TN、TP、pH和出水流量;
3. 21个处理过程监控和操作设备的在线记录数据,包括:2个溶解氧(DO)仪表、2个水位仪表、2个pH仪表、8个氧化还原电位(ORP)仪表和7个浊度仪表,这些仪表均位于生物反应罐中。

 混合深度学习模型的开发

该文作者建立的深度学习模型整体如图2所示。其中,(a)图展示了混合TCN-LSTM模型的整体框架。代表向前预测时间;是扩张率;代表 Sigmoid 和双曲正切激活函数;分别是时间的输入门、遗忘门和输出门;分别是时间的单元状态和隐藏状态;(b)图展示了使用滑动窗口法的采样策略;(c)图展示了TCN网络的残差连接的例子。

图 2. WWTP出水预测的混合深度学习模型示意图
在TCN中,TCN结构的超参数包含5个隐藏层,膨胀率分别为2、4、8、16和32,滤波器尺寸为3,dropout率为0.1。对于LSTM结构,LSTM层含有67个神经元,dropout率为0.3,循环计算三次。对于dense layer,神经元与LSTM层中的神经元相等。损失函数(loss function)被设置为平均绝对误差(mean absolute error),这使得开发的模型对异常值敏感。训练的周期数(epochs)设置为80,批量大小(batch size)配置为32。
模型可解释性方法-SHAP
本文采用Shapley 加法解释(SHAP)进一步解释所开发机器学习模型的行为。SHAP 方法基于 Shapley 值,该值源自合作博弈论,为成员之间分配收益提供了一种合理的方法(。特征的 Shapley 值代表其对预测的贡献:Shapley 值的绝对值越大,特征的贡献越大。因此,SHAP 值的一个优势是其能够描述模型预测基于模型特征值变化而如何改变。数学上,Shapley 值定义为:

其中: 是解释模型,是特征值的最大子集大小;是特征的 Shapley 值;属于表示简化特征,其中 1 或 0 表示在计算 Shapley 值时模型特征的存在或缺失。


               

               

               

               

               

               

               
主要结果

                   
与单独使用TCN和LSTM相比,该文作者提出的TCN-LSTM混合深度学习模型的预测能力得到了增强
如图3和表1,混合TCN-LSTM模型在 MAPE、MAE和RMSE的测量指标上比单一TCN模型提高了28.1∼29.5%,预测与观测测试数据之间的R2从0.746提高到了0.855。混合TCN-LSTM比单一LSTM模型在MAPE、MAE 和 RMSE测量指标上提高了22.9∼33.1%,R2高达0.855。

图3 比较单一和混合深度学习方法对污水处理厂污水的时间序列预测效果

表1 深度学习方法对污水TN预测精度的统计

同时,该文作者将所提出的混合TCN-LSTM模型与传统的前馈神经网络(FFNN)进行了比较,预测精度也较为突出,如表2。
表2 TCN-LSTM模型与FFNN的预测精度比较
该文作者提出的TCN-LSTM混合深度学习模型能够良好地预知WWTP未来8小时内的TN变化
图 5 展示了对测试数据集中污水处理厂出水总氮(TN)的模拟分析,预测提前时间分别为 1、2、4 和 8 小时。在此图中,无警报、警报 I 级和警报 II 级分别代表出水 TN 浓度范围小于 5.0 mg/L、5.0∼8.0 mg/L 和大于或等于 8.0 mg/L。8.0 mg/L 的 II 级警报阈值表示对接近 IV 标准超限排放的早期预警(即,出水 TN 浓度为 10.0 mg/L)。根据测试数据集,提前 1、2、4 和 8 小时的早期预警准确率分别为 87.3%、76.2%、70.6% 和 69.3%。随着预测提前时间的增加,污水处理厂出水 TN 的早期预警准确性可能会呈现下降趋势。然而,混合模型在预测提前时间延长至 8 小时时,仍然为大多数(超过 70%的无警报、警报 I 和警报 II 的事件提供了准确的早期预警。

图5 在预警时间为(a) 1、(b) 2、(c) 4、(d) 8小时,混合模型预测污水处理厂出水事件
该文作者通过SHAP分析进一步了解出水TN的变化规律
SHAP分析表明出水 TN 预测受进水、控制和出水参数共同影响,如图6。基于 SHAP 分析,识别出了5 个最具影响力的参数:出水总氮浓度、缺氧预处理罐中的氧化还原电位、泵进水流量、粗格栅前调节池水位(控制污水处理厂进水)和好氧罐中的溶解氧浓度。同时,若移除 5 个最具影响力的参数时,测试数据的MAPE、MAE和RMSE值增加了179∼229%,R2 值下降了 96.9%。这表明移除更敏感的变量显著降低了 TCN-LSTM 模型的性能。相比之下,如果移除 SHAP 分析识别的 10 个最不具影响力的参数,模型性能几乎没有下降。从这个角度来看,基于 SHAP 分析结果移除不对模型输出有贡献的变量可以进一步提高建模效率,同时优化污水处理厂的监控活动和管理策略。

图6 SHAP分析及模型各输入参数的SHAP值

文献信息             
:5              

点击“原文链接”,查看论文         


               

               

声明:本公众号分享的前沿学术成果来源于各学术网站,不依法享有其所有权。若原作者发现本次分享中的文字及图片涉及侵权,请立刻联系公众号后台或发送邮件,我们将及时修改或删除!         

邮箱:environmodel@sina.com         

若您认为有用,欢迎

Environmodel设为星标,或

点击“在看”或“分享”给他人

Environmodel
Environmodel(环境模型)专注于环境科学与工程领域的建模及模型研究进展,并分享涵盖机器学习、深度学习以及人工智能等相关领域的理论知识、主流工具和Python编程技巧。
 最新文章