郭鑫，李文静，乔俊飞：基于自组织模块化神经网络的污水处理过程出水参数预测

文摘 2024-11-05 19:38 北京

基于自组织模块化神经网络的污水处理过程出水参数预测

郭鑫 ^1,^2,^3,⁴ 李文静 ^2,^3,⁴乔俊飞 ^2,^3,⁴

（1. 河南工业大学电气工程学院，河南郑州 450001； 2. 北京工业大学信息学部，北京 100124； 3. 计算智能与智能系统北京市重点实验室，北京 100124； 4. 智慧环保北京实验室，北京 100124 ）

DOI：10.11949/0438-1157.20240324

摘要针对城市污水处理过程关键出水水质一些参数难以在线测量的问题，提出了一种基于经验模态分解（EMD）的自组织模块化神经网络（MNN）出水参数软测量模型。首先设计一种基于EMD的任务分解方法，将复杂的时间序列分解为若干子序列，并采用样本熵和欧氏距离分别计算子序列的复杂性及相似性，自适应调整子网络模块。然后针对子网络模块初始结构难以确定的问题提出一种前馈神经网络的结构自组织算法，实现子网络模型根据分配的子任务动态调整自身网络结构，更有效地对各子序列进行预测。最后通过基准时间序列预测和实际污水处理厂中出水水质参数检测实验验证了所提出的模型具有较好的预测精度和自适应性。

关键词经验模态分解；动态建模；模块化神经网络；时间序列预测；废水

Prediction of effluent parameters in wastewater treatment process using self-organizing modular neural network

GUO Xin ^1,^2,^3,⁴ LI Wenjing ^2,^3,⁴QIAO Junfei ^2,^3,⁴

（1. College of Electrical Engineering, Henan University of Technology, Zhengzhou 450001, Henan, China； 2. Faculty of Information Technology, Beijing University of Technology, Beijing 100124, China； 3. Beijing Key Laboratory of Computational Intelligence and Intelligent System, Beijing 100124, China； 4. Laboratory for Intelligent Environmental Protection, Beijing 100124, China ）

Abstract: It is well known that some key effluent quality parameters are difficult to measure online in the urban sewage treatment. To solve this problem, this paper proposes a new soft-measurement model using empirical mode decomposition and modular neural network (EMD-SMNN) for effluent quality parameters. First, a task decomposition algorithm based on EMD is proposed, which can decompose a complex, multi-frequency time series of effluent quality parameters into several sub-time series, and it can adaptively adjust subnetwork modules according to the complexity and similarity of sub-time series calculating by the sample entropy and Euclidean distance. Then, a novel self-organizing algorithm of FNN is proposed to solve the problem that the initiating structure of subnetwork is difficult to given, which can dynamically adjust the structure of subnetworks and predict subtasks effectively. Finally,through the benchmark time series prediction and the actual effluent water quality parameter detection in the sewage treatment plant, it is verified that the proposed EMD-SMNN has a good prediction accuracy and self-adaptability.

Keywords: empirical mode decomposition；dynamic modeling；modular neural network；time series prediction；wastewater

引言

城市污水处理过程是一个大规模、强干扰性、不确定性的复杂生化反应过程，其出水水质参数是废水处理后的水质是否达到标准、污水处理过程是否高效及稳定运行的主要依据^[1-2]。然而实际污水处理过程中一些关键水质参数是难以实时检测的，包括生化需氧量（biochemical oxygen demand, BOD）、氨氮（ammonia nitrogen, NH₃-H）等^[3]。当前城镇污水处理厂一般采用仪表/仪器设备进行出水水质参数实时检测，但该方法易受外界不确定性干扰影响以及设备易受污染，测量精确度较差，导致出水水质参数出现异常时难以及时发现，从而造成水质二次污染^[4-5]。因此，近几十年来，国内外学者一直致力于城市污水处理过程出水水质实时检测方法，主要包括传统离线化验方法、机理建模方法和数据驱动方法等。其中，传统离线化验方法是一种离线的、周期长的实验室方法^[6-7]，测量耗时较长，难以应用于污水处理厂出水水质参数的实时检测和监测；机理建模方法是在对污水处理各过程工艺、多个生物和化学反应过程等机理认知基础上建立其数学模型，从而实现污水处理过程中出水水质参数实时检测和预测^[8-9]，但污水处理过程具有强干扰性、不确定性等特点，而且其微生物反应过程尚不清晰，导致现有机理模型精度难以达到预期效果。

为克服传统实验室方法和机理建模方法的局限性，基于数据驱动的建模方法，利用易测量的水质参数建立出水水质软测量模型，实现污水处理过程水质实时检测和预测，在污水处理领域获得广泛的关注。其中基于神经网络的建模方法因具有较强的非线性建模能力、适应性和学习能力，已经成功应用于城市污水处理领域，取得了较好的效果^[10]。例如闻超垚等^[11]提出了一种基于稀疏偏最小二乘算法和Schweppe型广义M估计的随机权神经网络稀疏鲁棒建模方法，可以在线鲁棒预测污水处理过程水质参数。Meng等^[12]设计了一种基于增长策略和二阶学习算法的自适应径向基函数网络模型，实现在线出水BOD和出水总氮的准确预测。Fernander等^[13]通过主成分分析方法选择与水质参数相关的辅助变量，根据神经网络方法建立了出水化学需氧量（chemical oxygen demand, COD）、总磷等水质参数的软测量模型。Zhu等^[14]采用灰色相关分析方法筛选出与BOD和NH₃-H相关特征，建立了基于支持向量机前馈神经网络的水质参数预测模型，可以准确预测出水BOD和NH₃-H。然而，面对具有高非线性、强不确定性、时变性等特性的污水处理过程，静态的神经网络模型初始规模难以确定，无法适应动态环境下的出水水质参数预测。

因此，近年来学者们对神经网络模型自组织算法进行研究，从而实现神经网络可以根据污水处理过程的动态特性动态调整自身网络结构（隐含层数、神经元数），以获得紧凑的神经网络模型。如Qiao等^[15]提出了一种单层前馈神经网络的在线自组织方法，利用网络实时误差和隐含层神经元贡献度获得网络局部信息，可以根据数据变化在线增加或删减隐含层神经元，成功应用于污水处理过程出水BOD预测。韩红桂等^[16]通过计算隐含层神经元输出信息的强度以及之间的互信息增加或删减径向基函数（radial basis function, RBF）网络的结构，提高RBF的动态特征响应能力和逼近能力，实现了污水处理过程水质COD和BOD在线测量。Meng等^[17]根据网络的学习精度和规则的重要性，结合改进二阶算法和最小二乘法的混合学习算法动态调整模糊神经网络结构和参数，可以有效预测污水处理过程出水NH₃-H。廉小亲等^[18]提出了一种基于RBF网络的污水处理水质COD软测量模型，通过自组织特征映射网络对数据样本进行聚类分析以确定RBF网络的结构和参数，有效提高了静态RBF网络的水质COD预测精度。但实际应用中，单一神经网络模型难以准确地对复杂、大规模、多流程的污水处理过程出水水质参数建模、预测，无法适应污水处理过程的所有工况。另外，当新知识出现时，网络参数（连接权值）或结构可能会发生较大的改变，破坏已学的知识，即灾难性遗忘问题。

模块化神经网络（modular neural network, MNN）采用“分而治之”策略，将复杂的任务分解为多个简单、独立的子任务进行学习，有效降低任务的复杂性，缓解单神经网络的灾难性遗忘问题。因此，MNN引起了国内外学者们广泛的关注和应用，如模式识别、非线性系统建模、时间序列预测等^[19]。任务分解是MNN设计中需要解决的首要问题，直接决定着各子网络模型的学习任务。聚类算法是一种无监督学习的技术，常用来设计任务分解，可以根据样本间的相关性将时间序列划分为一组簇的集合^[20-21]。如蒙西等^[22]通过模拟大脑皮层工作原理构建了基于互信息和专家知识的类脑模块化神经网络软测量模型，应用于污水处理过程关键出水参数检测。丛秋梅等^[23]采用模糊聚类算法划分污水处理过程，并构建极限学习机的子网络模型，对各子任务进行学习、预测，集成各子网络模型对出水水质参数进行预测。Duan等^[24-25]利用聚类算法、主成分分析等方法有效地划分任务为几个简单的子任务，已成功应用在非线性系统建模、污水处理过程、城市生活垃圾焚烧等领域。但在污水处理应用中，这类MNN模型没有充分考虑数据的时间序列特性，仅考虑在样本空间的划分，可能会造成一些子网络模块分配较少样本。另外，在MNN建模过程中一般采用固定结构的神经网络模型作为子网络模型，其初始结构难以确定，而目前开展子网络模型动态调整同时子网络模型结构自组织的建模方法的研究较少，导致MNN难以根据各子任务不同的动态特性建立合适的子网络模型，水质参数预测精度不能达到令人满意的效果^[26-27]。

针对以上问题，本研究根据出水水质参数数据的时间局部特性以及神经元之间的相互作用提出了一种基于经验模态分解（empirical mode decomposition, EMD）的自组织模块化神经网络（self-organizing modular neural network, SMNN）模型（EMD-SMNN）。首先设计了一种基于EMD的任务分解算法，将一个复杂、多频率的出水水质参数数据分解为若干个简单、单频率、独立的子时间序列，并采用样本熵和欧氏距离自适应合并复杂度较小且相似度较大的子时间序列，动态调整子网络模块以保证模型的紧凑性。然后提出了一种前馈神经网络结构自组织算法，通过网络学习性能和神经元之间的信息增加或删减网络结构，并通过权值衰减的惩罚机制对冗余隐藏节点进行无缝修剪，从而在保证MNN模型预测性能的同时获得一个紧凑的子网络结构。最后通过基准问题和污水处理过程出水NH₄-N预测的实际问题对所提模型的有效性进行验证。

1 EMD-SMNN结构

模块化神经网络结构主要包括输入层、任务分解层、子网络层和集成输出层^[28]。本研究提出的EMD-SMNN网络结构如图1所示。

图1 EMD-SMNN结构Fig.1 Structure of EMD-SMNN

EMD-SMNN各层具体描述如下。

输入层：该层主要输入数据，输入节点数n由t时刻样本x(t) 的维数决定。

任务分解层：该层包括任务分解算法和任务分配策略，任务分解算法把任务分解成若干个简单、独立的子任务，任务分配策略把子任务分配给相应的子网络模块学习。本研究中，EMD-SMNN根据时间尺度的时间特性分解时间序列，并采用样本熵和欧式距离合并相似性大的子时间序列。

子网络层：该层主要构建子网络模块学习相应的子任务。子任务为不同频率的时间序列，为了找到能够拟合当前分配的子任务的最佳模型结构提出一种单层前馈神经网络（feedforward neural network, FNN）结构自组织方法。为了更好地预测子时间序列，对子时间序列重构状态空间向量x(t) = {x₁(t)，x₂ (t-T)，…，x_n[t–(D–1)T]} 作为子网络的输入变量，其中T为时间延迟，D为嵌入维度。

当t时刻输入样本x(t) 时，子网络层中第h个子网络模块输出为

(1)

式中，w_h为子网络模块隐含层与输出层之间的权值，v_h为子网络模块输入层与隐含层之间的权值，b₁_h、b₂_h分别为隐含层和输出层的偏置，隐含节点的激活函数为sigmoid函数。

集成输出层：该层对子网络层中激活的子网络模块进行集成，EMD-SMNN的集成规则是各子网络模块的加权求和。

t时刻，EMD-SMNN输出为

(2)

式中，a(t)=[a₁，a₂，…，a_l] 为集成矩阵，y(t)= [y₁(t), y₂(t)，…，y_l(t)] 为当前时刻子网络模块的输出。

2 EMD-SMNN结构设计

2.1 基于EMD分解过程

EMD是一种信号序列的自适应处理技术，它将一个复杂、多频率的信号序列分解成若干个简单、单频率的IMF分量和残余序列r，广泛应用于复杂非线性和非平稳信号的处理。因此本研究提出了一种基于EMD的任务分解算法。

具体步骤如下。

Step1：找出原始时间序列x(t) 的所有极值点。

Step2：采用三次样条插值法对极大值点构建上包络线E_max(t)，对极小值点构建下包络线E_min(t)。

Step3：计算上下包络线的均值m(t)。

(3)

Step4：从原始时间序列x(t) 中筛去m(t)，剩余部分h(t) 为

(4)

Step5：判断h(t) 是否满足EMD算法两个基本条件。若满足，则h(t) 为一个IMF分量（本征模函数），则残余序列r(t) 为

(5)

残余序列r(t) 代替原始时间序列x(t)，返回到Step1。若不满足，则h(t) 代替原始时间序列x(t)，返回到Step1。直到筛分的h(t) 为单调函数或满足停止条件

(6)

式中，i为所述IMF分量的个数；ε表示筛分门限，一般取值范围为0.2~0.3。

Step6：采用样本熵和欧氏距离分别计算子时间序列（IMF分量，残余序列r）复杂性、相似性。

（1）样本熵计算子时间序列复杂性

首先把时间序列x(t) 划分成一组维度为m的向量序列：X^m(1)，…， X^m(N-m-1)。其中X(i)=[x(i)，x(i+1),…，x(i+m-1)]，1≤i≤i-m+1。然后计算X^m(i) 与X^m( j) 距离小于等于r_o的j（1≤j≤N-m，j≠i）的数目B_i，公式如下

(7)

(8)

同理，时间序列x(t) 再划分成一组维度为m+1的向量序列，得到

(9)

(10)

计算时间序列样本熵公式如下

(11)

式中，N为子时间序列的长度；本研究中选择m=2，r_o=0.2σ （σ为原始子时间序列的标准偏差）。

（2）欧氏距离计算两个子时间序列的相似性

对于子时间序列x₁(t)和x₂(t)，采用欧氏距离计算相似性，欧氏距离越小相似度越大，公式如下

d[x₁(t)，x₂(t)]=

(12)

Step7：合并复杂性较小、相似性较大的子时间序列。复杂性阈值范围为（0.1~0.5）F_o，其中F_o为所述原始时间序列复杂性，相似性阈值范围为0.1~0.5。

Step8：最终原始时间通过基于EMD任务分解算法分解为若干个简单的子时间序列。

EMD的两个基本条件包括：①本征模态函数（IMF分量）在整个时间范围内，局部极值点和过零点的数目必须相等或最多相差一个；②在任意时刻点，局部最大值的包络（上包络线）和局部最小值的包络（下包络线）平均必须为零。所以基于EMD任务分解算法能够根据时间尺度的局部特性有效地对时间序列进行分解。

2.2 子网络模型结构自组织算法

为更好地学习不同频率的子任务，提出一种前馈神经网络的结构自适应生长-修剪算法，从而解决子网络模型初始结构难以确定问题。子网络激活函数采用sigmoid函数，输入变量为，其结构如图2所示。

图2 子网络模型结构Fig.2 Structure of sub-network

目前，在修剪网络结构时，现有自组织算法仅考虑了神经元对输出的重要性，而且直接修剪神经元可能会破坏网络已学习到的知识。因此，提出的子网络模型自组织算法采用互信息和敏感度分析方法判断神经元之间的相互作用及贡献度，并通过添加权值惩罚项实现对冗余神经元的无缝修剪。

子网络模型采用具有滑窗机制的梯度下降算法进行学习。具体步骤如下。

2.2.1 增加神经元

网络误差是判断神经网络学习性能的直接指标。因此，在网络陷入局部最优时，当网络误差达到预期误差时，说明当前网络结构可以学习当前样本；当网络误差大于期望误差时，说明当前网络学习能力不足，需要增加神经元。

网络局部最优可表示为

(13)

式中，为迭代延迟，为很小的正数。

为了保证网络在样本少时不出现过拟合，设计了一个衰减函数ρ(t) 作为预期误差E_d的系数。

(14)

式中，t_n为样本数。

当网络陷入局部最优时，网络误差E(t)满足

(15)

式中，ρ(t)>1。

若当前网络不能够学习当前知识，则增加一个隐含层神经元以提高网络的学习能力，新神经元的初始权值如下：

(16)

(17)

式中，，y(t)为网络输出，y_out(t)为期望值；v_:_j(t)为贡献值最大的隐含层神经元j到输入层的权值；b^h和b^o分别为隐含层、输出层的偏置。

2.2.2 删减神经元

当网络误差达到期望误差时，为保证网络的紧凑型，删减与其神经元相互作用小且贡献度小的神经元。

神经元i的贡献^[15]表示为

(18)

(19)

神经元i和j之间的相互作用表示为

(20)

式中，p(·)为概率密度，H₁、H₂分别为神经元1、2的输出，N表示滑窗内样本数。

当神经元i与其他神经元的相互作用较小且贡献度小时

(21)

式中，δ₁和δ₂都是很小的正数。

则删减该神经元，添加权值惩罚项。

(22)

2.2.3 子网络结构自适应生长-修剪算法

该算法更好地挖掘出神经元局部动态信息，使网络结构动态自动调整，实现子网络模型结构自组织，提高了模块化神经网络的自适应能力。

具体步骤如下。

Setp1：初始化子网络模型的参数。

Setp2：当网络陷入局部最优时，计算当前网络误差E(t)。

Setp3：当E(t)≥ρ(t)E_d时，说明网络不能学习当前样本，则增加一个神经元，初始权值设置如式（16）和式（17）。

Setp4：当E(t)<ρ(t)E_d时，通过式（19）和式（20）分别计算神经元之间的相互作用及神经元贡献度。

Setp5：根据式（21）判断冗余神经元，并通过添加权值惩罚项进行删减。

Setp6：新样本到达，训练网络，返回Setp2。

Setp7：直到所有样本学习完成。

2.3 EMD-SMNN学习过程

EMD-SMNN首先通过EMD分解算法基于时间尺度的局部特性对时间序列分解，然后合并复杂性小且相似性大的子时间序列以保证网络的紧凑性，并构建不同结构的子网络模块对子时间序列进行学习。图3为EMD-SMNN学习过程示意图。具体步骤如下。

图3 EMD-SMNN流程图Fig.3 Flow diagram of EMD-SMNN

Step1：对原始时间序列x(t) 进行归一化处理。

(23)

式中，x′(t)为归一化后时间序列，x_min和x_max分别为原始时间序列x(t) 的最小值和最大值。

Step2：通过EMD算法把时间序列x′(t)分解为IMF₁，IMF₂，…，IMF_k分量和一个残余序列r。

Step3：采用样本熵和欧氏距离自适应合并简单且相似性大的子时间序列以保持网络紧凑性。

Step4：建立相应的子网络模块，对子时间序列进行训练、学习。本研究中，子网络模块由固定结构的前馈神经网络组成，采用梯度下降法训练网络，初始网络权值随机设置。

Step5：最后对子网络模块学习结果进行加权求和，输出预测结果。

3 实验结果及分析

为了验证EMD-SMNN的性能，选取Mackey-Glass时间序列预测和Lorenz时间序列预测等基准问题以及污水处理过程中出水NH₄-N预测等实际问题，同时分别和基于模块化神经网络模型的MNN（SWEMD-MNN^[27]，OAMNN^[28]，CMNN^[29]，OSAMNN^[30]）和单神经网络模型（FNN，CCRNN^[31]，CICC^[32]，CCPSO^[33]，MLP-BLM^[34]）进行对比。另外，为更好地验证所提出模型的有效性，对比MNN模型的子网络模块具有相同结构的FNN模型，并与子网络模型结构固定（3个隐含层神经元）的SWEMD-MNN和EMD-MNN模型进行了对比，验证子网络模型结构的自组织算法性能。

选取均方根误差（RMSE）和归一化均方根误差（NMSE）作为MNN性能的评价标准。

(24)

(25)

式中，N为样本数，、、分别为期望输出、网络的实际输出、期望输出的平均值。

3.1 Mackey-Glass时间序列预测

Mackey-Glass时间序列因具有混沌特性，在文献中常作为一个基准问题验证提出模型的准确性。

Mackey-Glass时间序列可以由一个延迟微分方程产生，微分方程如式（26）。

(26)

式中，τ为延迟参数，时间序列当τ>16.8时产生混沌现象。

实验时τ=17，采用四阶Runge-Kutta方法产生1000个实验数据，选取前500个数据作为训练样本，剩余的500个数据作为测试样本，利用嵌入维度重构原始时间序列的相空间D=3、T=2，预测下一步的值^[32]。初始化EMD-SMNN参数：复杂度阈值为0.2F_o，其中F_o=0.3795为所述原始时间序列复杂度，相似度阈值为0.4，初始子网络结构具有2个隐含层节点。

图4为Mackey-Glass时间序列通过EMD分解的分量及残余序列，x(t) 为归一化后的原始数据。可以看出分量IMF₄和IMF₅范围分别在[-0.01 0.01]和[-0.02 0.02]，相似性较大且复杂性较小，因此考虑两分量的合并，以减少MNN结构的冗余。

图4 Mackey-Glass时间序列的EMD分解子时间序列Fig.4 Subseres decomposed by EMD for Mackey-Glass time series

图5和图6为EMD-SMNN的各子网络模型训练过程和测试结果，图7为EMD-SMNN预测Mackey-Glass时间序列的结果。其中图5（a）为子网络隐含层神经元根据分配的子时间序列动态地增加或删减，图5（b）为各子网络模型的训练RMSE；图6为测试过程中各子网络模型的预测结果，其预测RMSE见表1。从子网络模型训练过程和测试结果可以得知，各子网络模型可以根据不同子任务自动调整网络结构且具有较小的测试误差，能精确地预测各子时间序列，从而EMD-SMNN集成各子网络模型能够精确地预测Mackey-Glass时间序列。

图5 子网络模型学习Mackey-Glass时间序列各子序列过程：（a）子网络模型结构动态变化；（b）子网络模型训练RMSEFig.5 Learning process of subseries of Mackey-Glass time series by sub-networks: (a) dynamic change of structure; (b) training RMSE of sub-networks

图6 Mackey-Glass时间序列各子序列预测结果Fig.6 Prediction results of subseries for Mackey-Glass time series

图7 Mackey-Glass时间序列预测结果Fig.7 Prediction results for Mackey-Glass time series

表1 子网络模型的预测RMSETable 1 Prediction RMSE of sub-networks

表2所示为EMD-SMNN及其他模型预测Mackey-Glass时间序列的性能，实验结果为独立30次实验的平均值，黑体为最好的预测结果。从表2对比结果可以看出，与基于聚类MNN模型（SWEMD-MNN^[27]，OAMNN^[28]，CMNN^[29]）及单神经网络模型（FNN，CCRNN^[31]，CICC^[32]，CCPSO^[33]）相比，基于EMD分解的模块化神经网络模型测试误差RMSE和NMSE具有较小的值。SWEMD-MNN^[27]和EMD-SMNN结构可能比CCRNN^[31]和CICC^[32]稍大，但具有较高的预测精度。在相同子网络模块条件下，基于EMD分解的模块化神经网络模型能够根据时间序列的时间特性把Mackey-Glass时间序列有效地分解，提高了基于聚类模块化神经网络模型的预测精度。与SWEMD-MNN^[27]相比，具有结构自组织的子网模型可以更好地对各子任务进行建模，提高了子网模型的预测精度和适应性。从表1预测结果可以看出，训练后，EMD-SMNN的子网络模型1和2结构与EMD-MNN相同，能更好地学习数据变化，其子网络模型3、4和5具有更小的结构且与EMD-MNN性能相近，最终EMD-SMNN具有较好的预测性能，模型结构更加紧凑。

表2 不同模型的Mackey-Glass时间序列预测结果Table 2 Prediction results of different models for Mackey-Glass time series

注：“—”表示在原文献中未给出。

3.2 Lorenz时间序列预测

Lorenz混沌系统可由3个微分方程构成，如式（27）。

(27)

实验时，Lorenz混沌系统参数σ=10、γ=8/3、ρ=28，初始值x(0)=1.0、y(0)=1.0、z(0)=1.0。通过Lorenz混沌系统的x维时间序列产生1000个数据，选择前500个数据训练网络，其余500个数据测试网络性能，利用嵌入维度重构原始时间序列的相空间D=3、T=2，预测下一步的值^[32]。初始化EMD-SMNN参数：复杂度阈值为0.2F_o，其中F_o=0.1753为所述原始时间序列复杂度，相似度阈值为0.4。

图8所示为通过EMD算法分解的分量及残余序列，x(t) 为归一化后的原始数据，各子时间序列之间相似性较小，没有进行子时间序列的合并。图9为子网络模型训练过程，其中图9（a）、（b）分别为各子网络模型结构动态变化和训练RMSE。图10为Lorenz时间序列各子序列预测结果，其各子网络模型训练RMSE见表3。从训练过程和预测结果可以看出，各子网络模型可以动态调整自身结构，而且能够精确预测各子时间序列。图11为EMD-SMNN预测Lorenz时间序列的结果，展示出EMD-SMNN具有较好的预测性能。

图8 Lorenz时间序列的EMD分解子时间序列Fig.8 Subseries decomposed by EMD for Lorenz time series

图9 子网络模型学习Lorenz时间序列各子序列过程：（a）子网络模型结构动态变化；（b）子网络模型训练RMSEFig.9 Learning process of subseries of Lorenz time series by sub-networks: (a) dynamic change of structure; (b) training RMSE of sub-networks

图10 Lorenz时间序列各子序列预测结果Fig.10 Prediction results of subseries for Lorenz time series

表3 子网络模型的预测RMSETable 3 Prediction RMSE of sub-networks

图11 Lorenz时间序列预测结果Fig.11 Prediction results for Lorenz time series

表4为EMD-SMNN及其他模型预测Lorenz时间序列的性能，实验结果为独立30次实验的平均值，黑体为最好的预测结果。从表4比结果可以看出，相比基于聚类MNN模型（OAMNN^[28]，CMNN^[29]）及单神经网络模型（FNN，CCRNN^[31]，CICC^[32]，MLP-BLM^[34]），基于EMD的模块化神经网络模型测试误差RMSE和NMSE有较好的预测精度。在相同子网络模块条件下，EMD-MNN能够根据时间序列的时间特性分解Lorenz时间序列，提高了MNN的预测效果。在表3中，子任务1和4复杂性较大，EMD-SMNN的子网络模型1和4结构自动调整为4个隐含层神经元，比具有3个隐含层神经元的EMD-MNN的预测结果明显地提高，而在子任务5较为简单时EMD-SMNN的子网络模型5结构为2个神经元。因此，具有结构自组织的EMD-SMNN对Lorenz时间序列预测表现出明显的优势，更适应复杂的任务。

表4 不同模型的Lorenz时间序列预测结果Table 4 Pediction results of different models for Lorenz time series

注：“—”表示在原文献中未给出。

3.3 城市污水处理出水水质参数预测

在城市污水处理过程中，NH₄-N浓度是出水水质的关键指标，是一个复杂的时间序列。常用的技术主要包括具有化学反应的测量方法、基于机理模型的测量方法等，这类技术周期长，容易受到外界因素影响。因此，在本研究中通过实际污水处理厂数据验证所提出的EMD-SMNN的性能。

实验采用EMD-SMNN 建立污水处理过程中出水NH₄-N预测模型。数据为北京市某污水处理厂2014年9月16日到9月22日1008个样本，其中720个样本（5天）用于训练，剩余288个样本（2天）用于测试，采用1 h的数据预测未来10 min的NH₄-N浓度，即网络输入向量[x(t) x(t-1) x(t-2) x(t-3) x(t-4) x(t-5)]预测x(t+1)。初始化EMD-SMNN参数：复杂度阈值为0.5F_o，其中F_o=0.0731为所述原始时间序列复杂度，相似度阈值为0.5。

图12所示为出水氨氮浓度分解的分量及残余序列，x(t)为归一化后的原始数据。图13~图15所示为EMD-SMNN各子网络模型结构动态变化、训练误差、子时间序列预测结构及出水氨氮浓度预测结果。从训练过程和预测结果可以看出，EMD-SMNN各子网络模型结构可以自动调整，能精确地预测子任务。最后，EMD-SMNN对各子网络模型进行集成，具有较好的预测效果。

图12 出水氨氮浓度的EMD分解子时间序列Fig.12 Subseries decomposed by EMD for effluent NH₄-N

图13 子网络模型学习出水氨氮浓度各子序列过程：（a）子网络模型结构动态变化；（b）子网络模型训练RMSEFig.13 Learning process of subseries of effluent NH₄-N by sub-networks: (a) dynamic change of structure; (b) training RMSE of sub-networks

图14 出水氨氮浓度的子序列预测结果Fig.14 Prediction results of subseries for effluent NH₄-N

图15 出水氨氮浓度预测结果Fig.15 Prediction results for effluent NH₄-N

表5和表6所示为EMD-SMNN及其他模型预测出水氨氮浓度的性能，实验结果为独立30次实验的平均值，黑体为最好的预测结果。与单神经网络模型（FNN）及基于聚类的模块化神经网络（OAMNN^[28]，CMNN^[29]，OSAMNN^[30]）相比，基于EMD分解的模块化神经网络模型的RMSE及NMSE最小,具有较好的出水氨氮浓度预测精度。具有结构动态调整的EMD-SMNN比子网络模型结构固定的EMD-MNN和OSAMNN^[30]具有更好预测性能，可以建立适应各子任务的子网络模型，从而进一步提高MNN模型的预测精度。

表5 子网络模型的预测RMSETable 5 Prediction RMSE of sub-networks

表6 不同模型的出水氨氮浓度预测结果Table 6 Prediction results of different models for effluent NH₄-N

注：“—”表示在原文献中未给出。

4 结论

针对传统MNN通常基于样本空间划分时间序列，没有充分考虑其时间特性且子网络模型初始结构难以确定，导致城市污水处理过程出水水质参数实时检测精度不能达到令人满意的效果，提出基于自组织模块化神经网络的污水处理过程出水参数预测模型（EMD-SMNN），该模型通过基于EMD的任务分解算法有效分解时间序列，同时合并复杂度较小且相似度较大的子时间序列以保持网络的紧凑性，构建具有结构自组织的子网络模型对相应的子时间序列进行训练、学习。通过基准问题和实际污水处理厂数据的实验结果表明，相比传统MNN模型和单个神经网络模型，所提出的EMD-SMNN模型能够根据时间尺度的局部特性有效地分解时间序列，各子网络模型根据子任务可以自动调整自身结构，能够有效提高MNN模型预测精度，并且避免了一些子网络模块分配样本较少的问题。

引用本文：郭鑫, 李文静, 乔俊飞. 基于自组织模块化神经网络的污水处理过程出水参数预测[J]. 化工学报, 2024, 75(9): 3242-3254 (GUO Xin, LI Wenjing, QIAO Junfei. Prediction of effluent parameters in wastewater treatment process using self-organizing modular neural network[J]. CIESC Journal, 2024, 75(9): 3242-3254)

通讯作者及第一作者：郭鑫（1990—），男，博士，讲师，guo_xin@haut.edu.cn

http://mp.weixin.qq.com/s?__biz=MzA5OTE2OTU5Mw==&mid=2449497723&idx=3&sn=f4ba9f139271729cc8cec4e70bfe5ad4

MOFs帮助环境

推送MOFs基环境功能材料在环境污染控制领域的研究进展。

郭鑫，李文静，乔俊飞：基于自组织模块化神经网络的污水处理过程出水参数预测

基于自组织模块化神经网络的污水处理过程出水参数预测

Prediction of effluent parameters in wastewater treatment process using self-organizing modular neural network

引 言

1 EMD-SMNN结构

2 EMD-SMNN结构设计

2.1 基于EMD分解过程

2.2 子网络模型结构自组织算法

2.3 EMD-SMNN学习过程

3 实验结果及分析

3.1 Mackey-Glass时间序列预测

3.2 Lorenz时间序列预测

3.3 城市污水处理出水水质参数预测

4 结论

引言