北京化工大学丨李季,王建林,王雯,等:基于DBSVDD-RVR的多模态间歇过程质量变量在线软测量

学术   2024-11-11 16:50   北京  

基于DBSVDD-RVR的多模态间歇过程质量变量在线软测量

李季 1 王建林 1 何睿 1周新杰 1王雯 2 赵利强 1

(1. 北京化工大学信息科学与技术学院,北京 100029; 2. 中国科学院生态环境研究中心,中国科学院环境生物技术重点实验室,北京100085 )

DOI:10.11949/0438-1157.20240333


摘 要 现有的多模态间歇过程软测量未考虑过程数据的批次差异及过渡模态的复杂时变特性,影响了间歇过程模态识别的合理性及质量变量在线软测量的准确性。提出了一种基于双边界支持向量数据描述-相关向量回归(double boundary support vector data description-relevance vector regression,DBSVDD-RVR)的间歇过程质量变量在线软测量方法。依据间歇过程离线模态划分获得的各稳定及过渡模态历史数据,建立DBSVDD在线模态识别模型,并引入滑动窗,构建间歇过程在线模态识别策略,利用DBSVDD模型实现在线测量数据的模态识别;在此基础上,构建了基于超球体距离的数据相似度计算方法,选择过渡模态在线数据的相似建模数据集,建立过渡模态的即时学习RVR软测量模型,并依据历史数据建立各稳定模态的RVR软测量模型,实现间歇过程质量变量的在线软测量。青霉素发酵过程的实验结果表明,所提方法有效地提高了间歇过程模态识别的合理性和质量变量在线软测量的准确性。
关键词 间歇式;双边界支持向量数据描述;在线模态识别;模型;预测

DBSVDD-RVR based online soft sensing for quality variables in multimode batch processes

LI Ji 1 WANG Jianlin 1 HE Rui 1ZHOU Xinjie 1WANG Wen 2 ZHAO Liqiang 1

(1. College of Information Science and Technology, Beijing University of Chemical Technology, Beijing 100029, China; 2. Key Laboratory of Environmental Biotechnology, Research Center for Eco-Environmental Sciences, Chinese Academy of Sciences, Beijing 100085, China )

Abstract: The existing multimode batch process soft sensor does not consider the batch difference of process data and the complex time-varying characteristics of transition modes, which affects the rationality of batch process mode identification and the accuracy of online soft sensing of quality variables. This paper proposes an online soft sensing method for batch process quality variables based on double boundary support vector data description-relevance vector regression (DBSVDD-RVR). According to the historical data of stable and transition modes obtained by offline mode partition of batch processes, the online mode identification model of DBSVDD was established. Then, the sliding window was introduced to construct the online mode identification strategy, and the online mode identification of batch data was realized by using DBSVDD model. On this basis, the data similarity calculation method based on hypersphere distance was constructed, and the similarity modeling data set of online data in transition mode was selected to establish the just-in-time learning RVR soft sensing model of transition mode. The RVR soft sensing model of each stable mode was established according to the historical data, and the online soft sensing of batch process quality variables was realized. The experimental results of penicillin fermentation process show that the proposed method effectively improves the rationality of mode identification and the accuracy of online soft sensing for quality variables in batch processes.
Keywords: batchwise;double boundary support vector data description;online mode identification;model;prediction

引言

间歇过程广泛应用于制药、食品、微电子等领域[1-2]。间歇过程质量变量的在线测量是实现过程在线监测与优化控制的重要前提,但由于传感技术制约,间歇过程的某些关键质量变量不易直接在线测量[3-5]。随着数据存储和分析技术的发展,利用间歇过程数据建立不易测关键质量变量与易测过程变量数学模型的数据驱动软测量方法,已成为实现间歇过程质量变量在线预测的有效途径[6-9]。然而,间歇过程的操作切换和固有特性,使其生产过程包含了多个稳定的运行模态,过程数据呈现出多模态特征,且当生产过程从一个稳定模态切换到另一个稳定模态时,稳定模态之间的过渡模态区域内的数据呈现出较强的动态渐变趋势,使得过渡模态的数据特征更加复杂,给数据驱动的间歇过程软测量带来了新的挑战[10-12]
近年来,针对间歇过程的多模态特性,国内外研究学者已经提出了许多间歇过程的多模态软测量方法,这些方法的共同特点是依据历史数据将间歇过程划分为多个不同的模态,并对各模态分别建立数据驱动的软测量模型,进而将在线测量数据输入对应的模态软测量模型实现质量变量的在线预测[13-15]。其中,间歇过程的模态识别和模态软测量建模是影响多模态软测量方法准确性的关键因素。
间歇过程的模态识别主要包括离线模态划分和在线模态识别两部分,现阶段对前者的研究已经比较成熟,统计分析建模和聚类分析是常用的两类间歇过程模态划分方法[16-17]。基于统计分析建模的模态划分方法通过建立多元统计分析模型提取数据特征,依据特征信息在时域的变化情况实现模态划分,但此类方法假设过程数据服从高斯分布,影响了其模态划分结果的合理性[18]K均值(K-means,KM)[19]、模糊C均值(fuzzy C-means,FCM)[20]、高斯混合模型(Gaussian mixture model,GMM)[21]、密度峰值聚类(density peaks clustering,DPC)[22]等聚类分析方法通过计算数据样本的相似性实现模态划分,无须数据服从高斯分布且不依赖于过程模型,已成为间歇过程模态划分的主要方法。谭帅等[23]利用高斯混合模型实现间歇过程的离线模态划分,并以多个高斯混合模型描述稳定模态和过渡模态特性;Zheng等[24]利用密度峰值聚类算法,在计算过程数据样本的局部密度时通过K近邻算法进行约束,提高了模态划分的合理性;Luo等[25]在FCM的基础上提出了时序约束模糊C均值聚类(sequence-constrained fuzzy C-means,SCFCM)的间歇过程离线模态划分方法,能够获得符合间歇过程数据时序特征的模态划分结果。基于聚类分析的离线模态划分结果为建立各模态软测量模型奠定了良好的基础,但缺乏对在线测量数据的合理模态识别方法,影响了软测量模型选择的合理性。若直接利用离线模态划分时的数据相似度或隶属度指标,计算在线数据与各模态中心的相似性识别模态,由于无法进行动态寻优,相似度或隶属度函数会退化为在线数据与各模态中心的高斯距离,难以保证模态识别结果的时序性和合理性。因此,现有方法大多直接利用离线模态划分获得的模态时间标签进行在线模态识别[24-26],虽然识别结果能够保证时序性,但忽略了间歇过程数据的批次差异性[27],导致其在线模态识别结果不合理。此外,现有的间歇过程多模态软测量方法利用历史数据建立各模态软测量模型,未对间歇过程过渡模态数据的复杂动态特性和强时变特性进行分析与处理,导致过渡模态的软测量模型误差较大。针对此问题,一些学者提出了基于即时学习(just-in-time learning,JITL)[28]策略的在线软测量方法,通过选择与在线数据相似的历史数据集,构建软测量模型实现当前时刻数据的在线预测,从而有效地表征过渡模态数据的复杂过程特性。然而,依据欧氏距离选择在线数据的相似建模数据集,忽略了间歇过程数据的非线性和高维度特征,影响了所建在线软测量模型的准确性。
本文提出一种基于DBSVDD-RVR的多模态间歇过程质量变量在线软测量方法。首先,利用SCFCM对间歇过程历史数据进行模态划分,依据各稳定模态及过渡模态历史数据建立DBSVDD模型,并引入滑动窗,结合在线数据球心距与各DBSVDD模型内外边界的关系,构建间歇过程在线模态识别策略,利用DBSVDD模型识别在线测量数据的所属模态;然后,分别建立各稳定模态的RVR软测量模型和各过渡模态的JITL-RVR软测量模型,实现间歇过程质量变量的在线软测量;最后,利用青霉素发酵过程验证所提方法的有效性。

1 基于DBSVDD的间歇过程在线模态识别

间歇过程的操作切换和固有特性,使其具有多模态特性。依据间歇过程的历史数据实现离线模态划分,并对在线测量数据进行模态识别,是实现间歇过程模态软测量建模及质量变量在线预测的前提和基础。

1.1 间歇过程离线模态划分

采集I个批次的间歇过程历史数据I为批次数,J为变量数,K为采样点数。对间歇过程历史数据X按批次方向求平均,并将各变量分别减均值除以标准差进行标准化,获得间歇过程离线模态划分数据集
利用SCFCM方法对进行模态划分,将间歇过程划分为个模态,依据误差平方和最小原则,SCFCM的优化目标函数L

(1)
式中,表示模态数目;表示第i个模态的优化目标函数;为平滑参数;为所有过程数据对第i个模态的隶属度矩阵;表示第i个模态中心;表示属于第i个模态的隶属度;为过程数据与第i个模态中心之间的欧氏距离。
引入拉格朗日乘子法,可得模态中心和隶属度的计算式为

(2)

(3)
为保持模态划分结果的时序性,SCFCM对逐个数据进行迭代优化更新隶属度,第i个模态中的前一半数据仅能被重新分配到第i-1和第i模态中,后半部分数据仅可重新分配到第i和第i+1模态中,通过迭代更新式(2)和式(3)所示的模态中心和隶属度得到各模态的右边界集合为,其中奇数项表示稳定模态的右端点,偶数项表示过渡模态的右端点,进一步将I个批次的间歇过程数据沿变量方向展开,得到第p个模态数据集为

1.2 基于DBSVDD的间歇过程在线模态识别

对间歇过程质量变量进行在线软测量时,为选择正确的模态软测量模型,需要识别在线数据样本的所属模态。由于间歇过程同一模态在历史批次与在线批次的运行特性一致,因此可以计算在线数据样本与各模态历史数据的相似度识别当前时刻数据所属模态。考虑间歇过程数据的非线性、高维特征及过渡模态的复杂时变特性,建立双边界SVDD模型,并依据在线数据的球心距与各DBSVDD模型内外边界的关系构建在线模态识别策略,实现间歇过程的在线模态识别。
1.2.1 DBSVDD在线模态识别建模
SVDD29通过非线性变换将间歇过程数据映射到高维空间,求解式(4)所示的优化问题,寻找在高维空间中体积最小的超球体对过程数据进行表征和描述。

(4)
式中,R为SVDD超球体半径;a为超球体球心;为松弛因子;C为惩罚系数;为非线性映射函数。
利用拉格朗日乘子法求解式(4)的优化问题,可得过程数据对应的超球体半径和球心

(5)
式中,为训练数据;为拉格朗日乘子;为支持向量;为高斯核函数,定义为

(6)
式中,为核参数。利用式(7)计算测试样本到超球体球心的距离D

(7)
当超球体距离D小于等于超球体半径R时,则认为测试样本与训练数据属于同一模态,以此实现间歇过程的在线模态识别。
由于间歇过程过渡模态的动态特性复杂且波动较大,直接利用过渡模态数据建立模态识别模型会导致模型准确性和可靠性较低。因此,利用各稳定模态数据训练SVDD模型,获得超球体球心及内边界,保持SVDD超球体球心不变,利用各稳定模态及其相邻过渡模态数据计算超球体外边界,构建双边界SVDD间歇过程在线模态识别模型。图1为模型构建示意图。

图1   基于DBSVDD的间歇过程在线模态识别模型构建示意图Fig.1   Constructing of mode identification model for batch processes based on DBSVDD
首先,利用各稳定模态历史数据训练DBSVDD模型,则稳定模态p对应的DBSVDD超球体球心及内边界为

(8)
式中,表示稳定模态p的间歇过程数据样本数量;表示稳定模态p的DBSVDD超球体球心;为稳定模态p的DBSVDD超球体内边界;为训练数据;为训练数据对应的拉格朗日乘子。
然后,考虑到间歇过程过渡模态数据与其前后稳定模态数据相关且不同,过渡初期的过程数据特征与前一稳定模态比较接近,而过渡后期的数据特征与后一稳定模态数据更为相似,将各稳定模态与相邻过渡模态数据进行合并,利用合并数据计算DBSVDD模型的超球体外边界。第一个稳定模态数据与其后一个过渡模态数据进行合并,最后一个稳定模态数据与其前一个过渡模态数据进行合并,其余稳定模态数据则分别与其前一过渡模态数据及后一过渡模态数据进行合并,获得个合并数据集

(9)
依据式(7)计算标准化后的间歇过程合并数据集内各数据点到对应DBSVDD模型球心的距离,将距离从小到大排序后,取Q分位点作为l个DBSVDD模型的超球体外边界,则

(10)
式中,内各数据点到对应DBSVDD球心的超球体距离从小到大排序后的结果;中的元素数量;Q为与实际间歇过程相关的超参数,用于选择与各稳定模态数据相似度较高的过渡模态数据,设定置信度为95%,本文取Q=0.95。
依据式(8)~式(10)计算出间歇过程l个超球体球心及内外边界,完成间歇过程DBSVDD在线模态识别模型构建。
1.2.2 间歇过程在线模态识别策略
结合间歇过程DBSVDD超球体的球心及内外边界,依据在线数据样本的球心距与对应DBSVDD模型内外边界的关系,构建了间歇过程在线模态识别策略。
对于间歇过程在线批次的数据样本,初始化模态标志mode=1,表示属于第一个稳定模态,利用第一个DBSVDD模型进行模态识别;当发生模态切换时,模态标志mode+1,表示进入下一过渡模态,利用第二个DBSVDD模型进行模态识别;当时,利用第l个DBSVDD模型进行模态识别,模态标志mode=l为奇数时,表明当前时刻数据属于稳定模态,l为偶数时,表示当前时刻数据样本属于过渡模态,直至完成所有在线批次数据样本的模态识别。
模态标志mode=l为奇数时,将代入模态标志对应的第l个DBSVDD模型中,对其进行标准化后计算到超球体球心的距离

(11)
进行比较,若,则属于当前稳定模态l;若,表明发生模态切换,进入下一过渡模态,即

(12)
可能仍属于当前模态,也可能发生了模态切换。引入滑动窗,在考虑间关系的基础上,进一步分析加入当前时刻数据前后滑动窗内间歇过程数据到超球体球心距离的统计特性变化,识别所属模态。的采样时刻为窗口右端点和窗口左端点大于等于前一个模态切换点的采样时刻。分别计算加入当前时刻数据前后窗口内所有数据到当前DBSVDD超球体球心距离的标准差,设定置信度为95%,若加入后的标准差大于2倍的原标准差,则当前时刻数据导致窗口内超球体球心距的统计特性发生显著变化,表明发生模态切换,进入下一过渡模态;若加入后未导致窗口内超球体球心距的统计特性发生显著变化,则将窗口向后滑动一个时刻,统计下一时刻数据对窗口内数据统计特性的影响,即

(13)
式中,分别表示加入当前时刻数据前后滑动窗内所有数据到超球体球心距离的标准差。
当识别到间歇过程在线批次数据样本进入下一过渡模态时,模态标志,计算与第l+1个DBSVDD模型超球体球心的距离

(14)
进行比较,若,表明当前时刻数据仍属于过渡模态;若,表明当前数据进入下一稳定模态;若,同样计算加入当前时刻数据前后滑动窗内所有数据到当前DBSVDD超球体球心距离的标准差,若加入后的标准差大于2倍的原标准差,则表明发生模态切换,进入下一稳定模态,模态标志,即

(15)
利用间歇过程历史数据的离线模态划分结果,依据所构建的DBSVDD在线模态识别模型,结合上述识别策略即可实现间歇过程在线批次数据的模态识别。基于DBSVDD的间歇过程模态识别方法流程如图2所示。

图2   基于DBSVDD的间歇过程模态识别方法流程图Fig.2   The flow chart of mode identification method for batch processes based on DBSVDD

2 基于DBSVDD-RVR的多模态间歇过程质量变量在线软测量

利用间歇过程历史数据建立各稳定模态的RVR软测量模型,考虑间歇过程过渡模态的复杂时变特性,构建基于超球体距离的数据相似度计算方法,选择过渡模态在线数据的相似建模数据集,建立过渡模态的JITL-RVR在线软测量模型,结合间歇过程在线模态识别结果,实现质量变量的在线软测量。

2.1 间歇过程模态软测量建模

RVR[30]是一种基于贝叶斯框架的稀疏非线性回归模型。给定训练数据集,RVR模型可表示为

(16)
式中,为服从分布的高斯噪声;为权重向量。训练数据集的似然函数计算为

(17)

(18)
式中,为基函数矩阵;为核函数。为避免模型过拟合,引入超参数,则权重向量的均值和方差可表示为

(19)

(20)
式中,。由此,权重向量的估计可转化为超参数和噪声方差的估计,ασ2的迭代更新公式为

(21)

(22)
式中,的第i个对角元素;为均值的第i个元素。则对于测试数据,RVR的预测输出和预测方差的计算式为

(23)

(24)
对于间歇过程各稳定模态,依据各稳定模态历史数据集,利用RVR方法建立模态软测量模型为

(25)
式中,表示间歇过程稳定模态p的RVR软测量模型;表示间歇过程稳定模态p的质量变量数据;表示间歇过程稳定模态p的所有辅助变量数据。
与稳定模态不同,间歇过程的过渡模态动态特性复杂、具有较强的时变特性,直接利用历史数据建立过渡模态的软测量模型难以准确反映过渡模态中质量变量与辅助变量间的相关关系。因此,对于间歇过程的过渡模态,本文利用即时学习策略建立在线RVR软测量模型,通过计算当前时刻在线数据与对应过渡模态历史数据的相似度,选择建模数据集构建RVR软测量模型,实现对过渡模态数据的在线软测量。
当在线数据样本属于过渡模态l时,计算与过渡模态l中所有历史数据的相似性,由于间歇过程数据具有非线性和高维度特征,本文构建了基于超球体距离的数据相似度计算方法,通过非线性变换将过程数据样本映射到高维特征空间计算相似性。依据式(11)计算过渡模态l的在线数据样本与其前后两稳定模态的DBSVDD超球体球心距

(26)
则过渡模态l的所有历史数据与其前后两稳定模态DBSVDD超球体的球心距为。超球体距离反映了数据样本在高维空间的位置差异性,数据样本越相似,超球体球心距越接近。在线数据样本和历史数据样本的超球体距离差值为

(27)
的值越小说明在线数据样本与历史数据样本的相似度越高。将在线数据样本与过渡模态l的所有历史数据样本的相似性度量结果从小到大排列得到,则对应的历史数据集合可表示为,设决定建模数据数量的比例系数为,分别选择前个数据样本,并将其并集作为的相似数据样本集,即

(28)
以此获得在线数据样本的建模数据集为,进而利用RVR方法建立在线软测量模型,获得过渡模态在线数据样本的输出预测值。

2.2 基于DBSVDD-RVR的多模态间歇过程质量变量在线软测量流程

对间歇过程在线批次数据样本,利用所提基于DBSVDD的在线模态识别方法进行模态识别,若该时刻数据被识别为稳定模态数据,将其标准化后输入对应模态的RVR软测量模型进行预测;若该时刻数据被识别为过渡模态数据,则利用所构建的基于超球体距离的数据相似度计算方法,从该过渡模态的历史数据中选择的相似数据作为建模数据集,构建RVR在线软测量模型,实现质量变量在线预测。
综上所述,基于DBSVDD-RVR的多模态间歇过程质量变量在线软测量的流程如图3所示,其主要步骤如下。

图3   基于DBSVDD-RVR的多模态间歇过程质量变量在线软测量流程图Fig.3   Flow chart of online soft sensing of quality variables for multimode batch processes based on DBSVDD-RVR
(1)对多批次间歇过程历史数据进行模态划分,获得各稳定及过渡模态数据集。
(2)利用各稳定模态及过渡模态数据集构建间歇过程DBSVDD模态识别模型。
(3)利用各稳定模态历史数据,建立间歇过程各稳定模态的RVR软测量模型。
(4)利用基于DBSVDD的间歇过程模态识别方法识别在线数据的所属模态。
(5)若属于稳定模态,则直接将其输入对应稳定模态的RVR模型,实现质量变量的在线软测量;若属于过渡模态,则利用超球体距离计算与对应过渡模态历史数据的相似性,选择建模数据集,建立RVR在线软测量模型,实现质量变量的在线预测。

3 实验结果与讨论

为验证本文所提方法的有效性,以青霉素发酵过程为实验对象,选择数据相似度模态识别-RVR(datasimilarity-RVR,DS-RVR)方法、时间标签模态识别-RVR(time stamp-RVR,TS-RVR)方法作为对比方法,采用式(29)和式(30)所示的均方根误差(root mean square error,RMSE)和决定系数(coefficient of determination,R2)作为质量变量在线软测量的评价指标。

(29)

(30)
式中,为测试集样本数量;表示测试集质量变量的预测值;表示测试集质量变量的真值;为测试集质量变量的均值。RMSE反映了预测值与真实值的误差,越小越好。反映了模型的拟合优度,越接近1越好。

3.1 青霉素发酵过程

青霉素发酵过程是一种典型的多模态间歇过程,青霉素浓度是衡量青霉素发酵过程生产效益的重要质量变量。本文利用PensimV2.0仿真平台[31],在不同初始条件和高斯白噪声下生成25批过程数据,其中20批为训练集,用于离线模态划分、在线模态识别模型构建和软测量建模,其余5批为测试集,验证所提方法在线模态识别及软测量结果的有效性。各批次采样时间均为400 h,采样间隔为1 h。以青霉素浓度为待预测的质量变量,选择与其相关的10个可测过程变量为输入变量,如表1所示。

表1   青霉素发酵过程变量Table 1   Process variables of penicillin fermentation

注:1 cal=4.184 J。


3.2 青霉素发酵过程在线模态识别

首先,利用SCFCM方法对青霉素发酵过程历史批次数据进行模态划分,依据青霉素发酵过程的先验知识[32],设定稳定模态数目为3,隶属度阈值为0.6,即隶属度小于0.6为过渡模态,得到各稳定模态与过渡模态划分结果为:第1模态的时间区间为[1,42],第2模态的时间区间为[43,50],第3模态的时间区间为[51,137],第4模态的时间区间为[138,186],第5模态的时间区间为[187,400],其中第2、4模态为过渡模态。
以青霉素发酵过程历史数据的模态划分结果为依据,利用1.2.1节所述方法构建DBSVDD在线模态识别模型,采用5折交叉验证确定各DBSVDD模型的高斯核宽参数,获得各DBSVDD模型的内外边界如表2所示。

表2   各DBSVDD模型的内外边界Table 2   The inner and outer boundaries of each DBSVDD model


进一步结合1.2节构建的在线模态识别策略,设定滑动窗宽度利用所提DBSVDD模态识别方法对青霉素发酵过程测试批次数据进行在线模态识别。图4为不同方法对第1个测试批次的在线模态识别结果。

图4   不同方法对第1个测试批次的在线模态识别结果Fig.4   Mode identification results of the first online batch
由图4可以看出,基于数据相似度的模态识别方法仅考虑了在线批次数据与各模态中心的隶属度,不存在动态寻优过程,隶属度退化为在线数据与各模态中心的高斯距离,难以表征间歇过程数据的非线性与高维特征,且忽略了过程数据的时序特征,导致其模态识别结果存在时序错乱。时间标签方法和DBSVDD方法对5个测试批次的在线模态识别结果如表3所示。

表3   不同方法对5个测试批次的在线模态识别结果Table 3   Mode identification results for 5 test batches by different methods


由表3可知,基于时间标签的模态识别方法直接依据离线模态切换点将在线数据划分至各个模态,忽略了间歇过程数据的批次差异性;而本文提出的DBSVDD在线模态识别方法,充分考虑了间歇过程数据的时序、非线性和高维特征及批次差异性,依据各模态数据特征的相似性进行模态识别,能够实现在线批次数据的合理模态识别。

3.3 青霉素浓度在线软测量

依据青霉素发酵过程历史批次数据,结合离线模态划分结果,利用2.1节所述方法建立各稳定模态RVR软测量模型,采用5折交叉验证确定各模态RVR模型的高斯核参数。进而根据测试批次数据的在线模态识别结果,将各稳定模态在线数据输入对应RVR软测量模型实现青霉素浓度的在线预测;对属于过渡模态的在线数据,利用2.1节所述基于超球体距离的相似度计算方法选择历史数据作为建模数据集,构建JITL-RVR的在线软测量模型,实现过渡模态数据的青霉素浓度在线预测。图5和图6分别为第1个测试批次不同方法的青霉素浓度在线软测量结果及预测误差。

图5   第1个测试批次不同方法的青霉素浓度在线软测量结果Fig.5   Online soft sensing results of penicillin concentration for different methods in the first test batch

图6   第1个测试批次不同方法的青霉素浓度在线软测量误差Fig.6   Online soft sensing error of penicillin concentration for different methods in the first test batch
可以看出,DS-RVR方法由于模态识别结果存在时序错乱,直接影响了在线软测量时模态模型选择的合理性,预测准确性较低;TS-RVR方法虽然较好地保持了时序性,但忽略了间歇过程数据的批次差异性,对在线批次数据的模态切换点识别不合理,导致模态误识别数据点(如图中137~142和186~189的数据点)的预测误差较大,且未对过渡模态数据的复杂动态特性和强时变特性进行分析与处理,导致过渡模态数据点的预测准确性较低;本文方法充分考虑了间歇过程数据的批次差异性,模态识别结果合理有效,同时对过渡模态数据采用JITL建模策略,依据超球体距离选择相似数据集,建立RVR在线软测量模型,能够有效地表征过渡模态数据的复杂过程特性,预测准确性较高。不同方法对5个测试批次青霉素浓度软测量结果的RMSE和R2如表4所示。

表4   不同方法对5个测试批次青霉素浓度软测量结果的RMSE和R2Table 4   RMSE and R2 of penicillin concentration soft sensing results for 5 test batches by different methods


由表4可以看出,本文所提基于DBSVDD-RVR的多模态间歇过程质量变量在线软测量方法对5个测试批次均具有较低的RMSE和较高的R2,证明所提方法能够合理地识别模态,并对各模态数据建立合适的软测量模型,有效地提高了青霉素浓度在线软测量的准确性。

4 结论

针对间歇过程数据的非线性、高维度及批次差异性影响模态识别合理性,且过渡模态的复杂过程特性影响模态软测量模型预测准确性的问题,本文提出了一种基于DBSVDD-RVR的多模态间歇过程质量变量在线软测量方法。该方法考虑间歇过程数据的高维、非线性特征及批次差异性,建立了DBSVDD模型对间歇过程不同模态数据进行表征,并引入滑动窗构建模态识别策略,保证了模态识别的时序性,能够合理地识别在线数据所属模态;所构建的质量变量在线软测量方法,充分考虑了过渡模态数据的复杂时变特性,能够根据在线测量数据更新软测量模型,实现间歇过程质量变量的在线软测量。青霉素发酵过程的实验结果表明,相较于DS-RVR方法和TS-RVR方法,本文方法实现了合理的在线模态识别,建立的多模态软测量模型有效地提升了青霉素浓度在线预测的准确性。

引用本文: 李季, 王建林, 何睿, 周新杰, 王雯, 赵利强. 基于DBSVDD-RVR的多模态间歇过程质量变量在线软测量[J]. 化工学报, 2024, 75(9): 3231-3241 (LI Ji, WANG Jianlin, HE Rui, ZHOU Xinjie, WANG Wen, ZHAO Liqiang. DBSVDD-RVR based online soft sensing for quality variables in multimode batch processes[J]. CIESC Journal, 2024, 75(9): 3231-3241)

第一作者:李季(1987—),男,博士研究生,2021400224@mail.buct.edu.cn

通讯作者:王建林(1965—),男,博士,教授,wangjl@mail.buct.edu.cn;王雯(1987—),女,博士,研究员,wenwang@rcees.ac.cn




化工学报
《化工学报》(月刊)是我国化工领域权威性学术期刊,EI、SCOPUS收录,由中国化工学会和化学工业出版社共同主办、化学工业出版社出版。
 最新文章