尹刚,钱中友,等:基于Adaboost-PSO-SVM的铝电解槽健康状态诊断方法研究

学术   2024-10-09 16:50   北京  

基于Adaboost-PSO-SVM的铝电解槽健康状态诊断方法研究

尹刚 1 钱中友 1曹文琦 2全鹏程 2许亨权 2颜非亚 3王民 4向禹 5向冬梅 6卢剑 3左玉海 7何文 8卢润廷 3

(1. 煤矿灾害动力学与控制全国重点实验室,重庆大学资源与安全学院,重庆 400044; 2. 阿坝铝厂,四川 阿坝 623001; 3. 贵阳铝镁设计研究院有限公司,贵州 贵阳 550081; 4. 重庆旗能电铝有限公司,重庆 410420; 5. 陆军工程大学通信士官学校,重庆 400353; 6. 中汽院新能源科技有限公司,重庆400705; 7. 青海海源绿轮制造有限公司,青海 西宁 810000; 8. 眉山市博眉启明星铝业有限公司,四川 眉山 620010 )

DOI:10.11949/0438-1157.20231066


摘 要 针对铝电解槽在铝电解生产过程中故障频发的问题,提出了一种基于支持向量机(support vector machine, SVM)的铝电解槽健康状态诊断模型,考虑传统的支持向量机只能适用于二分类问题,采用自适应推进算法(adaptive boosting, Adaboost)将支持向量机的二分类问题转化为多分类问题用于求解铝电解槽健康状态诊断问题,充分考虑了子模型的权重,强化了模型的适用性。并利用粒子群优化算法(particle swarm optimization,PSO)对其超参数寻优,提高模型的预测精度。实验结果表明,提出的铝电解槽健康状态诊断模型的准确率和Macro-F1分数分别达到94.70%和0.9453,相较于其他传统模型均有显著提升。
关键词 电解;算法;健康状态;预测;实验验证

Health state diagnosis of aluminum electrolytic cells based on Adaboost-PSO-SVM

YIN Gang 1 QIAN Zhongyou 1CAO Wenqi 2QUAN Pengcheng 2XU Hengquan 2YAN Feiya 3WANG Min 4XIANG Yu 5XIANG Dongmei 6LU Jian 3ZUO Yuhai 7HE Wen 8LU Runting 3

(1. State Key Laboratory of Coal Mine Disaster Dynamics and Control, College of Resource and Safety Engineering, Chongqing University, Chongqing 400044, China; 2. Aba Aluminium Factory, Aba 623001, Sichuan, China; 3. Guiyang Aluminium Magnesium Design & Research Institute Co., Ltd., Guiyang 550081, Guizhou, China; 4. Chongqing Qineng Electric Aluminum Co., Ltd., Chongqing 410420, China; 5. Communication NCO Academy, Army Engineering University of PLA, Chongqing 400353, China; 6. China Automobile Research Institute New Energy Technology Co., Ltd., Chongqing 400705, China; 7. Qinghai Haiyuan Green Wheel Manufacturing Co., Ltd., Xining 810000, Qinghai, China; 8. Bomei Qimingxing Aluminium Co., Ltd., Meishan 620010, Sichuan, China )

Abstract: In order to solve the problem of frequent failures of aluminum electrolytic cells in the aluminum electrolytic production process, a health state diagnosis model of aluminum electrolytic cells based on support vector machine (SVM) was proposed. The thickness of the wall, current efficiency and electrolytic temperature were taken as the comprehensive evaluation indexes of the health state of aluminum electrolytic cells, and the health state of aluminum electrolytic cells was divided into four grades: excellent, good, medium and poor. Considering that traditional support vector machine (SVM) can only be applied to binary classification problem, Adaboost algorithm is used to transform SVM binary classification problem into multi-classification problem to solve aluminum electrolytic cell health diagnosis problem, which fully considers the weight of submodels and strengthens the applicability of the model. The hyperparameters of the model were optimized by using PSO algorithm. The classification accuracy of the model was 94.70% and the Macro-F1 score was 0.9453 in the aluminum electrolytic cells. Compared with the Adaboost-SVM model without optimization algorithm and the PSO-SVM model without integrated algorithm, Adaboost-PSO-SVM improves classification accuracy by 8.34% and 4.93%, and Macro-F1 scores by 8.84% and 5.20%, respectively. Compared with the current mainstream machine learning algorithms DT and KNN, the classification accuracy is improved by 13.64% and 11.11%, respectively, and Macro-F1 scores are improved by 13.47% and 11.04%, respectively. The model provides a comprehensive assessment of the optimal maintenance period for aluminum electrolytic cells. This not only reduces the frequency of failures in aluminum electrolytic cells but also enhances the economic benefits of aluminum plants.
Keywords: electrolysis;algorithm;health state;prediction;experimental validation

引 言

铝电解的生产过程发生在铝电解槽中,其健康状态的良好与否直接影响其故障发生的概率。当铝电解槽的健康状态不佳时,会导致高能耗和低铝产量,从而影响铝电解车间的整体生产效率。因此,对铝电解槽的健康状态进行诊断不仅可以确保铝电解槽正常稳定的运行,提高生产效率和原铝的产量及质量,还能够提前预测槽内问题,减少因故障而造成的损失。近年来,诸多学者开始对铝电解槽的健康状态进行研究,以及时预测铝电解槽健康状态的变化,以便迅速调整并维护铝电解槽的正常运行状态。例如,傅长宏[1]运用多种综合分析方法,分析了国内某铝厂10台电解槽的测量数据,借助Minitab统计分析软件探寻了数据之间的内在联系,为铝电解槽的设计和生产阶段参数设定提供了可靠的依据。Pass等[2]针对铝电解生产数据中存在的噪声问题,改进了聚类分析算法。邓少松[3]提出了一种基于阳极电流和神经网络集成的故障诊断方法,通过对电流数据进行深度处理和特征提取,实现对铝电解槽的异常诊断。张旖芮等[4]针对铝电解生产过程中数据存在的隐藏现象,根据工艺原理和槽况特性,采用改进的模糊聚类算法对铝电解进行聚类分析,剔除孤立点,并对相似数据进行聚类处理,从而实现槽况的分类处理。侯婕等[5]通过建立LSTM预测模型将铝电解槽槽况分成两类,模型预测准确率达到91.6%。此外,曹丹阳等[6]提出了一种改进的自适应K值高斯混合模型算法,用于铝电解槽槽况的分类识别。韦业辉[7]以铝电解的实际生产为背景,研究了基于火眼图像的铝电解槽热平衡状态诊断,并提出了一种半监督核极限学习机算法(SSKELM)用于实时槽况诊断。陈祖国等[8]采用简单语义网和贝叶斯结合的方法,对铝电解槽健康状态进行评估,充分挖掘了铝电解日常生产过程中的过程知识。李界家等[9]通过采集不同槽况下的生产数据,利用支持向量机算法将铝电解槽生产状态诊断为正常或异常,然后使用布谷鸟优化算法对SVM结构进行优化,实现对数据的监测和异常状态类型的诊断。崔桂梅等[10]根据不同槽状态下电流效率的特点,建立了基于槽状态分类多支持向量机的电流效率预测模型。于世福等[11-12]利用主元分析法对铝电解槽槽况进行监测,能够及时预测出铝电解槽是否处于异常状态。这些研究为铝电解槽的健康状态诊断提供了有力的支持,有望提高铝电解产业的生产效率和可持续性。然而,目前大多数专家学者主要将铝电解槽的健康状态划分为正常和异常两种状态,对其进一步的分级尚待深入研究。此外,现有研究中的样本容量相对较小,导致健康状态的预测精度有待进一步提高。
支持向量机是机器学习领域中一种有监督的学习方法。针对支持向量机的研究主要涉及以下几个方面。首先,在非线性问题中,核函数的研究是一个重要方向,研究者致力于开发新的核函数,如线性核、多项式核和径向基函数(RBF)核,以提高模型的泛化性能[13]。其次,多类别分类的问题也受到关注,考虑传统的支持向量机只能适用二分类问题,研究者提出了一对一和一对其余的策略来扩展SVM到多类别分类问题[14]。在应对不平衡数据集方面,研究主要通过修改优化模型改变数据分布,或者设计新的损失函数使分类超平面向多数类偏移从而达到精确分类的效果[15-16]。针对大规模数据集的挑战,更多专注于通过随机梯度下降等方法加速SVM的训练过程[17]。国内外学者已广泛应用SVM解决了很多健康状态和故障诊断等问题。例如,尹刚等[18]构建了一种基于核主成分分析法结合支持向量机(KPCA-SVM)的铝电解槽漏槽事故预警模型,该模型在预测铝电解槽漏槽方面表现出卓越的性能。孙同敏[19]提出一种基于深度置信网络(DBN)和最小二乘支持向量机(LSSVM)的航空发动机健康状态评估方法,通过无监督学习训练深度置信网络,提取多传感器数据的特征,并利用LSSVM算法对特征参数进行状态划分,实现设备和系统状态的自动评估。王萍等[20]采用了LS-SVM对锂电池健康特征随循环次数增加的变化趋势进行了预测,结果表现出高度的精确性和可靠性。叶远波等[21]提出了一种基于麻雀搜索算法(SSA)优化SVM的方法,用于继电保护装置的状态评估。魏永合等[22]提出了一种将集合经验模态分解(EEMD)和SVM相结合的方法,用于滚动轴承的退化状态识别。实验结果表明,该方法能够准确识别滚动轴承的退化状态。Li等[23]提出了一种基于粒子群优化算法和SVM的锂离子电池健康在线估计方法,探讨了不同锂电池健康状况下电池荷电状态的变化规律。Lan等[24]提出了一种基于优化的 Adaboost线性 SVM 的数据驱动方法,通过从经过桥梁的车辆接收到的原始振动信号来检测桥梁损坏程度,针对不同健康状况的数据集提出相应的策略进而有效地识别桥梁损伤程度,提出的算法相对其他常用算法具备更好的泛化性能。鉴于支持向量机在处理小样本、非线性和局部最小问题方面表现出色,与本文应用场景较为契合,提出一种基于Adaboost-PSO-SVM的铝电解槽健康状态诊断预测方法,利用Adaboost集成学习算法对PSO优化后的SVM进一步强化,以提高诊断预测准确率。
为了更准确地管理铝电解槽的健康状态,将其分为四个状态,分别是优、良、中、差,并进行预测。技术人员可以根据铝电解槽的健康状态分级对其进行不同的操作和管理。对于健康状况较差的铝电解槽,需要由高级技术人员进行操作和管理,特别要在后续的生产过程和停槽维修中给予更多的重视。而对于健康状态较好的铝电解槽,则可以由普通技术人员来操作和管理,以确保所有铝电解槽都保持在最佳的运行状态[25]。这种差异化的管理方法有助于有效地提高生产效率和维护设备的稳定性。传统上,对铝电解槽的健康状态评估主要依赖于技术人员的主观经验,这容易导致评估的主观性和片面性[26]。基于数据驱动的方法对铝电解槽的状态监测是有效的[27-29],将机器学习应用在铝电解槽健康状态的诊断中,可以减少对人工经验的依赖,提高健康状态评估的客观性和准确性[30]
本研究以炉帮厚度、电流效率以及电解温度作为铝电解槽健康状态的评判指标,将铝电解槽的健康状态划分为四个不同等级,并通过相关性分析确定与铝电解槽健康状态高度相关的工艺参数,最终得到参与本文模型的训练和测试的数据。将机器学习应用在铝电解槽健康状态诊断问题中,提出一种基于SVM的铝电解槽健康状态诊断模型,采用Adaboost将支持向量机的二分类问题转化为多分类问题,并用PSO对SVM的参数进行优化,提高模型的诊断预测准确率,最终实现对铝电解槽健康状态的诊断。

1 方法理论

1.1 Adaboost算法

Adaboost(adaptive boosting)算法,也称为自适应推进算法,是机器学习领域中一种重要的集成学习算法,集中应用于分类问题[31]。与目前已有的集成算法相比,Adaboost算法在处理非线性、高维度以及不平衡数据样本方面表现更加出色[32-33]。Adaboost算法利用了传统的Boosting思想,使大量的弱分类器以某种方式组合起来,最终得到一个分类能力大幅提高的强分类器。其核心思想就是通过改变训练样本中错误标记的样本权重来训练一系列弱分类器,并将这些分类器串联起来[34]。Adaboost随着算法的迭代,基分类器的重心会偏向于难以正确分类的样本,以此通过对每个样本赋予不同的权重来实现这一目标。Adaboost算法的执行过程如图1所示。

图1   Adaboost算法的执行过程Fig.1   Execution process of the Adaboost algorithm
Adaboost解决多分类问题时,给定样本总数为N的训练数据集,其中,为实例样本,为样本标签,i=1, 2, …, N。初始化样本的权重值如式(1)所示:

(1)
根据设定值,迭代m次,m=1, 2, 3,…, MM为总迭代次数。依照样本的权重分布Dm,训练样本数据集得到m个基学习器Gm(x),计算Gm(x)对于加权训练样本数据集的分类误差概率,具体计算公式如式(2)所示:

(2)
式中,是误差率;表示指示函数,是弱分类器Gm(x)对的分类结果;wmi是迭代m次时,第i个样本数据所对应的权值。若,则,否则
计算的系数,即最终集成所有基学习器后的权重系数:

(3)
式中,R为分类数。
根据诊断结果错误率以及弱分类器权重,更新样本数据的权重,其数学表达式为:

(4)

(5)
式中,Zm是规范化因子。引入规范化因子是为了使Dm+1中的所有元素之和为1,即:

(6)
式(6)中,Zm通过调整权重来关注训练集中样本的分类是否正确,如果样本被正确分类,训练集中样本的权重系数就会被降低。但如果样本分类错误,下一个弱学习器将重点关注该样本,不断调整分类错误的概率,直到达到预期效果,由此建立了分类器的线性组合:

(7)
最终得到强分类器G(x)如式(8)所示:

(8)

1.2 支持向量机

支持向量机(SVM)由Vapnik等[35]于1995年设计,主要用于解决二分类问题。与神经网络相比,SVM在处理线性不可分问题时表现出色。SVM以结构风险最小化为期望准则,力求使模型获得最佳的泛化能力。在进行模式识别时,其基本思想是寻找两个类别之间间隔最大的分类边界。对于那些无法通过最大间隔超平面分离的样本,SVM采用核函数对样本数据集进行映射,将原始不可分类的样本数据转换为可分类的样本数据,既而模型可以在更高维的特征空间中找到最大间隔超平面,从而有效地对样本进行分类。
对于给定的数据集 ,设为样本数据映射到高维空间的特征向量,则支持向量机的超平面描述为:

(9)
其判决函数表述为:

(10)
目标函数为:

(11)

(12)
式中,ω是超平面的法向量;b是偏置项,即希望找到一个由(ωb)确定的超平面。由于硬间隔对于具有噪声点的数据不太友好,容易造成分类误差,从而使得分类器性能下降,因此引入松弛变量。求解最优超平面可表示为:

(13)

(14)
式中,C为惩罚因子。C越小,分类超平面与数据拟合程度越高;C越大,则代表分类超平面与数据拟合程度减弱,即分类错误样本点越多。
对于非线性分类问题,SVM通过使用核函数将低维数据映射到高维空间进行分类。本文选用高斯函数(RBF)作为SVM的核函数。RBF不仅具有较强的抗干扰能力,而且具有良好的局部寻优能力。其分类效果较常用的线性核函数和多项式函数更加出色。RBF的表达式为:

(15)
式中,σ为核函数;k代表两个向量xixj之间的欧氏距离。

1.3 粒子群优化算法

粒子群优化算法(PSO)是一种全局优化算法,最早基于模拟鸟群的觅食行为而设计[36]。在PSO算法中,每个粒子代表一个潜在解,在搜索过程中,粒子通过信息交流来决定是否找到了其个体最优解,并通过与其他粒子交流信息来找到整个搜索空间的全局最优解。PSO模拟了鸟群觅食的过程,将待优化的问题视为鸟群在解空间中觅食,解空间则是鸟群的飞行领域。在这个空间中,每个粒子的位置代表了解空间中的一个潜在解,也对应于待优化问题的一个解。相对于其他优化算法,PSO算法具有原理简单、参数较少、快速收敛以及易于实现的优点。
假设m个粒子在一个d维的解空间中搜索,第i个粒子在d维的位置记作,在d维的速度记作,每个粒子在各自搜索空间中搜索到的最优解记作,与整个粒子群共享信息得到的最优解记为Gid,当找到两个最优解时,每个粒子根据下式更新其位置和速度:

(16)

(17)
式中,i=1,2,3,…,M,表示种群规模;w是用于控制速度的惯性权重;c1c2是学习因子,通过适当调整c1c2的值可以提高算法的收敛速度,从而避免陷入局部最优解;rand1和rand2是介于0和1之间的随机数。
采用粒子群优化算法对支持向量机进行优化,将测试集的分类错误率作为目标函数,通过搜索得到目标函数的全局最小值即粒子的适应度。

2 铝电解槽健康状态评判指标及特征选择

2.1 健康状态评判指标

铝电解过程是在铝电解槽内部进行的。在铝电解生产过程中,操作人员通过维持工艺参数在合理的范围内,确保生产过程正常进行。然而,操作人员尚无法直接判定铝电解槽的健康状态,只能凭借多年的工作经验和铝电解槽的使用时间来估计铝电解槽的未来运行状态和健康状态。因为现场采集到的生产数据是没有标签的,所以在预测之前,需要对铝电解槽的健康状态进行标记。
炉帮是槽膛内最薄的部分,其厚度可用于评估铝电解槽是否存在漏槽的风险。因此,炉帮的厚度成为判断铝电解槽健康状态的一个关键指标。在铝电解过程中,电解温度和电流效率会直接或间接地影响铝电解槽的运行状况[37]。铝电解槽的电流效率越高,其电解性能越佳,生产运行状况也越理想,因此故障发生的可能性较低,健康状态较好[38]。电解温度是评估铝电解槽健康状态的另一个重要指标,其直接影响铝电解槽炉帮的厚度,一般情况下铝电解正常生产的电解温度是950~970℃。电解温度过高会导致槽壳变薄,严重时可能引发漏槽问题。另一方面电解温度过低会导致氧化铝在电解质中溶解度降低,电解不充分,进而减少出铝量。当电解温度低于950℃时,铝电解槽内的电解质会缓慢结晶,导致炉帮变厚,破坏铝电解槽的稳定性,可能引发故障。当电解温度高于975℃时,炉帮熔解,严重影响铝电解槽的运行状况。
因此以炉帮厚度、电流效率以及电解温度作为铝电解槽健康状态的评判指标,并将铝电解槽的健康状态划分为四个不同等级。在样本数据中会存在三类评判指标数值分布在不同状态等级对应的数值范围中,此时取三类指标中对应最低等级的健康状态等级作为评判整个铝电解槽的健康状态等级。铝电解槽健康状态的评判标准具体如表1所示。

表1   铝电解槽健康状态评判标准Table 1   Criteria for judging the health state of aluminum electrolytic cells


2.2 健康状态特征选择

在铝电解生产过程中,由于工艺参数之间存在着强耦合性,一个特征参数的变化通常会引起一个或者多个其他参数的相应变化[39]。其他铝电解过程的特征参数的变化会直接或间接地影响铝电解槽的电流效率和电解温度。通过对铝电解槽内主要生产参数(如槽电压、分子比、铝水平、电解质水平、氧化铝浓度、出铝量、氟化盐含量、效应系数)与电解温度、电流效率和炉帮厚度之间的Pearson相关系数[40]进行分析。表2是经Pearson相关系数法计算得到的各工艺参数与电解温度、电流效率和炉帮厚度之间的相关度。从表中可以看出,各工艺参数与电解温度、电流效率和炉帮厚度之间的Pearson相关度均大于0.7,属于高度相关。因此,将槽电压、分子比、铝水平、电解质水平、氧化铝浓度、出铝量、氟化盐含量、效应系数作为诊断模型的输入参数,以健康状态分类四个等级优、良、中、差为模型输出。

表2   铝电解槽健康状态参数Pearson相关度Table 2   The Pearson correlation coefficient for the health state parameters of aluminum electrolytic cells


3 铝电解槽健康状态诊断模型

3.1 模型框架

构建了一种基于数据驱动的铝电解槽健康状态诊断模型。首先对数据集进行缺失值处理和标准化,其中炉帮厚度、电解温度和电流效率作为铝电解槽的评判指标,同时将影响炉帮厚度、电解温度和电流效率的生产参数作为模型输入特征参数,将铝电解槽健康状态作为模型的输出向量。SVM的分类性能主要是受惩罚因子C和高斯核函数g的影响[41]。传统SVM的Cg通常需要根据经验和分类结果进行调整,这一过程复杂且难以实现最佳效果。因此,利用粒子群算法(PSO)对二者进行寻优,以确保模型的分类性能达到最佳水平。为了解决SVM诊断效果不稳定的问题,采用 Adaboost 集成算法对其强化。Adaboost算法充分考虑了子模型的权重,可以通过误差来动态调整子模型的权重系数,从而提高模型的预测精度。因此,以PSO-SVM作为Adaboost的弱学习器,构建了基于Adaboost-PSO-SVM的预测模型,实现对铝电解槽健康状态的诊断,模型框架如图2所示。

图2   Adaboost-PSO-SVM铝电解槽健康状态诊断模型框架Fig.2   Adaboost-PSO-SVM health state diagnosis model for aluminum electrolytic cells

3.2 模型评价

对于二分类模型,常用的评价指标是F1分数(F1-score),F1-score是精确率(Precision)和召回率(Recall)的调和平均,其取值范围为[0,1]。其计算公式如下式所示:

(18)

(19)

(20)
式中,TP(true positive)表示把正类预测为正类;FP(false positive)表示把负类预测为正类;FN(false negative)表示把正类预测为负类。
针对铝电解槽健康状态诊断的多分类问题,引入宏平均(macro average),通过计算出所有类别的精确率和召回率及其F1-score,再通过求平均值得到在整个样本上的Macro-Precision、Macro-Recall和Macro-F1。宏平均的计算公式如式(21)~式(23)所示:

(21)

(22)

(23)
式中,k表示类别数。
当样本数据为多分类数据集时,只采用传统的分类准确率无法有效评估分类器的性能。因此,选取Macro-F1和分类准确率(Accuracy)作为评价模型性能优劣的指标。Accuracy的计算公式如式(24)所示:

(24)

4 实验验证

本文采集某铝业有限公司300 kA系列铝电解槽2020年10月至2022年9月的真实历史生产数据进行仿真实验,共采集了2640个样本,将样本进行分类后得到状态标签及样本分布如表3所示。每个数据样本包含槽电压(x1、分子比(x2)、铝水平(x3)、电解质水平(x4)、氧化铝浓度(x5)、出铝量(x6)、氟化盐含量(x7)、效应系数(x8)8个输入参数,将健康状态分类四个等级优(Y1)、良(Y2)、中(Y3)、差(Y4)为模型输出。所有样本均匀分布,按9∶1划分为训练集和测试集,具体实验设置如表4所示。

表3   状态标签及样本分布Table 3   State labels and sample distribution


表4   实验数据采集信息Table 4   Experimental data acquisition information


4.1 模型参数设置

利用PSO对Cg进行寻优,以确保模型的分类性能达到最佳水平,其优化流程如图3所示。其中,将测试集的分类预测错误率作为目标函数值,搜索目标函数的全局最小值即粒子的适应度。粒子群优化算法的适应度为0.053,即测试集的分类预测错误率为5.30%,此时模型的分类预测正确率最高。核函数参数g的寻优范围设置为[0.01, 100],惩罚因子C的寻优范围设置为[0.1, 500],迭代次数设定为200,种群规模为50。在对支持向量机优化前,惩罚因子C和核函数g分别是默认为1和样本数量的倒数0.00037879,经PSO优化后,模型的参数设置如表5所示。

图3   PSO优化SVM参数流程图Fig.3   PSO optimized SVM parameter flow chart

表5   SVM模型参数Table 5   SVM model parameters


在Adaboost集成算法中,弱分类器的数量T对铝电解槽健康状态的诊断精度产生重要影响。根据现有研究,如果Adaboost弱分类器数量过多,将增加计算量和预测时间,并可能导致模型过拟合;如果弱分类器数量过少,模型可能无法充分训练,导致欠拟合,从而无法确保诊断模型的准确性。因此,确定适当数量的Adaboost弱分类器对提高模型的预测精度至关重要。设定弱分类器不同数量的值来寻找出模型的最佳性能时分类器的数量,在大量实验基础上,确定了T在2~15,实验结果如图4所示。

图4   Adaboost弱分类器数量与准确率关系Fig.4   Relationship between the number and accuracy of Adaboost weak classifiers
由图4可知,当Adaboost弱分类器数量较少时,铝电解槽健康状态诊断模型的预测准确率相对较低。随着Adaboost弱分类器数量的增加,模型的预测准确率逐渐提高。然而,当Adaboost弱分类器数量T超过9时,模型的准确率略微下降最后趋于稳定,表明增加更多的弱分类器数量已经不能提升模型的准确率。为了节约训练时间,将Adaboost弱分类器数量T设置为9。

4.2 模型性能验证

本文共采集2640个样本,所有样本均匀分布,按9∶1将其划分为训练集和测试集,训练集用于模型的训练,测试集用来评估模型的性能,预测结果如图5所示。

图5   Adaboost-PSO-SVM模型诊断结果Fig.5   Adaboost-PSO-SVM model diagnosis results
测试集的264个数据样本中,Adaboost-PSO-SVM铝电解槽健康状态诊断模型正确诊断的样本数为250个,诊断错误的样本数为14个,模型的准确率为94.70%,Macro-F1分数为0.9453。

4.3 融合模型与单一模型对比

在相同的数据集下,对比验证了未采用优化算法的Adaboost-SVM铝电解槽健康状态诊断模型和未采用集成算法的PSO-SVM铝电解槽健康状态诊断模型的性能,单一模型诊断结果如图6、图7所示,融合模型与单一模型性能对比结果如图8所示。

图6   Adaboost-SVM模型诊断结果Fig.6   Adaboost-SVM model diagnosis results

图7   PSO-SVM模型诊断结果Fig.7   PSO-SVM model diagnosis results

图8   单一模型与融合模型性能对比Fig.8   Comparison of performance between single model and fusion model
通过对比实验验证,Adaboost-PSO-SVM在准确率和Macro-F1分数方面都表现出更出色的性能。与PSO-SVM相比,Adaboost-PSO-SVM的分类准确率和Macro-F1分数分别提高了9.66%和8.84%;相对于Adaboost-SVM,提高了5.49%和5.20%。实验证明,经过PSO优化和Adaboost集成的SVM融合模型能更准确地进行铝电解槽健康状态的诊断。

4.4 不同分类算法对比

为了验证Adaboost-PSO-SVM模型的性能,通过单独建立k最近邻算法(k-nearest neighbor, KNN)和决策树(decision tree, DT)在相同的数据集下对2个模型性能进行对比验证,KNN和DT模型诊断结果分别如图9、图10所示。将测试集准确率和Macro-F1作为评估指标,模型性能对比结果如图11所示。

图9   KNN模型诊断结果Fig.9   KNN model diagnosis results

图10   DT模型诊断结果Fig.10   DT model diagnosis results

图11   Adaboost-PSO-SVM与传统分类算法性能对比Fig.11   Performance comparison between Adaboost-PSO-SVM and traditional classification algorithms
如图11所示,将Adaboost-PSO-SVM与当前主流的机器学习算法DT和KNN模型进行了对比实验验证。结果显示,Adaboost-PSO-SVM相对于DT和KNN模型,在分类准确率方面分别提高了13.64%和11.11%,而在Macro-F1分数上分别提高了13.47%和11.04%。因此,Adaboost-PSO-SVM模型更具有精确预测铝电解槽健康状态的能力。

4.5 不同优化算法对比

为了验证PSO在铝电解槽健康状态诊断模型上的适用性,采用常见的麻雀搜索法(sparrow search algorithm, SSA)和灰狼算法(grey wolf optimizer, GWO)做对比实验,实验结果分别如图12、图13所示,不同优化算法性能对比结果如图14所示。相对于Adaboost-SSA-SVM和Adaboost-GWO-SVM模型,Adaboost-PSO-SVM模型的分类准确率和Macro-F1分数最高。

图12   Adaboost-SSA-SVM模型诊断结果Fig.12   Adaboost-SSA-SVM model diagnosis results

图13   Adaboost-GWO-SVM模型诊断结果Fig.13   Adaboost-GWO-SVM model diagnosis results

图14   不同优化算法性能对比Fig.14   Performance comparison of different optimization algorithms

5 结论

利用PSO对SVM进行优化,并以此作为Adaboost的弱分类器,构建一种基于Adaboost-PSO-SVM的诊断模型,结合真实历史生产数据,对铝电解槽四种健康状态进行诊断。主要结论如下。
(1)提出了将炉帮厚度、电流效率和电解温度作为铝电解槽健康状态的综合评判指标,将铝电解槽的健康状态按其优劣程度分为优、良、中、差四个等级。
(2)对铝电解槽工艺参数进行Pearson相关性分析,得到影响铝电解槽健康状态的关联参数也是模型的输入参数8个,分别是:槽电压、分子比、铝水平、电解质水平、氧化铝浓度、出铝量、效应系数、氟化盐含量。
(3)考虑传统的SVM只能适用于二分类问题,提出了通过采用Adaboost集成算法将SVM的二分类问题转化为多分类问题用于求解铝电解槽健康状态诊断问题,集成后模型的分类准确率和Macro-F1分数分别提高了9.66%和8.84%。
(4)构建了基于Adaboost-PSO-SVM的铝电解槽健康状态诊断模型,最终模型在铝电解槽健康状态分类任务上实现准确率为94.70%,Macro-F1分数为0.9453,与其他分类算法模型相比最高。
(5)未来可以将铝电解槽健康状态诊断与故障预报相结合,实现对铝电解槽具体故障的预报,从而帮助电解车间的工作人员提前采取针对性措施进行干预,从而防止故障的发生。

引用本文: 尹刚, 钱中友, 曹文琦, 全鹏程, 许亨权, 颜非亚, 王民, 向禹, 向冬梅, 卢剑, 左玉海, 何文, 卢润廷. 基于Adaboost-PSO-SVM的铝电解槽健康状态诊断方法研究[J]. 化工学报, 2024, 75(1): 354-365 (YIN Gang, QIAN Zhongyou, CAO Wenqi, QUAN Pengcheng, XU Hengquan, YAN Feiya, WANG Min, XIANG Yu, XIANG Dongmei, LU Jian, ZUO Yuhai, HE Wen, LU Runting. Health state diagnosis of aluminum electrolytic cells based on Adaboost-PSO-SVM[J]. CIESC Journal, 2024, 75(1): 354-365)

通讯作者及第一作者:尹刚(1964—),男,博士,教授,yk115@cqu.edu.cn





化工学报
《化工学报》(月刊)是我国化工领域权威性学术期刊,EI、SCOPUS收录,由中国化工学会和化学工业出版社共同主办、化学工业出版社出版。
 最新文章