来源:《中国电力》2024年第10期
引文:胡云鹏, 都成刚, 齐军, 等. 基于D-S证据理论的配电网接地故障原因综合辨识模型[J]. 中国电力, 2024, 57(10): 133-142.
配电网是向消费者提供可靠和高质量电力的基础设施,据统计,配电网中的大多数故障都发生在配电线路上,其中单相接地故障(single-phase-to-ground fault,SPGF)约占配电线路中所有故障的70%。为保证供电可靠性,配电系统大多采用中性点非直接接地系统。SPGF因故障电流很小,故障痕迹难以捕捉,导致故障检查和维护的效率很低。因此,自动准确识别SPGF对于提高配电系统的可靠性至关重要。《中国电力》2024年第10期刊发了胡云鹏等撰写的《基于D-S证据理论的配电网接地故障原因综合辨识模型》一文。文章分析了单相接地故障的故障特征,并研究开发了接地故障原因的综合辨识工具。首先,从故障波形数据中提取了时域、频域和时频域的多个特征,基于多变量方差分析(MANOVA)的统计分析表明了所提取特征的有效性。其次,建立了基于极限学习机(ELM)和支持向量机(SVM)的接地故障原因识别工具,开发了基于Dempster–Shafer(D-S)证据理论的故障原因综合辨识工具,以提高接地故障检测的准确率和维护效率,有效阻断由绝缘劣化引起的单相接地故障发展。
单相接地故障(single-phase-to-ground fault,SPGF)是配电网中最常见的故障,严重影响配电系统的可靠性和安全性,准确辨识SPGF可以提高配电网接地故障处理的精细化水平。首先,从故障波形中提取能有效反映不同接地故障原因的多域特征组成候选波形特征集,通过多元方差法分析波形特征与接地故障原因的相关性,筛选识别接地故障原因的有效特征;然后,分别设计基于极限学习机和支持向量机的故障原因辨识模型,利用Dempster-Shafer(D-S)证据融合理论对模型的识别结果进行融合,建立了接地故障原因综合辨识模型;最后,基于现场数据对所建立的综合辨识模型的有效性进行了验证,结果表明综合辨识模型优于任何单一辨识模型,验证了该模型的优势和可行性。1.1 多波形特征
根据不同接地故障原因在不同时间、频率和时间-频率域中的各种特征,本文选择了11个电气特征作为候选特征用来建立识别规则与综合辨识模型。
1.1.1 最大零序电流与最大电流变化的比率C1
最大零序电流I0max可以反映故障相对于故障介质的总体变化状态。初始瞬态阶段期间电流的最大变化ΔI0max表示故障的动态状态,其计算式为
式中:In+1、In为故障触发后零序电流2个连续的采样点。最大零序电流I0max与零序电流最大变化值ΔI0max的比值可以反映故障特征,且不受负载水平和网络状态的影响。初始瞬态阶段期间电流的最大零序电流I0max与最大电流变化ΔI0max之间的比率I0ratio为通过对不同接地故障原因引起的接地故障零序电流的快速傅立叶变换分析证明了接地介质的差异被映射为过渡阻抗的非线性差异,影响零序电流的谐波。波形与正弦波相比的失真度通常用总谐波失真(T)来表示,其计算式为式中:h为谐波数;I(h)为第h次谐波电流的均方根值;M为最高谐波数,在本研究中设置为10。根据统计结果,各种原因的SPGF总谐波失真值分布广泛。因此,这里采用总谐波失真的对数,即lg(T)来描述零序电流的失真程度。通过计算暂态时间窗后的稳态零序电流前10个循环的平均值获得。为避过暂态时间窗,选取故障后第5个周波开始作为计算lg(T)所需采集的稳态零序电流的起始点。即使在接地故障的稳态下,不同原因引起的故障稳态特征也不同。采用波形失真的随机度来描述稳态内容,并将其定义为当前波形失真度的标准偏差R,其计算式为式中:k为零序电流在稳态中的第k个循环;N为稳态中的循环次数,在本研究中设置为10;μ为零序电流波形N个周期的失真度lg(T)的平均值。通过相空间重构,根据零序电流的原始1维时间序列数据,可以构造m维矢量。对于I(t)=[it1,it2,⋯,itN],当m=2时,对于时间延迟τ,可以获得2维向量Im为以这2个矢量分别作为横坐标和纵坐标,可以获得零序电流的相空间轨迹。使用2维图,信息维度D为式中:r为方框比例。该图可分为r2框。对于不同的r值,信息熵的计算式为其中pi为第i个框中相空间轨迹的概率。接地故障的初始瞬态阶段提供了丰富的反映接地介质类型的信息。由不同类型的绝缘引起的接地故障的波形在振幅、不同时期的能量和不同频带的能量方面存在差异。小波变换对时间-频率窗口具有良好的适应性,能够反映故障初始阶段波形的特征信息。本文利用3次B样条小波对故障零序电流波形进行分解和重构。样条小波是一种最常用的离散小波变换。与其他小波基有所不同,样条小波基具有明确的时域和频域表达式,研究证明3次B样条小波在噪声情况下检测信号的奇异性渐近最优。式中:n为分段多项式的次数;c(i)为B样条系数;βn(x)为连接n+2个空间点{0, 1, 2, ···, (n+1)}的n次B样条函数。根据3次B样条小波变换对故障零序电流进行重构和分解,提取7个特征(C5–C11)计算式为式中:f(t)为系统故障的零序电流波形,如图1所示;Im为故障的零序电流峰值;t0为f(t)初始时间;ttotal为所选波形的终止时间;ts(t0<ts<ttotal)为故障发生时间;tw为故障瞬态过程的结束时间;tmid为f(t)的中间时间;tk为tmid和ttotal之间的选定时间,用于区分暂态过程前后零序电流的时频特性;tm为f(t)的峰值时间;th为tm之后零序电流的前半个峰值;n为小波变换层的数量;Ei为在[ts,tw]周期中零序电流的第i层小波变换信号的能量;ej为在[t0,tk]周期中零序电流的第j层小波变换信号的能量;U0为故障前的线路电压;Ms为f(t)的最大斜率;M1为从t0到tw过程中故障零序电流的能量;Mtotal为从t0到ttotal过程中故障零序电流的能量;Mmid为从t0到tmid过程中故障零序电流的能量;Mk为从t0到tk过程中故障零序电流的能量。
Fig.1 Explanation of feature selection in the time-frequency domain
在此过程中,f(t)是1.1个周期的故障零序电流波形(故障后第一周期含有丰富暂态分量,故取故障前0.1个周期,故障后1个周期)。特征[C1、C2、C3、C4、C5、C6、C7、C8、C9、C10、C11]构成候选波形特征集。从某县区配电网的采样率为4096Hz的故障指示器中收集接地故障数据。共收集避雷器击穿61例,线路对横杆放电61例,电缆绝缘损坏61例,绝缘子击穿(闪络)55例,树木接触59例,其他原因接地故障145例。不同接地故障原因和相应的符号如表1所示。
Table 1 Fault types and their corresponding symbols
多元方差分析(MANOVA)的主要目的是研究自变量如何影响因变量的反应模式。本文在收集数据的基础上,利用SPSS软件,通过MANOVA分析了11种波形特征与引起单相接地故障的原因之间的关系。F-数据是一种在零假设之下,统计值服从F-分布检验的统计量值。通常用来分析判断模型中的全部或一部分参数是否适合用来估计母体。本文中采取不同波形特征的F统计数据如表2所示。从表2可以看出,11个波形特征的F-数据的显著性水平α值结果在[0.01, 0.05]内,具有统计学意义。此11个波形特征与接地故障原因有很强的相关性,因此可以作为反映不同接地故障原因的特征量。统计结果表明,11个波形特征都可以作为候选故障特征。
Table 2 Statistical results for waveform features based on MANOVA
引起单相接地故障的原因与上述11个波形特征之间的映射关系十分复杂。考虑到机器学习算法具有较强的映射挖掘能力,本文选择极限学习机和支持向量机来建立相应的接地故障原因识别模型。然后,利用Dempster-Shafer(D-S)证据融合理论对2个模型的识别结果进行融合,从而最大限度地挖掘出2个模型的映射规则,提高识别精度。
2.1 极限学习机ELM
极限学习机是一种适用于单隐层前馈神经网络的机器学习算法,在训练速度和泛化性能方面具有突出优势。这主要是由于它随机初始化输入层和隐藏层之间的权重和隐藏层间的偏差,然后通过矩阵运算获得隐藏层和输出层之间的连接权重,而不是使用传统的误差反向传播和梯度下降算法来更新模型参数。
极限学习机工作原理如下。
设X={x1,x2,⋯,xN|xi∈RD,i=1,2,⋯,N}表示N个样本的训练集,D表示维度,Y={y1,y2,⋯,yN|yi∈RP}表示矢量化标签,P表示分类的数量。具有L个隐藏神经元和激活函数g(x)的单隐藏层神经网络为
式中:ωk为从输入层到隐藏层的权重向量;βk分为从隐藏层到输出层的权重向量;bk为第k个隐藏神经元的偏差;g(⟨ωk,xi⟩+bk)为相对于输入样本xi的第k个隐藏神经元输出。此外,它可以用紧凑形式Hβ=Y表示,具体为式中:H为单隐层前馈神经网络的隐藏层输出矩阵;β为输出权重矩阵。用户指定学习率和动量后,可以使用反向传播学习算法找到单隐层前馈神经网络的最佳权重和偏差。但是,这种方法存在缺陷,不能保证找到全局最小误差。在探索前馈神经网络在有限训练集中的逼近能力时,研究人员发现,与训练样本数量相比,单隐层前馈神经网络可以用少得多的隐藏层神经元达到指定误差水平的逼近能力。根据最小范数和最小二乘函数,可以求解式(11)中的权重矩阵β为式中:H+为矩阵H的Moore-Penrose广义逆。与反向传播学习算法相比,这种处理可以直接获得具有最佳泛化性能的权重的最小范数,而无需涉及局部极小值。①使用式(11)计算新输入XU的隐藏层输出矩阵HU;然而,这种方法也会在一定程度上影响模型的识别结果。因此,本文采用粒子群优化算法(Particle Swarm Optimization,PSO)对其初始权值和偏差进行优化。①粒子种群初始化:随机产生一组粒子,对每个粒子的初始速度v0和初始位置x0进行随机化设置;②计算每个粒子的适应度值;同时,计算粒子的个体极值Pbest和全局极值Gbest,并记录对应的粒子位置;③迭代更新:根据式(14)和(15)对每一粒子的速度和位置进行更新,每次更新后均需重新计算适应度值,将更新得到的粒子适应度值与历史最优位置时的适应度值进行比较以确定最优适应度值。粒子速度和位置的更新公式为式中:V、X分别为第i粒子速度、位置矢量在D维空间上的分量;Pbest为粒子的个体极值;Gbest为粒子的全局极值;C1和C2为加速系数;w为粒子群系统的惯性因子;rand1和rand2为随机常数范围在[0-1]之间。④赋值:将粒子群优化算法寻优得到的最优解赋值给ELM的权重和偏置。4)基于ELM的接地故障原因识别模型的构建步骤如下。①定义ELM模型参数。具体来说,本文将十一个波形特征作为输入,因此输入层中的神经元数量设置为11。结合经验公式,隐层神经元的数量设置为13个。将表1中所示的六种接地故障原因作为输出,输出层中的神经元数量设置为6。隐层神经元的激活函数被选为Sigmoid函数,输出向量被Softmax函数处理,将输出向量中每个元素的值转换为0~1之间。②对训练集和测试集进行划分,然后输入由11个波形特征组成的特征向量数据,并定义每个接地故障原因的向量标签。利用粒子群优化算法对初始权值和偏差进行优化,完成模型的训练和优化。支持向量机是一种优秀的分类算法。它通过核函数将原始数据映射到高维空间,并在高维空间中找到最合适的分类超平面,实现数据的2元分类。对于训练集{(x1,y1),⋯,(xi,yi),⋯,(xN,yN)},xi∈RD,yi∈{−1,1},SVM的基本思想是映射输入向量xi,通过核函数φ()从原始空间RD转移到高维特征空间。在这个高维空间中,利用结构风险最小化原理构建最优决策函数f(x)为根据结构风险最小化原理准则,该问题可以转化为优化问题为式中:c为容错惩罚系数(c>0);ξi为松弛因子(ξi⩾0);N为样本总数。这种类型的优化问题可以通过拉格朗日方法和库恩-塔克定理来求解,最终得到最优的线性决策函数。在本文中,一对一的求解方法用于多分类,而传统的支持向量机算法用于2分类求解。本文选择径向基函数作为核函数。通过交叉验证优化模型参数,具体包括惩罚因子c和核函数参数g。提取11个特征作为 SVM 模型的输入。通过组合多个支持向量机,可以实现数据的多分类。基于Libsvm软件包,建立了单相接地故障原因识别模型,具体步骤如下。2)选择核函数类型,本文选择径向基函数作为核函数。3)选择模型的核心参数c和g,c表示类中异常数据的重要性,g表示核函数的参数系数。4)设置模型的交叉验证次数,以获得最优核心参数c和g,本文将其设置为10。5)利用获得的最优c和g,通过Libsvm中的svmtrain函数对多分类模型进行训练,并采用Libsvm的svmppredict函数测试分类精度。Dempster-Shafer证据理论是一个处理不确定性的完整理论,具有很好的灵活性。本文将其用于融合ELM和SVM的识别结果,具体流程如下。1)识别框架决策问题的所有可能结果的集合统称为识别框架O。在本文中,识别框架是指导致单相接地故障的6种原因,可以表示为式中:F1, ···, F6分别为表1中从上到下的6种接地故障原因。2)选择证据并构建基本概率分配(BPA)。使用ELM和SVM的诊断结果作为2个独立的证据。首先,使用质量函数将它们转化为满足D-S证据理论的BPA。在D-S证据理论中,用可靠性系数α衡量证据的可靠性,其值在0到1之间。基于ELM和SVM的识别模型表明,本文研究的识别准确率高于80%。因此,我们将可靠性系数设置为0.8。6种接地故障原因和不确定度θ的3个证据(i=1, 2, 3)的质量函数为式中:αi为第i个证据的可靠性系数;mi(Fj)为命题Fj的第i个证据的BPA;mi(θ)为具有不确定性的第i个证据的BPA;Yij为第j个故障原因的第i个证据的诊断输出概率。3)证据融合综合ELM和SVM的识别结果,基于Dempster组合规则计算BPA,其计算式为式中:A、B和C分别为识别帧O的3个子集;K为归一化常数。4)决策诊断,本文使用以下规则来确定接地故障原因,其计算式为式中:Ftype为通过结合ELM和SVM的识别结果最终确定的接地故障原因。规则1规定,所确定的接地故障原因具有最高的BPA;规则2规定,所确定的接地故障原因的BPA需要大于不确定性。
从某市供电公司收集了442个渐进性单相接地故障数据集,以测试所提出辨识模型的性能,如表3所示。297个数据集对应绝缘劣化引起的渐进性单相接地故障,其他145个数据集被视为渐进性单相接地故障的另一种原因。针对上述真实数据,进行了3种测试和分析:1)ELM和SVM模型的识别性能进行测试;2)基于D-S证据理论的融合模型的识别效果测试;3)不同模型的识别性能比较。
Table 3 Data size for each fault type
3.1 ELM和SVM的识别结果
3.1.1 ELM
在模型的构建过程中,每个故障原因的训练样本数量设置为40,其余样本属于测试集。11个特征都被提取作为输入。粒子群优化算法(PSO)用于优化初始权重和偏差。c1和c2的初始值设置为1.5,粒子群的大小被设置为30,且适应度函数设置为ELM标签的输出和实际故障标签之间的误差平方和。隐藏层神经元的数量设置为11,激活函数设置为sig函数,适应度函数随着迭代次数的变化而变化,如图2所示。在各种测试案例中,当迭代次数达到500次时,模型基本上得到了优化。每种情况的识别准确率如表4所示。
Fig.2 The variation of fitness relative to the number of iterations in PSO
Table 4 Diagnostic accuracy for different cases3.1.2 SVM
使用交叉验证方法对模型中的参数c和核函数参数g进行了优化,以获得最佳的分类效果。11个特征都被提取作为输入。为便于融合不同方法的结果,SVM模型的训练集和测试集、ELM模型的训练集和测试集相同。参数c和g被限制为[–5,5],步长均为0.1。采用3重交叉验证方法。当c=0.5和g=4时,获得最佳识别结果(92.8%)。对于每组输入数据,融合模型将输出一个7维向量,表示6种接地故障原因以及无法确定接地故障原因的不确定程度。每种接地故障原因的识别精度如表5所示。可以看出,融合模型的整体识别精度为94.1%,高于基于ELM的识别模型和基于SVM的识别模型。测试集中每种故障原因对应的数据大小和识别准确率如表5所示。对于各种故障原因,融合模型表现出令人满意的识别性能。
Table 5 Test set data size and recognition accuracy rate for different fault types3.2.2 结果分析
这里给出了几组例子,其中单个模型出现了错误的识别结果,但通过融合模型获得了正确的识别结果,如表6所示。
Table 6 Recognition results of partial data
以表6中第1行的情况为例,解释综合辨识模型的融合过程。对于这种情况下的数据,ELM模型给出F1–F6的概率分别为0.256249255、0.004109717、0.482954321、0.16859212、0.008038152和0.080056435,SVM的识别结果为F3。根据D-S证据理论综合3种方法的输出结果后,该组数据属于F1–F6的概率分别为0.364862069、0.000420907、0.59704804、0.017266807、0.000823249和0.008199191。由于在D-S证据理论中引入了可靠性系数,其结果也将输出一个概率值(0.019578928),该值表示无法确定的程度。根据D-S证据理论的识别规则,最终识别结果为F3,与实际情况相一致。
本文针对单相接地故障原因的辨识,提出了基于D-S证据理论的配电网接地故障原因综合辨识模型,得到以下结论。1)从故障波形中提取能有效反映单相接地故障的多域特征组成候选波形特征集,通过多元方差法分析波形特征与接地故障原因的相关性,以此判断所提波形特征可以作为候选故障特征。2)分别设计了基于ELM和SVM的故障原因辨识模型,利用D-S证据融合理论对模型的识别结果进行融合,从而最大限度地挖掘出2个模型的映射规则,建立新的识别规则和模型,提高了故障识别精度。3)针对具体算例分析可以看出,基于D-S证据理论的综合辨识模型优于每个单一模型。基于D-S证据理论的综合模型可以提高单相接地故障检测准确率和维护效率,并防止由绝缘劣化引起的SPGF发展。本文方法可以嵌入到现有的配电自动化系统中,用于工程应用。未来研究将集中在进一步探索由绝缘劣化引起的SPGF更为全面的特征和预防技术上。
根据国家版权局最新规定,纸媒、网站、微博、微信公众号转载、摘编《中国电力》编辑部的作品,转载时要包含本微信号名称、二维码等关键信息,在文首注明《中国电力》原创。个人请按本微信原文转发、分享。欢迎大家转载分享。