摘 要
由于风力发电机组故障维修成本巨大,因此必须开发有效且可靠的风力发电机组故障预警方法,在风电机组发生故障前进行提前预警,以便降低风电场的运营和维护成本。
目前风电机组数据采集与监视控制系统(SCADA)已经在风电场有了广泛的应用,其中蕴含着大量的潜在数据信息,同时深度学习方法在海量数据挖掘方面有比较明显的优势,因此深度学习方法在风力发电机组故障预警领域的应用潜力巨大。
本文:
综述了近年来相关深度学习方法在风力发电机组故障预警的研究进展; 总结了风电机组故障预警的大体步骤,分析了各个步骤的具体处理方法,对每种技术方法的特点进行整理分析; 最后阐述了深度学习在风电机组故障预警领域所面临的挑战,并对今后的研究重点进行了展望。
1 风电机组故障预警方法
水平轴发电的风电机组的发电机类型分别为带有齿轮箱的双馈式异步风电机组和没有齿轮箱 的直驱式永磁同步风电机组。
相比之下,关于双馈 式异步风电机组的研究较多,其主要原因在于双馈式异步风电机组齿轮箱是较易损坏部件,而直驱式永磁同步风电机组结构简单,运行可靠性较高。
双馈式异步风电机组结构如图 1 所示,直驱式永磁同 步风电机组结构如图 2 所示。
其中发电机、主轴轴承和齿轮箱长期处于交变载荷,且承载压力大是易损部件。在一些特定的地区,由于空气潮湿且高空温度低,叶片覆冰也是常见故障。此外也有学者关注了发电机变桨系统、变流器、液压系统、转子、绕组、永磁体等部件的故障预警。
文献中故障预警零部件分布如图 3 所示,可以看出齿轮箱、主轴轴承和发电机是学者们常用的故障预警部件。
目前大多数风电场都安装了数据采集与监控 系统,以监控风电机组的运行状态 。SCADA 数 据不需要额外添加传感器就能获取海量数据,因此 以 SCADA 数据为基础的风力发电机组故障预警方 法具有先天优势。虽然风电场都安装了 SCADA 警报系统,但是 SCADA 警报日志的生成是因为风 电机组传感器的检测数据波动超过一定阈值或者 风电机组一些操作未完成,从而生成的风电机组状态消息并不能作为风电机组真正的故障信号。所以很多学者基于风电机组 SCADA 数据对风电机组故障预警方法进行研究。
大体来讲,风电机组故障预警模型搭建可以分为两部分:
第一部分
离线训练部分,其主要目的是进行初始模型的训练,通过数据处理方法、预测模型搭建和预警模型阈值设定对风电机组历史运 行数据进行参数选择、数据拟合和状态判定。
第二部分
在线预警部分,其主要目的是将搭建好的模型导出,设计风电机组故障预警系统,完成与用户之间的交互操作(表示层) 、对 SCADA 数据进行在 线访问(数据访问层)和模型的故障预警(应用层) 。风电机组故障预警模型搭建方法如图4所示。
当前大多数学者都是在离线稳态状态下对风 电机组 SCADA 数据进行分析处理 ,重点为风电机组故障预警模型搭建的离线训练部分,具体步骤可以分为:SCADA 数据预处理;数据预测模型的搭建;预警阈值的设定。
2 SCADA 数据预处理
2.1 SCADA 异常数据处理
初步数据异常数据处理是删除 SCADA 警报日 志中的故障数据,然后进一步地进行数据操作。对 风电机组进行异常数据处理工作,大部分学者都是 基于风速⁃功率散点图来展开的,风速⁃功率散点图 不仅降低了原始高维数据处理困难的问题,而且能 比较完整地表现出风电机组的状态信息。
风速⁃功率散点图如图5所示,可以看出异常数据可以分为3种:
①停机数据,实际风速大于 0 m / s,但是风 机的有功功率为 0 kW,这是由于风机停机造成的; ②限电数据,风机的输出功率在理想功率曲线以 下,这可能是由于人为控制风机限电造成的;③噪 声数据,数据点随机分布在整体数据之外,这可能 是由于风机故障或者外界噪声引起的。
由图5可以看出风电机组异常数据远少于正常数据。
SCADA 异常数据处理方法如表 1 所示:
2.2 SCADA 数据参数选择
关于 SCADA 参数选择的方法很多,将参数选 择方法进行分类整理,可以分为单变量法和整体法。单变量法是比较简单的 SCADA 参数选择方 法,也是文献中最常用的方法,该方法主要是统计 SCADA 数据自变量参数和目标参数之间的关联性, 并将 SCADA 参数间的关联度进行排序,通过设定阈值,过滤掉关联度比较低的 SCADA 参数。
与单变量法不同,整体法不单独分析 SCADA 数 据自变量与目标变量之间的相关性,因为这样做可能 错过多个变量间隐含关系与目标变量之间的相关性。整体法通过添加或减少自变量对模型整体进行考察, 判断自变量对模型整体的影响,通过变量对整体模型 的贡献率、综合性的影响对变量重要性进行排序,用于变量的选择。
2.3 SCADA 数据归一化
常用的 SCADA 数据归一化方法主要包括 min⁃ max 标准化和 Z⁃score 标准化,min⁃max 标准化是对 SCADA 原始参数进行线性转化,使其映射到[0,1] 。Z⁃score 标准化是对 SCADA 原始参数的均值和标准 差进行标准化,使其均值为 0,标准差为 1。
3 SCADA 数据预测模型搭建
目前现有的深度学习模型主要有卷积神经网 络及其变体、自动编码器及其变体、受限玻尔兹曼 机及其变体、循环神经网络及其变体。这些模型 已经广泛应用于图像处理和语言识别等领域,并取 得了突破性的成果。很多学者基于这些深度学 习方法对风电机组 SCADA 数据进行预测模型的搭 建,在海量数据中提取多源参数特征、时间参数特 征以及时空参数特征,以获取更全面系统的风电机 组综合特征,并基于 SCADA 数据对深度学习模型 进行改进,优化深度学习模型的参数,增加模型的 深度,拓宽模型的宽度,以提高 SCADA 数据预测模 型的鲁棒性和预测精度,并进一步延长预测步长。
3.1 多源参数特征提取
为了保证模型的稳定性,大多数学者采用多源 参数特征提取的方法,通过相关性较大的几个参数 来预测目标值。多源参数特征提取方面的模型,主 要可分为 3 种经典模型,分别是深度神经网络模型(DNN) 、自动编码器(AE)和受限玻尔兹曼机(RBM) 。
深度神经网络是从人工神经网络(ANN)发展上来的,它比人工神经网络有更多的隐藏层数,深度神经网络模型如图 6 所示。
很多学者是以深度神经网络为基础,以优化模型参 数权重为目标,采用麻雀搜索算法(SSA)、粒子群算法( PSO ) 、 遗 传 算 法 ( genetic algorithm, GA)等优化算法对深度神经网络模型参数寻优, 提高预测精度。其中 SSA⁃DNN 模型成功应用于风 电机组齿轮箱相关参数的预测,PSO⁃DNN 模型成功 应用于风电机组主轴承相关参数的预测,GA⁃DNN 模型成功应用于风电机组变桨系统相关参数的预测。
自动编码器是一种包含了编码器和解码器的 神经网络模型,其核心思想是保证输入和输出的一 致性,这样就做到了数据传输过程中特征的提取, 自动编码器模型如图 7 所示。
很多学者基于自编码 器的变体对 SCADA 数据相关参数进行预测,对与自编码器的改进主要在增加了模型的深度方面,用于 风电机组 SCADA 参数预测的自编码器变体有深度 自编码器(DAE) 、堆叠去噪自编码器(SDAE)、深度变分自编码器 ( DVAE)。
其中深度自编码器成功应用于风电机 组齿轮箱、主轴轴承和变流器相关参数的预测,堆 叠去噪自编码器成功应用于风电机组主轴轴承相 关参数的预测,深度变分自编码器成功应用于风电 机组齿轮箱相关参数的预测。受限玻尔兹曼机(RBM)是一类层间全连通,层内无连通的无自反馈 神经网络模型,受限玻尔兹曼机模型如图 8 所示。
自 Hinton 等提出了一种有深度的、紧密相连的置信网络以来,这种算法成为深度学习的主流。这种算法的思想是将多个 RBM 堆叠在一起形成深度置信网 络 (DBN ) , 用 于 风 电 机 组 SCADA参数预测的模型有深度置信网络、多个深 度置信网络融合模型(DBN⁃SOM)、基于鲸鱼优化算法的深度置信网络模型(WOA⁃DBN)。
其中深度置信网络成功应用于风电机组主轴轴承相关参数的预测,多个深度置信网络融合模型成功应用于风电机组齿轮箱相关参数的预测,基于鲸鱼优化算法的深度置信网络模型成功应用于风电机组齿轮箱和发电机相关参数的预测。
3.2 时间序列特征提取
很多学者认为在 SCADA 特征参数预测中,时 间序列信息与特征参数的变化有着强相关性。长 短期记忆人工神经网络 (LSTM)和门控循环单元神经网络(GRU) 都是循环神经网络(RNN) 的变体, LSTM 模型和 GRU 模型能够通过单元之间的记忆,保留参数的时间相 关性,通过之前单元的信息与当前单元的信息来预 测下一时刻的信息。
LSTM 模型是比较经典的时序 序列预测模型,很多学者基于 LSTM 模型开展风电 机组相关参数的预测。但是就风电机组 SCADA 数 据预测模型而言,GRU 相比于 LSTM,GRU 更容易收 敛,且对于 SCADA 数据有更好的鲁棒性和抗敏感 性。LSTM 细胞单元如图 9 所示:
GRU 细胞单元 如图 10 所示:
3.3 时空参数特征提取
很多学者注意到了风电机组SCADA数据的空 间信息,通过时空特征参数提取保留模型的时间特 征和空间特征,首先通过卷积神经网络(CNN)卷积层的矩阵运算保留 SCADA 参数的空间关联性,然后通过长短期记忆人 工神经网络门单元的记忆功能保留 SCADA 参数的 时间 连 续 性, CNN⁃LSTM 模 型 如 图 11 所 示:
与 CNN⁃LSTM 结合较紧密的两个算法是双向(Bi)算法和注意力机制(AM)算法。Bi 算法的主要目的是提供给预测模型 输出层输入序列中每一个点完整的过去和未来信 息,以弥补传统的深度学习模型结构忽略未来时间 联系的缺陷。AM 算法的思想可以理解为从大量 SCADA 参数信息中筛选出少量重要信息,并聚焦到 这些信息上,忽略不重要的 SCADA 参数信息。另外AM 算法在模型中的应用主要是通过权重计算给模 型分配权重,使输出值聚焦到权重较大的模型上面。
3.4 基于 SCADA 的深度学习模型小结
基于 SCADA 的深度学习模型已应用于风电机 组发电机、齿轮箱、主轴轴承等关键部件相关参数 的预测,其模型搭建的改进思想、搭建方法、监测位 置等总结如表 3 所示。
4 预警阈值的设定
大部分学者使用预测值和真实值之间的残差 来判断风电机组的异常状况。由于风电机组的运 行状况复杂多变,各个系统在实际运行工况中很容 易出现残差极值,如果风电机组预警阈值设定过低,很容易发生误报现象,如果风电机组预警阈值 设定过高,又容易发生漏报现象,风电机组预警阈 值设定与最后预警模型报警的稳定性直接相关。首先针对残差计算的极值问题,大多数学者都 采用移动加权指数平均的方法(EWMA)对风电机组预测数据和 真实数据之间的残差值进行平滑处理。
其主要目的是通过设定权重系数的形式充分考虑以前 所有残差信息,以反映残差近期的变化趋势。为了进一步增强风电机组故障预警阈值的稳 定性,大多数学者都把目光放在了一段时间内残差 的变化上。训练集数据能很好地反映残差变化趋 势。
为了实现更精确的风电机组故障预警,有学者 开发了自适应动态阈值设置方法,通过滑动窗口设置动态阈值。
也有学者提出了不同的解决思路,为了对误报警点进行检测。
5 结论
SCADA 数据因为数据的多源性,在故障预警方面有独到的优势,但也面临着众多挑战。SCADA 数据预处理研究和 SCADA 数据预测模型搭建研究都是为了在有足够好的预测精度的基础上,使风电机组故障预警时间得到进一步延长。预警阈值设定 主要是为了提高风电机组故障预警的稳定性。采取有效的数据预处理方法合理地增加模型深度和 宽度,从而找到合理的阈值范围,进一步延长风电 机组故障预警时长和提高预警的稳定性,这是基于 深度学习的风力发电机组故障预警方法的难点和 重点所在。工程上都希望这个方法有更长的预警 时长和更好的报警稳定性,以保证在风电机组出现 问题之前,能给风场的运维人员更长的准备时间以 排除故障或者及时安排风电机组相关零件的调度 工作,保证风电机组的安全运行并减少风电机组的 停机时间,降低风电机组的维护成本。
国内外学者关于风电机组健康状态的研究中,基于信号的两大热门研究方向分别是 SCADA 数据 和基于传感器的风电机组振动信号。目前在商业 上的风电机组状态监测系统大多都是在振动信号 上开发的,因此振动信号也是研究中不可忽视的一部分。基于振动信号的风电机组健康状态大部分 研究都集中在故障诊断方面,这与基于 SCADA 数 据的故障预警模型优势互补,一方面振动信号采集 频率更高更容易提取风电机组故障特征参数,适合 用于故障分类研究,另一方面 SCADA 数据参数多 且数据量庞大,但数据采集频率较低,更适用于故 障预测研究。有望在通过 SCADA 数据完成风电机 组故障预警的基础上,进一步地通过振动信号分析 风电机组关键零部件的故障位置,实现两种信号结合的风电机组故障位置精确预警。
—THE END—
参考文献:
夏博, 李春杨, 万露露, 等. 基于深度学习的风力发电机组故障预警 方法研究综述[J]. Science Technology & Engineering, 2023, 23
感谢对本公众号的支持,点个“在看”收藏一下吧~
如需购买视频课程资源,请联系:forwardtszs