DOI Link:
https://doi.org/10.1016/j.apenergy.2024.123757
Googlescholar:
https://scholar.google.com/citations?user=9IW6ywwAAAAJ&hl=en&oi=ao
ScienceDirect:
https://www.scopus.com/authid/detail.uri?authorId=56152306100
UniversityWeb:
https://nice.sogang.ac.kr/
3. 收录日期
1. 科学问题
提出一种基于DAE和IVA联合方法的主动电池模块异常检测技术,旨在通过机器学习与电化学分析相结合,精确识别电池系统中的异常模块并预测其衰退趋势。
2. 实验与模型方法
光伏集成ESS的运行原理(Fig. 1a)
ESS包括光伏发电与能量管理系统(EMS)结合的能量存储架构。 - BMS功能
管理电池状态,包括电压监控、SOC(电池荷电状态)平衡维护,以及防止过充现象。 - EMS功能
管理光伏发电和ESS运行历史数据,同时监控PCS(电力调节系统)的状态,并控制充放电过程。 - PCS功能
完成AC/DC之间的电能转换。
ESS模块与系统架构(Fig. 1b)
ESS系统由9个机架(rack)并联,每个机架包含17个模块,总计153个模块。 每个模块由42节锂离子电池组成(14串3并,14S3P),标称电压为51.8 V,标称容量为189 Ah。 单机架通过模块串联,标称电压为881 V,容量保持189 Ah。
温度监控和传感器布置
ESS安装了306个温度传感器,用于监测模块的进气和排气温度。 当前研究未直接监测电池表面温度,若加入此数据,可进一步优化模型性能。
数据采集与SOC范围
数据范围:2019年8月1日至2020年7月1日,共一年运行数据。 SOC操作范围:5%至70%,受韩国政府法规限制,属于安全操作区间。 数据记录频率:每分钟采集一次电压、电流和温度等模块级数据。
SOC范围对模型性能的影响
- DAE模型
更广的SOC行为范围(高低极端)可提供更丰富的数据,增强模型的泛化性能。 - IVA方法
在SOC范围的极端值(起始和终止阶段)电压变化更显著,有助于快速捕获IVA峰值,提升检测性能。 当前研究中受限于SOC范围,但未来若解除限制,模型性能预计将大幅提升。
Fig. 1. Specific structure of PV integrated ESS and battery configuration.
2.2 提议框架概述
1. 框架目标与特性
主动检测ESS中的异常模块,以预防电池故障的发生。
目标是发现异常,而非诊断具体故障原因(如锂沉积、内部短路、气体生成或电极材料变化)。
2. ProADD框架流程(Fig. 2)
(1) 数据预处理:
对电压、电流和SOC数据进行预处理,以适配数据驱动方法(DAE)和基于电化学的方法(IVA)。
(2) 方法特点:
DAE方法:基于一天的电压和电流数据,数据量越多,模型性能越优。
IVA方法:基于锂离子电池的电化学行为,通过电压差实现分析。
(2) 诊断固化:
结合两种方法的结果,使用OCSVM进行异常分类,使用Z-score进行量化分析。
Fig. 2. An overview of the proposed ProADD.
3. 典型机架的日数据表现(Fig. 3)
(1) 电压、电流和SOC数据:
展示一个典型机架中17个模块的日变化曲线,不同模块以不同颜色表示。
(2) 电流特性:
由于模块串联,机架中所有模块电流一致,电流曲线以红色显示为单一线条。
(3) 充放电规律:
充电:从上午10点开始,SOC达到70%后停止;由光伏发电供能,电流存在波动。
放电:下午6点至8点完成,采用恒流(CC)协议,最大C率为0.5C。
Fig. 3. Daily ESS profiles of one rack (17 modules in different colors).
2.3 基于去噪自编码器(DAE)的方法
1. 模型背景与选择
自编码器(AE):是一种用于半监督学习和无监督学习的人工神经网络,主要应用于异常检测和图像去噪。AE通过将输入数据编码为低维表示(潜向量),再从中重建输入数据,实现对数据的压缩和选择性重建。
挑战:ESS操作数据包含噪声和不确定性(如随机不确定性),这些可能干扰AE对信号的重建。
改进:为缓解随机不确定性并增强重建性能,本研究采用去噪自编码器(DAE)替代AE,通过向输入数据添加少量噪声改善模型泛化能力与表现。
2. DAE模型结构(Fig. 4)
(1) 目的:
重建输入数据的核心特征,消除输入中的干扰。
不仅用于去噪,更注重数据表示的改进。
(2) 输入与输出:
输入:将一天的一维原始数据转化为二维图像(28天×1440分钟×2通道,即电压和电流)。
输出:与输入维度相同的二维图像。
(3) 过程:
数据归一化到[0,1]范围,添加随机高斯噪声。
编码阶段将数据压缩至低维潜向量(Eq. 2)。
解码阶段重建数据(Eq. 3)。
(4) 结构描述:
编码器由两层卷积神经网络(CNN)组成,使用ReLU激活函数。
输入数据通过一个密集层处理,最终压缩为314维潜向量。
随机噪声比例为输入数据的2%。
Fig. 4. Structure of the propose DAE.
3. 训练与性能评估
损失函数:使用RMSE最小化输入与输出之间的差异。
重建误差:
平均电压重建误差为10.372 mV。
平均电流重建误差为12.982 mA。
结果总结:尽管光伏发电引起间歇性充电行为,模型依然能够很好地重建ESS的电压与电流模式。
4. 输入数据与模型参数
输入特征:Table 2,包含数据格式和随机噪声比例。
模型参数:潜向量维度显著低于输入维度,确保特征压缩效果和模型鲁棒性。
3. 研究结果
3.1 基于DAE的异常模块主动检测结果
1. 重建性能评估(Fig. 5)
原始电压与电流轮廓(黑色虚线)与DAE重建的轮廓(红线)对比表明:即使存在间歇性太阳能发电,电压和电流轮廓仍能被良好重建。
结果显示:模型能够有效捕捉ESS实际操作中的电气特性。
Fig. 5. Voltage and Current reconstruction.
2. 重建误差分析(Fig. 6(a))
(1) 误差直方图:展示153个模块的每日误差分布及降序排列的误差值。
颜色标识模块状态:蓝色表示低于阈值,红色表示超过阈值。
模块 r0715 的重建误差最高(0.0249 RMSE),显著高于平均误差(0.0117 RMSE)。
(2) 阈值确定:
通过误差分布的明显分离点确定,阈值设为0.014。
使用K均值聚类验证结果,结果与阈值设定一致。
3. 异常模块可视化(Fig. 6(b))
(1) 雷达图展示:模块按逆时针排列,不同机架用背景颜色区分。
(2) 异常标记:
异常模块以红色高亮,标注模块ID。
显著偏离正常特征的模块被明确标识,便于后续排查。
4. 潜向量分析
(1) 虽然DAE能很好地重建电气信号,但难以直接解释SOH、内部阻抗(IR)、退化等因素。
(2) 潜空间可视化:
潜向量表示DAE编码过程中提取的特征集合。
将潜向量嵌入潜空间中可进一步确认和解释模型的检测结果。
Fig. 6. Description chart of DAE error.
3.2. 基于K均值聚类的DAE模型解释
1. 潜向量与降维可视化(Fig. 7)
(1) 潜空间分析:
高维数据通过DAE学习后散布于潜空间,形成不同子空间。
PCA投影到二维空间,用K均值聚类方法分类。
结果显示,不同月份的153个模块形成不同的流形,颜色表示聚类结果。
(2) 聚类特性:
每月的充放电模式差异使得流形解缠。
每个流形内,重建误差最大的模块(红色点)聚集在一起。
潜向量的低维表示能够进行基于距离的解释,便于风险评估。
2. DAE与AE重建性能比较
(1) 实验结果:
AE的RMSE为0.2037,而DAE的RMSE为0.117,重建误差减少了一半。
说明DAE的重建能力更强,且形成的潜空间流形更加直观和解缠。
(2) 流形特性:
PCA可视化中,DAE在两个轴(axis-0和axis-1)上均形成流形,而AE仅在axis-0上形成流形。
DAE在异常模块(红点)的可视化上表现更优。
Fig. 7. The visualization of AE and DAE.
3. 聚类评估与模块分类(Fig. 8)
(1) 聚类指标:
使用轮廓系数(Silhouette Coefficient)和戴维斯-鲍丁指数(DB Index)评估聚类效果。
1. 轮廓系数:
衡量类间距离与类内距离之比,值越高,聚类效果越好。
在3和4处指数下降,10处最大。
2. DB指数:
衡量聚类的大小与类间平均距离之比,值越低,聚类效果越好。
在3处增大后逐渐减小,19处最小。
(2) 聚类结果:
选取K=5为最佳聚类数,兼顾两种指标。
将153个模块分为5个簇,其中簇3中的7个模块与DAE重建误差最大的7个模块一致(红色)。
4. 结论
潜空间中模块的聚类有助于逐步评估模块风险水平,从而提高ESS的安全性。
DAE比AE具有更优的重建能力和流形可解释性,并能更清晰地识别异常模块。
Fig. 8. Clustering evaluation metrics.
3.3. 去噪性能与电池异常检测对比
1.去噪性能对比
(1) 实验方法:
引入两种传统去噪算法:Savitzky-Golay (SG) 滤波器和小波变换。
生成噪声数据及其去噪版本,作为数据增强后训练augDAE模型。
(2) 结果分析:
DAE平均重建误差:0.0117。
augDAE平均重建误差:0.0109,略低于DAE,显示传统去噪方法在噪声消除方面更有效。
2. 异常检测性能对比(Fig. 9)
(1) 阈值与分布:
对DAE和augDAE模型的模块误差分布及阈值进行分析。
K均值聚类的阈值(红色虚线)和误差分布阈值(绿色虚线)用于分类异常模块(红色标记)。
(2) augDAE问题:
在augDAE中,两个阈值之间存在显著的不一致性。
部分模块位于两个阈值之间,检测结果不稳定。
3. 关键发现
虽然传统去噪方法增强了训练数据的噪声去除能力,但并未显著提高异常检测性能。
清晰的误差分布分离或潜空间分离对异常检测更为重要。
DAE模型在异常模块检测中表现出更高的稳定性和一致性。
4. 结论
采用额外的去噪方法可能提升噪声抑制,但可能引入阈值对齐问题,反而削弱异常检测能力。
DAE模型通过潜空间的清晰分离更适合用于电池异常检测。
Fig. 9. Reconstruction Error histogram.
3.4. IVA 方法
1. ICA 方法的局限性
(1) 优点:
Fig. 10:增量容量分析 (ICA) 能有效分析电池的降解机制。
可通过容量差异预测电池寿命,误差仅为 1.1%(RMSE)。
(2) 缺点:
需高时间分辨率测量,且对噪声极其敏感,即使在实验室环境下亦如此。
难以适用于实际场景的数据。
2. IVA 方法的提出
(1) IVA 方法:为克服低时间分辨率和数据噪声问题:
基于增量电压(而非增量容量)。
Fig. 10(a) 与 Fig. 10(c):在恒定电流放电下,ICA 的电压–容量曲线与 IVA 的电压–时间曲线等效。
Fig. 10(d) 采用两曲线差值的增量电压分析。
3. IVA 方法的优势
(1) 聚焦放电电压曲线:
电压曲线在光伏集成储能系统中通常较规则。
(2) 操作条件:
常温、恒定放电速率及功率输出下,放电曲线可信度高。
允许模块内部状态的定性比较。
(3) 恒定电流放电假设:
将容量视为时间的函数,放电电压曲线包含电化学信息。
Fig. 10. Traditional ICA in (a) and (b) versus the proposed IVA in (c) and (d).
4. 实验验证(Fig. 11)
(1) 电压曲线变化:
以 336 天的实验数据为基础,计算初始放电曲线与 90 天后放电曲线的差值。
图像显示两个显著峰值:放电初期和接近放电结束时。
为适应实时诊断,仅考虑放电初期(10% 总时间)。
(2) 模块异常的表现:
初始阶段(Fig. 11(a)):
r0715 模块的 IVA 峰值为 1.7 mV,显著高于平均值 0.6 mV。
90 天后(Fig. 11(b)):
r0715 的 IVA 峰值升至 5.9 mV,是平均值(2.4 mV)的两倍以上。
同机架中其它模块的 IVA 曲线也有所升高。
5. 结论
模块 IVA 曲线的显著变化,尤其是异常模块(如 r0715)的急剧升高,表明存在显著退化。
IVA 方法在实际应用中可通过短时间放电分析快速诊断模块异常。
Fig. 11. Progression of the IVA method. Each line represents one of the 17 modules in rack 7, (a) the curves after 30 days, (b) the curves after 90 days. Highlighting the module with the largest peak of IVA.
3.5. 基于 IVA 峰值的模块异常预警结果
1. IVA 曲线的演变
(1) 时间变化:
Fig. 12:不同周期月份(1、2、3、6、10个月)后的 IVA 曲线,每列代表不同的时间点,每行代表不同机架(1-9)。
每条曲线表示一个模块的 IVA 曲线,具有最高 8 个 IVA 峰值的模块用橙色线条标出。
(2) 时间推移的影响:
随着时间的推移,IVA 峰值逐渐增大,并且在 ESS 的充放电过程中变化愈加明显。
实验发现,当观察期小于 60 天时,难以得到可靠的结果。相比之下,60 天和 90 天的观察结果相似。
ESS 的制造商保修期为 15 年,60 天的周期仅占 ESS 生命周期的 1.1%,相对较短。
2. IVA 峰值与未来能量的关系
(1) 模块间的差异:
Fig. 13:绘制了 IVA 峰值与每个模块未来能量的散点图。
X 轴表示 336 天后的能量,Y 轴表示 90 天操作后的 IVA 峰值。
所有 153 个模块的散点图显示,尽管每个机架的 ESS 操作计划相同,IVA 峰值较高的模块具有较低的未来能量,表明其退化较严重。
3. DAE 错误与 IVA 峰值的匹配
(1)一致性:
被 DAE 错误检测选中的 7 个异常模块,也在 IVA 峰值的前 8 个模块中。这表明基于深度学习的数据驱动检测与基于电化学的 prior knowledge 检测有很好的匹配,支持了联合主动电池异常检测的模型。
Fig. 12. IVA curves for racks and months.
Fig. 13. IVA and future energy relationship.
3.6. 联合方法用于主动电池异常检测
1. 联合检测方法概述
(1) DAE与IVA的比较:
DAE方法通过机器学习提取电池信息的潜在向量,而IVA方法则通过时间域表示电压,将容量转换为时间,在恒定电流条件下进行分析。
(2) 泛化挑战:
该模型无法直接应用于不同的ESS进行准确性验证,因为不同的电池化学性质和应用场景要求对模型进行重新训练。
2. DAE误差与IVA峰值的相关性
(1) 散点图分析:
Fig. 14 :153个模块的散点图,x轴表示DAE重构误差,y轴表示IVA峰值。每个模块由一个点表示,红色圆圈表示同时具有大DAE误差和大IVA峰值的模块,黑色圆圈表示仅具有大IVA峰值的模块。
(2) 高相关性:
两个指标之间存在强相关性,具有高IVA峰值的模块通常也具有较大的DAE误差,反之亦然。
(3) 阈值设定:
IVA峰值超过黑色虚线阈值的模块被视为电化学角度的异常模块,DAE误差超过红色虚线阈值的模块则被视为深度学习角度的异常模块。
Fig. 14. Anomaly Modules Correlation between DAE and IVA.
3.7. 使用OCSVM进行主动电池异常检测
1. OCSVM概述
OCSVM(单类支持向量机)是一种无监督异常检测方法,用于将数据点分类为正常类别或异常值。与传统的SVM不同,OCSVM建模正常类别,并通过与该类别的距离来识别异常值。
数学公式:
Eq.(4)和(5)给出了二次优化问题,目标是最大化与原点的距离,同时最小化异常值的惩罚项。
Eq.(6)给出了分类的决策函数,Eq.(7)则展示了使用的核函数。
Fig. 15. Joint anomaly module detection using OCSVM.
2. OCSVM结果
(1) 分类结果:
Fig. 15:OCSVM分类结果,将145个模块分类为正常模块,8个模块分类为异常模块。这些异常模块的详细信息列在表3中。
OCSVM的结果与DAE和IVA异常模块的超集一致,验证了两者的结合效果。
3.8. 电池异常Z评分
1. Z评分方法
(1) 为了联合量化电池模块的异常程度,采用Z评分进行统计分析。通过选择正常分布的尾部区域(即分位数),确定最终的异常检测结果。
(2) 数据转换:
Fig. 16:数据转换的过程。在Fig. 16(a)中,IVA峰值呈正态分布,而DAE误差呈指数分布。为了便于统计分析,对DAE误差进行Box-Cox变换,使其转换为正态分布,同时保留原始信息。
Fig. 16. Transform data for normality.
2. Z评分计算
(1) Z评分公式如Eq.(10)所示,衡量样本相对于数据集均值和标准差的位置,描述了样本在整体数据分布中的关系。
(2) 结果展示:
Fig. 17 :转换后的数据在二维空间中的散点图,基于Z评分将样本从蓝色到红色进行着色,表示从低到高的异常得分。低分的模块处于正常范围内,而高分的模块则被识别为异常模块。
3. 异常模块分析
(1) Z评分结果:
Table 3 展示了Z评分最高的10个异常模块,得分最高的模块为r0617,异常得分为4.7631。这些模块的异常得分与OCSVM和IVA、DAE的异常检测结果一致。
Fig. 17. Bivariate normal distribution of transformed data.
4. 重要结论
1. 联合检测方法
本文提出基于DAE和IVA的联合方法进行电池模块的主动异常检测。两者通过不同的技术手段(机器学习和电化学分析)互为补充,提升了检测的精度和可靠性。
2. DAE与IVA的相关性
DAE误差与IVA峰值呈高相关性,模块的高IVA峰值通常伴随较大的DAE误差。两种方法的结合能够更有效地识别电池模块的异常。
3. OCSVM分类
使用OCSVM方法分类153个电池模块,成功识别145个正常模块和8个异常模块,验证了基于DAE和IVA的异常检测方法的有效性。
4. Z评分量化异常
采用Z评分对DAE误差和IVA峰值数据进行统计量化,进一步识别和量化模块的异常程度,与OCSVM和IVA/DAE结果一致。
5. 异常模块确认
Z评分分析确认了10个异常模块,得分最高的是r0617,异常得分为4.7631,验证了所提方法的准确性和一致性。
PDF