《储能科学与技术》推荐|管鸿盛 等:贫数据条件下锂离子电池容量退化轨迹预测方法

科技   2024-10-30 14:00   北京  

作者:管鸿盛 钱诚 孙博 任羿

单位:北京航空航天大学可靠性与系统工程学院

引用:管鸿盛, 钱诚, 孙博, . 贫数据条件下锂离子电池容量退化轨迹预测方法[J]. 储能科学与技术, 2024, 13(9): 3084-3093.

DOI10.19799/j.cnki.2095-4239.2024.0643

本文亮点:提出了一种融合容量退化曲线增广和神经网络算法的锂离子电池容量退化轨迹预测方法;在仅有少量完整标记电池的贫数据条件下准确预测了不同放电方案电池的容量退化轨迹;所提方法可采用不同类型神经网络进行容量退化轨迹预测。

摘 要 在锂离子电池使用过程中,因实际运行条件的限制,通常难以获取大量完整标记的电池数据,对实现电池容量退化轨迹的准确预测构成了显著挑战。为此,本文提出了一种融合容量退化曲线增广和常用神经网络算法的锂离子电池容量退化轨迹预测方法。首先,基于少量完整标记的电池容量退化数据,采用多项式函数和蒙特卡洛方法得到虚拟容量退化曲线,并通过KL散度和欧氏距离进行筛选。之后,构建多层感知机(multi-layer perceptron, MLP)、卷积神经网络(convolutional neural network, CNN)、门控循环单元网络(gated recurrent unit, GRU)和长短期记忆网络(long short-term memory, LSTM)等四类常用神经网络模型,用以映射虚拟容量退化曲线数据至电池实际容量。最后,以虚拟容量退化曲线数据为输入,实际容量为输出,利用少量完整标记电池的数据对模型进行预训练,并利用待预测电池的早期退化数据进行微调,从而实现容量退化轨迹预测。通过77只具有不同放电方案的电池的数据对所提方法进行验证。结果表明,在仅有3只完整标记电池的容量退化数据条件下,所提方法的预测性能不受神经网络类型的影响,四类神经网络均准确预测了其余电池的容量退化轨迹,MAPE和RMSE的均值分别控制在2.3%和31 mAh以下。
关键词 锂离子电池;容量退化轨迹;贫数据条件;神经网络
锂离子电池具有能量密度高、自放电率低、寿命长等优点,已被广泛应用于电动汽车、消费电子、航空航天等领域。鉴于电气设备的使用寿命与其电池密切相关,学术和工业界将延长电池寿命作为研究目标,以期最大限度地降低电气设备的维护成本并提升其安全性。电池容量,作为衡量电池储存电量的指标,常用于评估电池的健康状态(SOH)。对于锂离子电池来说,准确地掌握其容量退化规律有助于对其开展预测性维护和指导梯次利用。然而,锂离子电池在实际运行过程中常面临复杂的动态负载和随机充放电条件,导致电池的真实容量数据难以获取。此外,通过实验获取大量完整的容量退化数据不仅耗时而且成本高昂。因此,在缺乏大量完整标记电池数据的贫数据条件下进行容量退化轨迹预测,具有显著的实际应用价值。
近年来,神经网络算法在锂离子电池容量退化轨迹预测方面得到了广泛应用。例如,Xu等提出了一种融合物理模型与数据驱动的容量退化预测方法,利用基于LSTM的序列到序列模型实现了高精度的电池容量预测。Strange等采用多层CNN模型,结合插值方法构建了锂离子电池在不同老化水平下的容量退化曲线。Zhou等提出了一种结合循环寿命预测技术的迁移学习策略,在两阶段老化过程中实现了磷酸铁锂电池长期容量退化轨迹的准确预测。Zhao等开发了一种基于双向长短期记忆网络(Bi-LSTM)的容量退化预测方法,通过老化轨迹匹配和深度迁移学习,在不同老化阶段实现了可靠的容量预测。Che等提出了一种具有长期正则化的域适应多任务学习方法,在不可见的动态负载和温度条件下,对电池容量退化轨迹进行了短期和长期预测,取得了较高的预测精度。Qian等针对动态负载条件,开发了一种基于注意力机制和序列到序列模型的SOH预测方法,通过输入历史状态信息和未来负载信息,实现了长期退化曲线的预测。唐梓巍等提出了一种基于Informer神经网络的容量退化预测方法,预测结果的平均绝对误差和均方根误差分别控制在2.57%和3.5%。Han等提出了一种自适应LSTM方法,通过提取健康特征并利用自适应LSTM模型进行一步预测,容量预测的平均误差为6%。Li等提出了一个基于序列到序列模型的预测框架,能够同时预测容量和功率衰减,并准确地预测车辆在寿命早期的容量和内阻退化轨迹。
尽管基于神经网络的容量退化轨迹预测方法已取得较高精度,但其训练过程依赖于大量电池测试数据。在数据匮乏的情况下,神经网络模型难以充分训练,显著限制了其预测精度。针对上述问题,本文提出了一种融合容量退化曲线增广和常用神经网络算法的锂离子电池容量退化轨迹预测方法,能够仅依赖贫数据条件准确预测出电池的容量退化轨迹。该方法首先利用多项式函数和蒙特卡洛方法,对少量完整标记电池的容量退化数据进行增广得到大量虚拟容量退化曲线,并通过KL散度与欧氏距离进行筛选,确保虚拟容量退化曲线能够有效反映电池的退化规律。进一步,构建了包括MLP、CNN、GRU和LSTM在内的四类常用于锂离子电池容量估计与预测的神经网络模型,采用预训练和微调相结合的两阶段训练策略,将虚拟容量退化曲线数据映射到电池真实容量,从而实现容量退化轨迹预测。

1 锂离子电池容量退化轨迹预测方法

本文提出的锂离子电池容量退化轨迹预测方法主要包括容量退化曲线增广、神经网络模型构建、模型训练与验证等步骤。

1.1 容量退化曲线增广

在锂离子电池的使用过程中,固体电解质界面相的形成和分解、石墨剥离和镀锂等多种物理和化学降解机制会改变电极的开路电压,导致电极滑动或收缩,进而引起电池容量退化。这些化学反应受到温度、负载电流和放电深度等因素的影响,导致不同电池的容量退化曲线存在差异。因此,在贫数据条件下开展电池容量退化轨迹预测的关键在于从有限的数据中提取出多样化且具有代表性的容量退化特征。
为此,本文采用图1所示的方法,对少量完整标记电池的容量退化曲线进行增广,生成大量能够反映电池退化规律的虚拟容量退化曲线。首先,使用多项式函数和蒙特卡洛方法,从少量完整的容量退化曲线出发,生成初步的虚拟容量退化曲线。然后,根据电池早期的容量退化轨迹与虚拟容量退化曲线的早期数据,以KL散度和欧氏距离为标准,筛选出16条能够反映电池退化特性的虚拟容量退化曲线,形成虚拟容量退化曲线集合。

图1   锂离子电池容量退化曲线增广流程
1.1.1 基于多项式函数和蒙特卡洛方法的虚拟容量退化曲线生成
假设某只完整标记电池的循环圈数为,对应的容量为。使用式(1)所示的三次多项式函数对其容量退化曲线进行拟合。

(1)
其中,表示第k圈循环对应的容量,为待拟合的参数。
在获取拟合参数后,使用蒙特卡洛方法对其进行随机化处理。首先,基于参数建立正态分布,其中均值设置为,标准差设置为与数量级相同的基准数(p为整数)。接着,从正态分布中抽取随机参数。为确保随机抽样范围的合理性,根据3原则将其设定为。最后,将随机参数用于式(1),生成虚拟容量退化曲线。为了覆盖本文所使用的数据集中电池循环寿命范围,在生成虚拟容量退化曲线时将最大循环圈数设置为2670。
1.1.2 基于KL散度和欧氏距离的虚拟容量退化曲线筛选
一般来说,由式(1)生成的虚拟容量退化曲线通常会与电池的实际退化行为存在偏差。为此,本文采用KL散度和欧氏距离作为度量标准,评估电池早期容量退化数据与虚拟容量退化曲线之间的相似性,并据此筛选出符合电池退化规律的虚拟容量退化曲线,KL散度和欧氏距离的阈值分别设置为2×10-4和0.25。
假设电池前h圈循环的容量为,某条虚拟容量退化曲线前h圈循环的容量为。根据式(2)和式(3),分别计算真实容量序列Y与虚拟容量序列S的KL散度和欧氏距离。然后,判断其KL散度和欧氏距离是否同时小于设定的阈值。若满足条件,则保留此虚拟容量退化曲线;否则,重新生成并进行筛选。

(2)

(3)

1.2 神经网络模型

本文选用了锂离子电池容量估计和预测领域中流行的四类神经网络模型进行容量退化轨迹预测研究,包括MLP、CNN、GRU和LSTM。
如图2所示,所选用的MLP、CNN、GRU和LSTM四类神经网络模型之间的主要差异在于第一层网络(flatten层与relu激活函数除外),分别为全连接层、卷积层、GRU层和LSTM层。其中,CNN模型的卷积层包括一个一维卷积层和一个最大池化层。四类神经网络模型均以虚拟容量退化曲线数据为输入,实际容量为输出。所有模型都通过flatten层进行降维,并使用relu激活函数增强非线性能力。最后,模型通过两个串联的全连接层输出容量。

图2   四类典型的神经网络模型:(a) MLP模型;(b) CNN模型;(c) GRU模型;(d) LSTM模型
四类神经网络模型采用统一的输入输出格式,并保持相似的超参数规模。以形状为(32,16,1)的输入向量为例,各模型的层结构如表1所示。特别的,在CNN模型中一维卷积层采用3个卷积核,最大池化层的步幅设为2。

表1   四类神经网络模型的超参数


1.3 模型训练与验证

为了提升神经网络模型的收敛速度和精度,采用式(4)所示的归一化方法对虚拟容量退化曲线数据和真实容量进行归一化处理,将数据映射到区间

(4)
式中,分别为原始数据的最大值和最小值。
用于模型训练的数据集可表示为,其中n表示训练数据集中的样本总数,为第i个样本的容量,为第i个样本所属电池的虚拟容量退化曲线的容量值。以某电池第i圈循环数据为例,根据虚拟容量退化曲线得到该循环的输入为。其中,表示第k条虚拟容量退化曲线在第i圈循环的容量值。
模型的训练过程包括预训练和微调两个阶段,如图3所示。在预训练阶段,将少量完整标记电池的容量退化数据作为预训练数据集,对模型进行训练,以学习电池全寿命周期的容量退化规律。在微调阶段,利用早期标记电池的退化数据(前30%的数据)对模型的全部参数进行更新,使其适应电池的特定退化行为。预训练和微调过程的具体参数如表2所示。

图3   神经网络模型的训练流程

表2   神经网络模型预训练和微调参数设置


最后,将训练完成的神经网络模型应用于待预测的电池,进行方法的验证。神经网络模型的训练和测试在笔记本计算机(操作系统:Windows11 64位;CPU:12th Gen Intel(R) Core(TM) i5-12500H;GPU:NVIDIA GeForce RTX 3050Ti Laptop GPU)上进行,在Pytorch环境中搭建模型。本文采用均方根误差(root mean square error, RMSE)和平均绝对百分比误差(mean absolute percentage error, MAPE)作为模型的评价指标,如式(5)和式(6)所示。

(5)

(6)
其中,分别表示容量真实值和预测值,N表示总循环数。

2 结果与分析

2.1 锂离子电池老化试验数据

本文使用的数据来源于华中科技大学提供的锂离子电池老化数据集,包含77只标称容量为1.1 Ah的A123 APR18650M1A电池老化数据。所有电池均采用相同的快速充电方案C1(5 C充电至80%SOC)—C2(1 C充电至3.6 V)—CV(3.6 V恒压充电至0.05 C)。该数据集考虑了77种不同的多级放电方案,电池按照C1(100%SOC到60%SOC)—C2(60%SOC到40%SOC)—C3(40%SOC到20%SOC)—C4(20%SOC到2 V)四步放电方案放电。放电方案中C1~C4分别表示4个步骤的恒流放电倍率,针对每只电池采用不同的组合。图4显示了电池放电容量退化曲线,循环圈数范围在1100~2700。在本文中,图4所示的电池B1、B2、B3(3条虚线对应的电池)被视为完整标记电池,其余电池仅已知前30%循环的容量值。

图4   锂离子电池容量退化曲线

2.2 容量退化轨迹预测结果

本文通过3只完整标记电池的容量退化数据进行预训练,并利用待预测电池的早期容量退化数据进行微调。74只电池的容量退化轨迹预测结果如表3所示,四类神经网络模型均展现出较高的预测精度,MAPE和RMSE的均值均低于2.3%和31 mAh。其中,GRU模型表现最佳,而CNN模型的预测精度最低。

表3   容量退化轨迹预测结果


为进一步分析模型在每只电池上的预测性能,图5展示了GRU模型预测结果的详细误差。其中,图5(a)显示所有电池的容量预测绝对误差。从图中可以看出,大多数电池的最大绝对误差保持在100 mAh以下。图5(b)和(c)分别给出了具有最小和最大MAPE的两只电池(18号和4号电池)的容量退化轨迹预测结果,其中彩色虚线标示了预测起点。18号电池的预测结果与实际轨迹高度吻合,MAPE仅为0.26%。相反,4号电池的预测误差随着循环次数的增加而逐渐增大,尽管如此,5.83%的MAPE仍处于可接受范围内。图5(d)和(e)中的直方图及彩色曲线(核密度估计)描述了所有电池预测结果的MAPE和RMSE分布,大多数电池的MAPE和RMSE低于3%和40 mAh。上述验证结果表明,本文提出的方法仅需要少量完整标记的电池数据即可实现高精度的容量退化轨迹预测。

图5   GRU模型的容量退化轨迹预测结果:(a) 74只电池的容量预测绝对误差;(b) 最小MAPE对应的容量退化轨迹预测结果;(c) 最大MAPE对应的容量退化轨迹预测结果;(d) MAPE分布;(e) RMSE分布

2.3 虚拟容量退化曲线增广敏感性分析

锂离子电池容量退化轨迹预测的准确性高度依赖于容量退化曲线的增广,导致虚拟容量退化曲线的规模成为平衡预测效率与精度的关键参数。为此,本文开展虚拟容量退化曲线增广敏感性分析研究,增广后的虚拟容量退化曲线数量由10条增加至28条,并将其分别应用于四类神经网络模型,以预测74只电池的容量退化轨迹。
图6显示了四类神经网络模型的MAPE均值。结果表明,四类神经网络模型的MAPE均值保持在1.8%~2.6%。GRU模型在大多数情况下表现最佳,MAPE均值始终低于2.2%。MLP模型在虚拟容量退化曲线数量不大于20条时精度逐渐提升,之后精度有所下降。相比之下,CNN模型和LSTM模型的精度较低,MAPE均值在大部分情况下超过2.2%。总体来看,当虚拟容量退化曲线数量小于等于16条时,四类神经网络模型的精度整体有所提升;而当虚拟容量退化曲线数量超过16条后,四类神经网络模型的精度波动较大且没有显著提升。

图6   MAPE均值随虚拟容量退化曲线数量的变化

2.4 虚拟容量退化曲线筛选方法的消融实验

为了评估虚拟容量退化曲线筛选方法的选择对锂离子电池容量预测精度的影响,本文进行了一系列消融实验。实验设置有如下4种方案。#1:无筛选,即不对生成的虚拟容量退化曲线进行筛选,标记为“No”;#2:仅基于KL散度进行筛选,标记为“KL”;#3:仅基于欧氏距离进行筛选,标记为“D”;#4:同时基于KL散度和欧氏距离进行筛选,标记为“KL-D”。
各筛选方法的预测误差对比如图7所示。结果表明,在不进行筛选的条件下,MLP、CNN和GRU模型的MAPE和RMSE值均最高,最大值超过了10%和100 mAh。当采用基于KL散度和欧氏距离的双重筛选方法时,四类模型的预测精度显著提高。此外,在不同的筛选方法下,CNN模型的预测精度变化最小,而GRU模型的预测精度波动最为显著。

图7   使用不同虚拟容量退化曲线筛选方法的预测误差:(a) MAPE(b) RMSE
此外,表4展示了使用不同虚拟容量退化曲线筛选方法时,四类神经网络模型预测结果的误差均值。在各种筛选方法中,CNN模型显示出较小的变化,其MAPE和RMSE均值均保持在3.1%及40 mAh以下。在仅使用基于KL散度的筛选方法时,四类模型的误差均值较为接近。然而,在采用基于欧氏距离的筛选方法时,误差均值之间的差异较大,其中GRU模型显示出最小的误差。相比之下,当同时基于KL散度和欧氏距离进行筛选时,四类模型均实现了最低的MAPE均值,表明这种双重筛选方法对提高预测精度较为有效。

表4   使用不同筛选方法的预测误差均值


2.5 模型训练方案的消融实验

为验证预训练和微调结合的训练方案的有效性,本文实施了四类不同的训练策略,并在74只电池上测试了这些方案。具体训练方案包括4种。#1:使用3只完整标记电池进行预训练后直接进行测试,标记为“P”;#2:仅使用待预测电池的早期容量退化数据进行训练,标记为“T”;#3:使用3只完整标记电池进行预训练,并用待预测电池的早期容量退化数据对图2所示模型的全连接层1进行微调,其余网络层冻结,标记为“PF-1”;#4:在预训练的基础上,使用待预测电池的早期容量退化数据对所有网络层进行微调,标记为“PF-All”。
图8给出了这些训练方案的预测误差对比。结果显示,仅利用3只完整标记电池进行预训练的方案,四类模型的MAPE和RMSE均值均保持在4%和40 mAh以下。当仅用待预测电池的早期退化数据进行训练时,预测误差最大,这反映出神经网络模型未能捕捉到电池后期的退化信息。相比之下,基于预训练并全面微调的训练方案(PF-All)显示出更高的精度。在各种训练方案中,MLP模型的性能变化较小,其MAPE和RMSE均未超过8%和90 mAh。而GRU和LSTM模型对训练方案的敏感度更高,特别是在仅使用待预测电池早期数据进行训练时,其MAPE和RMSE均超过了9.5%和110 mAh。

图8   使用不同训练方案的预测误差:(a) MAPE(b) RMSE

3 结 论

本文通过结合容量退化曲线增广和神经网络算法,实现了贫数据条件下锂离子电池容量退化轨迹的准确预测。利用少量完整标记电池的容量退化数据,通过多项式函数和蒙特卡洛方法生成虚拟容量退化曲线,并通过KL散度与欧氏距离对其进行筛选。随后,构建了四类神经网络模型,包括MLP、CNN、GRU和LSTM,将虚拟容量退化曲线映射到真实容量。在77只具有不同放电方案的电池上进行了验证,结果表明在仅有3只完整标记电池的条件下,所提方法能够准确预测电池容量退化轨迹,四类神经网络模型的MAPE和RMSE均值均低于2.3%和31 mAh。此外,通过消融实验进一步分析了虚拟容量退化曲线筛选方法和模型训练方案,验证了基于KL散度与欧氏距离的筛选方法和预训练与全面微调相结合的训练方案的优越性。总体而言,本文提出的方法在贫数据条件下具有显著的预测精度和可靠性,为机载电池管理系统等应用提供了技术支持。


第一作者:管鸿盛(1997—),男,博士研究生,研究方向为锂离子电池状态估计与寿命预测,E-mail:guanhs@buaa.edu.cn;

通讯作者:钱诚,副研究员,研究方向为锂离子电池可靠性,E-mail:cqian@buaa.edu.cn。



本刊推荐

(点击图片可跳转到相应文章合集)

邮发代号:80-732
联系热线:010-64519601/9602/9643
投稿网址:http://esst.cip.com.cn/CN/2095-4239/home.shtml

储能科学与技术
中文核心、科技核心和cscd核心期刊,化学工业出版社和中国化工学会主办,主编黄学杰研究员。投稿及下载官网:http://esst.cip.com.cn/CN/2095-4239/home.shtml;欢迎给公众号投稿
 最新文章