基于数据驱动与迁移堆叠的锂离子电池SOH估计方法

文摘   科学   2024-04-25 17:11   北京  

Wu J, Cui X, Meng J, et al. Data-Driven Transfer-Stacking-Based State of Health Estimation for Lithium-Ion Batteries[J]. IEEE Transactions on Industrial Electronics, 2024, 71(1): 604-614.

摘要

锂离子电池的健康状况对电动汽车的安全可靠运行起着至关重要的作用。然而,现有的大多数SOH估计方法仍然需要大量的电池老化数据,建立的模型通常缺乏通用性。本文建立了一个基于数据驱动的迁移堆叠模型,以使SOH估计方法更具通用性。首先,从电池充电数据中提取潜在的健康特征,然后通过重要度函数对其进行筛选。其次,采用支持向量回归(SVR)方法建立不同电池数据的源模型,以选定的特征为输入,容量为输出。随后,使用迁移堆叠(TS)方法来组合所有源模型。在解决了为每个源模型分配权重的优化问题后,仅使用前30%的目标电池数据建立了用于SOH估计的TS-SVR方法。最后,通过三个不同的电池数据集验证了所提出的算法,结果表明算法具有更好的估计性能,本方法只使用少量的目标电池数据,即可在电池全寿命周期内实现准确的SOH估计。

引言

电池管理系统(BMS)是电动汽车的基本要素,在电池组的状态监测和运行控制中发挥着重要作用。锂离子电池的健康状况(SOH)估计是BMS的核心功能。准确的SOH可以帮助BMS正确判断电池的老化状态,对提高故障预后性能,保障电动汽车的安全性具有重要意义。

机器学习方法可以在不考虑锂离子电池内部复杂化学反应的情况下有效地挖掘数据规则,从而成为主流的SOH估计方法。然而,这些研究仅针对单电池老化的特征,而没有考虑特征的泛化性能。最近,有学者提出了使用迁移学习来估计电池的SOH。这种机器学习方法可以将任务从源域转移到目标域,以提高所构建模型的通用性,根据源数据建立的模型可用于估计目标的状态。然而,使用迁移学习方法来估计目标电池的SOH存在一些局限性。迁移学习可以很好地将源电池模型迁移到目标电池,但是,如果电池之间存在显著差异,那么在传输过程中就不容易保证源模型的泛化能力。因此,如何构建一个具有更好泛化性能的模型是需要解决的问题。

为了解决上述问题,我们在本研究中提出了一种基于数据驱动与迁移堆叠的锂离子电池SOH估计方法。首先,分析了IC和CC曲线,提取了多个特征。其次,计算每个特征的重要性。利用决策树中节点的重要度函数对特征进行筛选。然后,使用TS方法对来自不同电池的模型进行集成,并利用部分目标电池数据来优化每个模型的权重。最后,得到了用于估计目标电池SOH的广义传递模型。本文的主要贡献可概括如下:

(1)通过对决策树中节点的杂质进行排序,以及通过对不同电池数据的通用性进行全面分析,来保证所选择的特征具有良好泛化性能。

(2)为了保证模型的通用性,提出了一种基于TS的方法。通过加权优化函数合并来自多个来源电池的模型,以模拟目标电池的模型。

(3)通过三种电池数据集,使用不同的度量来评估所提出的方法。验证了基于TS的SOH估计方法的有效性和可靠性。

本文的其余部分组织如下:在第二节中,对四个电池进行了不同操作模式的电池老化实验。第三节利用决策树中节点的重要度实现了特征提取和选择。第四节基于TS构建了支持向量回归(SVR)模型。第五节演示了两组锂离子电池的实验。最后,第六节总结了全文。

实验

对四个ICR18650-15P型锂离子电池进行循环测试,生成老化数据。表1列出了它们的规格。在本研究中,使用CC和恒压(CCCV)充电/放电策略进行实验。充电和放电过程如图1所示。在1-C速率的CC和CV充电之后,电池以两种不同的速率(5C和10C)完全放电。具体而言,B1和B11的放电速率为5C,B2和B12的放电速率是10C。

表1 实验电池数据表

图1 不同放电过程 (a)5C (b)10C

四节电池的循环实验期间的容量衰减如图2所示。可见,电池在不同放电条件下的退化趋势可能有显著差异,如B11(5C放电)和B2(10C放电)。B11的容量在第120个周期后急剧下降,在第196个周期达到最大可用容量为1.2Ah(约80%SOH)。此外,B2的曲线相对平坦,直到第342个周期达到其最大可用容量1.2Ah,比B11多出约150个周期。此外,具有相同充放电条件的电池,如B1和B11也可能具有不同的容量退化率。在第120个循环之前,两种电池的老化轨迹相似。然而,在第120个循环之后,B11的最大可用容量比B1下降得更快,最终显示出与其他电池完全不同的老化轨迹。

图2 不同电池的容量退化曲线

特征处理

特征提取

从IC曲线中提取特征被认为是描述电池老化过程的有效方法。IC的本质是使用微分方程来分析CC充电数据。例如,B1电池在不同SOH下的IC曲线如图3所示。IC的表达式如下所示:

其中是充电电流;是采样时间的差值;是电压差.

图3 B1在不同SOH下的IC曲线

IC曲线的峰值反映了锂离子嵌入和脱嵌过程中电池的相变,并且随着内阻的增加,峰值位置向右移动。同时,峰值位置和面积也容易受到电池内部电化学过程变化的影响。因此,选择与IC曲线的峰值相对应的电压、峰值面积和峰值作为反映电池SOH的特征,表示为F1-F3。此外,如下式所示,IC曲线中增量的方差以及两个固定电压(此处设置为3.8V和4.1V)的增量差被确定为F4和F5:

其中是IC的值;是IC的平均值;分别是IC在两个固定电压下的值。

特征筛选

由于并非所有上述提取的特征都能有效地估计电池的SOH。此外,高维特征还会增加模型训练过程中的计算负担,同时使电池老化模型更加复杂。因此,应该去除对SOH估计模型的构建没有帮助的特征。集成决策树可以根据重要度函数对所有输入的重要性进行排序。该方法可以获得提取的特征的重要性,并进行特征选择以实现特征降维。步骤如下:

(1)对于输入向量和输出向量,设置向量以包括所有数据:

(2)采样得到,其中是决策树索引。设置为决策树的数量,为决策树最大深度,为训练集和测试集的比率。用相同的参数对所有电池进行训练和测试,得到每个决策树的输入和输出关系如下:

(3)获取决策树的平均估计值:

(4)分析决策树中节点的重要性,然后对特征的重要性进行排序。节点的重要性如下:

其中,分别是节点及其左右子节点中训练样本与总样本的比率;分别是节点及其左右子节点的杂质判据。节点的杂质如下:

其中是节点样本;是节点样本的目标变量的平均值;是观测值。

(5)在计算每个节点的重要性后,可以如下获得特征的重要性:

其中是训练样本中的节点数量;是总样本中的节点数。其中所有特征的重要性权重之和被归一化如下:

其中表示第个电池中第个特征的重要性。

(6)各种特征可能在不同电池的老化模型中发挥多种作用,因此需要具有不同的重要性权重,在考虑了各种电池之间的差异后,定义了一个新的指标来评估每个特征的综合性能:

其中是建模电池的数量;是第个特征的总重要性。

基于迁移堆叠的SOH估计

电池在不同的工作条件下会显示出不同的老化轨迹。在传统的机器学习中,只使用一个源模型来估计目标状态。由于源数据和目标数据可能存在差异,因此要保证源模型的泛化性能并不容易。叠加方法已被广泛应用于各种研究中,其本质是通过给多个模型赋予不同的权重来提高泛化能力。如果这些源模型可以集成,则每个模型的权重将根据目标电池的部分数据进行自适应调整。随后得到目标电池的广义模型。通常,通过TS的适应性来解决堆叠模型中每个源模型的权重。这意味着该方法可以自动解释源模型和目标模型之间的相似性。为了建立不同电池的广义电池老化模型,TS方法如下所示:

(1)建立源模型。SVR比神经网络和其他方法具有更严格的数学证明过程和更快的收敛速度。此外,它也适用于处理中小样本问题。因此,这里选择SVR来建立源模型。

(2)建立堆叠模型。对于每个SVR源模型,目标电池的部分数据被替换到每个源模型中作为训练集,并且输出可以表示如下:

其中分别表示样本模型和源模型的数量。

(3)为了获得可靠和稳定的模型,对目标模型进行了k次交叉验证。然后,用一小部分实验数据建立了目标电池的SVR模型,表示为。其输出表示为

(4)每个模型的权重系数如下所示:

约束条件为:

其中是权重系数;是每个模型的输出;是SOH的真实值。综上所述,得到了基于TS的SVR模型(TS-SVR),其表达式如下:

具体地,如果特定的源模型与目标模型高度相关,则系数的大小将很大,这意味着给模型分配了很大的权重;如果源模型与目标无关,那么将为小系数,这意味着相应的模型被赋予了一个小权重。

实验结果与分析

所提出的SOH估计方法如图4所示。首先,分析电池的老化数据,并从CC充电过程中的IC和电压曲线中提取特征。然后,使用决策树中的重要度函数来获得模型中每个特征的权重,并且对不同电池的每个特征的权重值进行评估和排序,以选择用于基于TS的模型的最广义的特征集。最后,使用TS方法对源模型进行堆叠。通过求解优化问题获得每个模型的权重,并将其应用于建立目标电池的SOH估计模型。

图4 所提出的SOH估计方法流程

实验使用交叉验证方法建立以下组:第一组使用基于B2、B11和B12电池的TS-SVR模型来估计B1,第二组使用基于B1、B11、B12电池的TS-SVR模型估计B2。每组使用第三节中选择的特征集作为模型的输入,SOH作为模型的输出来训练模型。在每组中,分别基于源数据集建立堆叠SVR模型。然后,将目标电池的前30%老化数据用作训练集,将剩余的老化数据用作测试集。通过训练集解决堆叠模型中的权重优化问题,然后将源模型转移到目标电池模型。用于比较的GPR和SVR都是由来自目标电池组的部分数据建立的。此外,我们增加了三种基于迁移学习的神经网络方法作为比较方法。深度神经网络(TL-DNN)由四层组成(一个输入层、两个隐藏层和一个输出层,每个隐藏层有十个单元)。递归神经网络和长短期记忆神经网络的方法参数与DNN相同。

图5、图6和表2显示了所提出的TS-SVR和其他算法的误差分布和估计结果。如图所示,GPR方法的估计性能最差,这可能是由于缺乏训练集数据,导致先验知识不足,后验估计产生较差的估计结果。SVR和神经网络方法由于其良好的拟合能力而优于GPR方法。值得注意的是,三种神经网络方法的性能各有优点,不同电池的估计性能各不相同。尽管神经网络方法的拟合精度优于GPR方法,甚至接近SVR方法,但由于迭代时间长,其效率远低于SVR方法。TS-SVR方法在每组中的结果是六种方法中最好的,此外,从误差分布可以看出,所提出的TS-SVR方法的估计误差主要集中在[-0.01,0.01],比其他方法更准确、更稳定。

图5 B1和B2的SOH估算结果。(a)-(g)为B1,(h)-(n)为B2。(a)和(h)为估算结果,(b)-(g)和(i)-(n)为不同模型的误差分布

图6 B11和B12的SOH估算结果。(a)-(g)为B11,(h)-(n)为B12。(a)和(h)为估算结果,(b)-(g)和(i)-(n)为不同模型的误差分布
表2 不同电池采用不同算法的SOH估计结果

结论

本文提出了一种基于数据驱动与迁移堆叠的锂离子电池SOH估计方法。首先,对集成决策树中的杂质进行分析,得到特征维数较小的最优特征集。其次,使用迁移堆叠来处理多个电池源模型。随后通过传递过程建立了SOH估计模型。利用目标电池的部分数据来解决优化问题,量化每个源模型的权重,从而获得目标电池的泛化模型。三组电池的对比实验表明,TS-SVR方法仅用目标电池的前30%数据就可以准确估计电池的SOH。特别地,与基于迁移学习的神经网络相比,它具有更好的结果和更高的效率,这充分验证了TS-SVR的准确性和可靠性。

本文存在的局限性为没有充分考虑操作条件中的不确定性。在未来的工作中,将研究不同的环境温度和充电剖面对所开发的SOH估计方法的影响。

推荐阅读

在混合操作条件下使用物理驱动的机器学习进行原位电池寿命预测

虚拟断层扫描技术:基于机器学习支持测量的加工过程阶段分割新方法

一种用于动态工作条件下锂离子电池多状态估计的CNN-SAM-LSTM混合神经网络

融合物理知识的数据驱动方法——飞机发动机全生命周期退化监测

基于条件生成对抗模仿学习的自动驾驶汽车动态测试场景生成方法

基于粒子滤波和在线特征融合及选择的损伤预测研究

基于人工智能的锂离子电池健康诊断:利用恒流恒压充电的瞬态阶段

基于参数优化的多核相关向量机的锂离子电池循环老化预测

强化学习协助进化计算方法的综述与展望

一种提高物理信息神经网络可靠性的原则性距离感知不确定性量化方法


学术人人
传播科学与学术研究动态,发布学术领域重要研究成果。 重点推广可靠性系统工程(包括可靠性、维修性、保障性、测试性、安全性和环境适应性)理论研究成果,传播相关知识。
 最新文章