IF 14.7 | NREL,USA | 机器学习用于预测热失控下LIB的放热变异性

文摘   2024-10-15 10:08   新加坡  
声明:推文作为学术交流用途,无任何商业用途,如有侵权或解读错误之处,请在后台留言指正~ 
点击阅读原文查看原文 
 1. 原文链接

DOI Link:

https://doi.org/10.1038/s41467-024-52653-3

 2.通讯作
  • Googleshcolar

https://scholar.google.com/citations?user=reEtYEkAAAAJ&hl=en&oi=sra

https://scholar.google.com/citations?user=yF7-XWcAAAAJ&hl=en&oi=sra

  • ScienceDirect: 
https://www.scopus.com/authid/detail.uri?authorId=56613490600
https://www.scopus.com/authid/detail.uri?authorId=57195493578
  • UniversityWeb:
https://research-hub.nrel.gov/en/persons/donal-finegan

https://research-hub.nrel.gov/en/persons/paul-gasper

 3. 收录日期

Received: 28 February 2024

Accepted: 13 September 2024
Published: 27 September 2024
 4. 研究内容

1. 科学问题

  • 通过多次喷射质量测试和少量热输出测量预测任意电芯类型的热输出分布

2. ML模型方法

  • 数据收集

    • 通过分级热失控量热计 (FTRC) 进行多年的实验,测量电池热失控结果。

    • 测量项目包括总热输出、正极和负极释放的热量、壳体的热量,以及电池的质量喷出。
    • 大部分FTRC实验在同步辐射设施进行,以便用高速X射线拍摄热失控过程。

  • 数据预处理

    • 选择平衡的数据集用于模型训练,排除了定制电池和内置短路装置的测试电池。

    • 仅使用样本数超过10的电池,且限定为100% SOC的商业电池。

    • 总热输出和分级热量输出通过电池的放电容量(kJ/Ah)进行归一化,显示出热输出和喷出质量的相关关系。
  • 建模方法

    • 使用链式回归预测归一化的总热输出及分级热量输出。回归顺序为:电池主体、负极、正极、总热输出。

    • 链式回归可避免累积误差,但也测试了独立模型,发现性能略差。目标数据在训练集中进行了z-score归一化
  • 特征选择

    • 预测特征包括电池元数据(如类型、制造商、充电容量)、FTRC实验记录(失效机制、底部通气装置激活)和热失控后的质量数据。

    • 数值特征做了z-score归一化,分类特征如制造商则采用one-hot编码。
  • 模型架构与评估

    • 使用“零样本”模型“i样本”模型进行测试。

    • 基线模型SVM模型(线性核)被用于预测,其中SVM性能更优,适合小数据集,优化分类边界。XGBoost模型略差。

    • 模型通过马氏深度、RMSE和KL散度等指标进行评估,并通过椭圆展示深度分布。
  • 模型预测的评估

    • 通过马氏深度分析预测值与实际值的相似性,高深度表示与其他分布点的相似性高。

3. 研究结果

3.1 数据集

  • 1. 数据标准化与简化分析

    • 总热输出的绝对值与电芯的充电容量、质量和尺寸相关,为简化分析,将总热输出按充电容量归一化喷射质量按总质量归一化

    • Fig. 1 展示了8种用于模型训练的电芯类型在TR期间的喷射质量分数、归一化总热输出和分数归一化热输出(正极、电芯主体和负极)的分布
  • 2. 实验电芯类型和测试集:

    • 商业生产的18650或21700规格、100%充电状态、样本数超过10的电芯作为模型训练数据。

    • 100% SOC但样本数少于10个、低SOC或经过改装的电芯数据用作模型性能的二级测试集。
  • 3. 喷射质量与热输出的趋势:

    • 不同电芯类型的喷射质量分数和总热输出的中位数与方差差异较大,通常喷射质量低与总热输出低呈正相关。

    • 喷射质量分数的方差大并不一定对应热输出方差大(如KULR 18650-K330)
  • 4. 分数热输出的观测:

    • 电芯主体的热输出在不同电芯类型中最为一致。

    • 正极和负极热输出的均值和方差变化较大。

    • 某些电芯类型(如LG 18650-MJ1和Sanyo 18650-A)的负极热输出为零或接近零,而其他类型(如KULR 18650-K330)的负极热输出占总热输出的50%。

Fig. 1. Distributions of heat and mass output behaviors of cells.
  • 1. 研究背景与动机

    • 观察到总喷射质量分数与归一化总热输出之间存在一般相关性,因此研究是否可以仅通过喷射质量的测量预测热输出。
  • 2. 总体相关性分析:

    • Fig. 2a 显示了喷射质量分数与归一化总热输出的线性回归,存在相当大的噪声,但整体上仍表现出较强的相关性。
  • 3. 单独电芯类型的相关性差异:

    • Fig. 2b 展示了对每种电芯类型的独立分析,发现整体数据集的喷射质量与热输出的关系比任何单独电芯类型的关系更强
    • 不同电芯类型之间的相关性强度存在显著差异。例如:
  1. LG 21700-M50:表现出正斜率和相对较窄的置信区间,表明喷射质量与热输出之间的强相关性。
  2. LG 18650-MJ1:显示出零斜率和较宽的置信区间,表明两者几乎没有相关性。
  • 4. 结论与启示:

    • FTRC结果的依赖性因电芯类型而异,因此需要将不同电芯类型独立对待。

    • 总体趋势表明,对于新电芯类型,使用少量FTRC测量数据仍然有可能进行合理的热输出预测。

    Fig. 2: Linear regression fits for heat and mass output data.

    3.2 电芯热行为的预测

    • 机器学习模型的训练目标

      • 数据处理步骤 Fig. 3训练机器学习(ML)模型预测电池在热失控(TR)期间的归一化分数热输出。

      • 未进行异常值过滤:因为高热输出或高喷射质量分数代表最严重的故障情况,保留在数据集中非常重要。
    • 热输出的预测方法:

      • 通过链式回归预测归一化的电芯主体、负极、正极和总热输出,因为总热输出是所有分数热输出的组合。

      • 链式回归比独立预测各热输出的误差更低。

      • 特征包括电芯元数据、FTRC实验记录、以及TR后的质量数据(绝对值和归一化值)。
    • 模型性能评估与数据划分:

      • 评估新电芯类型数据预测性能时,将数据分为训练集和测试集,所有测试集数据来自一种电芯类型,其余数据用于训练

      • “零次预测”模型:对于测试电芯,不使用任何已测量的热输出值进行预测。
    • “i次预测”模型与采样偏差:

      • 探讨通过进行额外的FTRC测量来校准新电芯类型的热输出预测的影响,即“i次预测”模型,其中i个来自测试电芯的数据样本被添加到训练集中。

      • 这引入了采样偏差。例如,KULR 18650-K330电芯有22种可能的1次预测模型,不同的FTRC试验样本添加到训练集会导致不同的模型效果。
    • 模型架构与比较:

      • 基线模型:线性回归模型,仅使用喷射/保留质量特征,通过全局回归进行零次预测,通过局部线性回归进行i次预测(Fig. 2)。

      • 三种模型架构:基线模型、支持向量机(SVM)模型和梯度提升树模型(XGBoost)。

      • 比较基线模型、SVM和XGBoost模型,展示了使用之前的FTRC测量数据和电芯元数据进行热输出预测(零次和i次预测)的优势,相较于将每种电芯类型视为独立实验。
    Fig. 3: Overview of data-treatment process.
    3.3 预测结果分析
    • 1. 模型性能比较与分析

      • 零次预测:SVM模型在8种电芯类型中,4种表现优于基线模型,2种表现相当,2种略差。

      • i次预测(i = 1到5):SVM模型在加入少量FTRC测量数据后,预测结果趋近于使用所有数据的结果,特别是在i = 1时改进最为显著表明通过一次测量可以校准“异常”电芯类型的热输出预测

      • 基线模型错误大且置信区间宽,原因在于将每种电芯类型独立处理,需要大量样本才能准确估计热输出。

      • Fig. 4a–h 比较了基线模型、SVM模型和XGBoost模型在不同电芯类型上的RMSE。

    • 2. SVM与XGBoost模型比较:

      • 相较于XGBoost,SVM模型在大多数电芯类型上表现更准确且不确定性更低,因此后续结果都基于SVM模型

      • SVM模型在次级测试集(测量少于10次或经过改装的电芯)上表现良好,证明了训练模型在新数据上的外推能力(Fig. 5)。
    • 3. 各热输出的RMSE分析:

      • 总热输出的RMSE差异较大,最差的电芯(LG 18650-MJ1)约2.2kJ/Ah,是最佳电芯(KULR 18650-K330)的两倍。

      • 正极和主体热输出的RMSE分别在1-2kJ/Ah0.5-1kJ/Ah之间,但负极热输出的RMSE变化超过10倍(0.2-2kJ/Ah),表明负极热输出与喷射质量在多数电芯类型中无一致关系。

      • 电芯主体的热输出预测准确度最高且置信度高,即使在i = 1时也表现良好,因为各电芯类型间电芯主体的热输出分布波动较小。

      • Fig. 4i–l比较了不同电芯类型的归一化总、正极、主体和负极热输出的RMSE。
    • 4. 预测分布与实际分布对比:

      • 零次预测模型准确预测了约一半电芯类型的分布,但未预测好的情况表现出两个特点:偏向全局均值、预测方差明显小于实际方差。

      • 随着i增加,预测分布的均值逐渐趋向实际分布。但对于“难以预测”的电芯类型(如LG 18650-MJ1、LG 18650 (BV-250)、Sanyo 18650-A),实际分布的波动性从未被模型完全学习到。

      • Fig. 6 展示了i = [0, 1, 3, 5]时归一化总热输出的预测与实际分布
    • 5. 热失控与充电状态(SOC)的关系:

      • 热和质量输出与SOC高度相关,高SOC导致更剧烈的热失控事件

      • 仅用100% SOC训练的模型不能很好地外推至低SOC,但即便是少量低SOC数据的加入,也能提高对新电芯类型的准确预测Fig. 7)。
    • 6. 结论与应用意义:

      • 喷射质量值和电芯元数据可以用于ML模型准确预测平均总和分数热输出。

      • 虽然分布的均值预测得很好,但初步估计异常情况(如极少数出现的异常高热输出)也同样重要,以确保电芯在热失控事件中的安全性。

    Fig. 4: Root mean squared errors (RMSE) for predicted heat outputs from cells.

    Fig. 5: (a-i) Root mean squared error (RMSE) for the total predicted heat outputs for i = 0 to i = n for each cell in the second test set.   For baseline (black) and SVM (blue) models, median RMSE for each i is denoted using a line, while 1σ and 2σ confidence intervals are shown using the dark and light shaded regions.

    Fig. 6: Actual and SVM predicted distributions of normalized total heat outputs from cells.

    Fig. 7: a) RMSE when main SVM model trained on only 100% SOC cells tested on trials of cells at lower SOC. b) RMSE when training expanded to include all MJ1 cells, including those at lower SOC’s. Total heat output plotted versus total ejected mass fraction for predicted and actual states for charge for c) LG 18650-M36 cell and d) MoLiCEL 18650-p28A which had no trials included in training model.

    3.4 异常值的预测性能

    1. 异常值的预测性能

    • 关注高热异常值,因其对电池系统的设计及防止热失控传播至关重要

    • 电芯热行为不仅受喷射质量的多少影响,还受喷射时机(如喷射时的温度)影响,这种复杂性使某些故障情景更具危害性

    • 方法:Kullback-Leibler (KL) 散度马氏距离图,分析了预测与实际热输出分布的相似性及误差来源。
  • KL 散度分析:

    • Fig. 8 显示了各电芯归一化总热输出的KL散度。相比RMSE,KL散度更能区分电芯分布预测的准确性,其最优和最差的差距为4倍,而RMSE为2倍

    • 进一步分析发现最差的KL散度和RMSE来自不同电芯(Sanyo 18650-A与LG 18650-MJ1),需要对两者进行深入研究。

    • KL散度随着更多数据的加入持续减小,表明所有电芯都在持续学习,而RMSE在i = 5到10时趋于稳定。
  • 马氏距离图分析:

    • LG 21700-M50:实际分布表明总热输出与总喷射质量之间有相关性,零次预测不能完全捕捉,但随着i = 3和10的增加,预测逐渐改善

    • Sanyo 18650-A:总热输出和喷射质量几乎无相关性,即使训练了10个样本,模型也难以准确预测热输出的波动性。

    • Fig. 9 展示了两种电芯的马氏距离图,一个随着i增加不断改善(LG 21700-M50),另一个则变化不大(Sanyo 18650-A)
  • 部分与总质量/热输出关系的差异:

    • 总喷射质量和总热输出几乎无相关性(接近圆形),但部分喷射质量和热输出间存在较强相关性,特别是电芯主体和负极。

    • 随着i增加,总热输出预测未显著改善,但部分热输出能更好地学习实际分布的均值和方差。

    • Fig. 10 LG 18650-MJ1电芯在i = 0和i = 3时的马氏距离图
  • 特征影响分析 (SHAP):

    • 电芯类型对总热输出预测的影响适中,特别是LG 18650-MJ1,由于其采用石墨-硅复合电极,能量密度较高,导致热输出更高

    • 顶部排气口和电芯容量对正极和总热输出的影响较大,而底部排气口几乎无影响,可能因为底部排气口的作用是冗余的。

    • 预测中最重要的特征是实验测量值(喷射质量),其中测试后电芯主体质量和负极喷射质量对模型预测影响最大。

    • Fig. 11 通过SHAP值量化了各输入特征对模型预测的相对影响。
  • 设计与实际关联

    • 低测试后电芯主体质量与高总热输出有关,因为高喷射质量常与低测试后主体质量及热生成相关。

    • SHAP分析表明回归模型的特征影响符合直觉,增强了通过喷射质量和电芯细节预测热输出的信心。

    结论

    • 通过KL散度和马氏距离分析模型的预测性能,表明即使部分电芯类型显示出低相关性(如LG 18650-MJ1),也能通过部分喷射质量数据较好地预测热输出的波动性。

    • SHAP分析验证了模型预测中各特征的合理性,使得基于喷射质量和电芯设计细节的预测更具可靠性。这些分析结果为设计更安全、更抗热失控的电池系统提供了有价值的指导。

    Fig. 8: Kullback-Leibler (KL) divergence of SVM model predictions of normalized total heat outputs.

    Fig. 9: Mahalanobis plots of the total ejected mass fractions versus actual and SVM predicted normalized total heat outputs.
    Fig. 10: Mahalanobis plots for the LG 18650-MJ1 cell of the relative ejected/retained mass features versus the SVM predicted and actual normalized heat outputs.

    Fig. 11: Mean absolute Shapley additive explanations (SHAP) value of each feature for each of the four model targets.


    4. 总结

    • 1. 技术局限与数据集范围

      • 本方法与当前文献中大多数机器学习预测电池行为的方法类似,受限于可用的训练数据集。训练数据集中主要包含相似的正极材料(如不同配比的LiNiMnCoO2和LiNiCoAlO2)和相似的负极材料(石墨及含有少量SiOx的电芯),因此建议只在相似的电芯类型和测试条件下使用该模型(如Fig. S1和S2中的次级测试集电芯结果)。

      • 若在其他条件下使用(如含LiFePO4正极或纯Si/SiOx负极的电芯、经历复杂循环历史的电芯、低荷电状态的电芯,以及经历过度充电或钉刺等不同滥用条件的电芯),模型预测效果可能不佳。

      • 随着Battery Failure Databank数据库的扩展,更多种类的化学物质、荷电状态和循环历史将被加入,进一步增强在新领域预测电池行为的信心。
    • 当前模型应用与预测性能

      • 市场上有大量18650和21700电芯,许多与本文中评估的电芯化学性质相似,但因工程和成分上的微小变化而导致不同的功率和能量密度。该方法可通过大量低成本快速测量的喷射质量数据,准确估计这些电芯的总热输出和部分热输出分布。

      • 5次FTRC测量可用来建立某种电芯类型的喷射质量与热输出的关系,然后通过数十到数百次喷射质量测量结合机器学习模型来估计热失控事件的热输出变异性。

      • 在次级测试集中的LG 18650 M36电芯,有着不同的外壳厚度和是否有底部排气口的差异,SVM模型在只用5次FTRC测量的情况下,能够以低不确定性预测每种电芯类型的热输出幅度和变化。
    • FTRC技术的未来扩展

      • 未来工作将拓展FTRC技术至其他电芯形式,如棱柱形或软包电芯。若这种基于喷射质量估计热输出的方法能推广至这些新电芯形式,将大幅减少大型锂电池安全测试的成本

      • 该方法应与其他电池安全测试结合,如使用加速量热法确定热失控起始温度,以制作商用锂电池的定量安全图谱,帮助系统工程师更好地设计无传播电池组
    • 实验与预测的结合

      • 结果表明,通过少量的FTRC测量补充大量喷射质量测量数据,可以准确预测许多商用18650和21700电芯的热失控期间的部分热输出分布。

      • SVM模型在8种电芯类型的139次FTRC测量中表现出色,仅用1次FTRC测量就能预测大多数电芯的平均热输出,误差小于2kJ/Ah(误差约为10%),且只需5次FTRC测量便可自信地估计热输出分布,包括异常高的热输出。

      • 通过增加喷射质量测量次数,能够进一步增强对任何电芯的热输出分布异常值预测的能力。
    • 机器学习在电池安全测试中的前景:

      • 数据驱动的方法能极大减少电池安全测试所需资源,通过少量实验量热试验来预测热输出的初始分布。然而,这种方法不应替代实验,仅作为初步评估电芯适用性的工具。

      • 目前的训练数据仅覆盖了完好电芯在满荷电状态下、有限的电极和电解质化学性质;随着Battery Failure Databank不断扩展,增加新的电芯化学成分、不同荷电状态和不同循环历史,该方法将帮助加快设计安全锂电池系统所需的关键数据的获取,提升锂电池的安全性和可靠性。

    知识点补充:

    1. SVM模型

    1. 基本概念

    • 目标:SVM的主要目标是找到一个最优超平面,以最大化数据点(支持向量)与超平面的间隔,从而实现对不同类别的有效分类。

    • 超平面:在二维空间中,超平面是一条直线;在三维空间中,它是一个平面;在更高维度中,它是一个超平面。

    2. 工作原理

    • 线性可分:在理想情况下,SVM假设数据是线性可分的,即可以用一条直线(或超平面)将不同类别完全分开。

    • 支持向量:支持向量是距离决策边界最近的样本点。这些点对定义边界起着关键作用,因此称为“支持向量”。

    • 间隔最大化:SVM旨在最大化支持向量与超平面之间的间隔,以提高模型的泛化能力。

    3. 核方法

    当数据在原始特征空间中不可线性分离时,SVM使用核函数将数据映射到更高维空间,以实现线性可分。常用的核函数包括:
    • 线性核:适用于线性可分的数据。

    • 多项式核:将数据映射到多项式特征空间。

    • 高斯径向基核(RBF核):适用于复杂的非线性分离问题。

    4. 优势与劣势

    • 优势

      • 适用于高维数据,尤其是在特征数量大于样本数量的情况下。

      • 在处理非线性问题时,使用核方法能够有效分类。

      • 有良好的泛化能力。

    • 劣势

      • 对参数选择和核函数的选择较为敏感。

      • 训练时间较长,尤其是在大型数据集上。

      • 不易于处理噪声数据,可能导致过拟合。

    5. 应用领域

    SVM被广泛应用于多个领域,包括但不限于:
    • 文本分类(如垃圾邮件检测)

    • 图像识别

    • 生物信息学(如蛋白质分类)

    • 财务分析和风险管理

    6. 实现与工具

    SVM可以通过多种编程语言和库实现,常用的包括:
    • Python:使用scikit-learn库的SVC类。

    • R:使用e1071包的svm()函数。

    • MATLAB:使用内置的SVM函数。

    7. 小结

    支持向量机是一种功能强大且有效的分类算法,适用于多种类型的数据集。通过合理选择核函数和参数,SVM能够提供准确的分类结果。在实际应用中,合理的数据预处理和特征选择也对SVM的性能至关重要。

    2. SVM模型在电池热失控预测中的应用

    支持向量机(SVM)是一种监督学习模型,擅长处理分类和回归问题。在本研究中,SVM模型被用于预测锂电池在热失控过程中的热输出表现,具体体现在以下几个方面:
    1. 模型功能与目标

    • SVM模型的主要功能是通过学习喷射质量与热输出之间的关系,预测不同类型锂电池在热失控过程中产生的热量。这对指导电池设计,尤其是在降低热失控风险和传播的设计中,有重要意义。

    • 该模型不仅限于预测热输出的平均值,还试图捕捉输出分布中的离群点,以便识别和应对那些异常高热量的热失控情况。

  • 输入与特征:

    • SVM模型使用多种输入特征,包括电池的设计细节(如电极成分、外壳材料等)和实验测得的喷射质量数据。

    • 为了更好地理解各特征的影响,使用了SHAP分析(Shapley Additive Explanations),确定了哪些输入对模型输出最为重要。分析发现,电芯的设计细节如顶部排气口的存在和电池容量对正向热输出有较大影响,而负向热输出与负喷射质量的相关性更强。

  • 模型的表现和分析:

    • 通过对比Fig. 4、Fig. 6Fig. 9中的结果,可以看出SVM模型在预测热失控中的平均热输出表现良好。即使在一些样本有限的情况下,也能较为准确地估计热输出的幅度和变化。

    • SVM模型能够区分喷射质量和热输出之间的强相关性或弱相关性。例如,对于像Sanyo 18650-A这样的电芯,该电芯的喷射质量与热输出呈现出较弱的相关性,模型虽然能预测平均值,但难以预测其变异性。在这些情况下,SVM模型通过反映出高预测不确定性,提示应增加更多的FTRC实验数据来提高预测效果。

  • Mahalanobis距离与热输出分布的分析:

    • 使用Mahalanobis距离图(如Fig. 9和Fig. 10)来展示SVM模型的预测分布与实际观测值的差异。

    • 图中显示了不同电芯在训练和未训练情况下的热输出分布,尤其是在增加了喷射质量样本后的变化。Mahalanobis图表明,对于一些电芯(如LG 21700-M50),随着更多样本数据的加入,SVM模型能够持续改进预测准确性;而对于Sanyo 18650-A这种喷射质量和热输出相关性较弱的电芯,即便增加训练数据,也未能明显改善预测结果。

  • 预测方法的优缺点:

    • 优点:

    1. SVM模型能够快速对电芯进行分类,标记出潜在的高风险热失控样本。在实际应用中,只需少量的FTRC测量即可快速得出热输出分布的初步估计。

    2. 能够捕捉喷射质量与热输出的非线性关系,通过合理设计的输入特征,可有效用于多种不同电芯类型的热失控行为预测。

    3. 通过ML方法,可以减少昂贵的实验成本,缩短数据采集的周期。

    • 缺点:

    1. 模型依赖于训练数据的覆盖范围,当前仅限于少数几种电芯类型和化学成分。在面向不同电芯时,尤其是不同化学成分、设计和使用历史的电芯,模型可能无法准确预测其热失控行为。

    2. 在喷射质量与热输出之间不存在明显相关性的电芯类型(如Sanyo 18650-A),模型无法很好地预测热输出的变异性。

  • 进一步研究方向:

    • SVM模型可以作为初步筛选工具,用于评估电芯的热失控风险,未来可与其他机器学习模型和传统量热方法结合使用,以构建更全面的电池安全评估体系。

    • 进一步优化模型输入特征,例如引入更多化学、电气和机械特性,将有助于提高模型在不同电芯上的预测适用性。

    • 随着Battery Failure Databank数据库的不断扩展和更多实验数据的加入,SVM模型的预测能力将不断提高,尤其是在应对具有更广泛变异性的电芯时。

    结论

    SVM模型在电池热失控行为预测中的应用,为快速评估不同电芯的热失控风险提供了有效工具。通过结合多种输入特征,模型能够在少量实验测量的基础上,预测出电芯的平均热输出和变异性。尽管模型在一些相关性弱的电芯类型上表现不佳,但总体上,该方法能大幅提高电池安全测试的效率。未来研究应进一步丰富训练数据和输入特征,以更好应对不同电芯类型的安全挑战。

    • PDF 

                                     

    仿真储能
    本平台主要更新关于锂离子电池、固态电池等储能元件仿真的最新文章和来自各国的能源新政策!欢迎关注!
     最新文章