基于充电健康因子优化和数据驱动的锂电池剩余使用寿命预测*

2024-01-28 04:46段慧云夏威邵杰汪洋青李彬
汽车技术 2024年1期
关键词:老化神经网络电池

段慧云 夏威 邵杰 汪洋青 李彬

(1.九江职业技术学院,九江 332007;2.武汉理工大学,武汉 430070;3.上汽通用五菱汽车股份有限公司,柳州 545005)

主题词:锂离子电池 剩余使用寿命 两步最大信息系数 时间卷积神经网络 注意力机制

1 前言

锂电池具有高比能量、低自放电率等特性,在新能源汽车领域得到了大规模应用。然而,在使用过程中,电池容量会出现不可逆衰减,引发潜在的安全问题。因此,对电池健康状态(State Of Health,SOH)和剩余使用寿命(Remaining Useful Life,RUL)的准确估计是保障电动汽车安全可靠的关键问题[1]。

电池的RUL 无法直接测量,只能通过电池内部参数变化与电流、电压、温度等参数的映射关系间接进行状态估计。常用的状态估计方法可以分为基于模型的方法和数据驱动法两类[2]。

基于模型的方法主要利用卡尔曼滤波、粒子滤波及其变种来更新老化模型的参数[3-4],实现RUL 预测。由于电池充放电过程中存在复杂的物理、化学变化,单一的经验模型难以完整表达电池的老化行为。

基于数据驱动的RUL 估计方法具有无模型、精度高、鲁棒性强的特点,得到了国内外学者的广泛关注。数据驱动法使用机器学习或深度学习技术来学习历史退化数据,而不需要对特定的模型进行拟合,根据训练的模型预测未来的容量,直到容量达到寿命终点(End Of Life,EOL)[5]。长短期记忆(Long Short-Term Memory,LSTM)神经网络[6]和门控循环单元(Gate Recurrent Unit,GRU)神经网络[7]等门控循环神经网络(Gated Recurrent Neural Network,GRNN)常用于电池RUL 预测模型的建立。

健康因子(Heath Factor,HF)的提取是基于数据的RUL 预测方法的关键问题[8-9]。健康因子一般指从充放电过程中提取的特征,这些特征随老化循环呈现有规律的变化。学者[10-12]提取了各种健康因子并通过分析其与老化容量间的相关性来验证其效果,并用于RUL预测[13]。

Widodo 等[14]基于放电电压样本熵特征来估算锂电池的SOH。但是放电数据存在数据不稳定的问题,如锂电池使用环境的干扰造成测量数据不够精确,另外,在应用实际中鲜有电池电量单次全部释放的情况。相比于放电过程,电池的充电过程大多是静态的,受外界影响小,且往往在充满电后再消耗电量,故从充电数据中提取健康因子更符合实际应用。Jia 等[15]选取了8 个健康因子进行电池SOH 估计,但未考虑健康特征过多导致计算量大且信息冗余的问题。

为了解决所选取的健康因子不理想而导致的锂电池RUL 预测精度不高的问题,本文从较为稳定的充电过程中提取出与电池循环寿命具有相关性的14个老化特征作为健康因子,通过相关性分析筛选优化的健康因子,基于这些因子建立具有注意力机制的时间卷积神经网络(Attention Temporal Convolutional Network,ATCN)模型进行锂电池RUL 估计,并在公共数据集上验证所提出的预测框架的性能。

2 两步最大信息系数健康因子筛选法

2.1 数据集及健康因子提取

本文采用美国国家航空航天局(National Aeronautics and Space Administration,NASA)艾姆斯研究中心卓越诊断学中心(Prognostics Center of Excellence,PCoE)的锂电池公共数据集[16]中B0005、B0006、B0007 和B0018作为研究对象,并移除了异常的放电容量循环数据。数据集中电池采用恒流恒压的方式充电,以1.5 A 的电流充至截止电压4.2 V,之后恒压充电至截止电流20 mA。当电池达到寿命终点,即额定容量下降30%(从2 A·h 降至1.4 A·h)时,试验停止。通过充电过程中电压、电流、温度等信息提取电池的老化特征,B0005电池的部分循环信息如图1 所示。由图1 可以看出,电压、电流、温度随着循环的继续呈现规律性变化。电池的充电曲线分为恒流(Constant Current,CC)和恒压(Constant Voltage,CV)充电2 个过程,电池的温度也总是在恒流阶段达到峰值并逐渐降低。

图1 B0005电池部分充电数据

考虑到数据集采样时间的非均匀性和传感器误差,本文提取了充电过程中14个健康因子用于电池的RUL估计,如图2所示。所筛选的特征在输入模型前进行最大最小归一化处理,将特征约束在[0,1]范围内,以避免各参数数量级不同对预测结果的影响。

图2 B0005电池充电曲线健康因子

14个健康因子可以分为4组:

a.第1组。恒流充电阶段电流曲线、恒压充电阶段电流曲线、整个充电过程中电流曲线与时间轴围成的面积,分别定义为FH1、FH2、FH3。

b.第2 组。恒流阶段充电时间、恒压阶段充电时间、恒流阶段充电时间与恒压阶段充电时间的比值,分别定义为FH4、FH5、FH6。

c.第3组。恒流充电阶段电池温度曲线、恒压充电阶段温度曲线、整个充电过程中温度曲线与时间轴围成的面积,以及3条温度曲线分别与3条电流曲线围成面积的比值,分别定义为FH7~FH12。

d.第4组。恒流阶段电压曲线的最大斜率、恒压阶段电流曲线的最大斜率,分别定义为FH13、FH14。

2.2 健康因子优化方法

最大信息系数(Maximum Information Coefficient,MIC)用于衡量2 个变量X和Y间线性或非线性关系的强度,相比其他传统的统计学方法,如皮尔森相关系数法,最大信息系数法能更好地衡量非线性变量之间的关系,而不需要假设数据集的数学模型。2个变量之间的最大信息系数可以计算为:

式中,I(xi,xj)为xi和xj之间的最大互信息;p(xi,xj)为联合概率密度;p(xi)、p(xj)分别为xi、xj的边缘密度函数;M(X)xi,xj为对I(xi,xj)进行[0,1]范围内归一化计算的结果;CMI(X)为变量X的最大信息系数;s、t分别为网格划分的行数和列数;B(n)为网格的分辨率,一般取B(n)=n0.6;n为网格的行列数,即划分的网格为n行n列。

由于所提取的14 个健康因子具有不同的尺度,因此在计算最大信息系数前,使用最小-最大规范化使得所选的健康因子具有同一尺度:

式中,ai,j、分别为第i个特征中的第j个原始数据和规范化数据;分别为第i个特征中原始数据的最大、最小值。

所提出的两步最大信息系数健康因子筛选步骤如下:

a.剔除与老化过程相关性低,不适用于电池RUL预测的健康因子。分别计算从电池充电过程中提取的14 个健康因子与电池容量间的CMI。当CMI满足式(3)时,认为该特征可以用作待筛选的特征:

式中,FHi为第i个老化特征;C为锂电池的容量;δ1为主特征集的阈值;CMIi为第i个老化特征与容量C之间的最大信息系数。

电池B0005老化特征筛选结果如图3所示。第1步最大信息系数选择过程中取δ1=0.78,健康因子FH9、FH10、FH11、FH14与电池老化数据集之间的最大信息系数小于0.78,可以认为这4 个特征不适合用于RUL 的估计,故主特征集定义为F={FH1,FH2,FH3,FH4,FH5,FH6,FH7,FH8,FH12,FH13}。

图3 B0005中每个老化因子与老化容量之间的CMI

b.计算主特征集F中任意2 个老化因子间的CMI。主特征集F中的一些特征与循环老化强相关,但与其他老化因子之间的相关性较差。当特征集输入到神经网络中进行训练时,过多的特征会引起噪声,过少的特征又会丢失有用的信息。更重要的是,特征选取不合适可能会导致预测结果较差。第2 步最大信息系数用于分析各特征之间的深度相关性,确定最优特征。通过计算每个特征之间CMI的平均值,给出合理的阈值来选择最优特征:

式中,M为主特征集F中健康因子的数量;CMIj为第j行最大信息系数的平均值。

当所有特征的平均最大信息系数均大于阈值,形成最优特征集,如图4所示。由式(4)可以得出δ2=0.93,并将主特征集F中平均CMI小于此阈值的老化特征移除,得到新的特征集FS={FH1,FH2,FH3,FH4,FH5,FH6,FH7,FH12},如图4b所示。

图4 主特征子集F中各特征间的最大信息系数和平均最大信息系数

3 锂电池剩余使用寿命估计

3.1 剩余使用寿命估计方法

RUL 的估计过程如图5 所示,包括数据采集、特征提取与筛选、模型训练、剩余使用寿命估计。

图5 锂电池剩余使用寿命预测框架

本文采用ATCN 对预测模型进行训练。时间卷积神经网络(Temporal Convolutional Network,TCN)结合了卷积神经网络和循环神经网络的优点,增加了视野间隔,可提高训练速度,节省存储空间。注意机制的引入突出了关键信息的影响,避免了将所有历史数据都输入TCN 中,进一步提高了RUL 估计的准确性,ATCN 的结构如图6所示。ATCN的最终输出可以计算为:

图6 ATCN预测模型结构

式中,fTCN()为时间卷积神经网络运算;yt为t时刻模型的输出;hi为第i个隐藏层的输出;ci为第i个注意层输出的权重系数。

3.2 网络训练与结果分析

本文所用的锂离子电池老化数据来自PCoE的公开数据集,在B0005、B0006、B0007、B0018中,使用早期的试验数据训练模型,剩余的测试数据用于RUL 估计。采用简单循环神经网络(Simple Recurrent Neural Network,SimpleRNN)、LSTM神经网络和GRU神经网络等几种不同神经网络与ATCN进行比较,以验证所提出的混合网络的性能。本文定义额定容量的70%,即1.4 A·h为电池的寿命终点。在性能对比验证中,50%的试验数据用于模型训练,剩余的数据用于估计电池的RUL。使用均方根误差(Root Mean Square Error,RMSE)和平均绝对误差(Mean Absolute Error,MAE)评价预测性能,各算法在4个数据集上的预测结果如表1所示。由表1可知,这4 种算法在精度和计算效率上均有不同的表现。LSTM和GRU的预测结果接近,这是由于它们的模型结构类似,均为门控循环神经网络,ATCN在对4个数据集的预测中都表现出最优的结果,验证了所提出混合网络ATCN的优越性。

表1 不同网络结构下剩余使用寿命估计误差

为验证所提出的两步最大信息系数筛选方法的效果,分别使用未筛选、一步最大信息系数筛选法、两步最大信息系数筛选法得到3种健康因子训练ATCN。使用50%的数据集作为训练集,剩余的数据用于RUL 预测。3种健康因子的RUL预测结果如表2和图7所示。未经过筛选的健康因子并不适用于RUL 预测,因为其中与老化循环不相关的数据会给模型引入大量的噪声,从而影响预测结果。经过一步最大信息系数和两步最大信息系数筛选后的健康因子在RUL 预测中表现良好,但两步最大信息系数筛选的健康因子预测结果精度更高,在同样的超参数设置下,具有更高的计算效率,这主要是因为两步最大信息法不仅剔除了与电池老化不相关的健康因子,同时消除了用于训练的健康因子中低关联度的健康因子,降低了健康因子间的相互影响。

表2 不同筛选方法下剩余使用寿命估计误差

图7 50%训练集RUL预测结果

为了进一步验证所提出的方法性能,采用10%的数据用于模型训练,90%的数据用于RUL 预测,预测结果如图8所示。可以看到,更小的训练集会导致预测精度的下降,但是所提提出的方法仍然具有合适的预测精度,B0005 的平均绝对误差为0.63%,均方根误差为0.76%,B0018 的平均绝对误差为0.86%,均方根误差为0.87%,证明了健康因子子集的鲁棒性和适应性。

图8 10%训练集RUL预测结果

4 结束语

本文提出了一种两步最大信息系数健康因子筛选方法,分析了电池充电过程的电流、电压和温度曲线,对提取的14 个健康因子进行最优选择,作为注意力时间卷积神经网络的输入建立剩余使用寿命估计模型,并以PCoE 数据集中4 个电池数据集为研究对象,验证了方法的性能,剩余使用寿命预测的平均估计误差在1%以下。

所提出的方法是建立在电池充电过程中的老化特征提取,对放电过程中健康因子以及其他数据集的优化性能,需要进一步研究。

猜你喜欢
老化神经网络电池
延缓大脑老化,要怎样吃
电池很冤
“一粒盐电池”
把电池穿身上
穿在身上的电池
神经网络抑制无线通信干扰探究
节能技术在开关电源老化测试中的应用
杜绝初春老化肌
基于神经网络的拉矫机控制模型建立
复数神经网络在基于WiFi的室内LBS应用