基于时空分布映射的大规模电池健康状态研究

2022-07-04 05:28陈东东张锦霞张之琛马星星张志宏

智慧电力 2022年6期

王波，陈东东，张锦霞，张之琛，马星星，张志宏

（1.国网陕西省电力公司信息通信公司，陕西西安 710065；2.上海交通大学生物医学工程学院，上海 200030；3.厦门大学信息学院，福建厦门 361005）

0 引言

铅酸蓄电池由于其价格低廉，高低性能稳定、安全性高、资源再利用性好等诸多优势，已逐步成为化学电池市场中使用范围最广的电池，广泛应用于动力系统、智能变电站、UPS 系统、大型储能设备等领域。然而，由于缺乏有效地维护和性能诊断手段，很多蓄电池组在实际使用中远远达不到额定使用寿命，经常会出现供电能力不足的问题[1-2]。现有的铅酸蓄电池在使用2—3 年后，大部分很难通过容量检测[3-4]。导致蓄电池组早期失效的主要原因是蓄电池组中有劣化单体电池的出现。由于蓄电池组各单体电池存在不一致性，使蓄电池组放电时，健康电池放电不到位（达不到截止电压），劣化电池过放电；充电时，健康电池过充电，而劣化电池充电不到位，进一步增大了蓄电池组的不一致性[4-6]。随着电池不断充放电，单体电池之间的差异不断增大，由于“水桶效应”，最终导致蓄电池组因个别单体的早期失效无法正常工作。此外，劣化电池将首先影响其附近的单体电池，并逐步扩散，最后导致整组电池不能正常工作[7-8]，严重影响到关键设备的供电安全和紧急情况下的供电安全。过充和过放现象，也容易导致其寿命缩短，容量衰减严重，故障停运的几率增加[9-10]。

为了确保蓄电池组的实际工作性能，国家和电力行业针对蓄电池组的存储、安装、验收和日常维护、定期容量测试制定了详细的标准和规程。根据《蓄电池电源装置运行与维护技术规程》相关规定，为保证蓄电池组和直流电源系统的安全可靠运行，对1 年以上的蓄电池组要求1—2 年做1 次深度超过蓄电池容量30%的核对性放电容量测试，对新投运的蓄电池组要求6 个月做1 次核对性放电[11-12]。目前蓄电池的主要维护方式是人工现场维护，对于配备大量蓄电池的企业，实际工作中难以达到维护规范的要求。同时，人工记录的数据缺乏统一的标准，也不能实时准确地反映蓄电池状态，难以进行有效地分析和评估。因此，各企业的绝大多数蓄电池组长时间处于维护失控状态，导致各种停电事故层出不穷，给企业造成大量损失。

因此企业急需在线对蓄电池进行性能评估的技术，实现同时监控大量蓄电池组的工作状态，自动完成对蓄电池放电数据的记录和分析，有效估测蓄电池组的性能[13-14]。

现有的电池健康状态预测方法大多仅依赖单一时间序列性提取电池特征[15]，本文提出了多状态空间维度和动态演变时间维度2 个层面对电池健康状态进行预测。通过各种传感器观测包括电流、电压、温度、内阻等时序特征，观测不同倍率下、不同健康状态的电池周期变化，训练得到强鲁棒性神经网络模型。通过聚类得到模式匹配。

本文将多尺度聚类理论应用于电池状态集的划分构建，结合具有时间性的序列切片，建立时空融合的电池健康状态神经网络预测模型。模型对原始电池放电观测样本的训练数据进行特征提取，得到的综合变量作为深度神经网络的输入，将测试数据基于训练数据得到的聚类中心进行近邻归类，最终通过模型回归预测每个样本的健康状态值。相比现有的深度学习方法，实验在小样本训练的基础上，相比现有方法准确性提升近4%，实现了对于实际工况环境下电池健康状态高效预测的需求。

1 数据驱动电池健康状态分析技术概述

1.1 电池健康状态评估

铅酸电池目前广泛应用于日常生活中，电力系统在不间断电源设备（Uninterruptible Power System，UPS）及智能变电站使用。铅酸电池应用在UPS 中，可保证终端设备不会因短暂停电而中断、并且可以一直供应高品质电源，有效保护精密仪器。为了降低UPS 在使用中存在的因电池衰退导致的不可预测风险，对铅酸电池剩余电池容量和健康程度进行预测尤为重要。现有的电池健康预测方法通常是在观测到电池直观状态参数发生突变时才判定电池故障，从而进行电池更换[16-17]。但是在这种情况下，电池已经达到乃至超出正常可使用寿命限制，可能已经因没及时更换电池而发生了一些意外事件，因此及时对电池剩余容量进行预测可以避免因电池剩余容量不足而造成的意外状况。

研究中常使用电池健康状态（State of Health，SOH）指标来进行衡量，其量值为SOH，常用于表示蓄电池实际容量、性能状态等与新电池的性能差异情况，一般按照等级进行分类[18]。如按照电池使用一段时间后实际性能参数与标称参数的比值分类，新出厂电池比值为100%，完全报废比值为0%，基于数据驱动的方法对电池SOH 预测常使用K-means，深度神经网络等技术。

根据厂家和客户的经验分类，电池根据SOH 可以分为：A 等健康、B 等良好、C 等一般、D 等较差、E等损坏等，详细见表1。

表1 电池健康状态分级表Table 1 Battery health rating table

电池健康状态SOH 计算公式为：

式中：C0为电池的额定容量；Ct为电池在第t个周期从浮充状态经过完全放电所放出的实际容量。

1.2 K-means聚类分析

聚类分析指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程[19]。其目标是在相似的基础上收集数据来分类。聚类技术被用作描述数据，衡量不同数据源间的相似性，以及把数据源分类到不同的簇中。

均值聚类算法[20]（K-means）是一种通过不断迭代进行求解聚类中心的聚类分析算法。其步骤为：（1）首先将所有数据D={di}预先分成K组，从K组数据中分别各选取1 个样本对象作为初始的聚类中心，这些中心节点可以组成聚类中心集合A={a1,…,aK}，每个聚类中心对应1 个不相同的类别。（2）分别计算所有样本与各个初始聚类中心之间的距离。距离用欧几里得距离计算，即多维空间中各个点之间的绝对距离，用公式表示为：

式中：xi，yi均为样本；dis t(X,Y)为样本xi，yi之间的欧几里得距离。（3）得到每个样本到各个聚类中心的距离，将该样本分配到距离最小的聚类中心所对应的类中。针对每个聚类中心对应的类别，通过计算所有属于该类别的样本平均值重新确定其聚类中心，用公式表示为：

式中：ai为该类别的聚类中心；ci为该类别的样本的集合。重复迭代距离计算及聚类中心计算操作，直到达到预设的终止条件，如迭代次数或最小误差变化等。

1.3 深度神经网络

深度神经网络[21-22]（Deep Neural Networks，DNN）是深度学习的基础，是基于感知机[23]（Perceptron）的扩展。

感知机是基于若干输入进行非线性映射，得到1 个输出结果模型，如图1 所示。

图1 感知机模型Fig.1 Perception model

感知机模型可以有效地进行二元判别，但是难以学习到高度负责的非线性函数关系，因此无法取得大规模实际应用。在感知机的基础上，通过多层堆叠，引入隐藏层，可大幅增加模型的非线性拟合能力[24-26]。此外，通过增加模型输出，可进一步增强模型的应用范围，例如分类任务、回归任务等。深度神经网络模型示意图如图2 所示。

图2 深度神经网络模型Fig.2 Deep neural network model

本文首先在特征预处理阶段通过引入K-means聚类分析，实现对电池健康状态数据的时空分布的映射，将不同放电倍率、不同观测指标的时序特征，划分进不同的时空模板中。然后对经过K-means聚类方法得到的数据进一步通过神经网络进行拟合，最终实现电池健康状态的预测。聚类方法实现了从单一层面分析到时空分布的映射，深度神经网络完成了多维特征到健康状态的拟合预测。

2 基于时空分布映射的深度神经网络模型

2.1 数据预处理

首先对不同健康状态的数据集进行数据预处理，生成符合模型需要的样本特征集、标签集。

标签集方面，遍历每个电池的电压，寻找达到截止电压10.9 V 的时刻，记录该时刻累计放电量，作为该电池实际容量，根据式（1）计算相应的电池健康状态SOH，作为该样本的标签。特征集方面，虽然电池有许多内部和外部老化因素，包括SOC、外加负载、环境温度、湿度及其化学反应，但估算模型中不可能全面反映所有因素。而且目标不是发现所有因素，是提出一个有效处理这些因素的框架，该框架可以无缝扩展，甚至可以通过其他合理的数据进行扩展。本文针对每个单体电池，选择每时刻的电压V、电流I和温度T作为电池当前时刻观测特征。

此外在构造样本标签集和特征集的过程中，对缺失值样本和异常值样本进行了清洗。缺失值处理主要针对原始内阻传感器数据，通过对数据的初步观察发现部分电池的温度值缺失，采用删除法去除该部分时刻的电池数据。对于异常值样本，需要在样本中挖掘不合理的值，即离群点。数据的异常值代表该数值显著性偏离所属样本的其余观测值。这些异常值可能由于多种因素造成，如测量误差，即测量的仪器出现故障导致的异常；输入错误，由于人为因素导致的数据收集、记录或输入过程中出现错误导致数据异常等。需要将这些异常值样本进行剔除。

分析这些样本，用符号表示为样本集合D=，其中I，V，T分别为t时刻观测得到的电池电流、电压和温度值，m为电池放电结束时刻。

2.2 时空分布映射

电池的老化效应高度依赖于特定放电时间及环境条件范围。例如，在低电压、高放电倍率和高温条件下持续使用电池会加速其老化。为了揭示使用范围造成的不同影响，将整个历史分布区域划分为较小的子区域，然后分别评估每个子区域。因此，将原始数据按照不同的时空维度划分为几个不相交的子区域，并采用相应的子区域作为其组合。

对于所有训练数据，将不同放电倍率下的每个电池每个周期里的每一个时刻数据作为1 个样本（时刻样本），将所有训练样本采用K-means 聚类分析，得到k个聚类中心。

对于模型输入训练数据即单个电池整个放电周期的观测数据进行时间维度转换，观测时刻t被等分成m份，每个时间间隔为总放电时长除以m。将每一个时间片记做t_i，时刻t被按照时间演变顺序再次划分进不同的时间片中。

进一步计算每个聚类中心所在类别中分属于不同时间片的所有时刻样本的个数，通过这种方式，将不同放电倍率、不同健康状态、不同放电时间的电池周期观测样本数据归一化成时间片乘以聚类中心个数的维度的特征向量，该特征向量中每个维度表示特定类时间片与特定聚类类别的观测时刻的样本数。由此可以得到神经网络模型的最终向量输入。时空分布映射的流程图如图3 所示。

图3 时空分布流程图Fig.3 Spatiotemporal distribution flow chart

2.3 深度神经网络回归

本文旨在预测电池健康状态，使用深度神经网络进行回归。神经网络模型包含了2 层隐藏层。模型可以用公式（4）表示：

式中：ReLu 为本文使用的激活函数；W1，W2分别为网络隐藏层中可学习的权重参数；b1，b2分别为2层隐藏层的偏置。

神经网络的隐藏层通过从输入层传输的数据进行多层非线性映射，最终呈现相应的预测结果。网络的优化目标是最小化预测结果和真实电池健康状态值之间的误差。用式（5）表示：

式中：为深度神经网络模型最优参数；SOH为电池健康状态；θ为深度神经网络模型参数；dt为训练样本。

3 实验结果与分析

本文使用的数据来自实验环境下真实电池的观测数据。

3.1 数据采集设备

观测设备为WiseBMS000 电池监控系统。包含BMS 集中监控管理软件、监控主机、电池采集模块3个层级。观测的电池型号为KELONG 6-GFM-100，标准电压为12 V，额定容量为100AH。实验环境为恒温25℃，湿度65%。

3.2 实验数据采集

电池数据采集首先对铅酸电池进行充电达到浮充状态。铅酸电池（6-GFM-100）的充电分为均充、浮充2 个状态。在均充阶段电流恒定，电压随着充电量提升。当电压达到浮充电压点（13.8 V）时，充电电流快速下降，并且电池电压保持浮充电压点。当充电量达到100%时，充电电流趋近于0 A。

C 为放电倍率，图4 为0.6C 放电倍率下29 节单体电池电压变化曲线。其中，每段曲线为1 节单体电池的电压变化曲线，共29 条。图5 为0.3C，0.6C，0.9C 3 个倍率下相同电池放电电流变化曲线。

图5 不同放电倍率下的电流变化曲线图Fig.5 Current variation curve under different discharge rates

从图4 可知，随着电池放电过程的进行，电池电压逐渐降低，但是在电池初始放电处存在骤降，这是由于实际工况环境下，电池从浮充状态到开始放电存在电压波动，而最终当整组电池达到额定电压，电池组停止放电，单节电池可能存在完全放电、过放、未完全放电多种可能，因此不同电池结束时电压差异较大。

图4 0.6C放电倍率下的电压变化曲线图Fig.4 Voltage variation curve at 0.6c discharge rate

从图5 可知电池在不同放电倍率下电流的变化过程。随着放电倍率的增大，电流也越大，放电时间越短。此外，电流在放电过程中并非保持不变，而是随着放电时间的增加，电流存在波动并呈现出总体上升的趋势，这是由于随着电池放电，整个电池组温度升高，电流也随之小幅上升。

在电池达到浮充状态后，对电池进行放电的同时，利用WiseBMS2000 电池监控系统对放电过程中平均每15 s 间隔对单体电池的电压、温度、内阻、容量、放电电流数据进行采集记录。累计放电量随着放电电流（放电率）大小变化而变化，均放电至电压无法下降情况，放电电流越小，累计放电量越大；放电电流越大，放电量越小。

因此，根据实际应用场景需求，本文分别在0.3C，0.6C，0.9C 3 种不同放电倍率下各采集了10 组铅酸电池组（每组29 节全新单体铅酸电池）放电数据。对这些电池进行连续完整周期的充放电直到电池寿命终止，并记录每1 节单体电池每个放电周期过程中的观测数据，作为本实验中的每1 条数据样本。

3.3 模型训练

对所有样本进行十折交叉验证划分。即将所有数据等分成10 份，随机选取其中9 份进行训练，1 份测试。迭代训练过程进一步选取剩余9 份，训练1 份测试直到每1 份都被测试过。

模型训练过程中涉及到网络超参数主要包括模型训练优化器，学习率，迭代次数，样本批大小，空间聚类数和时间转换数等。具体参数设置如表2 所示。

表2 训练参数设置Table 2 Training parameter setting

3.4 评价指标

采用2 种不同的方式评价模型预测准确性，采用平均绝对百分比误差（Mean Absolute Percentage Error，MAPE）作为模型的评价指标EMAP，衡量预测值与真实值的相对误差，其公式为：

采用平均绝对误差（Mean Absolute Error，MAE）作为模型的评价指标EMA，衡量预测值与真实值的绝对误差，其公式为：

3.5 单电池状态预测可视化分析

为了进一步分析比较本文方法与现有其它数据驱动方法在电池状态预测上的性能，对单个电池进行了预测并将结果可视化，如图6 所示。

图6 单个电池状态预测可视化Fig.6 Visualization of single battery state prediction

比较方法包括神经网络（Deep Neural Networks，DNN）、支持向量机（Support Vector Machine，SVM）、线性回归（Linear Regression，LR），Lasso 回归。相比现有其它方法，本文提出的基于时空分布映射的深度神经网络模型可以很好地拟合电池健康状态曲线。经典神经网络方法呈现出与电池状态变化相同的趋势，但存在一定的偏差。

3.6 模型实验结果与分析

比较原始深度神经网络、支持向量机、线性回归，Lasso 回归4 种不同的现有深度学习回归算法，分别计算其EMAP和EMA，结果如表3 所示。

表3 不同方法比较结果Table 3 Results on different methods %

分析模型检测结果可知，本文提出的基于时空分布映射的方法相比现有其它数据驱动方法在电池健康状态预测精度上有极大的提升。这是由于本文所设计的时空分布映射可以基于小样本数据对于电池健康状态在时空2 个维度进行聚类，为新的未知数据集提供了初始状态的模糊匹配模板，从而降低了后续神经网络模型的训练负担。而传统的纯深度学习方法缺乏有监督的指导，使得最终学习得到的结果缺乏有效的鲁棒性和泛化能力。

4 结语

本文提出了一种全新的基于数据驱动的方法研究，应用于大规模电池的健康状态预测。通过分析电池的大规模历史数据，从电池健康状态（空间维度）和时间演变放电过程（时间维度）2 个层面对于电池状态进行有效聚类，设计相应的基于时空分布映射的电池健康状态预测深度神经网络模型。

通过对比实验可知，本文提出的基于时空分布映射的电池健康状态预测深度神经网络模型在大规模电池健康状态预测EMAP准确率达到了93.62%，相比现有的其他神经网络模型提升约4%，EMA评价指标相比现有方法提升约3%，最终实现了对于大规模未知状态的电池进行精确的电池健康状态预测。今后将进一步考虑电池在实际放电过程中存在的机理问题，如电池老化过程中的余热效应、电池放电过程中的局部重生现象等。