基于深度残差网络的光伏故障诊断模型研究*

2021-12-23 06:41谢祥颖冷彪
计算机工程与科学 2021年12期
关键词:残差电站故障诊断

谢祥颖,刘 虎,王 栋,冷彪

(1.北京航空航天大学计算机学院,北京 100191;2.国网电子商务有限公司战略发展部,北京 100053;3.国家电网有限公司互联网部,北京 100031;4.国网电子商务有限公司数字科技部,北京 100053)

1 引言

太阳能资源是取之不尽、用之不竭的清洁能源,光伏发电是目前使用太阳能最广泛、有效的方式。根据2016年12月发布的《太阳能发展“十三五”规划》,到2020年底,中国光伏发电装机容量指标为105 GW,光热发电装机容量指标为5 GW。截至2018年底,中国光伏累计并网装机量174 GW,远超《太阳能发展“十三五”规划》目标。但是,在光伏发电广泛应用的同时,光伏电站故障频发成为了光伏产业发展亟待解决的问题。目前光伏故障诊断方法可以分为3大类:(1)传统基于光伏电路特点的诊断方法;(2)机器学习诊断方法;(3)深度学习诊断方法。

传统的故障诊断方法包括时域反射法[1,2]和等效电路法[3]。时域反射法通过对比时域反射信号与输入信号确定故障发生的位置。这种方法的缺点包括:能够检测出的故障类别少;白天光照会对时域反射信号产生干扰;需要系统停机进行故障诊断,难以实时进行。等效电路法是一种利用伏安特性进行故障诊断的方法,通过在电路中串联等效电阻来判断系统中是否存在故障组件。等效电路法虽解决了实时故障诊断的问题,但该检测方法不能大范围使用。

基于机器学习的故障诊断方法主要通过分析光伏电站的运行数据,然后对当前状态进行故障诊断。毕锐等[4,5]提出了使用模糊C均值聚类的方法,通过对不同故障进行特征提取从而实现聚类,构建故障特征向量与故障类型之间的模糊对应关系,然后根据正态分布特征计算故障特征向量与故障类型之间的隶属度关系,最终确定故障类型。叶进等[6]提出了基于改进DBSCAN(Density-Based Spatial Clustering of Applications with Noise)算法的光伏故障检测方法,首先将发电条件类似的电站聚类,然后对比同类电站的发电量,最终确定故障电站。基于贝叶斯网络BN(Bayesian Network)的概率集成学习方法[7]可以对工业场景中发生的故障类别进行诊断。除了上述研究方法之外,支持向量机SVM(Support Vector Machine)[8-11]和多层感知机MLP(MultiLayer Perceptron)[12]等分类方法也被用来对光伏电站运行状况进行故障诊断。但是,由于分布式光伏电站运行数据维度较高,一般的机器学习分类方法对故障的诊断准确率还有待提升。

深度学习故障诊断方法通常是基于数据驱动的解决方案:首先对光伏电站的运行数据进行分析,然后构建深度网络模型,接着根据历史运行数据对模型展开训练,最后将训练好的模型用于故障诊断。张国豪等[13]提出了一种使用采用卷积神经网络CNN(Convolutional Neural Network)和双向门控循环单元的时间序列分类方法,该方法探索了卷积神经网络在时间序列分类上的可行性。另外,全卷积神经网络FCN(Fully Convolutional Network)[14,15]也被广泛应用于故障诊断领域,并取得了良好的效果。

卷积神经网络方法有许多优点:不受时间和空间的约束,故障检测范围广,能同时检测多种故障类型。但是,随着检测故障的种类的增多,数据量和模型深度也会增加,模型的泛化能力会有所下降。

目前光伏电站的故障诊断方法存在检测故障种类单一、检测方法复杂难以推广、准确率低、网络退化等问题。针对这些问题,本文提出了一种基于残差网络结构的光伏故障诊断ResFD-PV(ResNet Fault Diagnosis for PhotoVoltaic)模型。该模型在某测试电站的故障诊断实验中,对4种故障类型的诊断准确率高达98.59%,适合在分布式光伏电站广泛推广。本文的主要创新点包含以下2点:

(1)本文利用卷积操作的平移不变性,采用一维卷积核对光伏电站的时间序列数据进行感知和特征提取,并建立了多级卷积的深度网络模型来提升光伏故障诊断的准确率。

(2)本文采用残差结构建立了深度网络跨层连接,解决了深度模型随着层数增加而导致的梯度消失问题,优化了深度模型的训练过程。

2 基于残差网络的故障诊断模型

2.1 光伏故障类型

分布式光伏电站每天会产生海量的数据,这些数据分别由位于不同区域和不同组的发电设备产生。每个区域和组的设备类型相同,发生的故障种类也相似,所以可以根据每组设备的运行状态来做故障诊断。

根据日常维修记录,常见的故障类别可以归纳为4种,分别是光伏板遮挡故障、逆变器运行故障、逆变器短路故障和电压数值异常故障。光伏板遮挡故障主要表现为光伏板的热斑现象,这种问题产生的原因一般是光伏板被遮挡,在数据中的表现一般是逆变器中电流显著降低。逆变器运行故障一般会导致电压较大,这样会导致逆变器运行异常。逆变器输出端短路一般会导致电路电流的迅速增大。电压数值异常是指三相电压超出正常的范围,一般是三相阻抗偏低或偏高导致的。常见故障与相关故障表现如表1所示。

Table 1 Fault categories,causes and results表1 故障类别及其表现

Figure 2 Network structure of the ResFD-PV model图2 ResFD-PV模型的网络结构

2.2 故障诊断流程

根据上文中选择的光伏故障类型和对应的故障数据表现可以得出,选择逆变器的三相电压和三相电流数据可对上述4种故障进行诊断。故障诊断可以分为提取原始数据、数据预处理、模型训练和模型测试与输出4个阶段,总体流程如图1所示。

Figure 1 Flow chart of fault diagnosis图1 故障诊断流程图

提取原始数据阶段:这个阶段的目的是根据故障类型提取出与故障相关的运行数据。根据表1可以得出,与本文研究的4种故障相关的数据为三相电压和三相电流。在提取数据阶段,将三相电压和三相电流值取出,然后分别对这些数据做预处理。

数据预处理阶段:由于原始数据有时会出现数据缺失异常的情况,对于原始三相电流和三相电压数据,需要根据缺失位置的前后数据取均值补全所缺数据。通常光伏电站在有光照的时候才能够正常开机运行,所以需要选择时间在8:00~18:00时的运行数据。由于电流数据变化较大,需要首先对电流值做滤波处理,减小瞬时异常数据的影响。然后计算每半个小时运行数据的均值作为该时间段的数据,减小短时间的异常数据对故障诊断产生的影响。为了使模型更容易提取故障特征,需要分别对电压和电流数据做处理,即预提取操作。最后将预处理特征的数据与原始数据结合为一维数据,划分为训练集与测试集。

模型训练阶段:首先设置模型的超参数,然后在训练集上对预设超参数的模型进行训练。

模型测试与输出阶段:该阶段主要是导出训练模型,然后在测试集上衡量模型的诊断效果。

2.3 残差网络模型

He等[16]提出了ResNet模型,该模型采用了残差网络结构来解决卷积神经网络退化和梯度消失的问题。残差网络模型主要用于图像识别领域,卷积核为二维卷积核。使用残差结构的神经网络在解决梯度消失问题上有着很好的表现。本文提出了一种基于残差网络结构的光伏故障诊断模型ResFD-PV,模型结构如图2所示。

ResFD-PV模型所用的卷积单元包含卷积层、规范化层BN(Batch Normalization)和激活层ReLU(Rectified Linear Unit)。

卷积操作的目的是将相邻数据的数据特征提取出来,多个卷积操作的叠加有利于扩大特征提取范围。

BN层的作用是规范数据范围、加快收敛速度和归一化数据。卷积神经网络的训练过程中会出现内部协变量移位现象。随着训练的进行,底层网络中的参数发生微弱变化时,这种变化会随着网络的深入不断被放大。另外,随着反向传播的进行,上层网络也因需要不断适应这种变化而进行调整,使得网络学习速度降低,减缓了收敛速度。本文针对这种现象,在每层卷积输出时增加规范化操作,以减少数据微弱变化对深层网络层的影响。

由于卷积操作是线性运算,如果仅仅是卷积层相连,那么最终也只能学习到线性关系的参数,所以需要在每个卷积操作之后加上激活函数层。激活函数层的引入使得原始的线性关系转化为了非线性关系,这样训练出的模型可以逼近非线性函数。ReLU函数常用于隐层神经元输出,如式(1)所示:

ReLU(x)=max(0,x)

(1)

基本卷积单元的计算公式如式(2)所示:

(2)

其中,W表示要训练的权重,x表示输入的参数,b为偏移,⊗是卷积操作符,BN为归一化操作,s为ReLU激活函数的输入。

如图2所示,分布式光伏故障诊断模型的基本框架使用了3个残差结构。每层残差结构由3个基本卷积单元组成,每个基本残差单元的最后一个ReLU层与残差输入相加的结果作为下一个残差结构的输入,3个残差结构中的卷积层通道数分别是64,128和128。基本残差结构如式(3)所示:

(3)

其中,每个Block表示一个基本的卷积单元,ki表示第k个残差结构的第i个基本卷积单元。

第3个残差结构的输出作为平均池化的输入。平均池化之后增加Softmax层输出分类结果。

Softmax是一种归一化指数函数,在深度学习领域,Softmax常用于分类问题。给定一系列类别,Softmax 可以给出某输入被划分到各个类别的概率分布。Softmax公式如式(4)所示:

(4)

(5)

其中,z表示原始向量,σ(z)j表示经Softmax操作后的第j个值,P(y=j|x)表示样本x属于第j类的概率,zj表示原始向量z的第j个分量,K表示类别数量。

传统的ResNet结构对每2个卷积层做一次残差相加。而ResFD-PV模型使用3层基本卷积作为残差基本单元,简化了模型结构,减少了参数。

3 实验与模型设置

3.1 数据集简介

实验中所使用的数据来源于某光伏电站2019年7月至2020年3月的运行日志和故障维修记录。运行日志数据包含发电量、上网电量、日发电量、电压和电流等72项数据记录。经过与故障维修记录的对比分析,发现故障常常出现在光伏组件上。另外,结合故障发生时的运行数据表现:故障发生时,运行异常数据常常反映在逆变器上。根据以上情况分析,筛选出逆变器运行数据6项和常见故障4项。筛选出的运行数据分别是三相电压U_AB、U_BC、U_AC和三相电流I_A、I_B、I_C。

3.2 数据预处理

本文将分布式光伏电站的运行状态划分为5种,其中1种为正常情况,另外4种为故障状态。为了避免因目标值大小引起的计算损失函数误差,本文采用了one-hot向量的方式来表示分类目标。one-hot向量中每一个位置的数值代表了一种分类结果,每个向量中仅有一位的值为1,代表了该组数据的所属类型,其它值都为0。

为了更加直观地体现故障数据特征,加速模型的训练过程,本文抽取出三相电压差(U1,U2,U3)和电流前后变化差值(I1,I2,I3)6项数据作为人工特征。然后对数据进行归一化处理,将原始缺失的数据补全。本文采用低通滤波器和小波变换分别对归一化后的数据进行降噪处理,归一化数据和降噪处理后数据对比如图3所示。

从图3中可以看出,经过小波变换后的曲线能够更加准确地描绘出电流变化趋势,所以后续的实验将使用小波变换来对电流数据进行滤波处理。

光伏电站每5 min产生一组运行数据,每天可产生120组(上午8:00至下午6:00)数据。这样的数据冗余度较高且训练中产生的参数较多。选择将每半小时计算一次数据的均值作为一组数据,所以每天产生20组数据。根据数据的时间序列特性,卷积网络使用一维卷积模型,将每天的数据变换为一维向量作为一个训练样本个体,则该向量长度为240。

Figure 3 Comparison between normalized data and noise reduction treated data图3 归一化数据和降噪处理后数据对比

3.3 评价指标

故障诊断类型一共划分为5种,分别是正常状态和表1中的4种故障类别。模型采用准确率(Accuracy)、精确率(Precision)、召回率(Recall)和F1等评价指标。

准确率描述了模型预测正确的样本概率,其计算公式如式(6)所示:

(6)

对于二分类问题,TP表示预测结果与实际结果均为正样本的数量;TN表示预测结果与实际结果均为负样本的数量;FP表示预测结果为正样本,实际为负样本的数量;FN表示预测结果为负样本,实际为正样本的数量。

精确率、召回率和F1的计算公式如式(7)~式(9)所示:

(7)

(8)

(9)

对于多分类的问题,只统计准确率,即分类正确的样本数占总体样本数的比例。在计算每种故障类别诊断的精确率、召回率和F1时,按照二分类的标准计算。

3.4 模型设置与分析

ResFD-PV模型训练过程中,需要手动指定一些超参数,这些超参数的设置在一定程度上影响了模型训练的最优结果。在本次实验中,设置的超参数如表2所示。

Table 2 Hyperparameter settings in ResFD-PV model表2 ResFD-PV模型中超参数的设置

卷积核的大小反映了模型感受野的范围。在传统图像处理的模型中,卷积核越大,模型的感受野越大,然而参数量会增加,花费的训练时间也就越长。在本次实验中,为了探究最优化的模型结构,选择不同的卷积核大小交叉排列,同时兼顾了计算量和精度。实验中选择的卷积核的长度分别是3,5,7和8。不同大小卷积核训练结果如表3所示。

Table 3 Training results using different convolution kernels表3 不同卷积核模型的训练结果

从表3中可以看出,在三层残差单元中卷积核大小均为3和残差单元中卷积核大小分别为5,5和3时,模型取得了比其他参数更好的实验效果,在测试集上的准确率为98.59%。而随着卷积核大小的增加,模型的泛化能力反而有所下降,导致此结果的原因可能有3种:(1)训练周期(Epoch)较小导致训练模型还未收敛;(2)参数过多而样本数量较少导致模型过拟合。

本文进一步探究了卷积核尺度对模型训练过程和模型准确率的影响。图4展示了3个残差基本单元中卷积核长度均为5,5,3时,模型训练过程中损失函数Loss值的变化曲线。从图4中可以看出,当训练周期在300时,训练模型的准确率已经不再变化,说明模型已经收敛。Loss值在训练过程中不断降低,当训练周期达到969时,Loss值达到最低点6.87e-4。可见卷积核大小均为5,5,3时已经达到了模型的最优化训练状态,过大的卷积核可能会造成模型的过拟合,影响泛化能力。

表4所示为卷积核为3时ResFD-PV模型得到的不同种类故障的精确率、召回率和F1 的值。从表4中可以看出,对不同种类的故障,ResFD-PV模型均有较好的表现。

Table 4 Performance of the ResFD-PV (kernel=3)model on the test set表4 ResFD-PV(kernel=3)模型在测试集上的结果 %

4 结果与讨论

4.1 故障诊断结果比较

本文选择了CNN[13]、FCN[14,15]、MLP[12]、SVM[9-11]和BN[7]等多个常见的故障诊断智能模型进行对比实验,结果如表5所示。

Table 5 Comparison of results of several fault diagnosis models表5 不同故障诊断模型的结果比较

从表5可以看出,本文提出的ResFD-PV模型在测试集上的准确率为98.59%,明显优于几种常见的故障诊断智能模型。CNN模型的网络结构与ResFD-PV模型类似,而且卷积核的大小与卷积层数量也保持一致,但是缺少了残差结构,在测试集上的准确率为95.30%。

采用卷积神经网络的模型在测试集上的准确率均在95%以上,最低的CNN模型为95.30%。而采用传统机器学习方法的模型,准确率均在80%以下,说明卷积神经网络故障诊断更加有效。这是因为:(1)从数据上来看,故障数据具有时序性的特点,即前后数据与时间有关。如上午阳光较弱时产生的电流值与中午光照强度较大时的电流值不同,电流值大小与监测时间相关,而这个关系通过SVM等传统算法难以学习。(2)不同维度的数据之间存在相互影响。如不同相的电压值应该大致相同,不同时间电压值变化很小,而不同相电压值相差超出一定范围则表明发生了故障。这种不同维度数据之间的相互关系也很难通过传统算法学习得到。(3)故障发生的时间较为随机,所以数据异常的时刻不固定,即使相同的故障数据也会呈现出不同的特征表现,因此传统方法会受到较大的限制。

随着社会经济不断发展,绿色发展的理念愈发深入民心,在此背景下,环境影响的评价机制作为一种预防性的环境保护制度显得十分重要。环境保护制度能够为环境综合治理和城市的环境规划提供参考依据,促进经济社会的长远发展。

由于ResFD-PV模型使用卷积神经网络,具有宽阔的感受野,能够学习到同一组数据和不同组数据之间的相互关系。而且多层卷积核的叠加,能够极大地拓宽感受野,学习到更多数据特征。同时,卷积神经网络与数据位置无关的特性正好适用于时序数据。采用残差结构能够加速模型训练过程,增加跨层间的联系,减弱梯度消失对模型训练的影响,进一步提高模型预测的准确率。从上述实验结果可以看出,残差神经网络在光伏故障诊断方面相比传统分类方法较优。

4.2 卷积网络模型训练过程比较

ResFD-PV模型采用了残差结构来解决深度卷积网络梯度消失的问题,从而加速模型的训练过程。为了验证残差结构的有效性,采用CNN模型与ResFD-PV模型进行实验对比。训练过程如图5所示。

Figure 5 Comparison of the training process of the ResFD-PV model and the CNN model 图5 残差网络模型和传统CNN模型的训练过程对比

从图5训练过程的准确率变化曲线可以看出,ResFD-PV模型有2个显著的特点:(1)训练刚开始时,准确率提升明显,且训练速度快。当Epoch达到380左右时,ResFD-PV模型已收敛,准确率达到最高点,而同周期的CNN模型还未收敛。当Epoch约为600时,CNN模型才收敛。(2)准确率高。ResFD-PV模型预测准确率一直高于CNN模型,最终的准确率为98.59%,明显高于CNN模型的95.30%。(3)在CNN模型训练后期,准确率波动一直较大,而ResFD-PV模型几乎没有波动,一直稳定在98.00%附近。从上述实验结果可以看出,本文提出的ResFD-PV模型在光伏故障诊断问题上显著优于CNN模型。

5 结束语

为了较好地解决分布式光伏电站运行时故障诊断问题,本文提出了一种基于残差结构的卷积神经网络模型,实现了光伏电站故障类型的快速诊断。针对光伏电站运行数据的时序性和故障发生时间的不确定性等特点,深度卷积神经网络能够有效地学习到数据之间的时序性特征。由于卷积操作的平移不变性,无论故障发生在什么时刻,均可以提取出相同的故障特征。另一方面本文采用残差网络结构,解决了深度模型随着层数增加而导致的梯度消失问题,优化了深度模型的训练过程。

光伏电站的测试数据上的实验结果表明,本文提出的ResFD-PV模型显著优于现有多种故障诊断模型,该模型可以广泛应用在分布式光伏电站的检测运维中,为电力巡检、故障分析提供新的解决方案。

猜你喜欢
残差电站故障诊断
基于双向GRU与残差拟合的车辆跟驰建模
基于包络解调原理的低转速滚动轴承故障诊断
三峡电站再创新高
基于残差学习的自适应无人机目标跟踪算法
低影响开发(LID)在光伏电站中的应用
基于递归残差网络的图像超分辨率重建
因果图定性分析法及其在故障诊断中的应用
平稳自相关过程的残差累积和控制图
基于LCD和排列熵的滚动轴承故障诊断
高速泵的故障诊断