基于多级特征提取的并网逆变器故障诊断策略

2022-08-05 05:11耿俊超王天真韩金刚陈国栋汤天浩
电源学报 2022年4期
关键词:特征向量特征提取准确率

耿俊超,王天真,韩金刚,陈国栋,汤天浩

(1.上海海事大学物流工程学院,上海 201306;2.上海电气输配电集团技术中心,上海 200042)

随着能源需求的不断增长,可再生能源的分布式发电系统得到了快速发展[1]。并网逆变器是分布式发电系统与公用电网之间的重要接口[2],在各种并网逆变器拓扑中,级联H 桥多电平逆变器CHMI(cascaded H-bridge multilevel inverter)具有谐波含量低、开关损耗小等优点,因此得到了广泛应用[3-4]。

在CHMI 中,因使用许多开关管(主要是IGBT),其故障情况会降低并网逆变器的可靠性。IGBT 主要存在开路故障和短路故障[5],短路故障已经存在较为成熟的解决方案[6]。当发生开路故障时,电路不会立即触发保护系统,并继续运行一段时间,因此需要相应的故障诊断策略以便及时定位故障[7]。近年来,大量的逆变器故障诊断策略被提出,可分为基于模型的方法、基于信号的方法和基于数据驱动的方法[8]。基于模型的诊断方法通过计算数学模型和实际系统的输出残差,来定位不同故障情况[9];基于信号的诊断方法通过处理电压或电流信号并实时比较其特征来实现故障诊断[10];与上述两种故障诊断方法相比,数据驱动的诊断方法具有更好的分类能力,更适用于多种类型的故障情况和复杂统[11]。在CHMI 中,随着电平数的增加,所使用的IGBT 数量也随之增加,因此难以建立其数学模型,并且由于存在相似故障的情况,通过基于信号的诊断方法难以直接准确地定位故障。因此,基于数据驱动的诊断方法更适用于CHMI,其关键是故障特征的提取。

常见的特征提取方法有频谱分析、小波变换与主成分分析PCA(principal component analysis)[12],快速傅里叶变换FFT(fast Fourier transform)是一种常用的频谱分析方法。文献[13]针对NPC 三电平逆变器中难以区分的故障,利用FFT 提取故障信号的谐波幅值,并结合BP 神经网络实现了简单开路故障诊断。FFT 一般是对整个信号进行的,不能精准获取局部信息,因此可能无法准确提取故障特征。与FFT 不同的小波变换可以将一个时间信号变换到时间频率域,能够更好地观察信号的局部特性。文献[14]通过小波变换与Concordia 变换相结合的方式,将生成的电流轨迹作为特征,降低了噪声的干扰,并利用支持向量机SVM(support vector machine)的分类方法,完成故障诊断,具有良好的故障检测效果。但小波变换需要选择合适的母小波以及设置可行的分解层数,一般依据经验选择,处理复杂故障情况时参数调整困难。PCA 通过线性变换将原始数据变换为一组各维度线性无关的表示,可提取出数据的主要特征分量,常用于高维数据的降维[15]。文献[16-17]利用PCA 进行特征提取并与不同的分类算法相结合,对于多种情况的IGBT 开路故障有很好的诊断效果,但传统PCA 可能会使数据成均匀化分布,导致故障特征不明显,对相似故障的特征提取效果不好。文献[18]提出了一种RPCA 与SVM 相结合的诊断策略,通过加入权重因子来改变原有的PCA 投影矩阵,从而能更好地凸显故障特征,提高了诊断精度。上述针对级联型逆变器的诊断方法,都应用于开环系统中,并网逆变器的闭环系统会对故障特征产生一定影响,文献[19]针对级联型光伏并网逆变器,以PCA 和SVM 为基础提出了一种多级分类的故障诊断策略,解决了存在的相似故障问题,但只对单管故障进行了验证。

针对级联型并网逆变器的单管与双管开路故障问题,本文提出了一种基于多级特征提取MLFE(multi-level feature extraction)的故障诊断策略。首先利用FFT 对原始数据进行预处理,使故障特征更加明显,然后使用MLFE 对多类型故障的关键特征进行提取,最后采用ELM 作为分类方法完成故障诊断。实验结果表明所提策略可以有效地提高诊断精度。

1 问题描述

图1 为三相级联并网逆变器的结构框图,每相都由n 个H 桥基本单元组成。根据锁相环PLL(phase locked loop)提供的电网相位信息,将输出电流从三相静止坐标(abc)转换为两相旋转坐标(dq),进行跟踪和控制[20],从而得到调制电压V。然后采用载波移相正弦脉宽调制CPS-SPWM(carrier phase shift-sinusoidal pulse width modulation)技术来生成脉冲宽度调制PWM(pulse width modulation)信号,以控制IGBT 的开通与关断。

图1 级联H 桥并网逆变器结构Fig.1 Structure of cascaded H-bridge grid-connected inverter

逆变器的数学模型建立为

式中:L 和R 分别为滤波电感及其等效电阻;ex和ix分别为电网电压和电网电流;uxo为逆变器输出电压。

1.1 故障特征分析

所研究的故障类型可以分为4 类:健康状态(可以视为特殊故障状态)、单IGBT 开路故障、同相双IGBT 故障以及不同相双IGBT 故障。具体分类如表1 所示。

表1 故障类型Tab.1 Fault types

上述故障情况的故障特征如图2 所示,0.3~0.4 s为正常状态,在0.4 s 设置故障。图2(a)显示了单个IGBT 开路故障时A 相的输出电压变化,可以看到,在发生故障后输出电压出现了电平削减;图2(b)是在A 相中发生双IGBT 开路故障时的输出电压变化,在这种情况下,输出电压在正半周和负半周分别产生了电平削减;图2(c)是IGBT 分别在A 相与B 相中发生开路故障时的波形变化,此时A 相和B相的输出电压同时出现了电平的削减。

图2 故障特征Fig.2 Features under fault condition

1.2 存在问题

在表1 中,总共有101 种故障情况,其中存在多种相似故障情况。为了实现精确的故障诊断,基于数据的诊断方法需要通过特征提取来选择主要特征。PCA 是一种广泛使用的特征提取方法,它通过线性变换将数据投影到新的坐标系中,并根据贡献率选择合适的主元完成特征提取。但是,对于相似故障情况,按贡献率选择的主元并不是最适合的。根据表1中的故障类型,采集逆变器输出电压作为诊断信号,通过PCA 提取特征后,第1 主元和第4 主元的输出结果如图3 所示。可以看到,在贡献率最高的第1 主元中存在大量相似故障特征,给故障分类造成困难,而在第4 主元中相似故障特征明显减少。因此,对于相似故障来说,根据贡献率选择的主元不是最合适的,难以获得合格的诊断精度。

图3 PCA 输出结果Fig.3 Output results of PCA

2 基于多级特征提取的故障诊断策略

为了解决PCA 应用于相似故障诊断时存在的问题,本文提出了一种FFT-MLFE-ELM 的故障诊断策略。该策略包括数据预处理、多级特征提取和故障分类3 个部分。

2.1 基于FFT 的数据预处理

将总故障类型数定义为I,每种故障类型采集J 个样本作为原始数据集,则总样本数N 为

设每个样本的采样点数为M,因此,原始数据集的矩阵大小为N×M。

时域上的故障特征很难直接通过计算单元分辨出来,而在频域中,不同故障的信号幅度和相位的变化会更加明显,因此,采用FFT 对原始数据集进行预处理[22]。变换后的数据矩阵可以表示为

式中,xj为第j 列数据样本,j=1,2,…,M。

同时,为了去除量纲对数据特征的影响,需要对每列数据进行标准化变换,使其具有相同的尺度。标准化公式可以表示为

通过式(4)计算得到标准化数据矩阵为

2.2 基于MLFE 的特征提取算法

2.2.1 基于PCA 的第1 级特征提取

第1 级特征提取采用PCA 算法进行初步特征提取,去除冗余特征与噪声,根据式(5)计算得到的协方差矩阵为

式中,(·)T为转置矩阵。

下一步计算协方差矩阵特征值和特征向量。根据特征值的大小,按照降序排列相应的特征向量,并通过特征值的累计贡献率CPV(cumulative percentage of variance)来选择合适的主元个数。累计贡献率表示为

式中:l 为选择的主元个数;λj为协方差矩阵的特征值,j=1,2,…,M。

当累计贡献率达到所设定的标准值如95%、99%等时,确定所要提取的主元个数l,由相应特征向量组成的PCA 投影矩阵为

最后,第1 级特征提取后的主元矩阵为

2.2.2 基于欧式距离阈值的第2 级特征提取

第1 级特征提取去除了冗余特征。第2 级特征提取算法主要目的是将主元矩阵按照分类信息的多少重新排列,根据分类信息数再次提取特征。

为了消除主元间不同数据量级的影响,需要对主元矩阵进行归一化处理,将每一列主元数据都映射在[0,1]范围内。归一化变换公式为

经过变换后得到的归一化矩阵为

其数据结构如图4 所示。在图4 中,第c 列主元可以表示为

图4 数据结构Fig.4 Data structure

在yc中共有I 类故障,每种故障有J 个样本,因此第c 列主元的第i 个故障样本为

根据式(13),yc可以重新表示为

欧式距离可以清楚地表现出不同数据样本之间的差异程度[22],因此,每一列主元中不同故障样本之间的欧式距离越大,代表其特征差异更明显,更容易实现分类。

广义的欧式距离计算公式为

则第c 列主元中不同故障样本间的欧式距离为

式中:m=1,2,…,I-1;n=i+1,i+2,…,I。

经过循环计算,主元矩阵所对应的故障样本间的欧式距离矩阵为

计算多组非相似故障间欧式距离的平均值,并通过仿真数据多次调整验证,确定最后的欧氏距离阈值h,将E 中每一列数据与h 进行比较,如果大于h,则对相应主元进行投票。循环比较后,得到主元得分矩阵,即

将得分矩阵中的元素降序排列,按照此顺序排列对应主元,选择合适的主元个数完成第2 级特征提取。

2.3 故障诊断方法

极限学习机ELM(extreme learning machine)是一种基于单隐藏层前馈神经网络的机器学习方法[23]。与BP 神经网络相比,ELM 的隐藏层阈值可以随机设置,设置后无需再次调整,大大减少了计算量。与SVM 相比,ELM 具有更快的学习速度和更好的泛化能力,其网络结构如图5 所示。

图5 ELM 网络结构Fig.5 Network structure of ELM

式中:g 为激活函数;wi为第i 个隐藏节点与输入节点之间的权重向量;βi为第i 个隐藏节点和输出节点之间的权重向量;bi为第i 个隐藏节点的偏置。

单隐层前馈神经网络的学习目标是使输出误差最小化,即

若存在wi和βi使得式(20)成立,则式(19)可以重新表示为

式(21)可以简写为矩阵形式,即

式中:H 为隐藏层输出矩阵;β 为输出权重矩阵;T为期望输出矩阵。

因此,ELM 学习过程可以总结为:随机分配输入权重和偏置,计算隐藏层输出矩阵H,计算输出权重矩阵β。

式中,H*为隐藏层输出矩阵H 的Moore-Penrose 广义逆矩阵。

所提出的诊断策略总体流程如图6 所示。

图6 所提诊断策略流程Fig.6 Flow chart of proposed diagnostic strategy

3 实验结果

为验证所提出故障诊断策略的有效性,在实验室搭建了三相级联H 桥五电平并网逆变器,总体实验平台如图7 所示,直流输入端由6 个1.5 kV·A 的直流电源组成,逆变器的主电路由6 个H 桥逆变器单元组成,电流控制部分通过Dspace(MicroLabBox)硬件在环控制器实现,输出电流通过容量6 kV·A变压器连接到电网。具体系统参数如表2 所示。

表2 系统参数Tab.2 System parameters

图7 实验平台Fig.7 Experimental platform

在实验系统中采集到故障样本数据后,应用不同诊断策略进行故障诊断。各个诊断策略均提取15 维特征向量,诊断准确率如表3 所示。为验证不同分类器效果,使用PCA 进行特征提取,并应用于ELM、SVM[14]和BP[13]这3 种分类算法中进行诊断,可以看出,BP 与SVM 的诊断精度都低于80%,无法实现准确诊断。而ELM 的诊断准确率有明显提高,证明ELM 对于多种故障的分类效果更好,但此时仍存在很多相似故障被错误诊断。

表3 不同诊断策略的准确率比较Tab.3 Comparison of accuracy rate among different diagnosis strategies

为验证所提出故障诊断策略的性能,将其与文献[18]和文献[19]中的诊断策略进行了对比。文献[18]与文献[19]的诊断策略准确率均低于90%,而所提基于FFT-MLFE-ELM 的诊断策略准确率达到了99.90%,远高于前两种诊断策略。

另外,从表3 还可知,当其他条件相同时,应用MLFE 的诊断策略准确率均高于应用PCA 的诊断策略准确率,当使用SVM 作为分类器时,总体准确率提高了8%。使用ELM 作为分类器时,应用不同特征提取方法的诊断结果如图8 所示。图8(a)为使用PCA 提取特征时的诊断结果,此时仍有多种相似故障无法诊断,导致了整体准确率的降低;图8(b)为使用MLFE 提取特征时的诊断结果,可以看出所有故障情况都可以被准确分类,验证了所提方法的有效性。

图8 故障诊断结果Fig.8 Fault diagnosis results

为了进一步验证所提诊断策略的性能,在表3中选择4 种策略分别应用MLFE 与PCA 的诊断,对比分析了特征向量维度变化时不同特征提取方法对诊断策略准确率的影响,结果如表4 和表5 所示。表4 是使用1~7 维特征向量时的准确率,可以看出,所提诊断策略的准确率随着特征向量的增加而快速增加,并且在使用7 维特征向量时,可以达到99%以上,明显高于其他诊断策略。在表5 中,在使用8~15 维特征向量时,所提诊断策略的精度逐渐逼近100%。其他诊断策略的精度最高只能达到98%。由图8(a)可见,此时仍存在许多无法诊断的相似故障。

表4 1~7 维特征向量的准确率比较Tab.4 Comparison of accuracy rate under feature dimensions of 1-7%

表5 8~15 维特征向量的准确率比较Tab.5 Comparison of accuracy rate under feature dimensions of 8-15%

为了更直观地显示每种故障诊断策略的性能,将表4 与表5 中的结果绘制为折线图,如图9 所示。

图9 不同诊断策略在各个特征向量下的准确率变化Fig.9 Changes in accuracy rate of different diagnostic strategies under each feature vector

在图9 中可以看出,使用MLFE 诊断策略的准确率呈线性增长变化,证明其提取的每一维特征向量都有利于故障分类,可以根据具体需要确定特征向量维数,而应用PCA 诊断策略的准确率存在大小不一的波动变化,其提取的部分特征向量会使分类效果变差。和其他3 种诊断策略相比较,从第4维特征向量开始,所提出的诊断策略具有更高的准确率,也更具稳定性。

4 结语

本文针对级联并网逆变器中存在的IGBT 开路故障情况,提出了一种基于多级特征提取的故障诊断策略。所提出的诊断策略包括数据预处理、特征提取和故障分类3 部分。首先,利用FFT 将数据样本从时域转换为频域,使故障特征更加明显。然后,针对特征提取存在的问题提出了多级特征提取方法,第1 级提取基于PCA 的主元贡献率选择特征,第2 级提取根据欧式距离阈值计算出的分类信息数再次选择特征。最后利用ELM 完成故障分类。实验结果表明,与其他诊断策略相比,所提诊断策略适用于多类IGBT 开路故障的诊断,精度高达99.90%。

猜你喜欢
特征向量特征提取准确率
同步定位与建图特征提取和匹配算法研究
克罗内克积的特征向量
高中数学特征值和特征向量解题策略
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
多层螺旋CT技术诊断急性阑尾炎的效果及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
三个高阶微分方程的解法研究
基于MED—MOMEDA的风电齿轮箱复合故障特征提取研究
基于曲率局部二值模式的深度图像手势特征提取