基于最优小波包变换与核主分量分析的局部放电信号特征提取

2010-11-04 01:15炬谢颜斌周倩张晓星
电工技术学报 2010年9期
关键词:模式识别波包频带

唐 炬谢颜斌周 倩张晓星

(1. 重庆大学输配电装备及系统安全与新技术国家重点实验室 重庆 400030 2. 重庆电力公司江北供电局 重庆 401147)

基于最优小波包变换与核主分量分析的局部放电信号特征提取

唐 炬1谢颜斌1周 倩2张晓星1

(1. 重庆大学输配电装备及系统安全与新技术国家重点实验室 重庆 400030 2. 重庆电力公司江北供电局 重庆 401147)

UHF法作为GIS设备PD检测的有效方法已得到广泛应用,但GIS内UHF PD信号的特征提取一直是研究的难点问题。作者从小波包对UHF PD信号分解过程入手,根据已建立的GIS内4种典型缺陷UHF PD数学模型,分别采用熵最小原则选取最优小波包基,利用所得到的最优小波包基对UHF PD信号进行分解得到的小波包系数,计算信号在各频带投影序列的能量、在各个尺度下的模极大值和绝对平均值,构造出能完整描述UHF PD信号的特征空间,并用KPCA法将高维特征空间降到低维特征空间,解决了维数危机,消除了类内散度矩阵的奇异性,并最大限度地保持原有信号的特性。由此作为模式识别的特征量能够较好地应用于UHF PD信号模式识别。

局部放电 特征提取 最优小波包 核主分量分析

1 引言

气体绝缘组合电器(Gas Insulated Switchgear,GIS)最常见的电气故障特征是在绝缘完全击穿或闪络前产生局部放电(Partial Discharge,PD)[1-3]。采用超高频(Ultra High Frequency,UHF)检测GIS内PD可以及时发现设备内部缺陷[3-4]。对局部放电信号进行有效模式识别,可以进一步准确地了解和掌握 GIS内缺陷类型性质和特征[5-9],对于保证GIS安全可靠运行,掌握GIS绝缘状况及指导GIS检修工作有着十分重要的意义。特征提取品质的优劣极大地影响着分类器的设计和性能,是模式识别最重要的核心问题之一。在 PD模式识别中,由于图像或者波形所获得的数据量相当大,对放电模式直接识别是很困难的。为了有效地实现UHF PD分类识别,就要对原始数据进行变换,得到最能反映分类本质的特征。

小波包变换(Wavelet Packet Transform,WPT)[10]在满足海森堡测不准原理的前提下,自由选择不同时间点、频率点上的时频分辨率,可以更精练地在时频联合分析相平面上提取非稳定信号的特征。20世纪90年代末,Bernhard Scholkopf小组在主分量分析的基础上,将核主分量分析(Kernel Principal Component Analysis,KPCA)推广到非线性领域,它通过核函数将输入空间的非线性问题转化到特征空间成为普通的特征值问题,比主成分分析具有更优越的降维效果[11]。

本文从WPT对UHF PD信号分解过程入手,根据已建立的GIS内4种典型缺陷UHF PD数学模型[12],分别采用熵最小原则选取最优小波包基,综合选用了UHF PD信号在各频带投影序列的能量、在各个尺度下的模极大值和绝对平均值,构造出能完整描述UHF PD信号的特征空间;利用KPCA法将高维特征空间降到低维特征空间,解决了维数危机,消除了类内散度矩阵的奇异性,并最大限度地保持原有信号的特性。研究结果表明,基于熵最小原则的最优小波包变换和KPCA法获得的信号特征均能够较好的应用于UHF PD信号模式识别。

2 GIS超高频局部放电信号检测

作者根据GIS设备绝缘缺陷放电形式和特点,设计了4种GIS模拟装置内局部放电物理模型[3]:分别是:高压导体金属突出物缺陷,简称N(needle)类放电模型缺陷;自由金属微粒缺陷,简称 P(particle)类放电模型;绝缘子表面固定金属微粒缺陷,简称M(metal)类放电模型;气隙缺陷,简称G(gap)类放电模型。

将上述4种人工物理缺陷模型分别置于研制的GIS模拟装置中[13],并充以0.5MPa的SF6与N2的混合气体(体积比 4∶1),通过研制的内置超高频传感器和高速数字采集系统[12-14](模拟带宽1GHz、采样率为20GS/s、存储深度48MB)获取UHF PD信号的数据和波形。实测放电波形如图1所示。

图1 4种缺陷的UHF PD信号Fig.1 UHF PD signals of four insulated defects

3 基于WPT的超高频局部放电信号特征空间构造

3.1 小波包分解的基本原理

小波包分解是一种更加精细的离散小波变换,对频带进行多层次划分,对每一节点系数采用近似值矢量分离法分解成两部分,从而得到完整的二进树。双尺度方程可以定义为式中,h(k),g(k)为共轭滤波器组;W1,0(t)为尺度函数;W1,1(t)为小波函数。每一节点(j,n)的小波包系数(Wavelet Packet Coefficients,WPC)由时间序列x(t)计算得到

WPC{Cj,n(k)}包含了重构信号的所有信息,其平方值代表了小波包树特定子带中信号的能量。

3.2 UHF PD信号的最优小波基选择

本文采用db系列小波包对UHF PD信号进行分解,分解层数4层,最优小波基的选择采用熵最小原则,且花费函数为Shannon熵[10]。对于离散的时间序列 x = (x1,x2,… ,xN),Shannon熵定义如下:

当 xi=0,则有M(x)反映了时间序列能量集中的程度,其最优小波包基快速搜索算法如下:

(1)对已进行归一化处理了的UHF PD信号的数学模型,采用小波包函数进行4层小波包分解,并计算出各节点的Shannon熵值。

(2)对最低层的各节点作标记,而对其他各层节点不作标记。

(3)将每层从左至右每两个节点构成一组,由下往上进行相邻两层的下一层每组的两个节点之和与上一层对应节点的熵值比较。

(4)若下一层的两个节点的Shannon熵和大于等于上一层对应节点的Shannon熵值,则对上一层的该节点作标记,而去掉下一层的该两个节点的标记;否则,以下一层该两个节点的Shannon熵之和取代上一层的该节点的Shannon熵值,但对标记不作处理。

(5)从下往上对相邻两层按上述过程逐层进行比较,直至所有层均处理完毕。被作上标记的所有节点所对应的小波包函数即是搜索到的最优小波包基。

针对GIS中4种常见缺陷研制的物理模型,作者采用5阶高斯函数构建了相应的数学模型[12],其数学表达式为

式中,参数ai表示波峰的高度;bi表示波峰所在位置的横坐标x的值;ci反映了波峰的陡度;n表示放电脉冲极值的个数;对应参数值参见文献[12]。

作者选用了 db系列小波构成的小波包并采用Shannon熵对GIS内4种典型缺陷对UHF PD数学模型进行4层分解后得到了最优小波包基。图2分别表示了以db4小波包为例经分解后得到的最优小波包基。从图中可以看出,对于不同的信号,即使采用同一小波包进行分解,所得到的最优小波包基也可能是不同的。

图2 4种缺陷的UHF PD数学模型的最优小波包基Fig.2 Best basis of wavelet packet for UHF PD mathematical models of four insulated defects

UHF PD信号经过快速最优小波包基选取后,使信号的能量更加集中,在“最佳”频率分片上得到一系列的小波包系数,这些系数完备地描述了信号的特征,因而可以用作分类的特征子集。信号经m层小波包分解后,原UHF PD信号的能量被分解到 2m个正交频带上,信号在各频带上的能量总和与原信号的能量一致,每个频带内的UHF PD信号表征原信号在该频率范围内的放电信息。因此,可将 UHF PD信号在各频带投影序列的能量或与能量对应的值作为特征矢量。另外,Mallat证明[10]了当各个尺度下的模极大值已知时,可利用投影迭代法恢复各尺度的子波变换值,从而完全实现原信号的重建。这表明利用各个尺度下的极大值作特征具有信息不丢失的优点,因而有望取得较高的识别能力。此外,每个尺度下小波包系数的统计特征也是工程上常用的特征之一[15]。在本文的研究中,综合选用了 UHF PD信号在各频带投影序列的能量、在各个尺度下的模极大值和绝对平均值完整地构造了其特征空间。但是该特征空间的特征维数仍然非常多,如果都作为识别的特征量,势必严重降低分类器的性能,而且很不适合实时应用的场合,因此必须进行降维处理,以除去那些对分类没有太多贡献的特征,同时可以用较低维数的向量作为分类器的输入向量,从而简化分类器的设计,并提高其识别能力。

4 基于KPCA的超高频局部放电信号特征降维处理及识别结果分析

4.1 KPCA的基本原理

PCA是一种基于目标统计特性的最佳正交变换,具有提取模式中具有最大描述特征的能力,然而PCA是一种线性算法,只考虑数据中的二阶统计特性,当UHF PD信号特征存在着大量非线性关系时,已经不能满足要求。因此,本文采用PCA与核学习方法的有机融合而形成的KPCA不仅特别适合处理非线性问题,而且能够提供更多的信息。

KPCA的基本思想是通过一个非线性映射,将输入数据映射到一个高维特征空间,再在特征空间上进行线性主成分分析。设输入数据 xk被映射为Φ(xk) 假设它们已被中心化,即满足

式中, xk(k = 1,… ,N) 是N个输入训练样本;Φ(xk)是变换后的训练样本。

映射后训练样本的协方差矩阵C为

求解下列特征方程:

式中,α1,…,αi为常数。

定义一个N×N的矩阵K

称 K为核矩阵。将式(7)、式(9)和式(10)代入式(8)得

这样求解式(8)的特征向量v的问题就转化为求特征方程(11)的特征向量α。由式(10)可知核矩阵K是对称、半正定方阵,且它的特征值将是非负的。通过对特征方程(11)的求解,可得到一组非零特征值λj以及对应的满足归一化条件(12)的特征矢量 αj(j=1,…,N)。

设x是一检验样本,则其在vj上的投影为

这样就可得到原始信号的投影特征矢量。

4.2 基于KPCA的UHF PD信号的降维处理

采用第2节所述试验得到的UHF PD信号为样本,该样本由4种放电缺陷模型在不同条件下测得,每类同种条件下均有100个有效放电样本,取其中50个样本作为训练样本,其余 50个为测试样本。因此,N类样本数为3200,P类样本数为1200,M类样本数为1600,G类样本数为1600。

将归一化处理后训练样本按照第3节介绍的方法经最优小波包变换后,得到一系列的小波包系数,计算出UHF PD信号在各频带投影序列的能量、在各个尺度下的模极大值和绝对平均值,构造出其特征空间分别用 x1,…,xN来表示。然后利用第 4.1节的KPCA法从特征空间中抽取核主成分特征,采用高斯核函数,其表达式为

式中,参数 σ= 0.3×N ,N为原始输入空间的维数。

图3为4种GIS典型缺陷归一化的最大特征值递减示意图。图中n代表第n个特征量。通过计算可得前 20个特征值对应的累计方差贡献率达到了87.5%以上,这样既减少了计算机的存储量,又大大缩短计算时间。然后将训练样本向该特征向量构成的空间投影,这些投影值构成原测试样本经KPCA提取后的新特征向量,作为分类器的输入进行模式识别。

图3 归一化特征量递减示意图Fig.3 Sketch map of normalized descending features

4.3 识别结果及分析

按照上述方法和步骤采用db系列最优小波包4层分解对UHF PD信号提取的特征向量进行放电模式识别,分类器选用了径向基函数神经网络,训练方法为正交最小二乘法,结果如下表所示。

表 UHF PD信号识别率Tab. Recognition rate of UHF PD signals

由上表看出,识别率均在 75%以上,其中采用db3、db4最优小波包对UHF PD信号分解识别率最高,均在85%以上。这是因为:当支集长度不消失矩太低时,不利于信号能量的集中;当支集长度太长时则会产生边界问题。另外,N类和M类缺陷识别率高于P类和G类缺陷的识别率。这是由于对于自由金属微粒缺陷(P类)存在的状态比较复杂,随着外加电压的变化,自由金属微粒缺陷有可能处于静止、起跳、舞动等不同运动状态,因此测量数据具有一定的分散性;对于气隙缺陷(G类)来说,主要是由于产生气隙缺陷的绝缘子在多次放电后,有数次击穿并伴有轻微炭化现象,因此导致对该缺陷所采集的波形发生较大的变化,从而导致识别率下降。

5 结论

(1)根据UHF PD的特点,提出一种适合UHF PD模式识别特征提取的新方法。在 GIS内典型缺陷UHF PD数学模型上,分别采用熵最小原则选取最优小波包基,综合选用了UHF PD信号在各频带投影序列的能量分部特征、在各个尺度下的模极大值和绝对平均值,构造出能完整描述UHF PD信号的特征空间,并用KPCA法从特征空间中成功提取了GIS内UHF PD信号特征量。

(2)采用Shannon熵最小原则法选取最优小波包,使UHF PD信号能量更加集中,并用最优小波包系数得到了UHF PD信号在各频带投影序列的能量、在各个尺度下的模极大值和绝对平均值完整地描述UHF PD信号的特征。

(3)利用KPCA法对特征空间进行特征压缩,解决了维数危机,成功地提取了UHF PD信号的特征向量,对实验室获取的UHF PD信号数据的识别效果证明了KPCA法选取UHF PD信号特征量是可行的。同时,用db4最优小波包对UHF PD信号进行分解所得到的小波包系数具有85.5%以上的识别率。

[1] 邱毓昌. GIS装置及其绝缘技术[M]. 北京: 水利电力出版社, 1994.

[2] 邱昌容, 王乃庆. 电工设备局部放电及其测试技术[M]. 北京: 机械工业出版社, 1994.

[3] 唐炬. 组合电器局放在线监测外置传感器和复小波抑制干扰的研究[D]. 重庆: 重庆大学, 2004.

[4] 成永红, 谢小军, 陈玉, 等. 气体绝缘系统中典型缺陷的超宽频带放电信号的分形分析[J]. 中国电机工程学报, 2004, 24(8): 99-102. Cheng Yonghong, Xie Xiaojun, Chen Yu, et al. Study on the fractal characteristics of ultra-wide band partial discharge in gas-insulated system(GIS) with typical defects[J]. Proceedings of the CSEE, 2004, 24(8): 99- 102.

[5] Hans Gerd Kranz. PD pulse sequence analysis and its relevance for on-site PD defect identification and evaluation[J]. IEEE Transactions on Dielectrics and Electrical Insulation, 2005, 12(2): 276-284.

[6] Sahoo N C, Salama M M A. Trends in partial discharge pattern classification: a survey[J]. IEEE Transactions on Dielectrics and Electrical Insulation, 2005, 12(2): 248-263.

[7] 刘云鹏, 律方成, 李成榕. 局部放电灰度图像数学形态谱的研究[J]. 中国电机工程学报, 2004, 24(5): 179-183. Liu Yunpeng, Lv Fangcheng, Li Chengrong. Study on pattern spectrum of partial discharge grayscale image [J]. Proceedings of the CSEE, 2004, 24(5): 179-183.

[8] 肖燕, 黄成军, 郁惟镛,等. 波形匹配追踪算法在多局放脉冲提取中的应用[J]. 中国电机工程学报, 2005, 25(11): 157-162. Xiao Yan, Huang Chengjun, Yu Weiyong, et al. Application of wavelet-based matching pursuits algorithm to multiple partial discharge pulses extraction [J]. Proceedings of the CSEE, 2005, 25(11): 157-162.

[9] 王国利, 郑毅, 郝艳捧, 等. 用于变压器局部放电检测的超高频传感器的初步研究[J]. 中国电机工程学报, 2002, 22(4): 154-160. Wang Guoli, Zheng Yi, Hao Yanpeng, et al. Study on the Ultra-high-frequency sensor for PD detection in power transformer[J]. Proceedings of the CSEE, 2002, 22(4): 154-160.

[10] Stephane Mallat. 信号处理的小波导引[M]. 杨力华,戴道清, 黄文良, 等译, 北京: 机械工业出版社, 2002.

[11] 孔锐, 施泽生, 郭立,等. 利用组合核函数提高核主分量分析的性能[J]. 中国图象图形学报, 2004, 9(1): 40-45. Kong Rui, Shi Zesheng, Guo Li, et al. Improving performance of kernel principal component analysis using combination kernel functions[J]. Journal of Image and Graphic, 2004, 9(1): 40-45.

[12] 周倩, 唐炬, 唐铭, 等. GIS内4种典型缺陷的局部放电超高频数学模型构建[J]. 中国电机工程学报, 2006, 26(8): 99-105. Zhou Qian, Tang Ju, Tang Ming, et al. Mathematical model of four typical defects for UHF partial discharge in GIS[J]. Proceedings of the CSEE, 2006, 26(8): 99-105.

[13] 孙才新, 许高峰, 唐炬, 等. 以盒维数和信息维数为识别特征量的GIS局部放电模式识别方法[J]. 中国电机工程学报, 2005, 24(2): 100-104. Sun Caixin, Xu Gaofeng, Tang Ju, et al. PD pattern recognition method using box dimension and information dimension as discriminating features in GIS[J]. Proceedings of the CSEE, 2005, 24(2): 100- 104.

[14] 孙才新, 许高峰, 唐炬, 等. 检测 GIS局部放电的内置传感器的模型及性能研究[J]. 中国电机工程学报, 2004, 24(8): 89-94. Sun Caixin, Xu Gaofeng, Tang Ju, et al. Model and performance of inner sensors used for partial discharge detection in GIS[J]. Proceedings of the CSEE, 2004, 24(8): 89-94.

[15] 张晓文, 杨煜普, 许晓鸣. 基于小波变换的特征构造与选择[J]. 计算机工程与应用, 2003, 19: 25-28. Zhang Xiaowen, Yang Yupu, Xu Xiaoming. Wavelet based feature representation[J]. Computer Engineering and Applications, 2003, 19: 25-28.

Feature Extraction for Partial Discharge Signals Based on the Optimal Wavelet Packet Basis Transform and Kernel Principal Component Analysis

Tang Ju1Xie Yanbin1Zhou Qian2Zhang Xiaoxing1
(1. State Key Laboratory of Power Transmission Equipment & System Security and New Technology Chongqing University Chongqing 400044 China 2. Chongqing Jiangbei Power Supply Bureau Chongqing 401147 China)

Ultra-high frequency (UHF) method has been widely used for partial discharge (PD) detection in gas insulated switchgear (GIS), but the feature extraction for UHF PD signals is a difficult issue all the while. In this paper, a method using wavelet packet transform (WPT) is proposed to decompose the UHF PD signals, and the best basis is selected using minimum entropy criterion based on UHF PD mathematical model of four typical defects in GIS, then the energy in each frequency range, maximal values of module and absolute average values in each scale are computed according to WP coefficients, and the features space is constructed integrally; Kernel principal component analysis (KPCA) is also proposed for reducing dimension of features, and dimension crisis is resolved well, and the divergence matrix strangeness in every class is eliminated. At the same time, the characteristics of signals are retained the farthest. The classification results show that the features used in this paper are quite well for UHF PD defect identification.

Partial discharge, feature extraction, best wavelet packet basis, kernel principal component analysis

TM835

唐 炬 男,1960年生,博士,教授,博士生导师,主要从事电气设备绝缘在线监测及故障诊断研究。

国家重点基础研究(973计划)(2009CB724506)和国家自然科学基金(50777070)资助项目。

2009-11-05 改稿日期 2009-03-12

谢颜斌 男,1980年生,博士研究生,主要从事 GIS设备在线监测及信号处理研究。

猜你喜欢
模式识别波包频带
基于支持向量机和小波包变换的EOG信号睡眠分期
Wi-Fi网络中5G和2.4G是什么?有何区别?
单音及部分频带干扰下DSSS系统性能分析
基于小波包Tsallis熵和RVM的模拟电路故障诊断
UPLC-MS/MS法结合模式识别同时测定芪参益气滴丸中11种成分
第四届亚洲模式识别会议
基于小波包变换的电力系统谐波分析
可拓模式识别算法中经典域的确定方法
调谐放大器通频带的计算及应用
LTE-U