基于模糊聚类和完全二叉树支持向量机的变压器故障诊断

2016-04-07 00:35舒乃秋武汉大学电气工程学院武汉430072
电工技术学报 2016年4期
关键词:支持向量机

李 赢 舒乃秋(武汉大学电气工程学院 武汉 430072)



基于模糊聚类和完全二叉树支持向量机的变压器故障诊断

李 赢 舒乃秋
(武汉大学电气工程学院 武汉 430072)

摘要为提高电力变压器故障诊断准确率,提出基于模糊聚类和完全二叉树支持向量机的故障诊断模型,即通过模糊C均值聚类,对样本采用完全二叉树结构逐层划分,直至最后得到各故障分类。该方法克服了一般方法对故障划分不明确、分类重叠和不可分等缺点。试验表明,相比改良三比值法、支持向量机分类“一对一”和“一对多”组合,该方法在电力变压器故障诊断中具有最高的诊断准确率。

关键词:变压器油中溶解气体 模糊聚类 完全二叉树 支持向量机

Transformer Fault Diagnosis Based on Fuzzy Clustering and Complete Binary Tree Support Vector Machine

Li Ying Shu Naiqiu (School of Electrical Engineering Wuhan University Wuhan 430072 China)

Abstract To improve the accuracy of power transformer diagnosis, the fault diagnosis model is proposed based on fuzzy clustering and complete binary tree support vector machine (SVM). That is, through fuzzy C-means clustering, samples are divided layer by layer using complete binary tree structure until the fault classification is completed. Compared with general approaches, the method overcomes the shortcomings of unclear division and overlap classification of fault types. The method obtains the highest diagnostic accuracy among the methods mentioned in this paper.

Keywords:Transformer dissolved gases in oil, fuzzy clustering, complete binary tree, support vector machine

0 引言

电力变压器是电力系统运行中最重要的设备之一,其运行状态直接关系到整个电力系统的安全性和经济性。当前,国内使用的大型变压器一般为油浸式变压器,针对此类变压器的故障检修一般是对油中溶解气体的浓度进行分析。传统的IEC三比值法是目前使用较广的故障诊断方法[1-3],但其不能够有效地处理不精确和不确定的信息,且故障编码与故障类别的关系并不是确定的,故人们转而寻求更有效的故障诊断方法。近年来,基于结构风险最小化的支持向量机(Support Vector Machine, SVM)理论为有限样本下,高维、非线性学习问题提供了解决思路[4],在电力变压器故障诊断领域取得了一定成绩,且逐渐得到广泛的应用[5-7]。文献[8]采用“一对一”支持向量机对六类电力变压器故障进行了诊断。文献[9]采用“一对一”和“一对多”支持向量机对电力变压器故障进行诊断。但基于“一对一”或“一对多”的支持向量机多分类诊断时存在不可分区域。相比之下,二叉树支持向量机具有测试速度快、不存在不可分区域等优点,它基于二叉树结构对测试样本逐层采用训练好的两分类支持向量机判断分析得出结果,但如果分类错误发生在二叉树的根节点处,会导致整个分类器具有较高的错误积累,故二叉树支持向量机性能的好坏和树的拓扑结构紧密相关。在一些基于支持向量机理论的电力变压器故障诊断中,诊断的层次结构是根据经验知识构建的。文献[10]根据经验知识构建了一棵五分类二叉树,提出基于粒子群优化支持向量机的电力变压器故障诊断。根据经验知识确定二叉树的方法适于类别数目较少的分类问题,对于类别数目较多的分类问题缺乏客观性和普遍性。此外,没有反映出故障样本的特性,不利于实际故障的正确诊断。

针对上述问题,本文提出基于聚类思想构建二叉树,利用模糊C均值聚类和分裂层次法构建电力变压器故障诊断完全二叉树,再与支持向量机相结合,建立基于完全二叉树支持向量机的电力变压器故障诊断模型。

1 SVM基本理论

最优分类超平面是指将两类样本点无错误地分开,且分类空隙最大的分类面。最优分类超平面是支持向量机分类的核心思想。对于非线性情况,通常考虑使用非线性映射将数据变换到一个特征空间F,然后在这个特征空间使用线性学习器分类。

式中,w为权重向量;b为偏置。w和b确定了分类面的位置。分类面必须满足约束

引入松弛变量ζi用于衡量实际指示值yi与支持向量机输出之间的距离。数据分离面的优化问题转化为优化问题

式中,惩罚参数C用于控制错分样本的惩罚程度。

引入Lagrangian乘子iα,上述问题转化为二次规划的优化问题

引入核函数K(xi, xj)=φ(xi)φ(xj),K( xi, xj)满足Mercer条件,式(4)转化为

αi>0对应的点称为支持向量机,通常支持向量的数目要小于训练样本的个数。通过解式(5)来获得分类决策函数

SVM中常用的核函数有

本文选择径向基核函数。在建模中,惩罚参数C和核函数参数γ 的选择,对于SVM诊断的准确率影响很大。C起到调节样本误分率与学习机复杂性的作用,以求得经验风险和泛化性能之间的某种均衡。C的取值小表示对错分样本的惩罚小,经验风险值大,学习机器的复杂度小,算法的泛化能力较好;C的取值大表示对错分样本的惩罚大,经验风险值小,学习机器的复杂度大,算法的泛化能力变差。每个数据空间至少存在一个合适的C使得学习机泛化性能最好。核函数参数γ 主要影响样本数据在高维特征空间中分布的复杂程度,其值过小或者过大也会对样本造成“过学习”或“欠学习”的影响。

2 模糊聚类

数学上把用一组特征参数表示的样本群按照一定标准进行分类的过程称为聚类分析。由于实际问题经常伴随着模糊性,因此根据事物特性指标的模糊性,应用模糊数学的方法确定样本的亲疏程度来实现分类的方法称为模糊聚类分析[11]。模糊聚类已在电能质量评估、电压控制和放电检测等领域得到了应用[12-14]。

模糊C均值(Fuzzy C-Means, FCM)是由Dunn 和Bezdek提出的一种聚类算法。模糊C均值聚类是从硬C均值(Hard C-Means, HCM)聚类算法上发展而来的,它对数据采用柔性的模糊划分,对每个数据点属于某个聚类的程度用模糊隶属度描述[15,16]。该算法首先随机选取若干聚类中心,所有数据点都被赋予对聚类中心一定的模糊隶属度,然后通过迭代方法不断修正聚类中心,迭代过程中以极小化所有数据点到各个聚类中心的距离与隶属度的加权和为优化目标。其基本思路为:将数据集∈ Rpn分为c类,任意样本xk对i类的隶属度为μik,分类结果用一个模糊隶属度矩阵U ={μik}∈Rpn表示,FCM通过最小化关于隶属度矩阵U和聚类中心V的目标函数Jm(U,V )来实现

3 完全二叉树支持向量机

3.1 二叉树支持向量机

二叉树的拓扑结构分为两种,一种是偏二叉树;另一种是完全二叉树结构。相对于偏二叉树来说,完全二叉树在训练时间和测试时间以及分类准确率上更有优势。对于多分类问题,如果每次都均分为两类,那么整个二叉树就是一个完全二叉树,树结构深度最小,测试时间和训练时间也最短。这是一种理想的树结构,由此建立的分类模型准确率也较高[5]。

本文采用模糊C均值聚类和分裂层次法构建电力变压器故障诊断完全二叉树。模糊C均值聚类对数据采用柔性的模糊划分方法,表达了故障样本所属类的不确定性,反映了各故障性质类间的模糊相似性和关联性。由各类的聚类中心采用分裂层次法生成一棵近似完全二叉树,使相似的类聚集在一起,而在诊断时保证了上层节点分类器诊断的准确性,减少误差累积,提高诊断的准确率。

3.2 完全二叉树支持向量机分类器的建立

建立完全二叉树支持向量机分类器的思想是:先利用模糊C均值聚类求取每类样本聚类中心;再对各聚类中心基于分裂层次法构造一棵二叉树;然后在二叉树的每个节点处,根据聚类中心重新构造学习样本集;最后训练每个节点处的支持向量机子分类器,得到基于完全二叉树支持向量机分类模型。分类器建立和未知样本测试的步骤如图1所示。

图1 完全二叉树支持向量机分类器的训练和测试步骤Fig.1 Complete binary tree SVM classifier training and testing steps

建模过程如下:

(2)利用模糊C均值聚类将C={c1, c2,…,cc}聚类成两类CP和CP∪CN=C 。

(3)正类样本集P1,由属于CP的各聚类中心对应的训练样本构成,负类样本集N1由属于CN的各聚类中心对应的训练样本构成,P1∪N1=S,并训练生成支持向量机SVM1,形成二叉树顶层根节点。

(4)将CP聚类成两类,正类样本P2和负类样本N2由各聚类中心所对应的训练样本构成,此时同理,将CN聚类成两类,正类样本P3和负类样本N3由各聚类中心所对应的训练样本构成,此时。

(5)由正类P2和负类N2训练生成支持向量机SVM2,由正类P3和负类N3训练生成支持向量机SVM3。

(6)重复步骤(4)和步骤(5),直至构造第c-1个支持向量机SVMc-1。

(7)由步骤(1)~(6)得到c-1个支持向量机SVM1,…, SVMc-1,由此形成二叉树的中间节点。

4 基于完全二叉树支持向量机的电力变压器故障诊断模型

4.1 故障特征量的选取与故障分类

本文用于变压器故障诊断的油中溶解特征气体主要有:H2、CH4、C2H6、C2H4和C2H2五种,考虑到各种特征气体含量之间的分散性及差异性,为避免输入特征量存在的数量级差别过大影响诊断效果,本文采用五种特征气体体积的相对百分比含量作为输入变量,对原始数据按照式(8)进行处理[17,18]。式中,xi1,…, xi5为色谱数据中各气体含量的原始值;分别为H2占氢烃的百分比、CH4、C2H6、 C2H4、C2H2占总烃量的百分比。

本文依据所收集的故障样本实际情况,考虑到电力变压器实际存在放电和过热同时发生的故障,确定为七种故障类型,即高能放电D2、低能放电D1、局部放电PD、高温过热T3(>700℃)、中温过热T2(300~700℃)、低温过热T1(<300℃)和放电兼过热DT。由于数据样本对模型的建立和诊断性能影响很大,所收集的样本应具有代表性、广泛性和紧凑性,本文从国家电网公司和南方电网公司所属的供电局和相关文献资料中收集了200多组具有明确结论的电力变压器故障数据,选取不同故障类型数据159组作为训练样本,另选取53组作为测试样本,样本分布见表1。

表1 故障样本分布Tab.1 Fault sample distribution

4.2 完全二叉树的生成

为确定二叉树结构,本文利用模糊C均值聚类求取每类样本的聚类中心,再由各类别聚类中心生成二叉树。其过程如下:

(1)将七类故障对应的样本集分别聚类,得到

(2)二叉树顶层的形成,利用模糊C均值聚类求得聚类中心和最优隶属度矩阵,见表3。

表3 第一次聚类得到的隶属度矩阵Tab.3 Membership matrix of the first cluster

(3)二叉树中间节点的形成。继续对下层节点进行聚类,见表4和表5。

表4 CN1聚类得到的隶属度矩阵Tab.4 Membership matrix of CN1

表5 CP1聚类得到的隶属度矩阵Tab.5 Membership matrix of CP1

(4)综合分析以上聚类结果,得到如图2所示的完全二叉树结构。4.3 支持向量机的训练

图2 电力变压器故障诊断的完全二叉树Fig.2 Complete binary tree of transformer fault diagnosis

依据所确定的二叉树结构,将训练样本集逐级分解,以训练六个支持向量机。在选择学习样本时将分到各类中的样本作为该类的训练样本。在训练过程中,核函数的选择和参数的设置是关键,本文采用网格搜索和交叉验证的方法获得最优参数C和γ,支持向量机的参数选择具体如下:

(1)设定C和γ 的取值范围,本文设定范围是(2-8, 28),C和γ 步长是0.5。

(2)在当前范围内进行指数增长的参数网格搜索得到若干组参数对(C, γ)。

(3)对每一参数对(C, γ)使用5折交叉验证法进行训练、测试,计算交叉验证准确度。

(4)以最高交叉验证准确度和最小惩罚系数为原则,确定最优参数对(C, γ)。

本文中SVM1~SVM6进行参数寻优的的结果见表6。

表6 SVM1~SVM6最优参数Tab.6 Optimal parameter of SVM1~SVM6

根据表6中最优参数分别对六个支持向量机进行训练,其训练结果见表7。

表7 SVM1~SVM6训练结果Tab.7 Training results of SVM1~SVM6

4.4 故障诊断实例分析

4.4.1 实例1

某500kV变电站#3主变A相,油色谱离线分析数据见表8。

表8 油中溶解特征气体组分含量Tab.8 Content of characteristic gas dissolved in oil(单位:μL/L)

利用改良三比值分析,三比值为(0.09,1.20, 9.03),故障编码为(0,2,2),属于高于700℃的高温过热故障。

利用本文方法,按照图2的二叉树结构分层逐级诊断,由根节点SVM1分类器得到决策函数f(x)值为-1.403 6,判断属于CN1类,根据结果使用第二层的SVM2分类器得到决策函数f(x)值为-1.008 4,判断属于CN2类,再根据结果使用第三层的SVM4分类器得到决策函数f(x)值为-0.137 4,判断属于DT类,即放电兼过热故障。

实际故障为放电兼过热,可见基于完全二叉树SVM的诊断结果与实际结果一致,而改良三比值法出现误判。

4.4.2 实例2

某变电站主变型号ODFPS—250000/500,2008 年7月1日色谱在线监测装置检测出有乙炔,7月2日取样进行离线分析,油色谱分析数据见表9。

表9 油中溶解特征气体组分含量Tab.9 Content of characteristic gas dissolved in oil(单位:μL/L)

利用改良三比值分析,三比值为(0.14,0.96, 6.91),故障编码为(1,0,2),属于电弧放电故障。

利用本文方法诊断,SVM1分类器得到决策函数f (x)值为-1.116 8,判断属于CN1类,根据结果使用SVM2分类器得到决策函数f (x)值为-0.399 7,判断属于CN2类,再根据结果使用SVM4分类器得到决策函数f (x)值为-0.005 9,判断属于DT类,即放电兼过热故障。

实际故障为套管引线铜螺栓松动,造成过热和间隙性放电。可见,基于完全二叉树SVM的诊断结果与实际结果一致,而改良三比值法出现误判。

4.5 不同方法诊断结果比较

利用基于完全二叉树支持向量机所建立的诊断模型对53组测试样本进行故障诊断。为评估模型的有效性,测试样本分别采用“一对一”组合、“一对多”组合和改良三比值法,基于同一数据集,同一特征参数进行诊断,各模型的诊断结果见表10。

由表10可知:

(1)本文基于完全二叉树支持向量机的诊断模型具有最高的诊断准确率,说明了该模型的有效性。

(2)分析不同类型故障诊断准确率,可以发现本文方法对“高温过热”和“高能放电”两类故障的诊断准确率均达到90%以上,高于其他类型故障。而对“低温过热”和“局部放电”两类故障的诊断准确率较低。这主要是由于“低温过热”和“局部放电”故障的样本数较少,支持向量机在训练时样本的不均衡性影响到诊断的准确性。

(3)本文方法避免了“一对一”组合和“一对多”组合的分类重叠和不可分区域的出现,同时简化了分类器的结构,减少了分类器数目,提高了诊断效率。

5 结论

1)基于完全二叉树支持向量机的诊断模型能很好地解决小样本学习问题,很好地解决了故障划分模糊、故障信息不明确导致故障识别困难的问题,同时保证了诊断准确度,可用于电力变压器诊断。

2)采用模糊聚类很好地反映了各故障性质类间的模糊相似性和关联性。

3)同其他方法相比,完全二叉树支持向量机取得了较为理想的故障诊断率,说明了该方法的有效性。

参考文献

[1] 肖燕彩, 陈秀海, 朱衡君. 遗传支持向量机在电力变压器故障诊断中的应用[J]. 上海交通大学学报, 2007, 41(11): 1878-1881.

Xiao Yancai, Chen Xiuhai, Zhu Hengjun. The application of genetic support vector machine inpower transformer fault diagnosis[J]. Journal of Shanghai Jiaotong University, 2007, 41(11): 1878-1881.

[2] 杨洪, 古世甫, 陶加贵, 等. 自适应分级多分类支持向量机在变压器故障诊断中的应用[J]. 高压电器, 2010, 46(5): 49-52.

Yang Hong, Gu Shifu, Tao Jiagui, et al. Application of adaptive hierarchical multi-class SVM to transformer fault diagnosis[J]. High Voltage Apparatus, 2010, 46(5): 49-52.

[3] 费胜巍, 苗玉彬, 刘成良, 等. 基于粒子群优化支持向量机的变压器故障诊断[J]. 高电压技术, 2009, 35(3): 509-513.

Fei Shengwei, Miao Yubin, Liu Chengliang, et al. Fault diagnosis of transformer based on particle swarm optimization-based support vector machine[J]. High Voltage Engineering, 2009, 35(3): 509-513.

[4] 孙才新, 陈伟根, 李俭, 等. 电气设备油中气体在线监测与故障诊断技术[M]. 北京: 科学出版社, 2003. [5] 贾嵘, 徐其惠, 李辉, 等. 最小二乘支持向量机多分类法的变压器故障诊断[J]. 高电压技术, 2007, 33(6): 110-113.

Jia Rong, Xu Qihui, Li Hui, et al. Fault diagnosis of transformer using multi-class least squares support vector machine[J]. High Voltage Engineering, 2007, 33(6): 110-113.

[6] 秦业, 袁海文, 袁海斌, 等. 基于优化最小二乘支持向量机的电能质量扰动分类[J]. 电工技术学报, 2012, 27(8): 209-214.

Qin Ye, Yuan Haiwen, Yuan Haibin, et al. Class-ification of power quality disturbances based on optimized least squares support vector machine[J]. Transactions of China Electrotechnical Society, 2012, 27(8): 209-214.

[7] 高彩亮, 廖志伟, 岳苓, 等. 基于小波奇异值和支持向量机的高压线路故障诊断[J]. 电力系统保护与控制, 2010, 38(6): 35-39.

Gao Cailiang, Liao Zhiwei, Yue Ling, et al. Fault diagnosis of HV transmission lines based on wavelet singular value and support vector machine[J]. Power System Protection and Control, 2010, 38(6): 35-39.

[8] 罗文, 王莉娜. 风场短期风速预测研究[J]. 电工技术学报, 2011, 26(7): 68-74.

Luo Wen, Wang Lina. Short-term wind speed forecasting for wind farm[J]. Transactions of China Electrotechnical Society, 2011, 26(7): 68-74.

[9] 朱文俊, 周刚, 王红斌, 等. 基于粒子群优化支持向量机的变压器故障诊断[J]. 水电能源科学, 2012, 30(4): 179-182.

Zhu Wenjun, Zhou Gang, Wang Hongbin, et al. Fault diagnosis of transformer based on particle swarm optimization-based support vector machine[J]. Water Resources and Power, 2012, 30(4): 179-182.

[10] 郑蕊蕊, 赵继印, 赵婷婷, 等. 基于遗传支持向量机和灰色人工免疫算法的电力变压器故障诊断[J].中国电机工程学报, 2011, 31(7): 56-63.

Zheng Ruirui, Zhao Jiyin, Zhao Tingting, et al. Power transformer fault diagnosis based on genetic support vector machine and gray artificial immune algorithm[J]. Proceedings of the CSEE, 2011, 31(7): 56-63.

[11] 肖燕彩, 朱衡君. 基于最小二乘支持向量机的电力变压器故障诊断[J]. 电力自动化设备, 2007, 27(9): 48-51.

Xiao Yancai, Zhu Hengjun. Transformer fault diagnosis based on least squares support vector machine[J]. Electric Power Automation Equipment, 2007, 27(9): 48-51.

[12] Bhalla D, Bansal R K, Gupta H O. Transformer incipient fault diagnosis based on DGA using fuzzy logic[C]//India International Conference on Power Electronics, IICPE, 2011: 1-5.

[13] Moreira M P, Santos L T B, Vellasco M M B R. Power transformers diagnosisusing neural networks[C]// International Joint Conference on Neural Networks, IJCNN, 2007: 1929-1934.

[14] 司文荣, 李军浩, 袁鹏, 等. 基于波形非线性映射的多局部放电脉冲群快速分类[J]. 电工技术学报, 2009, 24(3): 216-221.

Si Wenrong, Li Junhao, Yuan Peng, et al. The fast grouping technique of PD sequence based on the nonlinear mapping of pulse shapes[J]. Transactions of China Electrotechnical Society, 2009, 24(3): 216-221.

[15] 蒋德珑, 王克文, 杨平, 等. 基于聚类思想的电能质量综合评估[J]. 电力系统保护与控制, 2012, 40(7): 105-111.

Jiang Delong, Wang Kewen, Yang Ping, et al. Power quality comprehensive evaluation based on the clustering method[J]. Power System Protection and Control, 2012, 40(7): 105-111.

[16] 康勇, 李华强, 郑武, 等. 基于能量灵敏度矩阵和模糊聚类分析的电压控制分区[J]. 电力系统保护与控制, 2011, 39(12): 69-73.

Kang Yong, Li Huaqiang, Zheng Wu, et al. Voltage control partitioning based on energy sensitivity matrix and fuzzy clustering analysis[J]. Power System Protection and Control, 2011, 39(12): 69-73.

[17] 江伟, 罗毅, 涂光瑜. 基于多类支持向量机的变压器故障诊断模型[J]. 水电能源科学, 2007, 25(1): 52-55.

Jiang Wei, Luo Yi, Tu Guangyu. Transformer fault diagnosis based on multi-class SVM[J]. Water Resources and Power, 2007, 25(1): 52-55.

[18] 司马莉萍, 舒乃秋, 左婧, 等. 基于灰关联和模糊支持向量机的变压器油中溶解气体浓度的预测[J].电力系统保护与控制, 2012, 40(19): 41-46.

Sima Liping, Shu Naiqiu, Zuo Jing, et al. Concentration prediction of dissolved gases in transformer oil based on grey relational analysisand fuzzy support vector machines[J]. Power System Protection and Control, 2012, 40(19): 41-46.

李 赢 男,1991年生,硕士研究生,研究方向为电力设备在线监测及故障诊断。

E-mail: derickleeing@sina.com(通信作者)

舒乃秋 男,1954年生,博士,教授,博士生导师,研究方向为电力设备在线监测及故障诊断。

E-mail: shunaiqiu@21cn.com

作者简介

收稿日期2014-03-13 改稿日期 2015-06-18

中图分类号:TM411

猜你喜欢
支持向量机
基于支持向量回归机的电能质量评估
基于智能优化算法选择特征的网络入侵检测
数据挖掘技术在电厂经济性分析系统中的应用Q
基于改进支持向量机的船舶纵摇预报模型
基于SVM的烟草销售量预测
动态场景中的视觉目标识别方法分析
论提高装备故障预测准确度的方法途径
基于熵技术的公共事业费最优组合预测
基于支持向量机的金融数据分析研究
管理类研究生支持向量机预测决策实验教学研究