基于排序熵的故障严重程度识别特征选择算法

2015-06-23 16:25潘巍巍
厦门理工学院学报 2015年3期
关键词:特征选择单调排序

潘巍巍

(厦门理工学院应用数学学院,福建厦门361024)

基于排序熵的故障严重程度识别特征选择算法

潘巍巍

(厦门理工学院应用数学学院,福建厦门361024)

基于排序信息熵理论中的排序互信息指标,研究故障严重程度识别的特征评价和特征选择问题.实验结果表明:排序互信息能有效识别出单调的故障特征,为故障严重程度识别提供了一种简单、直观的方法.

故障诊断;排序;信息熵

故障严重程度可以表示为 “轻微故障”,“中等故障”和 “严重故障”[1-3].故障的不同严重程度之间本质上存在序的结构,即:“严重故障”比 “中等故障”表明设备的故障严重,“中等故障”比“轻微故障”表明设备的故障严重.按照故障的严重程度,有序关系可以表示为: “严重故障” >“中等故障” > “轻微故障”按故障严重程度进行故障诊断,要求工作人员将故障按照故障严重程度划分成几个等级,实际上存在多种划分方式,例如状态监测时将故障划分为 “轻微故障”和 “严重故障”;当 “轻微故障”时,表明设备已出现异常,须安排检修故障;“严重故障时”,须立即停机.

在模式识别领域中,故障严重程度识别可以理解为有序分类问题[4-5].故障特征集中存在与故障的严重程度之间存在单调约束关系的特征,被称为单调故障特征,即特征值随着故障程度的增大而单调增大或变小.单调故障特征能够反映出与故障严重程度之间的单调趋势,为故障严重程度识别提供直观、直接的识别方法.本文假设全部特征都与故障严重性之间满足单调约束关系,把故障严重性问题当作单调分类问题进行研究.故障特征集中只有很少一部分与故障严重程度相关的特征,大量不相关的故障特征不仅会降低故障严重程度识别的准确性,而且会增加算法的复杂度[6].因此,在故障程度识别之前,首先需要从全部特征集合中选择出与故障严重程度相关的故障特征子集,去除不相关和冗余的故障特征.

1 排序信息熵

定义2给定有序决策系统S=〈U,A,D〉,对于∀xi∈U,a∈A,xi关于特征a的有序信息粒子定义为:

相应的,对B⊆A,xi关于B和D的有序信息粒子分别定义为:

其中若∀a∈B,都有xj≥axi,则称xj≥Bxi.

单调分类是一类特殊的有序分类问题,即在有序分类的基础上,假设全部特征与决策之间存在单调约束关系.

定义3给定有序决策系统S=〈U,A,D〉,B⊆A,单调约束关系指的是:对∀xi,xj∈U,如果xi≤Bxj,有D(xi)≤BD(xj)(或者如果xi≥Bxj,有D(xi)≥BD(xj)).

Shannon信息熵是描述关系不确定性的度量指标,目前被广泛应用于通信系统、数据传输和信号处理等有关信息的领域.信息熵基于概率分布进行计算,单个噪声样本不会引起概率分布明显的变化,因此对数据噪声具有很好的鲁棒性.但信息熵指标是以等价关系生成的等价类为基础,不能刻画有序分类问题中的单调约束关系,因此不能直接应用到单调分类问题.文献 [4,7]介绍了 “排序信息熵”的概念,该指标考虑了对象之间的有序结构,能度量特征与决策之间的单调一致性.

定义4给定有序分类样本集U={x1,x2,…,xN},特征集合A,B⊆A.U关于B的前向排序熵和后向排序熵定定义为:

定义5给定有序分类样本集U={x1,x2,…,xN},特征集合A,B⊆A,C⊆A,B和C的前向联合排序熵和后向联合排序熵定义为:

定义6给定有序分类样本集U={x1,x2,…,xN},特征集合A,B⊆A,C⊆A.给定C后,B的前向联合排序熵和后向联合排序熵定义为:

定义7给定有序分类样本集U={x1,x2,…,xN},特征集合A,B⊆A,C⊆A.B和C的前向排序互信息和后向排序互信息定义为:

2 基于排序信息熵的特征选择算法

排序互信息度量了特征与决策之间的单调一致性,该指标可应用于评价有序分类的特征质量.本文将排序互信息作为特征评价函数,采用启发式搜索策略,设计基于排序熵的有序分类特征选择算法.

下面的研究内容,我们只考虑前向单调关系,后向单调关系可以得到类似的结果.

2.1 特征评价指标

定义8给定有序决策系统S=〈U,A,D〉,B⊆A.对∀a∈A-B,a相对于B的属性重要度定义为:

Sig≥(a,B,D)的值越大,说明在B已知条件下,属性a与决策D的单调相关性越大,属性a对决策D越重要.如果Sig≥(a,B,D)=0,表明D是完全依赖B的,a相对于B对D来说是多余的.

2.2 搜索策略

特征评价指标度量特征子集的质量,设计了特征重要度评价指标之后,接下来需要选择搜索策略搜索原始特征空间,寻找在此特征评价指标下最优的特征子集.本文采用前向贪心启发式搜索策略,算法框架如下:

算法:基于排序互信息的前向贪心属性选择

输入:S=〈U,A,D〉

输出:约简red.

3 实验结果与分析

本节将第2节提出的特征选择算法应用到齿轮裂纹故障严重程度识别中.本文的实验数据来源于文献 [8].实验系统中包括1个齿轮箱,驱动齿轮箱旋转的三相交流电机和提供负载的磁力制动器,如图1所示.

图1 实验系统图Fig.1 ExperimentaI system

齿轮箱里总共有三个轴和四个齿轮,齿轮#1位于轴1、齿数为48,齿轮#2的齿数为16,齿轮#1和齿轮#2啮合;齿轮#3位于轴2、齿数为24,齿轮#4的齿数为40,齿轮#3和齿轮#4啮合,其中齿轮#3为测试齿轮.根据裂纹深度和宽度的不同,人为的将测试齿轮破坏成不同的故障程度,令a为裂纹角度,a为弦齿厚度的一半,b为齿厚,齿轮的故障严重程度信息见图2和表1.实验中共使用了3个不同故障严重程度的齿轮,其中F0是一个正常齿轮,F1和F2分别代表两个不同故障程度的测试齿轮.

图2 裂缝角度α,齿厚b,分度圆弦齿厚2aFig.2 Crack angIe,face width and chordaI tooth thickness of a gear

表1 裂纹损伤的几何形状TabIe 1 Geometry of the crack fauIts

在3种负载 (load0,load1,load2)、4种转速 (1 200 rpm,1 400 rpm,1 600 rpm,1 800 rpm)、3种裂纹程度(F0,F1,F2)下,收集36个故障样本,重复运行3次,收集到的齿轮裂纹故障严重程度数据集共有108个样本.本文对振动信号共提取了52个故障特征,分别包括:时域特征、频域特征和专门用于齿轮故障诊断的特征.表2给出了特征编号以及对应的特征信息.

接下来,采用第2节提出的基于排序熵的有序分类特征选择算法,选择出与故障严重程度单调相关的特征子集,去除不相关的特征.单个特征与故障严重程度之间的排序互信息如图3所示.其中特征48与决策之间的排序互信息最大,图4展示了特征48与不同故障严重程度之间的关系.其中横坐标代表样本的编号,纵坐标代表这些样本在特征48上的特征值,d1代表齿轮正常情况,d2和d3分别代表裂纹程度分为25.从图4可以看出,特征48清晰地反映出了与决策之间的单调趋势:随着故障特征值的增加,故障程度的增大 (故障越严重).特征选择得到的特征子集中共包括17个特征,分别是特征3,4,7,8,11,14,15,16,18,19,27,38,45,46,47,48,52.

表2 特征编号和对应的特征描述TabIe 2 Feature number and corresponding description

续表Continued tabIe

图3 故障特征的排序互信息Fig.3 Feature evaIuation using RMI

图4 特征48与不同故障严重程度之间的关系Fig.4 ReIationship between Feature 48 and crack IeveIs

然后应用分类算法进行故障严重程度识别.本文选取了一个有序分类算法:OSDL,对比了两个分类性能指标:分类错误率 (CE)和平均分类损失 (MAE).基于10折交叉验证技术,表3给出了特征选择后的分类性能和使用全部特征进行分类时的分类性能.相比于原始故障数据集,表3的实验结果表明本文构造的特征选择算法既降低了故障特征空间的维数,又有效地降低了故障严重程度识别的错误率和平均分类损失.

表3 选中的特征子集、全部特征的分类错误率和平均分类损失TabIe 3 CIassification error and mean absoIute error comparison of feature seIected and aII features

4 结论

本文设计了基于排序熵的有序分类特征选择算法,以提高故障严重程度识别的准确性和泛化能力.实验结果表明了设计的有序分类特征选择算法的有效性.

[1]LI Z,YAN X,JIANG Y,et al.A new data mining approach for gear crack level identification based on manifold learning[J].Mechanics,2012,18(1):29-34.

[2]CHENG Z,HU N,ZHANG X.Crack level estimation approach for planetary gearbox based on simulation signal and GRA[J].Journal of Sound and Vibration,2012,331(26):5 853-5 863.

[3]ZHAO X M,ZUO M J,LIU Z L,et al.Diagnosis of artificially created surface damage levels of planet gear teeth using ordinal ranking[J].Measurement,2013,45(1):132-144.

[4]HU Q H,PAN W W,ZHANG L,et al.Feature selection for monotonic classification[J].IEEE Transactions on Fuzzy Systems,2012,20(1):69-81.

[5]PAN W W,HU Q H,SONG Y P,et al.Feature selection for montonic classification via maximizing monotonic dependency[J].International Journal of Computational Intelligence Systems,2014,7(3):543-555.

[6] JAIN A,ZONGKER D.Feature selection:evaluation,application,and small sample performance[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1997,19(2):153-158.

[7]HU Q H,GUO M Z,YU D R,et al.Information entropy for ordinal classifi-cation[J].Science China Information Sciences,2010,53(6):1 188-1 200.

[8]LEI Y,ZUO M J,HE Z,et al.A multidimensional hybrid intelligent method for gear fault diagnosis[J].Expert Systems with Applications,2010,37(2):1 419-1 430.

Features for Fault Severity Evaluation Based on Rank Entropy

PAN Wei-wei
(School of Applied Mathematics,Xiamen University of Technology,Xiamen 361024,China)

This paper discussed the feature evaluation and selection algorithm for fault severity level identification using rank entropy.The experiment results show that the algorithm is effective in identifying the monotonic features to make a feasible solution for fault level identification.

fault diagnosis;rank;entropy

O235

A

1673-4432(2015)03-0102-06

(责任编辑 晓 军)

2014-11-14

2015-02-02

厦门理工学院高层次人才项目 (YKJ14018R)

潘巍巍 (1983-),女,讲师,博士,研究方向为模式识别和故障诊断.E-mail:panweiwei@xmut. edu.cn

猜你喜欢
特征选择单调排序
单调任意恒成立,论参离参定最值
排序不等式
数列的单调性
数列的单调性
恐怖排序
对数函数单调性的应用知多少
节日排序
Kmeans 应用与特征选择
联合互信息水下目标特征选择算法
基于特征选择聚类方法的稀疏TSK模糊系统