基于高斯混合模型与改进网格搜索法的轴承故障诊断

2016-05-14 07:12陈远帆李舜酩
关键词:支持向量机

陈远帆,李舜酩

(南京航空航天大学,南京 210016)



基于高斯混合模型与改进网格搜索法的轴承故障诊断

陈远帆,李舜酩

(南京航空航天大学,南京210016)

摘要:为提高轴承复杂故障的诊断准确率,将高斯混合模型与改进网格搜索法相结合,开展了轴承故障诊断方法的研究,对不同情况下的轴承故障进行了诊断。首先将采集的数据进行了适当分段,利用混合高斯分布拟合各段数据,提取统计特征量作为故障特征指标;然后分别采用普通网格搜索法和改进的网格搜索法进行参数优化;最后以支持向量机作为分类器对轴承故障进行了诊断,并将2种优化算法的准确率进行了对比。结果表明:所提出的故障诊断方法准确率更高。

关键词:高斯混合模型;统计特征量;支持向量机;改进网格搜索法;故障分类

轴承是机械设备的关键部件,如何快速、高效地诊断出其故障就显得尤为重要。目前常见的轴承故障诊断方法有Wigner-Ville分布、小波分析、Hilbert-Huang变换、神经网络等。Wigner-Ville分布[1-2]时频分辨率高,具有明显的物理意义,但是对于多分量信号存在严重交叉项干扰;小波分析[3-6]有良好的自适应性,但其存在窗函数的局限性,无法准确描述频率随时间的变化;Hilbert-Huang变换[7-8]不受傅里叶分析的局限,适用于分析非线性、非平稳信号,但是当特征信号中混有强噪声时分析效果就不太理想;神经网络[9-11]具有很好的泛化能力,容错性较高,但其结构和类型的选择过分依赖先验知识或经验。混合高斯分布可以较好地拟合非高斯信号,而支持向量机在数据样本较少时仍能达到较好的分类效果。因此,本文采用混合高斯分布[12-14]来拟合各个数据点的概率密度函数,并在此基础上提取统计特征量均值、方差和峭度作为信号的故障特征指标,以改进的网格搜索法进行参数优化,最后以支持向量机作为分类器进行故障的识别与分类。

1高斯混合模型及其参数估计

高斯密度函数是一种参数化的模型,分为单高斯模型(single gaussian model,SGM)和高斯混合模型(gaussian mixture model,GMM)2类。其中,SGM仅仅适用于两类别划分的问题,而GMM适用于多类别划分问题。

1.1高斯混合模型

单一的高斯分布模型在二维空间近似于椭圆,在三维空间近似于椭球。但在很多分类问题中,样本并不满足这种“椭圆”特性,这就要引入高斯混合模型。高斯混合模型是单一高斯模型的一种延伸,它采用若干单一高斯分布模型的加权平均来表示。高斯混合模型定义如下:

(1)

其中:M为模型的混合数;wk为混合模型的权重系数,且∑wk=1;N(x;μk,Σk)为第k个单一高斯概率密度函数,计算式如下:

(2)

由于高斯混合模型能够平滑地近似任意形状的密度分布,因此近年来常被用在语音、图像识别等方面,取得了不错的效果。

1.2高斯混合模型的参数估计

确定高斯混合模型的个数是一个难点。对于混合模型中的3个参数,本文采用最常见的最大期望值算法(expectation maximum,EM)进行估计[15]。该算法基本步骤如下:

1) 初始化参数:包括协方差矩阵、均值、权重系数;

2) 期望步:计算响应度;

3) 极大化步:计算加权均值和协方差;

4) 计算对数似然:检查参数和对数似然是否已经收敛,若不收敛,则返回步骤2)。

(3)

(4)

(5)

(6)

将表达式(4)~(6)按照上述迭代算法进行计算即可得到最佳估计值。

2故障特征量分析与改进的网格搜索法

2.1故障特征量的提取与分类

故障特征的提取原则是希望特征量对故障信号十分敏感,且对其他无关信号的抗干扰能力很强。即要求一旦在正常信号中混入故障信号,故障特征量能及时地反映出来;当混入的故障信号不同时,特征量能显示出其区别;当信号强度、频率等改变时,特征量仍可较稳定地反映出信号中的故障。但在实际操作中,由于不同故障所表现出来的特性并不完全相同,所以并不能保证提取的灵敏度与稳定性都达到最佳,故本文选用稳定性较好、但是灵敏度较差的均值μ与稳定性和灵敏度都一般的方差σ2,以及灵敏度最好、但稳定性较差的峭度K作为进行故障分类的特征指标。计算公式如下:

(7)

支持向量机(SVM)[16-18]是20世纪90年代中期发展起来的基于统计学习理论的一种机器学习方法,其优点是在统计样本较少的情况下亦能获得良好的统计规律。SVM广泛地应用于统计分类和回归分析中,其本质是寻找一个最优的分类面。对于一般的非线性分类问题,在引入拉格朗日函数、松弛因子ξ、一个惩罚因子C以及核函数后可以转化为一个二次优化问题。

约束:yi(wTxi+b)-1≥ξi,i=1,2,…,n;ξi≥0。

常见的核函数有多项式函数、线性函数和径向基函数,而对于核函数的选择,目前还没有确定的标准。本文采用径向基函数作为核函数。对于参数c和g,本文采用改进的网格搜索法进行优化,分类时的参数设置为“-s=0”,“-t=2”。因为该问题属于分类问题,所以s取0,它表示选取C-SVC模型;t取2表示核函数选择径向基函数。c和g则由优化得到,初始条件不同,两者的值一般是不同的。

2.2改进的网格搜索法

采用网格搜索法搜索最优的c和g的值,原理如下:搜索给定范围内的所有可能的c和g的值,然后进行交叉验证,找出使交叉验证精确度最高的c和g的值,即为最优值。但由于该方法是一种遍历整个区域的搜索方法,所以搜索效率并不高。在参数较少的情况下,网格搜索法复杂度比其他高级算法高不了多少,又由于其搜索范围广、可并行性高,所以仍然是比较常见的搜索方法。通常最优值在一个较小的范围内,其余大部分范围都属于不必考虑的区域,因而希望在大部分区域搜索速度加快,而在最优值附近的最优区域放慢步伐,仔细搜索,找到最优值。本文中c的搜索范围是[2-8,28],g的搜索范围是[2-8,28]。对于未改进的网格搜索法,步距均采用0.5;对于改进的搜索法,首先在整个区域以步距3进行粗略的搜索,在找到最优值区域后,在最优值附近以步距0.5进行小范围搜索,最终得到最优值。采用改进的搜索法[19]可以明显减少无效搜索时间,提高搜索效率。

3所提出方法的具体步骤

本文提出一种基于高斯混合模型和改进网格搜索法的轴承故障诊断方法,具体步骤如下:

1) 对于每一种故障均取前120 000个数据点为计算数据,每500个数据点为1组进行分段,共分240段,给定一个混合高斯数目N,对于每一组的500个数据点均采用混合高斯分布进行拟合,得出1组均值、方差和峭度数据。

2) 将得到的240组统计特征量数据分为2部分:一部分作为训练数据(例如200组),另一部分作为测试数据(例如40组)。分组情况在每一种比较中具体给出。

3) 对训练数据分别采用普通网格搜索法和改进的网格搜索法优化参数c和g,得到2组c和g的最优值以及优化所需的时间。

4) 在运用支持向量机分类时分别设置步骤3)中得到的2组最优的c和g值,得出2种优化算法实际最优的分类准确率。

5) 比较2种优化算法所需时间以及最终得到的分类准确率,由此得出以混合高斯模型和改进的网格搜索法相结合的故障诊断方法的优劣。

4仿真及其结果分析

为了评价该方法对故障的分类效率,采用美国Case Western Reserve University电气工程实验室的滚动轴承故障模拟实验台采集到的数据进行测试,采用的测试数据均为采样频率为12 kHz的驱动端轴承数据,测试分5种情况。

4.1混合高斯模型数目不同时2种参数寻优法的故障识别率

采样频率为12 kHz,故障轴承直径为0.177 8 mm。以电机负荷为0马力的内圈、滚动体、外圈6点位置的驱动端故障数据和0负荷下正常基座数据这4组数据作为测试数据。取前120 000个数据点为计算数据,每500个点分为1组,共分成240组。以前200组数据作为训练数据,后40组数据作为测试数据。混合高斯模型数目不同时采用普通网格搜索算法和改进网格搜索算法进行参数优化的用时和准确率对比,结果分别如图1(a)、(b)所示。

图1 两种优化算法参数优化用时和准确率对比

由图1(b)可以看出:采用普通网格搜索法和改进的网格搜索法寻优,分类准确率都大致随混合高斯模型数目的增加先提高后降低,且实际准确率均有小幅提高,最优的混合模型数目均为N=6。由图1(a)可以看出:在相同高斯混合模型数目下,改进的搜索法用时小于普通的搜索法;随着混合模型数目的增加,改进搜索法用时与普通搜索法用时的差距越来越大。这是由于用时主要由两部分组成:一部分为高斯拟合用时;另一部分为参数搜索用时。在计算中可以发现:随着N的增大,高斯拟合时间会增加;混合模型数目超过10后,拟合时间会显著增加。所以,在N较大时,拟合占主要时间。由于数据的选择是随机的,所以假设在其他情况下的最优混合模型数也是6。

4.2训练组数不一样时的故障识别率

采样频率为12 kHz,故障轴承直径为0.177 8 mm。以电机负荷为0马力的内圈、滚动体、外圈6点位置的驱动端故障数据和0负荷下正常基座数据这4组数据作为测试数据。取前120 000个数据点为计算数据,每500个点分为1组,共分成240组。取N=6。下面分几种情况来分别计算准确率。不同分组情况下普通网格搜索法和改进网格搜索法对参数c和g的网格优化结果以及准确率对比如表1所示。

由表1可得:分类准确率随训练组数的增加而提高;在训练组数相同的情况下,采用改进的网格搜索法可使准确率提高。所以,在条件允许的情况下,训练组数应尽可能多,以达到最优的分类准确率。

4.3不同类别故障下的故障识别率

情况1故障尺寸、电机负荷、故障类型相同,故障位置不同。采样频率为12 kHz,故障轴承直径为0.177 8 mm。以电机负荷为0马力的外圈6点、3点、12点位置的驱动端故障数据和0负荷下正常基座数据这4组数据作为测试数据。取前120 000个数据点为计算数据,每500个点分为1组,共分成240组。取N=6。

情况2电机负荷、故障类型、故障位置相同,故障尺寸不同。采样频率为 12 kHz,故障轴承直径分别为0.177 8,0.355 6,0.533 4,0.711 2 mm。以不同故障轴承直径以及电机负荷为0马力的内圈驱动端故障数据和0负荷下正常基座数据这6组数据作为测试数据。取前120 000个数据点为计算数据,每500个点分为1组,共分成240组。取N=6。

情况3故障尺寸、故障类型、故障位置相同,电机负荷不同。采样频率为12 kHz,故障轴承直径为0.177 8 mm。以电机负荷分别为0,1,2,3马力的内圈驱动端故障数据和0负荷下正常基座数据这5组数据作为测试数据。取前及120 000 个数据点为计算数据,每500个点分为1组,共分成240组。取N=6。

在3种情况下普通搜索法和改进搜索法对参数c和g的网格优化结果以及准确率对比如表2所示。

表1 不同训练组数下普通网格搜索法和改进网格搜索法对参数c和g的网格优化结果以及准确率

表2 不同类别故障下普通网格搜索法和改进网格搜索法的参数选择及分类准确率

由表2纵向比较可得:不同类别故障下的分类准确率是不同的,情况1和情况2较好,但情况3相对较差,说明所选择的特征量对故障的尺寸变化和位置变化较敏感,而对于电机负荷的变化则不太敏感。所以在实际检测过程中,对于不同的情况应选择不同的特征量作为检测标准,以达到最佳的检测效率。由表2的横向比较可得:采用改进网格搜索法的分类准确率高于普通网格搜索法。

5结论

本文采用高斯混合模型与改进的网格搜索法相结合的故障诊断方法,对不同情况下的轴承进行故障诊断,并与高斯混合模型结合普通网格搜索法的故障诊断方法进行了对比。结果表明:

1) 所提方法的准确率与效率均高于后者。

2) 所提方法的故障识别率随高斯混合模型数目的增加先增后减,且故障识别率随训练组数的增多而提高。

3) 相同的特征量并不一定适用所有情况的故障诊断。对于高斯混合模型数目的确定,目前还没有一种被广泛认可的方法,一般采取穷举法求得。

参考文献:

[1]李舜酩,李香莲.振动信号的现代分析技术与应用[M].北京:国防工业出版社,2008.

[2]LI H,ZHENG H,TANG L.Wigner-Ville Distribution based on EMD for faults diagnosis of bearing[M].Berlin:Springer,2006.

[3]陶新民,徐晶,杜宝祥,等.基于小波域广义高斯分布的轴承故障诊断方法[J].机械工程学报,2009,45(10):61-67.

[4]NIKOLAOU N G,ANTONIADIS I A.Rolling element bearing fault diagnosis using wavelet packets[J].Ndt & E International,2002,35(3):197-205.

[5]PETER W T,PENG Y H,YAM R.Wavelet analysis and envelope detection for rolling element bearing fault diagnosis—their effectiveness and flexibilities[J].Journal of vibration and acoustics,2001,123(3):303-310.

[6]RAFIEE J,RAFIEE M A,TSE P W.Application of mother wavelet functions for automatic gear and bearing fault diagnosis[J].Expert Systems with Applications,2010,37(6):4568-4579.

[7]李常有,徐敏强,郭耸.基于改进的 Hilbert-Huang 变换的滚动轴承故障诊断[J].振动与冲击,2007,26(4):39-41.

[8]RAI V K,MOHANTY A R.Bearing fault diagnosis using FFT of intrinsic mode functions in Hilbert-Huang transform[J].Mechanical Systems and Signal Processing,2007,21(6):2607-2615.

[9]杨宇,于德介,程军圣.基于 EMD 与神经网络的滚动轴承故障诊断方法[J].振动与冲击,2005,24(1):85-88.

[10]LI B,CHOW M Y,TIPSUWAN Y,et al.Neural-network-based motor rolling bearing fault diagnosis[J].Industrial Electronics,IEEE Transactions on,2000,47(5):1060-1069.

[11]WANG C C,KANG Y,Shen P C,et al.Applications of fault diagnosis in rotating machinery by using time series analysis with neural network[J].Expert Systems with Applications,2010,37(2):1696-1702.

[12]肖涵,李友荣,吕勇.高斯混合模型与小波包能量相结合的齿轮故障分类[J].起重运输机械,2009 (1):92-95.

[13]孙贤昌,田学民,张妮.一种基于 GMM 的多工况过程故障诊断方法[J].计算机与应用化学,2014,31(1):33-39.

[14]李元,孙健.基于高斯混合模型和变量重构组合法的故障诊断与分离[J].南京航空航天大学学报,2011,43(7):207-210.

[15]肖涵.基于高斯混合模型与子空间技术的故障识别研究[D].武汉:武汉科技大学,2007.

[16]王明刚,朱永忠,王峰.SVM 在监控小批量生产中的应用及比较分析[J].重庆理工大学学报(自然科学),2014,28(3):140-144.

[17]崔建国,李明,陈希成,等.基于支持向量机的飞行器健康诊断方法[J].压电与声光,2009(2):266-269.

[18]杨丽, 高美婷.支持向量机无损测量组织光学参数的研究[J].激光杂志,2014(11):68-71.

[19王健峰,张磊,陈国兴,等.基于改进的网格搜索法的 SVM 参数优化[J].应用科技,2012,39(3):28-31.

(责任编辑陈艳)

Bearing Fault Diagnosis Based on Gauss Mixture Model and the Improved Grid Search Method

CHEN Yuan-fan, LI Shun-ming

(Nanjing University of Aeronautics and Astronautics, Nanjing 210016, China)

Abstract:The paper carried out the study of the method of bearing fault diagnosis under different conditions and combined the Gaussian mixture model with the improved grid search method to improve the diagnosis accuracy of complex bearing fault. The paper paragraphed the data appropriately and fitted the segment data using the mixed Gauss distribution, extracting statistical characteristics as the fault feature index, and then using common grid search method and the improved grid search method respectively, we had parameter optimization; finally, the paper used the support vector machine as a classifier for bearing fault diagnosis and compared the accuracy of two kinds of optimization algorithm.The results show that the accuracy is higher by using the proposed fault diagnosis method.

Key words:Gauss mixture model; statistical characteristics; support vector machine; improved grid search method; fault classification

中图分类号:TH13

文献标识码:A 1674-8425(2016)03-0034-06

doi:10.3969/j.issn.1674-8425(z).2016.03.006

作者简介:陈远帆(1991—),男,江苏常熟人,硕士研究生,主要从事机械零件故障诊断研究。

基金项目:中央高校基本科研业务费专项资金资助项目(NZ2015103);机械结构强度与振动国家重点实验室开放课题资助项目(SV2015-KF-01)

收稿日期:2015-10-23

引用格式:陈远帆,李舜酩.基于高斯混合模型与改进网格搜索法的轴承故障诊断[J].重庆理工大学学报(自然科学),2016(3):34-39.

Citation format:CHEN Yuan-fan, LI Shun-ming.Bearing Fault Diagnosis Based on Gauss Mixture Model and the Improved Grid Search Method[J].Journal of Chongqing University of Technology(Natural Science),2016(3):34-39.

猜你喜欢
支持向量机
基于支持向量回归机的电能质量评估
基于智能优化算法选择特征的网络入侵检测
数据挖掘技术在电厂经济性分析系统中的应用Q
基于改进支持向量机的船舶纵摇预报模型
基于SVM的烟草销售量预测
动态场景中的视觉目标识别方法分析
论提高装备故障预测准确度的方法途径
基于熵技术的公共事业费最优组合预测
基于支持向量机的金融数据分析研究
管理类研究生支持向量机预测决策实验教学研究