多核LSSVM算法在轴承故障识别中的应用

2018-03-05 12:33刘文婧陈肖洁
机械设计与制造 2018年2期
关键词:高斯故障诊断轴承

刘文婧,陈肖洁

(内蒙古科技大学 机械工程学院,内蒙古 包头 014010)

1 引言

滚动轴承故障诊断需要解决的关键问题是,如何从非平稳的故障信号中提取出有效的、可以表征故障状态的特征参数[1]。近年来,信号分析及其特征提取的方法有,短时傅里叶变换、Hilbert变换、Wigner-Ville分布和经验模式分解(empiricalmodedecomposition,EMD)等。非平稳信号的处理方法已广泛应用于机械故障诊断,并取得了不错的效果[2-3]。EMD分解方法可以有效地提取振动数据序列趋势,因此,我们可以利用EMD分解来获取信号的本征模函数(intrinsic mode function,IMF)分量。

故障模式识别主要有人工神经网络与支持向量机(support vector machine,SVM)两种方法。人工神经网络易陷入过度学习和局部最小值等困境。SVM通过隐式定义的核函数将低维的输入空间引入高维的特征空间,以高维空间中的可分来解决原本不可分的问题,具有求解高效,易处理非线性高维的问题,成功地应用于故障诊断[4-5],证明SVM在故障识别方面的优越性。然而,就获取最优解的计算代价而言,最小二乘支持向量机(least squares support vector machine,LSSVM)[6]凭借解决一组线性方程组来求解超平面参数的优势,在计算高效性上,优于SVM。但是,LSSVM面临着如何选择核函数的难题,同时,不同的单一核函数对SVM的分类精度影响较大。多核学习(multiple kernel learning,MKL)[7]的提出为核函数的选取提供了新的思路,拓宽了核函数选择的道路,即我们可以同时选择多个不同类型的基本核函数,也可以选择同一类型不同核参数的核函数。多核学习模型的至关重要的问题是,基本核函数的权系数如何确定。半定规划算法的多核学习LSSVM算法[8]和选择性多核学习SVM算法[9]中的多核权系数的求解均需要反复循环训练分类器LSSVM或SVM,计算开销较大。为了减小算法的计算开销,考虑到文献[10]提出的核极化核度量标准,借助于核极化的独立于学习分类器的优势,我们提出由核极化来确定多个基本核函数的权系数。

因此,我们联合考虑EMD提取振动信号趋势的有效性、LSSVM学习器计算的高效性、多核学习模型选择核函数的广泛性和核极化确定多核权系数快捷性,提出EMD与多核LSSVM算法,并用实验室的轴承信号检测所提算法的有效性。

2 EMD与数据特征提取

2.1 EMD

经验模式分解EMD方法的特点是直观性、先验性和自适应性。EMD分解信号的依据原则为样本数据本身的时间尺度特征,预先不设定任何基函数。在理论上,EMD适用于任何类型的信号的分解。因此,常常借助EMD分解非线性、非平稳信号,使复杂信号分解为有限个本征模函数IMF,获得一系列表征原信号特征不同时间尺度的局部特征信号,即模态函数IMF,IMF的频率由高到低。

2.2 数据的特征提取

我们对EMD分解的信号进行数据特征向量提取,主要采用的信号特征有均方值指标、峰峰值指标、峭度指标、偏度指标,各类的指标的具体形式如下:

峰峰值(peak-to-peak)是指最大的正值减去最大的负值之差。对故障信号来说,峰峰值要明显增大。

对机械故障诊断系统而言,均方值Xrms描述信号的能量,稳定性好,可以判别机械设备运转状态是否正常;峭度指标Cq对振动信号的冲击特征较敏感,反映信号的冲击特征;方差权衡振动信号的离散程度;偏度指示振动信号数据分布非对称程度。

3 LSSVM

二分类时,在非线性的情形下,给定一组包含l个样本的训练样本集,通过所谓的核函数的隐式定义,使 n 维空间的数据映射到更高维的S空间,随之,在高维S空间中,以线性分类的方式成功解决n空间的非线性分类问题。在综合考虑函数复杂度和分类允许误差的前提下,分类问题的数学语言可表述如下[6]:

式中:γ—正则化参数;ek—松弛变量,或分类允许误差;b—偏置常量。通过构建Lagrange方程求解式(2):

关于式(3),由 Karush-Kuhn-Tucker(KKT)条件可得:

整理式(4),可得线性方程组,如下:

式中:Ωij=yiyjk(xi,xj);Y=(y1,…,yl)T;I—与 Ω 同阶的单位矩阵;I1=(1,…,l)T,与 Ω 同行的全 1 列矩阵;拉格朗日乘子α=(α1,…,αl)T。

求解式(5),得到b和α,对未来输入样本x,LSSVM的输出决策函数为:

多分类时,多分类分类问题的求解方法主要有两种,一次性多目标优化和多分类问题通过某种原则转化为二分类问题。在实际应用中,鉴于多目标优化,即一次性求解所有分类问题的多参数的多目标优化算法,面临着求解变量数目较大,求解过程复杂等难题,并不适用。因此,我们采用将多分类转化为多个二分类LSSVM来实现多分类分类,为了保持样本数据的平衡性,采用一对一方式来实现多个二分类。

4 多核LSSVM

多核最小二乘支持向量机(leastsquaressupportvectormachine with multiple kernels,MK_LSSVM)算法的核心思想是将M个不同类型的基本核函数k1,…,kM进行线性或非线性的加权组合以获取新的等价核,并将新的等价核用于训练模型的构建。根据多核学习MKL[7]的原理,MK_LSSVM的决策输出函数为:

式中:μi—第i个基本核函数的组合权系数;M—基本核函数的个数。根据结构风险最小化,MK_LSSVM的原始优化问题的可表述为:

构建拉格朗日函数进行式(8)求解:

分别对式(9)的各参数 ωi,ek,b,ak求偏导,由 KKT 条件可得:

将式(11)整理为矩阵的形式可简写如下:

指出P的几何意义为当同类样本点相互靠近,异类样本点相互远离时,P值越大。换而言之,就是,当某一核函数对样本正确分类的贡献率越大时,相对应的P值就大。因此,在多核学习的框架中,我们可以利用相应基本核函数的核极化值的大小来确定其组合权系数的大小,权系数确定的具体表达式为:

目前,广泛使用的基本核函数有:高斯核、多项式核、线性核等。我们选用全局性核函数—多项式核和局部性核函数—高斯核,作为多核组合的基本核函数,高斯核和多项式核的表达式分别为:

为了减小不同核函数之间的差异性,我们对核函数进行球形标准化处理,具体公式为:

5 EMD与MK_LSSVM算法

EMD信号分解原理和多核LSSVM学习算法,在滚动轴承的故障诊断中,联合二者,提出了基于EMD与MK_LSSVM的轴承故障诊断算法,算法步骤如下:步骤1:采集各种机械信号(如,正常信号、内圈故障信号、外圈故障信号和滚动体故障信号),并进行EMD信号分解,对主要的IMF分量进行数据特征提取,即获取数据样本集,并确定训练集和预测集;步骤2:选择基本核函数,高斯核和多项式核,并设置相应的核参数值σ和q;步骤3:基本核函数的标准化处理,如式(16)所示。步骤4:计算每个核函数的核极化值Pi,并按式(14)确定核函数的组合权系数μi值;步骤5:MK_LSSVM分类器的学习训练,由式(13)确定 α 和b;步骤 6:MK_LSSVM的预测,根据式(7)预测新输入的样本x的类别。依据上述步骤,用具体实验,以验证所提算法是否有效。

6 实验

6.1 轴承故障模拟实验台

轴承故障模拟实验台主要由电动机、电机控制器、转速计、联轴器、转轴、轴承座、平衡转子、透明防护罩、基座组成,如图1所示。可模拟轴承状态及故障有:正常、滚动体故障、内圈故障、外圈故障。

图1 轴承故障模拟实验台Fig.1 The Experimental Table of Bearing Fault

6.2 轴承振动信号采集

轴承振动信号的采集过程:首先,轴承故障试验台将振动信号传输到轴承座上的传感器,然后,输送到振动信号采集仪,进行信号的模/数转换,最后,传送信号至电脑,显示采集信号的波形。轴承振动信号传输通路,如图2所示。信号采集流程图,如图3所示。

图3 信号采集流程图Fig.3 The Flow Chat of Signal Acquisition

为了成功地完成信号采集。(1)确定要采集信号的轴承状态(正常,滚动体故障,内圈故障或外圈故障);(2)确定电动机的转速(根据需要设定转速,如:1200r,1800r等);(3)设定采样频率(根据采样定理)和采样时间(根据需要);(4)确定样本组数(若需多组)。实验中,设置采样频率为2560Hz和采样时间为20s,电动机转速为1410r,分别模拟了轴承正常、外圈故障、内圈故障和滚动体故障等4种状态。我们从采集的各种状态的数据中,各选取1200个数据点,则样本数据总大小为4800x1。内圈故障的原信号时域图,如图4所示。

图4 内圈故障的原信号时域图Fig.4 The Original Signal Time Domain Diagram of Inner Fault

关于如何对采集到的轴承4种状态的加速度实验信号进行分析和识别,步骤如下:首先,对采集的各类轴承信号进行EMD分解,得到主要的IMF分量;然后,用均方值指标、方差指标、峰峰值指标、峭度指标、偏度指标提取第一个IMF分量的数据特征作为样本的输入特征;再然后,按照第5部分的MK_LSSVM算法对样本特征进行训练学习和预测识别。

6.3 实验参数设置

为了证实EMD与多核LSSVM的轴承故障诊断算法的有效性,对于各种状况的信号数据,经EMD分解和提取样本特征向量后,我们得到的总样本集大小为4800x5,设置训练集为总样本数的50%,总样本数的50%为测试集。选取高斯核和多项式核作为组合多核的基本核函数,其中核参数分别取σ=2、σ=3和q=2、q=3。MK_LSSVM算法的多核组合形式有:①高斯核(σ=2)、多项式核(q=3),即MK_LSSVM_g2+p3;②高斯核(σ=2)、多项式核(q=3)、多项式核(q=2),MK_LSSVM_g2+p3+p2;③高斯核(σ=2)、多项式核(q=3)、高斯核(σ=3),MK_LSSVM_g2+p3+g3。MK_LSSVM算法中正则化参数γ=10。作为对比,采用的算法方法有:经典的5-折C-SVM(高斯核σ和C的参数范围均为为[2-5,25],步长为),和高斯核(σ=2)的LSSVM,正则化参数γ=10,即LSSVM_g;Total为了体现算法的客观性,我们采用10次实验的平均值作为评价指标。各种算法的实验结果,如表1所示。

表1 试验结果Tab.1 The Results of Experiments

6.4 实验结果分析

表1的轴承识别实验结果表明,就分类准确率而言,MK_LSSVM_g2+p3+p2算法得到了最优的分类结果92.7857,次优的分类准确率91.7143由MK_LSSVM_g2+p3+g3取得。相比于5折C-SVM的90.9286,说明了所提的EMD与多核LSSVM算法在轴承故障诊断中的有效性。

7 结论

在轴承的故障识别中,对于各种状态的采集信号:首先,利用EMD分解和数据特征提取(如均方值、峰峰值、峭度、偏度、方差等指标)来获取信号的输入特征,即样本数据特征。然后,在多核学习的框架下,为了解决LSSVM选择核函数盲目性的难题,引入了核极化,以便确定多核组合的权系数,提出了核极化的多核LSSVM算法模型。最后,用所提算法模型分类器对数据特征进行学习训练,并识别预测集,实验结果表明了EMD与多核LSSVM算法的有效性。

[1]曾文韬,张华,鄢威.近似熵与支持向量机在发动机故障识别中的应用研究[J].机械设计与制造,2016(11):46-49.(Zeng Wen-tao,Zhang Hua,Yan Wei.Application of approximate entropy and support vector machine in fault diagnosis of engine[J].Machinery Design and Manufacture,2016(11):46-49.)

[2]SUN M,TANG H,XU Y.Mixed programming realization of the EMDWVD combined method[J].Telkomnika-Indonesian Journal of Electrical Engineering,2013,11(4):1902-1908.

[3]ZHANG X Y,CHAI K.Combined improved EEMD with SVM in the bearing low dimensional small sample fault diagnosis[J].Applied Mechanics and Materials,2013(427-429):354-357.

[4]MA J,WU J D,FAN Y G.Fault diagnosis of rolling bearing based on the PSO-SVM of the mixed-feature[J].Applied Mechanics and Materials,2013(380-384):895-901.

[5]LIU J,LIU Y,FENG F.A research on the fault diagnosis of transmission gears based on complex modulation zoom envelope spectrum and SVM[J].Qiche Gongcheng/Automotive Engineering,2014,36(5):608-612.

[6]SUYKENS J A K,VANDEWALLE J.Least squares support vector machines classifiers[J].Neural Processing Letters,1999,9(3):293-300

[7]MEHMET Gonen,ETHEM Alpaydin.Multiple kernel learning algorithms[J].Journal of Machine Learning Research,2011(12):2211-2268.

[8]JIAN L,XIA Z,LIANG X.Design of a multiple kernel learning algorithm for LS-SVM by convex programming[J].Neural Networks,2011,24(5):476-483.

[9]SUN T,JIAO L,LIU F.Selection multiple kernel learning for classification with ensemble strategy[J].Pattern Recognition,2013,46(11):3081-3090.

[10]BARAM Y.Learning by kernel polarization [J].Neural Computation,2005,17(6):1264-1275.

猜你喜欢
高斯故障诊断轴承
轴承知识
轴承知识
基于包络解调原理的低转速滚动轴承故障诊断
轴承知识
轴承知识
数学王子高斯
天才数学家——高斯
数控机床电气系统的故障诊断与维修
从自卑到自信 瑞恩·高斯林
基于LCD和排列熵的滚动轴承故障诊断