基于VMD-SVM的滚动轴承退化状态识别

2020-03-28 12:25吕明珠苏晓明刘世勋陈长征
机械设计与制造 2020年1期
关键词:特征向量分量轴承

吕明珠 ,苏晓明 ,刘世勋 ,陈长征

(1.沈阳工业大学机械工程学院,辽宁 沈阳 110870;2.辽宁装备制造职业技术学院自控学院,辽宁 沈阳 110161;3.中认(沈阳)北方实验室有限公司,辽宁 沈阳 110164)

1 引言

滚动轴承对旋转机械的可靠运行起着至关重要的作用,它从投入运行到完全失效会经历一个逐渐退化的演变过程[1]。如果能跟踪滚动轴承的故障发展,正确识别其退化状态,那么就能够合理制定设备维护策略,将适时维护变为视情维护,既能保证设备的安全运行又能节省大量的人力物力。在滚动轴承的退化性能识别方面,常选用振动信号进行研究[2]。在此过程中,需要完成两大关键任务:(1)提取退化特征,这是保证退化状态能够准确识别的先决条件;(2)建立分类模型,这是退化状态可以有效识别和诊断的主要方法。然而,提高不同退化状态下特征辨识度的前提是振动信号中必须包含丰富的故障信息。因此,对原始振动信号进行降噪和分解,并寻找敏感本征模态分量(IMF),已成为滚动轴承故障诊断与状态监测的研究热点之一[3]。

常用的信号处理方法有:小波包变换(WPD)、经验模态分解(EMD)、集合经验模态分解(EEMD)等。文献[4]提出了基于小波包奇异值熵的故障特征提取方法,通过对重构系数的奇异值分解保留有效成分,但由于小波基难于选择,降噪效果并不理想;文献[5]通过EMD分解求各IMF分量的能量值作为特征向量,但由于EMD分解易存在模态混叠和端点效应问题而无法提取有效IMF分量;文献[6]用EEMD方法虽然避免了模态混叠现象,但算法效率不高限制了其在大数据中的应用。

针对以上问题,采用变分模态分解(VMD)对原始振动信号进行分解,这是一种新型的数据处理方法,与其它方法相比具有明显的优势,如分解层数少、计算效率高、降噪效果好,且不会出现模态混叠和端点效应问题。另外,在分类模型上,选取了支持向量机(SVM)方法,与常用的支持向量描述(SVDD)和隐马尔可夫(HMM)模型相比,SVM更适合解决多分类问题,且不依赖于时间序列的区间长度,泛化能力强。鉴于此,将VMD分解与SVM模型结合起来,用于滚动轴承的全寿命退化状态识别中,将会获得良好的辨识能力,实验数据验证了所提方法的准确性和可靠性。

2 变分模态分解

2.1 算法原理

VMD方法是一种自适应信号分解方法,其处理信号的基本思路是先构造变分约束模型,再引入二次惩罚因子α和拉格朗日算子λ(t)将有约束模型变为无约束模型,然后使用交替乘子算法迭代搜索变分模型的最优解。在此过程中,各个模态分量的中心频率和功率谱中心被循环更新,最终完成信号的有效分解。

2.1.1 变分模型的构造

假设原始输入信号可以分解成K个离散的本征模态分量(IMF),记为uk(t)(k=1,2,…,K)。然后对各模态分量进行Hilbert变换得到单边频谱,并用预估中心频率ωk进行调制,得到如下约束变分模型[7]:

式中:∂t—对求偏导数;

δ(t)—单位脉冲函数。

2.1.2 变分模型的寻优

若能将式(1)转变为非约束模型,则最优问题容易求解。由线性规划的理论可知,通过引入二次惩罚因子α和拉格朗日算子λ(t),式(1)变为如下形式:

循环使用交替乘子算法就可以求得拉格朗日函数L的极小值点,解决变分模型的寻优问题,最终可得各模态函数及其中心频率。

2.2 包络熵最小值法确定最优分解层数

通过对VMD原理的分析可知,模态分量的个数K值需要预先给定,K值的选取直接影响VMD分解之后的各个模态分量中心频率的准确性。若K值偏小,则分解后各分量中心频率相距较远,不能体现原始信号的模态构成,属于欠分解;若K值偏大,则分解后各分量中心频率相距较近,增加了各分量频率的重叠率,属于过分解。因此,必须采用有效的方法适当选择K值。目前,K值的选取常采用观察中心频率法[8],这种方法过于依赖人为经验而不好把握阈值设置的尺度。

信息熵可以反映信号随时间序列的分布程度及规则性[9],包络熵是从包络谱的角度考察K个模态分量的信号稀疏性强弱,熵值越小则说明信号中的冲击成分越有规律,越能反映出原始信号的固有特征。因此,可将包络熵达到最小时所对应的K值作为最优分解层数,此时VMD分解的降噪效果和包含特征信息的程度均达到最佳。

构造如下仿真信号进行验证:

y=0.4sin(2π·25·t)+0.3sin(2π·125·t)+0.2sin(2π·250·t)+η(3)式中:η—高斯白噪声,标准差为0.1,采样频率为1000Hz,采样时

间为(0~0.3)s。

表1 不同K值的包络熵极小值Tab.1 Minimum EnvelopeEntropy of Different K Values

将仿真信号在不同K值下进行VMD分解,得到不同层数下包络熵的极小值(此时为局部最小值),如表1所示。

图1 仿真信号的VMD分解图Fig.1 VMD Decomposition Diagram of Simulation Signal

观察表1中各值可知,当K取4时,包络熵达到了最小值(此时为全局最小值),由此确定VMD的最优分解层数为4,分解后得到的各模态分量的中心频率分别为24.799Hz、124.9139Hz、250.0449Hz和415.2711Hz,各分量正弦信号及噪声信号均得到了有效剥离,时域波形,如图1所示。

2.3 选择敏感IMF分量

为了防止VMD分解产生虚假分量,可以从分解结果中筛选出最能表征出退化性能的分量作为敏感IMF分量,便于后续的分析。

峭度因子能反映出振动信号的冲击特性,是故障诊断常用的辨识方法,而相关系数准则常用来衡量分量信号对原始信号的复现程度,具有一定的统计学意义。若将两种方法结合使用,可大幅提高获取敏感IMF分量的准确度,避免将误差带入下一步的分析。计算各分量的峭度因子和相关系数,选取两者均为最大值时所对应的分量作为敏感IMF分量。若峭度因子和相关系数的最大值分别指向不同分量时,则需把多个分量进行信号重构。

3 退化状态特征选择

滚动轴承的全寿命运行数据信息量常常非常庞大,因而有必要对滚动轴承的不同运行阶段进行划分并构建特征向量集。

3.1 时域指标

时域指标具有良好的跟踪能力,但种类很多,常用的指标可达30多个,经过长期的研究和对比,发现在滚动轴承的全寿命运行数据中辨识效果较好的指标有如下9个:有效值、方根幅值、峭度、最大值、波形指标、峰值指标、脉冲指标、裕度指标、峭度指标,其中前4个为有量纲指标,后5个为无量纲指标,各指标的表达式见参考文献[10]。

3.2 能量熵

由于敏感IMF分量含有最为丰富的振动信息,能量熵的变化能反映出滚动轴承在退化过程中能量分布的均匀程度,并能随着故障程度的加深呈现出单调性,具有很好的识别能力,其计算公式如下[11]:

设一组序列 x=[x1,x2,…,xn],则有:

式中:xi—第i个子向量;

Ei—每个子向量的能量;

E—总能量。

归一化处理后,得到能量比:

能量熵为:

4 VMD-SVM退化状态识别模型

如何用少量的状态数据建立理想的分类模型,是影响到退化状态能否被准确识别的关键环节。

4.1 SVM分类原理

SVM是一种适合于小样本、非线性、高维度的分类方法[12],其核心思想是寻找一个最优超平面使各个类别之间的间隔尽可能最大化。

当样本集不可分时,需要引入惩罚因子来描述对离群点的容忍程度,算法可描述为如下寻优问题:

式中:孜i—松弛因子;

C—惩罚因子;

棕、b—超平面系数向量。

核函数能将非线性样本集映射到高维空间,从而使线性不可分问题得到解决,通常选取普适性较好的径向基(RBF)核函数,核函数的宽度系数g和惩罚因子C均会影响SVM的分类效果,采用交叉验证的方法获取最佳值[13]。

4.2 退化状态的识别过程

滚动轴承的运行过程按故障产生的程度大体上可划分为正常状态、轻度退化、中度退化、重度退化四个阶段,每一阶段定义为一个状态类别(打上一个标签),各类别下测得的振动信号经VMD分解后得到的敏感IMF分量都会有不同的特征表现,选取若干组特征向量构成样本集输入SVM分类器中进行训练和预测,并对分类结果的准确率进行统计,退化状态识别流程图,如图2所示。

图2 退化状态识别流程图Fig.2 Degenerate State Recognition Flow Chart

(1)模型训练:随机抽取滚动轴承在正常状态、轻度退化、中度退化、重度退化4种状态下的振动信号各20组,将这80组数据作为训练样本。然后,先根据包络熵最小值原则确定VMD的分解层数,再进行分解,比较各分量的峭度因子和相关系数,选择敏感IMF分量,计算各组敏感IMF分量的9个时域指标和1个能量熵指标构成10维特征向量,将80×10维样本集数据归一化后输入SVM模型进行训练,得到对应退化状态的模型库。

(2)状态识别:再取4种状态下的另外80组数据作为测试样本,按(1)中所述各步得到特征向量集经归一化后再输入训练好的退化状态模型库中,从而实现对轴承性能退化状态的识别。

5 实验验证与结果分析

使用美国辛辛那提大学智能维护中心公布的滚动轴承外圈故障全寿命数据,来验证基于VMD-SVM模型的滚动轴承退化状态识别方法的有效性。

实验台结构图,如图3所示。由电机拖动皮带驱动主轴旋转,转速为2000r/min,主轴上安装了4个ZA-2115型双列滚子轴承,轴承上施加一定的径向载荷,各轴承在水平和垂直方向上的振动信号分别由两个PCB 353B33型加速度传感器采集,数据采集卡的型号为NI DAQ-6062E每隔10min采集一次,采样频率为20kHz,采样点数为20480个。

图3 实验台结构图Fig.3 Structure of Test Bench

使用的是轴承1外圈失效数据。从正常运动到完全失效共采集了984组实验数据,持续运行时间为9840min。

5.1 退化样本划分

由于轴承磨合期不在4种退化状态之列,故将前两组数据视为无效数据剔除,并对余下的(2~984)组数据以振动信号的有效值(RMS)为依据进行状态划分,如图4所示。由图4可以看出,(2~532)组数据的RMS值比较平坦几乎没有变化,说明这一时期轴承为正常运行;(533~704)组数据的RMS值开始缓慢上升,说明这一时期轴承出现轻度退化;(705~931)组数据的RMS值波动较大,说明这一时期轴承的故障加深,认为轴承处于中度退化;(932~984)组数据的RMS值急剧上升,说明轴承健康状态急剧恶化并趋于失效,认为这一时期轴承处于重度退化。

图4 全寿命数据的退化样本划分图Fig.4 The Diagram of Degenerate Sample Partition for the Whole Lifetime Data

5.2 退化状态识别

首先要确定VMD分解的层数,选取正常状态下的一组数据共20480点,计算包络熵,如表2所示。

表2 正常状态轴承数据不同K值下的包络熵极小值Tab.2 Minimum Envelope Entropy of Normal Bearing Data Under Different K Values

当K=6时,包络熵达到最小,故确定VMD分解的层数为6,各分量的时域图和频谱图,且没有出现模态混叠现象,如图5所示。再对同组数据进行EMD分解,得到13个IMF分量(由于篇幅有限,这里仅给出前6个分量的时域图和频谱图),如图6所示。各分量的相似度较高且存在严重模态混叠问题,对比结果验证了VMD分解的优越性。

同样地,分别从其余3种退化状态中各取一组数据,用包络熵最小值法确定VMD分解层数均为6,并计算各分量的峭度因子和相关系数,发现都是IMF4的结果较大,故选取IMF4为敏感IMF分量。

接下来,分别从4种状态类别中随机抽取40组数据,20组数据作为SVM模型的训练样本,20组数据作为测试样本。提取训练样本每一组数据的特征向量,构成(80×10)维的特征向量集输入SVM模型进行训练,构建退化类别模型库。(其中训练集和测试集样本总数各为80组,由于篇幅有限,这里不再列出模型库数据)。

然后将80组测试样本特征向量集(每种运行状态随机抽取20组)输入训练好的SVM模型,对测试集数据进行预测,并将得到的预测结果与真实数据所属类别进行对比,如图7所示。

图7中横坐标是测试集样本编号(共80组),纵坐标是类别标签1~4分别对应滚动轴承全寿命运行时的正常状态、轻度退化、中度退化、重度退化4个阶段,从图中可以看出,前面三种类别的预测正确率均为100%,只有在第4个类别中出现了误分,将2个样本错分到了第3类,这主要是由于轴承进入重度退化时影响特征指标的因素较为复杂,使得有些特征向量辨识度下降,从而造成了误分。

为了验证所提方法在滚动轴承性能退化状态的识别效果,采用EMD-SVM模型,EEMD-SVM模型对相同数据集进行处理,其中EMD-SVM模型采用文献[5]中所述方法,EMD-SVM模型采用文献[6]中所述方法,两种方法分别先对原始信号进行EMD分解和EEMD分解,再筛选出少量特征向量输入SVM进行轴承退化状态识别,最后将识别结果进行对比,如表3所示。

由表3可知,在小样本情况下,EMD-SVM、EEMD-SVM、VMD-SVM对退化状态的综合正确率分别为86.25%、92.5%、97.5%,由于EMD分解存在模态混叠现象,导致敏感IMF分量含躁较多,所以识别正确率较低;EEMD分解虽然解决了模态混叠问题,但用设置阈值的方法去躁仍会保留一定程度的噪声成分;三种模型中VMD-SVM的识别正确率最高,这说明所提方法可以有效解决滚动轴承性能退化状态识别问题。

图5 正常状态轴承数据VMD分解图Fig.5 The Diagram of Rolling Bearing’s Data Under Normal State After VMD Decomposition

图6 正常状态轴承数据EMD分解图Fig.6 The Diagram of Rolling Bearing’s Data UnderNormal State After EMD Decomposition

图7 SVM模型分类结果图Fig.7 The Diagram of Classification Result for SVM Mode

表3 3种模型退化状态识别正确率对比Tab.3 Recognition Accuracy of Three Modes

6 结论

鉴于VMD分解和SVM模型的优点,提出了一种基于VMDSVM的滚动轴承退化状态识别方法。(1)采用包络熵最小值法确定VMD的最优分解层数,可以很好地将原始信号的各模态分量成功剥离。(2)利用峭度因子和相关系数准则选取敏感IMF分量,实现了对信号的降噪和主要故障信息的提取。(3)使用时域指标和能量熵作为退化特征向量,可以更加全面地反映滚动轴承的退化指标,方便进行下一步的识别工作。(4)从滚动轴承的全寿命数据中抽取少量样本对SVM模型进行训练和测试,获得较高的识别率,说明所提方法非常适合解决轴承这种非线性、非平稳、故障特征重复率不高的问题。

猜你喜欢
特征向量分量轴承
二年制职教本科线性代数课程的几何化教学设计——以特征值和特征向量为例
轴承知识
轴承知识
克罗内克积的特征向量
轴承知识
轴承知识
一斤生漆的“分量”——“漆农”刘照元的平常生活
一物千斤
一类三阶矩阵特征向量的特殊求法
论《哈姆雷特》中良心的分量