基于参数优化变分模态分解与支持向量机的齿轮箱故障诊断

2022-07-09 03:03程旺郝如江段泽森张晓锋夏晗铎

科学技术与工程 2022年15期

程旺，郝如江，段泽森，张晓锋，夏晗铎

(石家庄铁道大学机械工程学院，石家庄 050000)

齿轮箱是常见的机械传动部件，由于其结构复杂，容易受到润滑、温度等因素的影响，在长时间运转时，尤其是在高速重载的条件下，就十分容易产生故障，然而在故障早期很难通过肉眼观察和声音识别来发现故障，不能尽早进行维修，久而久之必定会对整台设备甚至工作人员造成伤害，因此对机械设备进行状态检测，判断故障类型和位置，保证机械的安全、稳定运行，减少经济损失和人员伤亡，具有十分重要的现实意义[1]。

进行故障类型识别之前一般都会先进行信号降噪处理，常见的降噪方法有经验模态分解(empirical mode decomposition, EMD)、小波变换(wavelet transform, WT)等，每种方法都存在着优势和不足，其中最常用的是EMD，EMD能够将信号分解为一系列本征模态函数(intrinsic mode function, IMF)[2]，可以将原信号的不同时间尺度的局部特征信息分解出来，应用十分广泛。排列熵(permutation entropy，PE)[3]可以用来度量一维时间信号的复杂程度，具有计算简单、抗噪能力强、对局部信号突变较敏感等优点，常用来进行信号的特征提取。

文献[4]提出EMD与支持向量机(support vector machine，SVM)相结合的刀具磨损状态识别方法，利用EMD将信号分解为多个IMF分量，然后通过时频联合分析的方法提取故障特征信息，最后以SVM进行故障类型识别，取得了较好的识别效果，但是其中的EMD分解存在严重的模态混叠现象，使得各个分量中不能很好地体现出故障特征信息。文献[5]采用完全集成经验模态分解(complete ensemble empirical mode decomposition with adaptive noise, CEEMDAN)与排列熵相结合的方法，有效地提取出了桥梁监测数据的特征信息，其中CEEMDAN虽然改善了EMD存在的模态混叠现象，但并未彻底消除模态混叠现象的存在。文献[6]利用脑电信号分量的排列熵作为分类特征，实现了脑电信号的分类，但是排列熵只能检测时间序列上单一尺度的振动突变信息，存在严重的特征信息丢失现象。为了解决上述问题，提出将参数优化的变分模态分解(variational mode decomposition，VMD)与多尺度排列熵(multi-scale permutation entropy，MPE)相结合，提取出齿轮箱故障特征向量，作为SVM的输入的滚动轴承故障诊断方法。

VMD算法是2014年提出的一种较新的时频分析方法，具有完备的数学理论基础，采用完全非递归的方式实现信号的分解，与EMD相比，VMD具有抑制模态混叠现象等优点，但也存在着需要人为确定分解层数K和惩罚因子α的不足。MPE可以获取时间序列上多个尺度的突变特征信息。现搭建试验台采集信号对本文方法进行实验验证该方法实现齿轮箱故障模式识别的有效性。

1 相关理论基础

1.1 变分模态分解

VMD是一种较新的时频分析方法，整个框架是一个变分问题，通过多次迭代来寻求变分模型最优解[7]，有效地避免了EMD模态混叠现象，具有完整的理论基础，分解过程如下。

(1)首先对信号进行希尔伯特变换，并调制信号的频谱到相应的基频带，计算过程为

(1)

式(1)中：δ(t)为冲击函数；uk(t)为分解得到的第k个本征模态分量；t为时间；ωk为对应的IMF分量uk(t)的中心频率。

(2)计算解调信号的梯度平方L2范数。其约束变分模型为

(2)

式(2)中:f为原始输入信号。

(3)为了将约束问题变为非约束问题，引入拉格朗日函数，即

L({uk},{ωk},λ)=

(3)

式(3)中:λ为拉格朗日乘子；α为惩罚因子。

(4)采用交替方向乘子算法求解式(3)，不断更新直到求出k个IMF分量为止，更新λn+1，即

(4)

式(4)中:τ为时间常数。

(5)设置判定精度ε>0，当满足式(5)时停止迭代。

(5)

1.2 磷虾群优化算法

磷虾群算法(krill herd algorithm，KHA)是模拟磷虾群的觅食活动得到的一种优化算法[8]，在平衡全局搜索、避免陷入局部极值方面具有一定优势。磷虾群优化算法的寻优过程包括以下三部分。

(6)

(2)觅食行为。第i个磷虾觅食行为可以用Fi表示为

(7)

(3)随机扩散运动。磷虾群的物理扩散是随机的，可以用Di表示为

Di=Dmax(1-I/Imax)σ

(8)

式(8)中：Dmax为最大扩散速度；σ为[-1,1]的随机方向，Imax为最大迭代次数。

1.3 包络熵与峭度准则

包络熵[9]可以反映信号的稀疏性，当故障信号经过VMD分解后，如果是包含故障信息较多的IMF分量，波形中含有规律性的冲击脉冲信号，则信号表现为较强的稀疏特性，包络熵值较小，反之包络熵值较大。包络熵Ep可以表示为

(9)

(10)

式中：pj为a(j)的归一化形式；a(j)为信号x(j)经过Hilbert解调得到的包络信号。

峭度[10]是振动信号处理领域经常用到的一种无量纲参数，可以用来表示振动信号的峰值大小，表达式为

(11)

1.4 多尺度排列熵

多尺度排列熵通过将时间序列粗粒化处理，计算得到不同时间尺度下的排列熵值，相比单一尺度而言，可以获得更丰富的状态量和特征信息，从而更加精确反映出系统的变化情况[11]。具体计算过程如下：

(12)

式(12)中：τ为尺度因子；N为时间序列长度；[N/τ]表示对N/τ取整。

(2)根据式(11)计算粗粒化后时间序列的排列熵，即可得到多尺度排列熵MPE，即

(13)

式(13)中:λ为时间之后；m为嵌入维数。

2 故障诊断流程

本文提出的基于参数优化VMD和改进MPE-SVM的齿轮箱故障诊断方法。首先搭建试验台，采集齿轮箱故障振动信号，然后对信号进行分解、选取分量、重构、提取故障特征等处理，最后进行故障模式识别，并采取控制变量法将试验结果其他结果进行对比。故障诊断流程图如图1所示，具体步骤如下：

图1 故障诊断流程图Fig.1 Flowchart of fault diagnosis

(1)利用磷虾群算法优化的VMD对原始信号进行模态分解，得到若干个IMF。

(2)依据峭度准则选取有效故障分量进行信号重构。

(3)确定多尺度排列熵重要参数，并计算多尺度排列熵。

(4)将得到的多尺度排列熵作为故障信息特征向量，输入到SVM做故障模式识别

3 实验测试与分析

3.1 试验台介绍

为了验证本文所提方法的可行性，采用动力传动故障诊断综合试验台(drivetrain diagnostics simulator,DDS)进行实验验证，试验台主要由驱动电机、行星齿轮箱、定轴齿轮箱、传感器、磁粉制动器等部分组程，试验台和传动系统分别如图2、图3所示。

此次实验共设置了7种工况，分别为齿轮断齿、缺齿、磨损、齿根裂纹、轴承内圈、滚动体和正常工况。其中故障齿轮位置为二级齿轮箱中间轴。设定电机转频fr=35 Hz，采样频率fs=12 800 Hz，轴承参数如表1所示，计算得出的不同部位的理论故障频率如表2所示。

图2 试验台示意图Fig.2 Schematic diagram of the test bed

图3 传动系统示意图Fig.3 Schematic diagram of transmission system

表1 轴承参数Table 1 Bearing parameters

表2 故障频率Table 2 Failure frequency

3.2 实验验证

以齿轮缺齿为例进行研究，首先将采集到的时域信号进行包络谱分析，得到如图4所示时域图和图5所示的包络谱图，可以看到故障冲击信号在时域图中已经被噪声掩盖，而在包络谱图中也不能找出明显的故障频率信息。

将故障信号进行EMD分解，得到各个IMF时域图和频谱，取包含主要信息的前10个分量进行分析，如图6所示。

可以看出EMD分解的故障信号存在十分严重的模态混叠现象，为了在原始信号中提取出有效的故障特征信息，接下来用VMD分解。首先以包络熵为适应度函数，利用磷虾优化算法寻找到最优的分解层数K和惩罚因子α，其中设置种群大小为50，最大迭代次数为20，最大诱导速度为0.01,觅食速度为0.02，大扩散速度0.005，优化过程中的适应度曲线如图7所示。

图4 原始信号时域图Fig.4 Time domain diagram of original signal

图5 原始信号包络谱图Fig.5 Envelope spectrum of original signal

图6 EMD分解IMF分量频谱图Fig.6 Spectrum of IMF components decomposed by EMD

最终计算出最优参数分解层数K=8，惩罚因子α=5 032，然后将参数带回VMD中，将数据分解为8个IMF分量，最后计算各个分量峭度，结果如图8所示，分别画出各个分量时域图和频谱如图9所示。

可以看出VMD分解与EMD分解相比明显的抑制了模态混叠现象，由于IMF4的峭度值明显大于其他分量，所以选取IMF4作为唯一的重构分量，得到新的故障信号，将其时域图，与原始时域图相比可以看到故障冲击变得十分明显，如图10所示，并对其进行包络谱分析，如图11所示，可以清晰地找出多倍故障频率(理论故障频率为10.15，在误差允许范围内)。

图7 磷虾优化适应度曲线Fig.7 Optimal fitness curve of krill

图8 各个分量峭度图Fig.8 Kurtosis diagram of each component

图9 VMD分解IMF分量频谱图Fig.9 Spectrum of IMF components decomposed by VMD

排列熵是衡量一维时间序列复杂度的一种平均熵参数，多尺度排列熵通过将时间序列粗粒化处理，计算得到不同时间尺度下的排列熵值，相比单一尺度而言，可以获得更丰富的状态量和特征信息，从而更加精确反映出系统的变化情况。

本文中7种故障信号初步得到的多尺度排列熵如图12所示，可以看出不同的故障信号具有不同的多尺度排列熵，因此多尺度排列熵适用于故障特征提取[12]。

多尺度排列熵有4个主要参数：嵌入维数m，时间序列的长度N，尺度因子τ以及时间延迟t。尺度因子能确定粗粒化后子序列的长度以及数量，尺度因子一般大于10即可，本文中设定尺度因子τ=12。其中嵌入维数对排列熵值的影响较大，如果m太小，故障信息丢失较多，m太大则严重影响计算效率。因此计算在最大尺度因子为20、m=3～8时，序列的排列熵值随尺度因子变化大小，结果如图13所示，当m=3～5时，序列的排列熵值随尺度因子变化较小，无法显示信号特征，同时为了减少计算量，嵌入维数m取6为最优选择。

图10 重构信号时域图Fig.10 Reconstructed signal time domain

图11 重构信号包络谱图Fig.11 Envelope spectrum of reconstructed signal

图12 不同工况下的多尺度排列熵Fig.12 Multi-scale permutation entropy under different working conditions

为了对比时间序列的长度N对排列熵值的影响，分别计算在m=2～8时，N=128、256、1 024、2 048、3 000、4 096时的故障信号排列熵值，结果如图14所示，以嵌入维数m=6为例进行分析，随着时间序列增加排列熵值也不断增加，但是到N=2 048时，增长速度明显放缓，同时可以发实现时间序列越大，在整个嵌入维度上熵值越稳定，但是随着时间序列的增加，所需的数据量、计算时间也会变大，综上所述，此时时间序列取3 000最为合理。

同样计算出不同时间延迟t的排列熵值，结果如图15所示，可以发现不同时间延迟对排列熵值影响很小，因此取t=1。

图13 不同嵌入维数下的多尺度排列熵Fig.13 Multi-scale permutation entropy under different embedding dimensions

图14 不同时间序列长度下的多尺度排列熵Fig.14 Multi-scale permutation entropy under different time series lengths

每种工况选用100组数据进行实验验证，其中50组为训练数据，剩余50组为测试数据，将7种工况分别用MPE-SVM、EMD-MPE-SVM、参数优化的VMD-MPE-SVM三种模型做故障类型识别，结果分别如图16～图18所示。准确率结果如表3所示。

图15 不同时间延迟下的多尺度排列熵Fig.15 Multi-scale permutation entropy under different time delays

图16 MPE-SVM分类结果Fig.16 Classification results of MPE-SVM

图17 EMD-MPE-SVM分类结果Fig.17 Classification results of EMD-MPE-SVM

图18 VMD-PME-SVM分类结果Fig.18 Classification results of VMD-MPE-SVM

表3 对比结果Table 3 Comparison results

由表3可以看出，经过磷虾优化的VMD-MPE-SVM的准确率达到了99.14%，与EMD-MPE-SVM相比，磷虾优化的VMD与多尺度排列熵相结合的故障特征提取方法在故障类型识别方面具有更高的准确率，体现了该方法的优越性。

4 结论

提出了一种将磷虾群算法优化的变分模态分解与多尺度排列熵相结合，采用支持向量机进行故障类型识别的齿轮箱故障诊断方法，经过实验验证得出以下结论。

(1)磷虾优化的VMD可以有效地避免人为设定分解层数K和惩罚因子α的不足，且分解效果明显好于EMD分解。

(2)通过重构前后信号的包络谱分析，可知优化的VMD降噪效果明显。

(3)多尺度排列熵克服了排列熵在提取故障特征信息只能反映单一尺度信息的不足，可以很好地体现故障特征信息。

(4)通过实验验证，该文方法能够准确、有效地进行齿轮箱故障特征提取和故障模式识别，在实际工程中具有一定的参考价值。