基于IGRSSA与IPSO-SVM的滚动轴承故障诊断方法

2021-07-22 01:34黄磊马圣
轴承 2021年10期
关键词:时域特征值增益

黄磊,马圣

(1.江苏航空职业技术学院 航空工程学院,江苏 镇江 212134;2.成都芯米科技有限公司 技术研发部,成都 610213)

轴承在旋转机械中承载着较强的工作载荷,其性能好坏直接决定着旋转机械的动力性能。随着对转子动力学的深入研究,振动信号能够用于揭示设备的健康状况,但实际工程中的轴承振动信号往往掺杂着不同部件振动带来的噪声而呈现为非平稳的周期信号,直接提取振动信号的故障特征难度较大。

奇异谱分析(Singular Spectrum Analysis,SSA)是一种基于主成分分析的非参数估计方法,常用于处理包含噪声的非平稳信号,其主要依据轨迹矩阵的主成分进行奇异分解、特征重组和重构,这种选择方式对其性能影响极大[1-3]。因此,文献[4]提出自适应的信号处理方法,实现信号从高频到低频的重构;文献[5]将分解后的分量进行形态学解调以避免端点效应并用于滚动轴承故障诊断。

另外,振动信号分析结合人工智能诊断方法成为主流,如支持向量机[7-9]、学习机[10]、人工神经网络[11]等被用于轴承故障诊断。但部分神经网络需要大量的训练样本,而支持向量机(Support Vector Machine,SVM)能够通过少量样本解决非线性高维空间问题,推广性较强。罚参数和核参数的取值影响着SVM的性能[12],粒子群算法(Particle Swarm Optimization,PSO)相比遗传算法具有操作简单,寻优速度快等特点,但易陷入局部极小值等问题限制了PSO的扩展性[13]。

综上所述,引入信息增益比(Information Gain Ratio,IGR)选择SSA分解后的分量信号进行重构去噪,采用动态惯性权重并引入梯度信息改进PSO,最终使用基于信息增益比的奇异谱分析对振动信号降噪,并结合改进PSO(IPSO)优化的SVM对滚动轴承进行故障诊断。

1 基于信息增益比的奇异谱分析

奇异谱分析属于一种广义功率谱分析,基本思想为:将一定长度的一维时间序列按照给定的嵌入窗口长度和时滞构造成轨迹矩阵,用主成分分析方法对轨迹矩阵中的时间序列进行分析,得到轨迹矩阵的特征向量和特征值,随后选用其中部分特征向量和时间系数实现信号的重构[14]。

使用奇异谱对时间序列x(t)进行分解重构时,选取的Ri分量决定重构信号的准确性。一般通过比较Ri分量所构成子矩阵的贡献率与阈值η(0.85~0.95)之间的关系进行选择[1]。为避免Ri分量增多而引入一些差异性较小的分量,不再考虑Ri分量所构成子矩阵的贡献率,而是直接考虑轨迹矩阵X的特征值的信息增益比,构造基于信息增益比的奇异谱分析(IGRSSA)。

1.1 特征值预处理

为避免求解轨迹矩阵X的特征值时部分特征值的数量级存在明显差异,对所有特征值进行归一化处理,即

(1)

1.2 特征值的熵值及其增益比

第i个特征值的熵值pi为

(2)

则第i个特征值熵值pi的增益比gi为

(3)

在选取分量Ri时,选择特征值信息增益比大于0.01的前k个分量进行信号重构。

1.3 IGRSSA算法验证

仿真信号如(4)式所示,冲击频率为250 Hz,信号采样频率为10 240 Hz,采集0.4 s共4 096个采样点,附带均值为0.5的随机噪声r(t)。用IGRSSA与SSA对仿真信号进行降噪分析,并结合(5)式的拟合优度函数计算2种方法对原信号的逼近程度。IGRSSA中熵值增益比阈值设定为0.01,SSA中子矩阵贡献率阈值设为0.85,IGRSSA与SSA的窗口长度均为1 333。

y(t)=y1(t)+0.5r(t)=

e-15tsin(2π×250t)+0.5r(t),

(4)

(5)

原始信号、重构信号的时域波形分别如图1、图2所示,由图可知:仿真信号在噪声干扰下发生紊乱,IGRSSA与SSA均能有效去除噪声,但IGRSSA去噪效果相比SSA好很多,尤其在采样点的后段。为进一步分析两者的降噪程度,按照(5)式计算IGRSSA与SSA重构信号的拟合优度,其中IGRSSA的拟合优度达到0.996 7,而SSA的拟合优度仅有0.913 3,说明IGRSSA相比SSA能够更好的对信号进行重构并抑制噪声。

图1 仿真信号的时域波形

图2 重构信号的时域波形

2 IPSO-SVM算法

2.1 数据预处理

支持向量机能够将低维线性不可分问题通过映射到高维空间进行线性可分,且在小样本下能够表现出较好的性能,因而被广泛应用于模式识别等领域[12]。

支持向量机属于数据驱动的分类诊断模型,通常针对某类故障构建样本数据时,提取的特征维度较高容易造成维度灾难且难以避免特征之间存在的共线性,反而容易导致诊断模型效果不佳。平均影响值(Mean Impact Value, MIV)用于评价自变量对因变量的影响程度,是神经网络中评价变量相关性较好的指标,其符号代表相关方向,绝对值大小代表自变量影响的重要程度[13]。假设网络的训练样本为P,当网络训练终止后,各自变量计算步骤如下[15]:

1)将训练样本P中的每个自变量在其原值基础上加、减10%,构成新的训练样本P1和P2。

2)用训练好的网络对P1和P2进行仿真,得到仿真结果Y1和Y2。

3)令YIV=Y1-Y2并按照观测列数平均,得到自变量对因变量的MIV值。

4)重复第1—第3步,计算各自变量的MIV值,并根据MIV的绝对值大小筛选自变量。

2.2 改进的PSO算法

经典PSO算法简单,收敛速度快,但容易陷入局部极值而导致趋同效应[16],且搜索移动时受到惯性行为影响而导致搜索精度较低。因此,对经典PSO进行改进以在小样本数据下取得较好的寻优结果。

考虑到惯性权值ω决定粒子在搜索空间的搜索能力,采用动态惯性权重,即

(6)

式中:ωmax,ωmin分别为最大、最小惯性权值;k为粒子当前迭代次数;G为粒子最大迭代次数。动态惯性权重能够保证在迭代次较小时权值较大,全局搜索能力强;迭代次数增加时权值减小,局部搜索能力强。

为使粒子能够较快的向最优目标方向进行搜索,引入梯度信息[17]优化SVM的罚参数c和核参数g,定义PSO优化SVM的适应度函数G(x)为

,(7)

式中:f(x|c,g),fo(x|c,g)分别为SVM在罚参数c、核参数g下的实际输出和期望输出;n为校验集样本数量。

假设G(X)对于变量X(X=[c,g])的偏导数都存在,则

(8)

若目标中各变量为线性时,G(X)对于变量X的导数可表示为

(9)

(10)

式中:x(k|t+1),x(k|t)分别为t+1和t时刻个体向量中第k个变量的位置;V(t)为粒子在t时刻的速度。

2.3 IPSO-SVM网络

如图3所示,IPSO-SVM利用IPSO种群中的个体作为SVM的罚参数c和核参数g,校验集误差作为适应度函数,按照IPSO的步骤对粒子进行寻优操作,找到最优粒子位置作为SVM的罚参数c和核参数g。

图3 IPSO-SVM流程图

IPSO-SVM算法步骤为:

1)将SVM的罚参数c和核参数g作为待优化变量,进行实数编码。

2)随机初始化种群,种群中的每个个体向量表示SVM的一组可行解。

3)按照(7)式计算种群的适应度值,找到个体最优位置。

4)计算个体向量梯度并排序,按照(10)式更新粒子位置,计算适应度值并实时更新最优个体的位置。

5)判断是否满足终止条件,若不满足则重复第3—第4步;若满足则输出最优个体,并将其赋值给SVM的罚参数c和核参数g。

3 基于IPSO-SVM的轴承故障诊断

3.1 滚动轴承试验数据

滚动轴承试验数据来源于美国西储大学轴承数据中心[18],电动机转速1 796 r/min,信号采样频率12 kHz,每周期传感器采样1 024个点工况下,6205-2RS深沟球轴承的故障数据见表1。

轴承振动信号某一周期内的时域信号、经IGRSSA算法处理后得到的重构信号如图4所示,经过IGRSSA处理后,不同故障类型轴承振动信号的幅值均有减小,且重构信号的趋势更为明显。

图4 不同故障类型轴承振动信号及IGRSSA重构信号

3.2 数据预处理

时域分析法在处理过程能够减少信号的畸变或损失[10],因此提取平均值、峰峰值、均方根值、标准差、偏度、峭度、波峰因子和变异系数等时域特征参数,每类故障样本选择100组,合计300组数据,提取的部分时域数据见表2。

表2 轴承振动信号的时域特征参数

考虑到变量之间耦合性等因素对自变量带来的影响,使用MIV方法对时域特征参数进行筛选。计算各个参数在正负10%增量时的MIV值,其负号代表相关的方向,绝对值大小表示影响程度大小。重复6次计算得到的MIV值见表3,由表可知:均值、标准差、波峰因子对仿真结果影响程度较小,可以考虑将其去除,选择峰峰值、均方根值、偏度、峭度和变异系数建立故障诊断模型。经过MIV筛选后的部分试验数据见表4。

表3 各时域参数的平均影响值

表4 最优时域特征参数

3.3 IPSO-SVM算法验证

按3∶1∶1的比例将数据集分为训练集、校验集、测试集,各样本集的数据随机选择,互不重复。为验证IPSO-SVM方法在滚动轴承故障诊断中的有效性,选择常用的BP神经网络、RBF神经网络、SVM、交叉验证优化的SVM(GridSearchSVM)、遗传算法优化的SVM(GA-SVM)、粒子群优化的SVM(PSO-SVM)进行对比分析。

3.3.1 对比算法的参数设置

BP神经网络络采用5-11-1的网络结构,即输入层5个神经元,隐含层11个神经元,输出层1个神经元,权值和阈值随机产生,隐含层采用S型正切函数tansig,输出层采用S型对数函数logsig,网络训练函数为trainlm;RBF神经网络中散布系数spread=0.5;SVM中的罚参数和核参数随机产生,文中记为Rand-SVM;GridSearchSVM中交叉验证样本为20;GA-SVM中,最大迭代步数为100、种群大小为30、选择交叉概率为0.6、变异概率为0.05、优化参数为2;PSO-SVM和IPSO-SVM中,c1=c2=1.5、迭代步数为100、粒子群大小为30、最大权重为0.9、最小权重为0.4、粒子最大搜索速度为10、最小搜索速度为-10、优化参数为2。注意:对比算法中SVM的罚参数和核参数的范围分别为[0.1,100]和[0.01,100]。

3.3.2 平均诊断准确率

在相同训练集和测试集的基础上,使用上述算法对滚动轴承故障数据进行诊断,结果见表5。其中,BP神经网络随机产生初始权值和阈值的问题导致每次试验结果不一致,表中数据为BP神经网络重复试验30次后的平均值;Rand-SVM的结果为随机试验10次后选择的最优值;GridSearchSVM,GA-SVM,PSO-SVM和IPSO-SVM均为某一次的诊断结果。

表5 不同算法的诊断结果

由表5可知:BP和RBF诊断方法由于参数设置问题导致诊断效果较差;选择Sigmoid核函数时所有的SVM诊断效果都较差;但SVM在选择RBF核函数和多项式核函数时均能达到很好的诊断效果,核函数为多项式时GridSearchSVM诊断效果最好(98.33%),核函数为RBF时IPSO-SVM的效果最好(98.33%)且其校验集误差相对较低;由最优罚参数和核参数可知,使得SVM达到较佳诊断效果的参数并不唯一;优化SVM中涉及到重复运算过程,因此诊断时间相对较长,但IPSO-SVM的诊断时间相对PSO-SVM和GA-SVM略短几秒。

3.3.3 算法的稳定性及收敛性

比较IPSO-SVM,PSO-SVM和GA-SVM对样本的适应性,采用对样本进行有放回的随机抽样,样本比例分配同3.3节但每次被选择为训练、校验、测试的样本数据不同。在核函数为RBF的前提下重复试验30次,诊断结果如图5所示,由图可知:IPSO-SVM,PSO-SVM,GA-SVM算法均存在不同程度的波动,其最大波动幅度分别为5.0%,6.3%,8.2%,平均准确率分别为97.72%,97.17%,96.50%;IPSO-SVM和PSO-SVM的平均误差收敛值均比GA-SVM效果好,但GA-SVM相比PSO-SVM收敛更早,IPSO-SVM平均收敛误差最小且其收敛速度最快。综上分析可知,IPSO-SVM的稳定性、平均诊断准确率和误差收敛效果均比PSO-SVM和GA-SVM要好。

4 结束语

引入信息增益比选择有用分量进行重构,并与基于子矩阵贡献率的奇异谱对比分析,从仿真信号重构趋势图、重构信号与原信号的拟合优度而言,IGRSSA的去噪重构性能比SSA的效果明显;采用动态惯性权值并引入梯度信息调整粒子搜索趋势也显著提高了PSO的性能。使用IGRSSA对轴承故障信号降噪处理并提取时域信号,采用MIV法筛选出最优时域特征参量作为后续故障诊断的数据集,与其他算法的对比分析表明,IPSO-SVM在选择RBF核函数时效果最好,波动性较小,误差收敛值小,收敛速度快,平均诊断准确较高,更适合滚动轴承的故障诊断。

图5 不同算法的随机抽样结果

猜你喜欢
时域特征值增益
一类带强制位势的p-Laplace特征值问题
基于增益调度与光滑切换的倾转旋翼机最优控制
单圈图关联矩阵的特征值
基于单片机的程控增益放大器设计
基于时域信号的三电平逆变器复合故障诊断
基于Multisim10和AD603的程控增益放大器仿真研究
H型群上一类散度形算子的特征值估计
基于极大似然准则与滚动时域估计的自适应UKF算法
基于时域逆滤波的宽带脉冲声生成技术
基于商奇异值分解的一类二次特征值反问题