基于时序关联分析的旋转机械故障诊断

2022-05-05 02:38侍洪波常玉清
振动与冲击 2022年8期
关键词:时序故障诊断精度

谭 帅, 马 遥, 侍洪波, 常玉清, 郭 磊

(1.华东理工大学 信息科学与工程学院,上海 200237;2. 东北大学 信息科学与工程学院,沈阳 110819)

旋转机械是现代工业、民用和军事应用中常见的机械类型,例如化工压缩机、高速列车走行部、航空航天发动机等,其运行状态检测和故障诊断对整个机械系统的安全运行至关重要[1-3]。滚动轴承作为旋转机械中最关键的零件之一,其工作状态直接影响着旋转机械正常运行。据相关统计,大约30%的旋转机械故障是由滚动轴承故障造成的[4]。因此,滚动轴承的状态监控以及故障诊断对保障旋转机械正常运转具有十分重要的意义[5-7]。

滚动轴承是旋转机械中的重要元件,为了实现精确的滚动轴承状态监控,工业过程中使用振动传感器来采集轴承的状态信息。旋转机械依靠轴承动力传动完成重复连续的周期旋转动作,因此滚动轴承的相邻旋转周期之间存在着很强的时序相关性。对滚动轴承的这种周期性的时序相关特性进行挖掘,对实现更精确的故障诊断有着非常重要的意义。

许多研究者对振动信号的时间序列特性进行了研究。传统的时间序列处理方法可以分为时序分析方法和特征提取方法。时序分析方法以时序模型为基础,对采集到的时序信号进行拟合得到模型参数作为特征。李学军等[8]使用自回归(auto-regressed,AR)模型对振动信号进行时间序列建模,将得到的模型参数作为特征向量,并使用聚类实现故障诊断。特征提取方法则是通过提取信号的时域、频域和时频域指标作为特征。廖庆斌等[9]对振动信号先做时序多相关处理,再使用经验模态分解方法对信号进行特征提取,改善了强噪声背景下特征提取不足的问题。深入挖掘振动信号中所蕴含的强时序相关性,对于提高故障诊断精度有着重要的意义。

随着深度学习的发展,尤其是长短时记忆人工神经网络(long short-term memory, LSTM)的提出使研究者们[10-12]开始对振动信号的时序相关性进行研究。张建付等[13]使用小波包变换提取特征向量输入LSTM网络,实现风电机组滚动轴承故障诊断;Lei等[14]提出了一种端到端的LSTM模型,直接从多变量时间序列数据中学习特征,并采集风机的振动数据验证了方法的有效性.很多学者将LSTM用于滚动轴承的故障诊断,虽然在一定程度上学习时间序列特性,却不能很好的挖掘振动信号周期间的时序的相关性。部分研究者为了解决振动采样数据量大的问题,采用了降采样的方法,损失了一部分时序相关信息,同样不能学习到完整的振动信号周期间的时序相关性。

针对上述问题,本文深入研究滚动轴承的旋转机理,挖掘滚动轴承在旋转周期之间的强时序相关特性,提出了周期记忆神经网络(periodization-LSTM, P-LSTM)。该方法将振动信号的周期性变化作为数据集的划分准则,利用频域分析方法对周期内数据进行特征分析,得到每个周期的数据特征;利用记忆因子模拟生物大脑对耦合信息关联记忆的功能,学习周期信号之间的时序相关关系,定量描述不同故障下振动信号周期间的时序相关关系,从而实现更加精确的故障诊断。

1 旋转机械的时序相关性

随着高速切削技术的发展,旋转机械的运行转速越来越高,滚动轴承作为旋转机械的核心传动部件,对其运行稳定性的要求也越来越高。高速旋转的运动特性导致其信号之间具有很强的时序相关性,这种相关特性既蕴含在信号周期内的样本之间,又蕴含在信号周期与周期之间。设备在运行时,后一个周期的旋转状态会受到前一个周期旋转状态的影响,周期之间存在强耦合关系,这种耦合关系可以通过周期间信号的时序相关性进行描述。

本文采用美国凯斯西储大学电气工程实验室的轴承振动数据[15],来研究不同故障下振动信号周期之间时序相关性的差异。本文采用的数据采集自轴承型号为SKF6205-2RSJEM型深沟球轴承。试验中发动机转速为1 797 r/min,传感器采样频率为12 kHz。试验设定的故障类型为损伤直径分别为0.07 mm和0.21 mm的滚动体、内圈和外圈3种故障。为了研究信号周期间的信号的时序相关性,使用不同故障下周期与周期间的皮尔逊相关系数,作为周期间时序相关性的表征。假:i为第i个样本;j为第i个样本的第j数据点;n为每个样本的总数据点;c为该样本所属类别;N为c类样本数量。则计算公式为

(1)

(2)

通过上式计算得到不同故障信号周期之间的皮尔逊相关系数rc,如表1所示。通过对表1进行分析,发现不同故障发生时其对应的滚动轴承运行周期间的时序相关性是不同的。轴承故障的程度不同,其时序相关性反应在相关系数上为,随着故障程度加深周期间的时序相关性加强,相关系数增大。另外可以发现轴承发生故障时振动信号周期间的相关系数相对于正常状态都发生变化,说明当轴承出现故障时周期间的时序相关性也会随之发生变化。

表1 不同故障数据周期间相关性

2 周期记忆神经网络

通过对旋转机械不同故障发生时振动信号周期间的时序相关性进行分析,发现滚动轴承不同故障下周期间时序相关性有所不同。为了深入挖掘这种周期间的时序相关性,本文提出周期记忆神经网络来实现这种时序相关性的学习。以Hochreiter等[16]提出的长短时记忆网络为基础,提出使用周期间时序相关性为数据集划分的指导依据,以学习数据周期间时序相关性,从而实现更加精确的故障诊断。

2.1 LSTM神经元结构

LSTM可以实现长时记忆的功能其重要原因是在神经网络中引用了记忆细胞的结构,记忆细胞的作用是根据当前观测信息选择性记忆重要信息,遗忘不重要的信息,其结构如图1所示。

图1 LSTM记忆细胞结构Fig.1 Structure of LSTM memory cell

记忆细胞的更新由细胞内的三个门进行控制,分别是输入门tt,输出门ot和遗忘门ft。输入门负责选择细胞要记忆的信息;遗忘门负责选择细胞将要遗忘的信息;输出门决定将要输出的信息,即根据当前输入和记忆细胞的记忆信息输出隐变量ht。记忆细胞的更新方式为

(3)

式中:W∈Rk×k,U∈Rm×k,b∈Rt均为可学习的参数;操作⊙为元素间的操作。记忆细胞在t时刻得到输入zt和前一时刻的隐变量ht-1,遗忘门将得到的信息进行非线性转换,决定前一时刻的记忆信息是否被保持;输入门将输入信息进行非线性转换加入到前一时刻的记忆中,形成新的记忆状态ct;输出门将得到的信息进行转换之后结合当前记忆状态ct输出成为当前时刻的隐藏状态ht。

2.2 P-LSTM网络框架

本文基于LSTM网络以及滚动轴承振动信号的旋转周期特性,以研究旋转周期间的时序相关性为目标,提出了周期记忆神经网络,其故障诊断框架如图2所示。

该框架分为四层:输入层、特征提取层、LSTM层和分类层。第一层数据输入层,为了有效提取数据周期特性,首先对原始振动数据按照旋转周期进行数据分段,使分段后数据保留完整的周期规律;第二层为特征提取层,其功能是对输入数据进行周期内特征提取,将旋转机械周期内的信息用数据特征表示出来,相邻周期的特征则作为第三层的输入,进行周期间时序相关性的学习;第三层为LSTM网络层,LSTM层的每个神经元接收来自第二层的周期内数据特征,通过相邻神经元之间的信息传递来学习前后周期间的时序相关性,得到反映数据周期间时序相关性的特征,将LSTM学习到的时序相关性特征作为第四层的输入;第四层softmax层的作用则是将接收到的特征进行全连接并进行特征映射,将时序相关特征映射到标签空间,从而实现故障诊断。

图2 P-LSTM的故障诊断框架Fig.2 The fault diagnosis framework of P-LSTM

2.3 周期内特征提取

LSTM因其能学习上下文之间的相关性,在处理自然语言等短小信号方面取得不错的效果。而滚动轴承的转速快、采样频率高,造成采集到的振动信号数据量大,信号冗余。如果将原始信号直接按照原来的长度输入LSTM网络进行训练,网络的复杂度会很大,待优化的参数量也会很庞大,造成网络的效果下降。因此需要对输入进行处理,一定程度上去除冗余信息。

为了解决上述问题,使LSTM能更好的学习轴承振动信号周期间的时序相关性,本文提出以滚动轴承的整数倍周期为数据分段依据,对一个或几个周期的分段数据进行周期内特征提取。使用快速傅里叶变换[17](fast Fourier transform, FFT)对周期分段后数据xt进行频域变换,提取频谱信息,其中离散傅里叶变换(discrete fourier transform, DFT)的计算公式为

(4)

式中:X(k)为x(n)的频谱;x(n)为离散信号;N为DFT点数。通过FFT时频域变换算法,将一个甚至几个周期的数据提取特征构成频域信号,一方面对时域信号可以起到滤噪降维的作用;另一方面从频域分析的角度可以更加准确的表征周期信号特征。

2.4 P-LSTM故障诊断方法

P-LSTM实现故障诊断的步骤如下:

步骤1将振动数据以周期为指导原则进行划分,将1个周期的数据xt作为一个时间窗口,每m个时间窗口作为输入窗,则输入窗可表示为X=(xT,x2T,…,zt,…,zmT)。

步骤2将输入层中每个时间窗的振动信号xi进行快速傅里叶变换,提取能够表征旋转周期内特性的特征,得到第二层特征层的输出Z=(zT,z2T,…,zt,…,zmT);

步骤3特征层输出作为LSTM网络层的输入,每个LSTM单元处理一个时间窗的特征, 当前LSTM单元接受来自前一个LSTM单元的输出以及当前输入。通过LSTM单元的传递关系学习前一个时间窗的特征和当前时间窗特征之间的时序相关性,即通过学习前后时间窗之间的时序相关性实现振动信号周期间时序相关性学习。

最后一个LSTM单元的输出hmT包含了当前输入层的所有周期之间的时序相关性,将其输入全连接层并结合softmax函数进行非线性变换得到当前输入所对应的故障类别y(S0∶y=[1 0 0 0 0 0 0]),从而实现故障诊断。假设故障总数为C,其中类别y的概率分布为

(5)

(6)

式中:i为第i个训练样本。通过网络训练得到的标签逐步逼近样本真实标签来优化网络参数,从而得到最优的权重。将测试数据输入训练好的网络进行故障诊断,验证网络的故障诊断性能。

3 方法验证

3.1 数据集设定

利用美国凯斯西储大学电气工程实验室的轴承数据来验证本文提出故障诊断方法的有效性。该轴承型号为SKF6205-2RSJEM型深沟球轴承,电动机轴承采用电火花加工进行故障播种,使用加速度计采集数据,采样频率为12 kHz,发动机转速分别设置为1 797 r/min,1 772 r/min,1 750 r/min,1 730 r/min。人工设置的故障可以分为三类:内滚道故障、滚动体故障和外滚道故障。每种故障由故障对应元件的损伤直径不同,可以分为2种状态,加上正常状态共计7种不同状态,详细信息如表2所示。

表2 振动信号参数表

在发动机转速为1 797 r/min且传感器采集数据的采样频率为12 kHz的条件下,加速度计每秒钟可以得到12 000个采样点,而数据集中每种故障的采样数据为10 s,也就是每种故障都有120 000个点,7种故障则是840 000个点的数据,数据量非常庞大,数据间的时序相关性存在冗余。通过文献分析可知,现有的故障诊断方法没有数据切分的标准,因此故障诊断精度不高。

本文采用发动机转速为1 797 r/min,损伤直径为1.778 mm和5.334 mm的数据来对提出的模型进行试验验证。根据发动机转速为v=1 797 r·min=29.95 r/s,计算可得试验轴承的转频为f=v=29.95 r/s≈30 Hz,根据采样频率为12 kHz可以计算得到一个周期为400个数据点。将数据集按照旋转周期进行处理,每种故障的数据可以分为300个周期,即300个样本。将其中的200个样本作为训练集,100个样本作为测试集。因此数据集可以分为1 400个样本的训练集和700个样本的测试集。

3.2 输入层数据窗口长度的确定

为了比较本文提出的P-LSTM算法在以不同周期为指导时故障诊断的效果,采用指导周期分别为T/2,T时处理的数据,输入P-LSTM模型,得到故障诊断结果如表3所示。表3中记录了取1/2周期和取整数倍周期下使用P-LSTM框架对7类故障进行故障诊断时,每一类的诊断精度和7种故障的平均诊断精度。从表中可以看出7种故障的诊断精度随着周期数的增加而提升,说明学习整周期T的时序相关性可以提高故障诊断的精度。

表3 P-LSTM模型在不同周期下的诊断精度

从表3中S6故障诊断精度来看,在以几种不同周期为指导时,其故障诊断精度一直都是100%,也就是几种模型都可以将其与其他故障很好的分离,从表1分析的数据时序相关性来看,故障S6的数据周期间的时序相关性与其他故障相差较大。这也说明时序相关性相差越大,故障越容易被区分,学习这种数据周期间的时序相关性可以帮助提高故障诊断性能。

3.3 LSTM网络时间步长的确定

为了验证本文提出的P-LSTM提取周期间的时序相关性的效果,对数据集进行不同时间步(即不同周期数)学习分析,并对不同周期数下的故障诊断精度进行比较,设定周期数为从2~30,不同周期数下的数据集设定如表4所示。将不同周期数下的数据集用P-LSTM网络进行训练,可以得到不同周期下的故障诊断结果如图3、图4所示。

表4 不同周期下数据集的设定

图3表示损失函数值随着时间步长的变化。图4表示故障诊断精度值随着时间步长的变化。通过两张图可以看出,在时间步为10之前,随着时间步的增加,测试集的损失函数逐渐减小,直到时间步为10时达到最小;测试精度则逐渐增加,直到时间步为10时达到99.8%。当时间步超过10之后随着时间步的增加损失函数逐渐增大,测试精度逐渐降低,直到时间步为30时,测试精度已经低于75%。

图3 不同关联周期数下的损失函数值Fig.3 Loss function values under different associated cycles

图4 不同关联周期数下的故障诊断精度Fig.4 Fault diagnosis accuracy under different associated cycles

从上述试验可以看出,随着关联周期数的增加,周期间的时序相关性被网络学习到,模型的诊断精度提升,直至损失函数值达到最低,同时模型精度也达到最高。但是随着关联周期继续增加,数据间的时序关联关系显著性会降低,即输入窗口内的第一周期数据与窗口内最后一个周期之间无明显关联关系,此时增加关联周期数,反而会导致模型诊断精度下降。根据损失函数最小化(模型精度最大化)原则,此处选择10作为最佳的关联周期数。

3.4 故障诊断结果

将处理好的数据输入提出的故障诊断框架进行训练,根据前文所述,时间窗口大小为400,经过FFT提取特征后数据被压缩为201,因此可确定LSTM层网络参数设置为,输入神经元维度为201,时间步长为10。分类层的输出故障类别为7类,因此隐藏层维度范围为[7, 201],batch_size设定为20,Drop_out层参数范围为(0, 1)。根据参数范围,使用网格搜索策略进行最优参数的搜索,最后得到最优参数为:隐藏层维度为64,Dropout层参数为0.23。故障诊断时将数据输入训练好的P-LSTM网络进行故障诊断。

为了便于观察故障诊断效果,本文使用t-分布随机邻居嵌入(t-distributed stochastic neighbor embedding, t-SNE)算法分别对原始数据和经过P-LSTM网络提取之后的特征进行降维,得到二维特征投影在二维坐标系中。使用P-LSTM网络进行故障诊断结果,如图5和图6所示。图5及图6中横轴和纵轴分别为使用t-SNE[18]算法降维后得到的两个主要特征。

从图5可以观察到,在训练之前数据样本分布非常混乱,各种故障之间状态存在严重混叠,无法直观分辨出各种故障所属类别。在经过P-LSTM网络进行故障诊断之后其诊断结果见图6,从图6中可以发现,7种故障聚成了7类,而且每一类之间有着明显的分界,可以很直观的观察出来。因此最终的诊断结果可以达到99.8%,说明使用P-LSTM网络通过挖掘振动信号周期间的时序相关性,可以提高故障诊断精度。

图5 测试数据分布Fig.5 Distribution of testing data

图6 P-LSTM诊断结果Fig.6 P-LSTM diagnosis result

3.5 P-LSTM性能分析

为了分析P-LSTM算法的性能,用较经典的LSTM算法与本文进行对比。两个网络在GTX 1060 GPU上进行训练,使用相同的数据集,得到的网络参数和训练时间如表5所示。

表5 P-LSTM与LSTM性能比较

从表5中可以看出来,相对于LSTM网络,P-LSTM网络待优化的总参数量少50 944,因此训练时间P-LSTM网络比LSTM网络快1 940 ms。说明P-LSTM网络可以比LSTM网络更快的训练,性能相对LSTM网络有一定的提升。

3.6 不同模型故障诊断效果分析

本文将提出的模型与支持向量机(support vector machine, SVM)、BP(back propagation)神经网络、循环神经网络(recurrent neural network, RNN)和LSTM等模型进行故障诊断比较试验,SVM、BP、RNN模型均按照整1周期的数据处理方式进行数据集处理,验证学习周期间时序相关性的优势。对各不同模型参数搜索方式与3.4节相同,根据不同的输入设定不同搜索范围,采用网格搜索策略进行参数搜索,最后获取各不同模型的最优参数设置如表6所示。 文章通过网格搜索得到的最优参数服务于试验使用的数据集。对于不同的数据集,使用网格搜索算法可以有不同的最优参数组合。

表6 各模型参数设置

SVM:使用带有非线性核函数RBF的SVM分类器来实现非线性分类问题。将数据集进行预处理得到新的数据样本之后,对每个样本进行特征提取, 提取时域的16个统计特征和频域的13个统计特征[19-20],将这些特征拼接成一个长的特征向量输入到SVM网络中进行训练。数据集中包含共分为7种故障,因此属于多分类问题,参数选择为一对多(one-versus-rest)策略,并且惩罚参数C设为10,核函数kernel设为rbf(径向基函数)。

BP:使用多层的BP神经网络和softmax层来进行故障诊断。使用两层BP来进行模型训练并使用一层dropout层来防止过拟合问题,最后使用一层softmax层来实现分类,Drop_out层的参数为0.3,各层的节点数为(128,32,7)。

RNN:RNN模型也可以学习前后神经元之间的数据相关性,使用一层RNN、一层dropout和一层softmax来进行故障诊断。训练数据和测试数据为按照前文所提的方式进行处理的数据,网络各层节点数设为(64,7)。

LSTM:为了说明P-LSTM算法的优越性,将P-LSTM与张建付等研究中和Lei等研究中的LSTM法进行比较,张建付等将数据按照200点作为一个样本进行划分,再使用小波包变换进行特征提取,将特征输入到LSTM网络中;Lei等将数据按照100点作为一个样本进行划分,并直接将数据输入LSTM网络中进行处理。

使用不同模型对滚动轴承的滚动体、外圈、内圈的2种不同故障成都的故障以及正常状态等7种设备运行状态进行故障诊断,各种算法故障诊断的精度和本文提出的模型P-LSTM的故障诊断精度对比结果,如表7所示。表7的精度是不同模型对7种不同故障进行诊断得到的平均精度值。图中可以看出,P-LSTM实现了最好的故障诊断精度,其诊断精度达到了99.8%,SVM、BP、RNN、LSTM(张建付等)和LSTM(Lei等)等精度均不及P-LSTM。得益于振动信号具有的强时序相关性,P-LSTM通过对时序相关性的学习提高了故障诊断的效果。

从表7中可以看出来,P-LSTM方法的故障诊断效果要稍优于LSTM(张建付等)与LSTM(Lei等)2种方法,可能的原因是,虽然同样使用LSTM作为基础网络,但是LSTM(张建付等)与LSTM(Lei等)使用的数据集没有按照振动周期作为指导来进行处理,因此每个样本没有包含完整振动周期的故障状态,单个LSTM神经元学习到的信息不全,LSTM神经元传递过程中信息不完整。因此诊断效果相对于P-LSTM有所下降。

表7 不同模型在不同周期下的诊断精度

通过试验可以证明,本文以旋转机械的旋转周期为数据处理的指导准则是有着积极意义的,可以通过挖掘旋转周期间的时序相关性来实现提高故障诊断精度的目标。

4 结 论

本文深入研究旋转机械旋转周期之间的时序关系,通过对旋转机械的运行机理进行研究得到旋转周期间存在强时序相关性的特性。因此以周期性为指导对监测轴承状态的时序信号进行分析,提出了一种周期记忆神经网络的故障诊断方法。该方法将数据按照一定旋转周期进行划分,并对每段数据进行周期内特征提取,利用记忆因子学习周期间时序相关特性,得到不同故障下数据的不同相关关系特征,从而实现更精确的故障诊断效果。最后通过试验比较分析,验证了本文提出的算法可以通过挖掘旋转机械周期间的时序相关性来提高故障诊断的精度。

猜你喜欢
时序故障诊断精度
顾及多种弛豫模型的GNSS坐标时序分析软件GTSA
清明
热连轧机组粗轧机精度控制
基于包络解调原理的低转速滚动轴承故障诊断
基于不同建设时序的地铁互联互通方案分析
基于DSPIC33F微处理器的采集精度的提高
数控机床电气系统的故障诊断与维修
基于FPGA 的时序信号光纤传输系统
基于量子万有引力搜索的SVM自驾故障诊断
以工匠精神凸显“中国精度”