基于SDAE和GRUNN的行星齿轮故障识别

2021-01-29 05:58高莲莲于广滨郭振宇
振动与冲击 2021年2期
关键词:隐层训练样本齿轮箱

于 军,高莲莲,于广滨,刘 可,郭振宇

(1. 哈尔滨理工大学 先进制造智能化技术教育部重点实验室,哈尔滨 150080; 2. 矿冶过程自动控制技术国家重点实验室,北京 100089; 3. 哈尔滨理工大学 自动化学院,哈尔滨 150080; 4. 哈尔滨理工大学 电气与电子工程学院,哈尔滨 150080; 5. 哈尔滨理工大学 机械动力工程学院,哈尔滨 150080)

行星齿轮箱具有传动比大和结构紧凑等特点,已广泛应用于汽车、风力发电和直升机等设备的机械传动系统中[1-2]。而复杂恶劣的工作环境常导致行星齿轮箱内部的齿轮发生裂纹、点蚀和磨损等故障[3],从而引起整个系统的失灵,甚至导致巨大的经济损失。因此,行星齿轮箱的故障诊断对避免潜在事故的发生和保障机械系统的可靠运行具有十分重要的意义。

近年来,深度学习理论因其强大的特征提取和表示能力而受到学者的广泛关注,已被成功应用于行星齿轮箱的故障诊断中。典型的深度学习模型包括深度置信网络(Deep Belief Network, DBN)、堆叠自动编码器(Stacked Autoencoder, SAE)、卷积神经网络(Convolutional Neural Network, CNN)和循环神经网络(Recurrent Neural Network, RNN)。DBN是由多个限制玻尔兹曼机组成的典型深度学习模型,每一限制玻尔兹曼机包含一个视觉层和一个隐层[4]。DBN可通过多隐层的非线性运算,提取和表示原始数据的高层次特征。Chen等[5]提出了一种基于维度约简和DBN的行星齿轮箱故障识别方法,用于提高故障识别准确率。Wang等[6]将一致性特征看作DBN的输入,实现行星齿轮箱的故障诊断。实验结果表明该方法具有较强的鲁棒性和较高的准确率。DBN虽具有简单的结构和极强的表示能力,但提取的故障特征常包含大量的冗余信息,从而极大地增加了计算复杂度,降低了识别准确率。

SAE是一种典型的无监督深度学习模型。它通过最小化重构误差使输出尽可能重构输入。为了快速处理大量输入数据并自动获得较高的诊断准确率,Jia等[7]提出了一种基于SAE的旋转机械智能诊断法。该方法通过预训练和精调的方式优化SAE的网络参数。Wang等[8]将生成对抗网络与SAE相结合,构建了一种行星齿轮箱诊断模型。该模型可用于提高小样本高噪声工况下的太阳轮诊断准确率。Jia等[9]提出了一种基于堆叠标准化稀疏自编码器的局部深度网络,实现机械设备的智能诊断。SAE虽具有突出的消噪特性,但其难于准确表示输入数据与故障类型间的映射关系。而且,对于复杂的非静态输入数据,它无法获得满意的诊断效果。

CNN是由LeCun等在1998年首次提出的一种用于图像处理的多层神经网络。它由滤波级和分类级组成。滤波级用于提取输入数据的特征,而分类级根据提取的特征进行模式识别。Jing等[10]利用CNN直接从振动信号的频域数据中提取故障特征,识别行星齿轮箱状态。Zhao等[11]开发了一种基于动态加权小波因子的深度残余神经网络,用于变转速工况下行星齿轮箱的故障识别。Han等[12]提出了一种基于多层次小波包融合的动态集成CNN。实验结果表明该模型能改进小样本和变转速工况下行星齿轮箱故障诊断的准确率和鲁棒性。尽管CNN已成功应用于行星齿轮箱的故障诊断。但在噪声环境下,其诊断效果会迅速恶化,难于准确判断行星齿轮箱状态。

作为一种新颖的深度学习模型,RNN(Recurrent Neural Network)具有突出的记忆能力和良好的动态特性。它通过构建单元间的联系,处理任意长度序列的输入数据。Zhao等[13]建立了一种基于局部特征的RNN模型。典型旋转机械的健康监测实验验证了该模型的有效性和鲁棒性。Liu等[14]提出了一种基于自动编码器和RNN的轴承故障诊断方法。该方法采用基于消噪编码的门控循环单元识别轴承的故障类型。Jiang等[15]设计出一种改进多隐层RNN,自动提取滚动轴承的故障特征。RNN常与其它深度学习模型相结合,实现对输入数据的消噪处理。然而,基于RNN的故障诊断方法较少应用于时变转速工况下行星齿轮箱的故障诊断。

然而,与固定轴齿轮箱不同,行星齿轮箱内部的行星齿轮既绕着自身的中心轴自传,又绕着太阳轮中心轴公转。行星齿轮在与太阳轮啮合的同时,还与齿圈啮合,其振动信号比固定轴齿轮更为复杂。而恶劣的工作环境常导致行星齿轮振动信号受到强烈的噪声干扰。此外,当采集时变转速工况下行星齿轮振动信号时,固定在齿轮箱箱体上的传感器采集到的是发生幅值调制或频谱调制周期性非静态信号。因此,噪声环境和时变转速工况下行星齿轮故障识别是行星齿轮箱故障诊断的难点之一。为此,本文提出一种基于堆叠消噪自动编码器(Stacked Denoising Autoencoder, SDAE)和门控循环单元神经网络(Gated Recurrent Unit Neural Network, GRUNN)的行星齿轮故障识别方法。构建基于SDAE和GRUNN的混合模型,自动地从含噪样本中提取鲁棒故障特征;采用Adam优化算法和dropout技术训练该混合模型,实现多参数的优化,防止过拟合现象的发生;根据训练后的混合模型,利用softmax分类器识别待诊样本中行星齿轮的状态。

1 SDAE和GRUNN简介

1.1 堆叠消噪自动编码器

(1)

(2)

(3)

式中:θ′={W′,b′}为解码网络参数;W′为权重矩阵;b′为偏移向量。DAE的训练目的是最小化重构误差,即

(4)

式中,M为样本数。DAE可从含噪样本中提取有效的特征。

图1 DAE的计算过程图Fig.1 Computational process graph of DAE

(5)

式中:θn+1为输出层的参数集;g(*)为softmax分类器的激活函数。SDAE通过最小化交叉熵损失函数LSDAE实现微调,采用Adam优化算法[18]微调SDAE的参数。

1.5 试剂性能验证及结果判读标准 选择上述不同IHC级别的标本,共25例,按照优化后条件行FISH检测。结果判读参照乳腺癌HER2检测指南(2014版)[2]选择至少2个视野,随机计数至少20个浸润细胞。①当HER-2/CEP17比值≥2.0时,HER-2为阳性;HER-2/CEP17比值<2.0,但平均HER-2拷贝数≥6.0时,HER-2阳性;HER-2信号连接成簇时,可不计数,直接视为基因扩增。②当HER-2/CEP17比值<2.0,且平均拷贝数/细胞<4.0时,HER-2阴性。③当HER-2/CEP17比值<2.0,平均HER-2拷贝数在4.0~6.0之间,结果判为不确定。

(6)

式中,Θ为SDAE的参数集,且Θ={θ1,θ1,…,θn+1}。最近的研究表明SDAE能有效地改进分类表现,并能自动地从含噪样本中提取鲁棒特征[19]。

图2 SDAE的模型结构Fig.2 Structure of SDAE model

1.2 门控循环单元神经网络

RNN通过建立隐层单元间的循环连接,记忆任意长度序列的输入数据[20]。其模型结构如图3所示。RNN的关键在于t时刻隐层输出ht是由当前输入xt和前一时刻隐层输出ht-1决定的,计算公式为

(7)

式中:W″和H为转换矩阵;b″为偏置向量;f为非线性激活函数。

图3 RNN的模型结构Fig.3 Structure of RNN model

然而,常规RNN的训练过程可能导致梯度消失问题。为缓解这一问题,Chung等[21]开发了一种可实现状态记忆和信息获取的门控循环单元(Gated Recurrent Unit, GRU),用于构建GRUNN。GRU的结构如图4所示。重置门r用于调整新输入与之前记忆的合并,更新门z用于调控之前记忆中保留的信息。GRU 中的转换函数定义为

zt=σ(Wzxt+Vzht-1+bz)

(8)

rt=σ(Wrxt+Vrht-1+br)

(9)

(10)

(11)

式中:σ为sigmoid函数;tanh为双曲正切函数;符号⊙为点积运算。

图4 GRU的结构Fig.4 Architecture of GRU

2 行星齿轮故障识别方法

2.1 行星齿轮故障识别框架

凭借堆叠结构和消噪训练,SDAE能自动地从噪声数据中提取鲁棒特征。与其它智能诊断方法相比,SDAE的训练过程避免了人工选择网络参数,获得的深度学习模型能客观地反映数据特点。因此,SDAE在噪声数据的故障特征提取方面取得了惊人的效果。作为一种新型的RNN变体,GRUNN不但能处理时序数据或前后关联数据,还能缓解常规RNN在训练过程可能导致的梯度消失问题。并且,它特殊的门结构能够有效地解决长短时间序列上的变化问题。因此,提出一种基于SDAE和GRUNN的行星齿轮故障识别方法,方法框架如图5所示。构建基于SDAE和GRUNN的混合模型,自动地从含噪样本中提取鲁棒故障特征;采用Adam优化算法和dropout技术训练该混合模型,实现多参数的优化,防止过拟合现象的发生;根据训练后的混合模型,利用softmax分类器识别待诊样本中行星齿轮的状态。

图5 行星齿轮故障识别框架Fig.5 Fault diagnosis framework of planetary gears

2.2 基于SDAE和GRUNN的混合模型

如果将SDAE与GRUNN相结合,构建一种混合模型,那么该混合模型将同时具备两者的优点。基于这个思路,本文开发一种新颖的基于SDAE和GRUNN的混合模型,模型结构如图6所示。它由SDAE、GRUNN和softmax分类器组成。SDAE的输入数据为行星齿轮振动的时域信号。将SDAE的输出看作GRUNN 的输入,提取输入信号的故障特征。softmax分类器将提取的故障特征转换为行星齿轮状态的概率分布。与其它单一结构的深度学习模型相比,该模型具有更深层次的网络结构,能够提取关键的鲁棒故障特征,改进模式识别效果。

图6 基于SDAE和GRUNN的混合模型结构Fig.6 Structure of the hybrid model base on SDAE and GRUNN

2.3 基于SDAE和GRUNN混合模型的训练

步骤1设置添加进SDAE输入数据中的噪声比例,通过最小化输入和输出的重构误差,实现SDAE各隐层参数的初始化;

步骤2设置dropout率,并将dropout技术应用于该混合模型,从而获得“较稀薄的”深度学习模型;

步骤3计算softmax 分类器输出的概率分布与目标类的概率分布之间的交叉熵损失函数,公式为

(12)

式中:p(x)为目标类的概率分布;q(x)为softmax分类器输出的概率分布;

步骤4设置Adam优化算法的学习率α,两个矩估计指数衰减率β1和β2,数值稳定常数ε,并将该算法用于训练该混合模型。

3 实验结果和对比分析

3.1 实验设备

本实验以行星齿轮为研究对象,通过识别其故障状态验证提出方法的有效性。图7为本实验室研发的行星齿轮箱实验台。它主要由驱动电机、两个对称放置的行星齿轮箱与磁粉制动器组成。采用六种行星齿轮模拟行星齿轮的六种典型状态,即正常(NC)、缺齿(CT)、断齿(MT)、轻度齿根裂纹(WTRC)、重度齿根裂纹(HTRC)、齿面磨损(FW),如图8所示。其中,行星齿轮齿根裂纹尺寸如表1所示。利用加速度传感器获得行星齿轮箱的振动加速度信号。在停机的过程中采集信号,驱动电机转速从60 Hz降至30 Hz。采样频率为25.6 kHz,采样时间为4 s。通过磁粉制动器模拟三种行星齿轮箱负载。每种负载采集20组样本,六种行星齿轮一共可获得360组样本。图9为齿面磨损行星齿轮的时域波形和频谱。

图7 行星齿轮箱实验台Fig.7 Planetary gearbox test rig

图8 六种行星齿轮Fig.8 Six planetary gears

表1 行星齿轮齿根裂纹尺寸

图9 齿面磨损行星齿轮的时域波形和频谱Fig.9 Time-domain waveform and frequency spectrum of planetary gear with face wear

3.2 实验结果

本实验将288组样本看作训练样本,72组样本看作待诊样本,样本数之比为4 ∶1。使用的程序开发框架为Tensorflow1.1.0,编程语言为Python。计算机配置为8核i7-6700处理器,16 GB内存。构建基于SDAE和GRUNN的混合模型。基于深度神经网络的故障诊断模型,通常将SDAE的网络模型中隐层数定为2~4个,通常将GRUNN的网络模型中隐层数定为1~3个。通过尝试,本实验中的混合模型由3个SDAE隐层、2个GRU层和1个softmax分类器组成。隐层神经元数目并非越多越好,当隐层神经元数目达到一定时,准确率趋于平稳,但训练时间显著增加。经过多次尝试,本实验将SDAE隐层和GRU层的神经元数目分别选为180和120。当电机轴旋转一周,可采集到853个数据点。为了包含足够的信息,并降低计算复杂度,输入数据(23×23=529)至少超过电机轴旋转一周所采集到的数据点数的一半。所以,输入数据为23×23矩阵。采用Adam优化算法和dropout技术训练该混合模型。噪声比例设为0.3,dropout率设为0.1,学习率α设为0.001,2个矩估计指数衰减率β1和β2分别设为0.9和0.99,数值稳定常数ε设为10-8,迭代次数设为550。利用softmax分类器识别待诊样本中行星齿轮状态。行星齿轮状态的识别准确率如表2所示。其中,每种行星齿轮状态的平均准确率为训练样本和测试样本中正确样本数与训练样本和测试样本的总数之比。从表2可知,行星齿轮故障越严重,诊断效果越好。这是由于从故障较重行星齿轮的训练样本中提取的故障特征更具特点,有助于识别待诊样本中行星齿轮状态。而且,每种状态的待诊样本准确率均超过96%,平均准确率均高于99%。由于行星齿轮缺齿和断齿的故障特征容易分辨,所以这两种行星齿轮故障的待诊样本准确率和平均准确率均接近100%。而行星齿轮齿根裂纹的故障特征较难分辨,但齿根裂纹的待诊样本准确率均超过97%。行星齿轮齿面磨损的故障信号较微弱,但待诊样本准确率可超过98%。因此,本文提出的基于SDAE和GRUNN的行星齿轮故障识别方法可准确识别行星齿轮的缺齿、断齿、齿根裂纹和齿面磨损四种故障。

表2 行星齿轮状态的识别准确率

由于行星齿轮状态的识别准确率受SDAE隐层神经元数目和GRU层神经元数目的直接影响,神经元数目对识别准确率的影响研究如下。改变SDAE隐层神经元数目,且每一GRU层神经元的数目与SDAE隐层神经元数目相同。SDAE隐层神经元不同数目下的诊断结果如图10所示。从图10可知,训练样本准确率为100%,待诊样本准确率均超过96%。然而,随着SDAE隐层神经元数目的增加,诊断时间逐渐升高。主要原因在于混合模型的计算复杂度逐渐增加,延长了训练时间。当SDAE隐层神经元数目超过180时,诊断准确率反而略有下降而诊断时间明显增加。所以,将隐层神经元数目选为180。

图10 SDAE隐层神经元不同数目下的诊断结果Fig.10 Diagnosis results with different neuron numbers of the hidden layers in SDAE

当SDAE中隐层神经元数目设为180时,改变GRU层神经元数目。GRU层神经元不同数目下的诊断结果如图11所示。从图11可知,随着GRU层神经元数目的增加,待诊样本准确率先升高然后保持稳定。当GRU层神经元数目达到120时,待诊样本准确率达到最大值。因此,将GRU层神经元数目选为120。

图11 GRU层神经元不同数目下的诊断结果Fig.11 Diagnosis results with different neuron numbers of the GRU layers

3.3 对比分析

为了验证本文提出的基于SDAE和GRUNN的行星齿轮故障识别方法的特征提取能力,SDAE,GRUNN和该方法分别用于提取样本中的故障特征。SDAE包含5个隐层和1个softmax分类器,隐层神经元数目设为180。GRUNN包含5个GRU层和1个softmax分类器,GRU层神经元数目设为120。采用Adam优化算法和dropout技术训练SDAE和GRUNN。其中,设定的参数与该混合模型中设定的参数相同。利用主元分析法(Principle Component Analysis, PCA)绘制这三种方法的样本主成分散点图,如图12所示。从图12可知,一些明显的现象值得注意,通过SDAE提取的故障特征无法清晰区分六种行星齿轮状态,一些状态彼此轻微重叠;此外,通过GRUNN提取的故障特征可使六种行星齿轮状态彼此区分开,但仍存在部分重叠区域。这表明难于利用SDAE和GRUNN对这六种行星齿轮状态进行有效区分。然而,利用基于SDAE和GRUNN的行星齿轮故障识别方法可实现六种行星齿轮状态的有效分离,改进同一行星齿轮状态的聚类分布。主要原因在于基于SDAE和GRUNN的行星齿轮故障识别方法不但具有SDAE的鲁棒特征提取能力,还能利用GRUNN缓解梯度消失问题。

图12 样本主成分散点图Fig.12 Scatter plots of principal components of the acquired samples

为研究信噪比(Signal-to-Noise Ratio, SNR)对诊断效果的影响,将基于SDAE和GRUNN的行星齿轮故障识别方法与BPNN,SVM,SDAE和GRUNN进行对比。采用MATLAB 2016a中的工具箱,实现基于BPNN或SVM的行星齿轮状态识别。BPNN的隐层单元数设为120,通过最小化预定误差目标值的方式,采用Levenberg-Marquardt优化算法训练BPNN。将径向基数核看作SVM的核函数,并采用cross-validation算法优化核函数参数和惩罚因子。采用EEMD方法提取样本中的时域特征和频域特征,一共可提取24个故障特征用作BPNN和SVM的输入。SDAE和GRUNN的结构和训练过程如前所述。不同SNR下五种诊断方法的待诊样本准确率如图13所示。从图13可知,随着SNR的减小,待诊样本准确率逐渐降低。当SNR=0时,BPNN和SVM的待诊样本准确率均低于80%,而该方法的待诊样本准确率超过95%。这是由于该方法利用SDAE的堆叠结构和消噪训练,自动地从噪声数据中提取鲁棒特征。与GRUNN和SDAE相比,基于SDAE和GRUNN的行星齿轮故障识别方法总是获得最高的待诊样本准确率,且待诊样本准确率均超过96%。原因在于该方法不但能从噪声数据中提取鲁棒故障特征,还能利用GRUNN处理前后关联的时序数据,缓解梯度消失问题。对比结果表明在五种诊断方法中,基于SDAE和GRUNN的行星齿轮故障识别方法具有较强的抗噪能力。

为研究训练样本数对诊断效果的影响,将基于SDAE和GRUNN的行星齿轮故障识别方法与BPNN,SVM,SDAE和GRUNN进行对比。不同训练样本数下五种诊断方法的待诊样本准确率如图14所示。从图14可知,随着训练样本数的增加,待诊样本准确率逐渐提高。当训练样本数超过200时,待诊样本准确率趋于稳定,基于SDAE和GRUNN的行星齿轮故障识别方法依然获得最高的待诊样本准确率。主要原因在于训练样本数的增加在改进诊断效果的同时,也引入了更多外部干扰。基于SDAE和GRUNN的行星齿轮故障识别方法采用Adam优化算法和dropout技术训练开发的混合模型,解决多参数的优化问题,防止过拟合现象的发生。与BPNN和SVM相比,基于SDAE和GRUNN的行星齿轮故障识别方法明显高于另两种常用方法。这主要在于SDAE能从噪声数据中提取鲁棒故障特征,改进模式识别效果。而另两种方法并不具备鲁棒故障特征的提取能力。此外,在训练样本数较小的情况下,基于SDAE和GRUNN的行星齿轮故障识别方法的待诊样本准确率明显高于其它诊断方法。这是由于该方法将SDAE和GRUNN相结合,构建出深层次的神经网络,从而挖掘出关键的故障特征。因此,基于SDAE和GRUNN的行星齿轮故障识别方法能在训练样本数较小的情况下获得良好的诊断效果。

图13 不同SNR下五种诊断方法的待诊样本准确率Fig.13 Test accuracy of five diagnosis methods under different SNRs

图14 不同训练样本数下五种诊断方法的待诊样本准确率Fig. 14 Test accuracy of five diagnosis methods under different training sample numbers

为研究基于SDAE和GRUNN的行星齿轮故障识别方法对时变转速的适应能力,将该方法与DBN,SAE,CNN和RNN进行对比。这四种诊断方法中深度学习模型的结构和训练过程与该混合模型相似。它们均包含5个隐层,并采用Adam优化算法和dropout技术进行模型训练。3个样本集分别看作训练样本或待诊样本,它们的描述如表3所示。五种诊断方法的待诊样本准确率如图15所示。其中,A→B是指将样本集A看作训练样本,将样本集B看作待诊样本。从图15可知,五种诊断方法的待诊样本准确率逐渐降低。样本集中驱动电机的转速越低,诊断效果越差。主要原因在于当驱动电机转速超过50 Hz时,深度学习模型每次的输入数据至少包含了一个旋转周期。较低的驱动电机转速可能导致深度学习模型每次的输入数据不能包含足够的训练或测试信息。与其它方法相比,基于SDAE和GRUNN的行星齿轮故障识别方法均获得最高的待诊样本准确率。原因在于基于SDAE和GRUNN的行星齿轮故障识别方法将SDAE和GRUNN组合在一起;利用SDAE的堆叠结构和消噪训练自动地从噪声数据中提取鲁棒故障特征;利用GRUNN处理前后关联的时序数据,缓解梯度消失问题。因此,基于SDAE和GRUNN的行星齿轮故障识别方法具有较强的时变转速适应能力。

表3 3个样本集的描述

图15 五种诊断方法的待诊样本准确率Fig.15 Test accuracy of five diagnosis methods

4 结 论

(1) 将SDAE与GRUNN相结合,开发一种新颖的基于SDAE和GRUNN的混合模型。该模型利用SDAE的堆叠结构和消噪训练自动地从噪声数据中提取鲁棒故障特征,实现行星齿轮状态的有效分离,改进同一行星齿轮状态的聚类分布。利用GRUNN处理前后关联的时序数据,缓解常规RNN在训练过程可能导致的梯度消失问题。因此,该模型具有较强的抗噪能力和时变转速适应能力。

(2) 在基于SDAE和GRUNN混合模型的基础上,提出行星齿轮故障识别方法。该方法采用Adam优化算法和dropout技术训练开发的混合模型,从而解决多参数的优化问题,防止过拟合现象的发生。并且,该方法将SDAE和GRUNN相结合,构建出深层次的神经网络,从而挖掘出关键的故障特征。因此,该方法能在训练样本数较小的情况下获得良好的诊断效果。

猜你喜欢
隐层训练样本齿轮箱
基于RTD可编程逻辑门的n变量函数实现算法
风电齿轮箱轴承用钢100CrMnSi6-4的开发
基于BP神经网络学习算法的图像压缩技术研究
人工智能
基于RDPSO结构优化的三隐层BP神经网络水质预测模型及应用
提高齿轮箱式换档机构可靠性的改进设计
宽带光谱成像系统最优训练样本选择方法研究
融合原始样本和虚拟样本的人脸识别算法
基于稀疏重构的机载雷达训练样本挑选方法
杭州前进齿轮箱集团股份有限公司