基于HVD小波包降噪编码深度学习的风电机组智能诊断研究

2022-06-29 09:57时培明范雅斐伊思颖韩东颖
振动与冲击 2022年12期
关键词:波包编码器模态

时培明, 范雅斐, 伊思颖, 韩东颖

(1. 燕山大学 电气工程学院, 河北 秦皇岛 066004;2. 燕山大学 车辆与能源学院,河北 秦皇岛 066004)

轴承作为基础的支撑零件,是风机中应用最为广泛的零件之一。风电机组工作条件恶劣,工况复杂,其减速箱轴承是故障频繁发生的关键部件之一,因而针对风机轴承的故障诊断方法技术的探索一直是学术界的研究热点[1-2]。然而, 风机轴承的振动信号一般是非线性非平稳性的,如何从原始信号中提取有效的特征实现准确诊断是一个很大的挑战。最新进展证明了深度学习算法[2-4]在处理复杂非线性、高维机械信号方面的高效性。其中,自动编码器网络无监督的学习模式有其突出的优势。Qi等[5]提出的经验模态和叠加稀疏编码器两阶段学习算法,证明了编码器较强的特征学习能力。Li等[6]将距离度量学习和k-means聚类方法集成到自编码网络结构中,表现出较高的分类精度。Zhang等[7]构造了流形稀疏编码器神经网络,试验证明,该方法能更好地提取出偶识别性的高级特征。Jiang等[8]提出使用多个噪声级顺序地训练降噪编码器,从输入数据中以不同的尺度捕获更详细的信息,提高诊断正确率。然而,多数算法没有表现出稳定的诊断性能,且在保证诊断率的同时需要较长的诊断时间。

本文提出基于修正的自动编码器-层叠降噪编码器(stacked denoising autoencoder,SDAE),通过网络架构的多重非线性变换,实现自适应鲁棒学习。结合希尔伯特振动分解(Hilbert vibration decomposition,HVD)高分解效率和小波包分解(wavelet packet decomposition,WPD)构造数据之间非线性映射关系的优点,克服了振动信号的噪声干扰,提高了诊断性能,同时能量熵的低维表示也降低了故障诊断时间。低维预处理结果作为SDAE的网络输入,完成网络的特征学习和故障分类。试验证明,本文提出的新的特征学习方法——HWSDAE方法能有效提高风机轴承故障分类精度。

1 模型数据预处理

1.1 希尔伯特振动分解算法

HVD是由Feldman等提出的一种经典的振动信号分解算法[9],将信号分解为幅值大小不同的分量之和,在处理非稳定信号时表现出较为突出的优越性。算法具体分解步骤如下。

步骤1希尔伯特变换。对于任意一个非平稳连续时间信号x(t),其Hilbert 变换可表示为

(1)

(2)

步骤2幅值最大分量的频率估计。多分量非平稳信号可以进行分解,根据式(2),信号x(t)的瞬时频率f(t)也可表示为

(3)

式中:前半部分f1(t)为信号幅值最大频率的瞬时频率;后半部分表示与前者相比快速变化的震荡频率部分。后者可以利用HVD的低通滤波器进行滤除。

步骤3同步检测求幅值和相位。利用正余弦函数构造两个正交信号,并同步检测出瞬时频率对应的瞬时幅值a(t)和相位θ(t)。

步骤4分离迭代。经步骤1~步骤3分离得到x(t)中幅值的最大分量

(4)

将x(t)与x1(t)的差值作为初始信号x0(t),即

x0(t)=x(t)-x1(t)

(5)

重复步骤2、步骤3,可得到各层分量xi(t),i=1,2,3,…设置迭代次数N或者x0(t)的归一化标准差σ<0.001,作为迭代的终止条件。

步骤5根据峭度与信号冲击强弱的关系选取模态分量S。

1.2 小波包原理

小波包分析[10]是改进的小波变换,克服了小波变换对于高频段的频率分辨率较差的缺陷。将故障信号进行小波包分解,WPD序列按照频带由低到高的阶数进行排序,计算各频带所占的能量熵,作为HWSDAE的输入。详细步骤如下。

步骤1对峭度选取分量S进行j(本文令j=5)层小波包分解。Xij为了分解后第i层中的第j个节点所在频段的小波包分解对应的系数大小。

步骤2对底层小波包分解系数进行重构。将步骤1中得到的32个频带的特征信号序列进行重构。Sij为Xij对应的重构信号。S5j为第5层各节点的重构信号,则S表示为

(6)

(7)

式中:N为原始信号长度;Hij为信号的第i层第j个小波包能量熵。

使用WPD分解矩阵的优势显而易见,矩阵将信号分离到单独的频带中,降低了被分析信号的总体复杂度,提取频带内和频带间的特征比直接从原始信号中提取特征更容易,有助于提高模型的故障诊断性能[11]。

2 HWSDAE算法模型

2.1 DAE

Vincent等提出了一个修正版的经典AE(auto-encoder,AE)[12],并命名为DAE(denoising autoencoder,DAE)。DAE是从AE的基本思想出发,随机破坏原始输入信号,避免其输出只是输入的简单映射,形成更具鲁棒性的表示。AE通过对隐藏特征进行编码解码,使网络输出尽可能与输入接近。标准的AE是一个全连接的3层神经网络:输入层、隐藏层和输出层。结构图如图1所示。

输入层和隐藏层构成编码网络

h=f(x)=Sf(WEx+bE)

(8)

隐藏层和输出层构成解码网络

y=g(h)=Sg(WDx+bD)

(9)

式中:x=[x1,x2,…,xn]∈Rn×1为输入值;h=[h1,h2,…,hm]∈Rm×1为隐藏值;y=[y1,y2,…,yn]∈Rn×1为输出值;f(·)和g(·)为激活函数。在标准的AE算法中,激活函数常采用S型函数即Sigmoid函数,如式(10)所示。

图1 标准AE模型Fig.1 Standard AE model

(10)

其中,编码器网络为ZE=WEx+bE,解码器网络为ZD=WDh+bD。WE∈Rm×n和WD∈Rn×m分别为编码和解码网络的权值,bE∈Rm×1和bD∈Rn×1分别为偏置。AE将输入数据加入权重参数W进行编码,经过激活函数并进行解码,该训练过程是为了寻求一组网络参数最小化损失函数。损失函数定义为输入与输出的二范数,即

(11)

式中:N为训练样本数;‖·‖2为二范数模型。由此可知,该目标函数是一个二次凸函数,依次求解偏导数,采用批量梯度下降法(batch gradient descent,BGD)更新权值参数,并通过反向传播算法进行网络微调,最终找到全局最优解。

(12)

2.2 HWSDAE算法

层叠降噪自编码器(stacked denoising autoencoder,SDAE)是多个DAE单元的堆栈,由一个输入层、一个输出层和多个隐藏层搭建而成。输入数据通过逐层的学习表示,进行特征的空间转换,能够捕捉更多数据的内在信息。另外,损坏数据输入的训练过程是无监督的,其主要目的是从未标记的数据中学习特征表示,避免了人为添加样本标签的步骤,提高了工作效率的同时减少了对主观经验的依赖,也更加适用于滚动轴承故障诊断的实际场景。输出端添加Softmax分类层,构建一个具有特征提取和模式识别功能的深度神经网络模型。

本文提出的HWSDAE算法模型是以SDAE深度学习为改进基础,结合HVD时频分析工具和小波包降维算法对原振动信号进行预处理,处理结果作为模型训练的输入,利用SDAE网络的自身特性,进行无监督网络训练和参数优化完成故障分类。本文所提方法流程图(见图2)、模型图(见图3)及详细诊断步骤总结如下。

步骤1将代表不同轴承故障类型的数据根据样本点的设定进行随机分段,按照一定比例分配到训练集和测试集。分别定义为Datatrain,Datatest。

步骤2试验设定将数据进行3层HVD模态分解,选取峭度值最大的模态分解量参与下一步的降维;接着进行5层小波包分解,得到32样本大小的能量熵,并以此构造特征向量。同理,测试集也进行上述步骤。分别定义为Trainset,Testset。

步骤3将步骤2得到的特征数据作为SDAE网络的输入,数据在深度学习网络中进行噪声破坏、隐藏层压缩、无监督训练和有监督微调等过程。网络顶层添加Softmax分类层。

步骤4将步骤2得到的测试集Testset放入训练完成的编码器网络,并给出对应的健康状况标签以及分类准确率。

图2 HWSDAE故障诊断流程图Fig.2 Flowchart of HWSDAE fault diagnosis

图3 HWSDAE故障诊断模型图Fig.3 Model diagram of HWSDAE fault diagnosis

2.3 HWSDAE模型参数选择

为了使网络模型最优化学习,本节以西储数据轴承外圈故障振动信号为例,进行参数选择。相对标准差和峭度值两个评估指标的选择基于模态信号稳定性和对信号敏感度的表现。其中,相对标准差越小表示模态信号相对原信号相似度越高;峭度值越大表示对故障信号的敏感度越高。

(1) HVD分解模态数

以5个模态分量的HVD分解为例,如图4所示。由图4可知,HVD分量1与原信号最接近,高频部分较为突出;分量2,3的波形图波动明显,信号的低频信息被细化分解;随着分解模态数的增加,频谱波动幅度和范围变小,频谱幅值量级在1×10-3左右,分解过程所消耗的时间也变长。图5表明,相对标准差在3层以后趋于稳定,且在3层分解量的峭度最大。综上分析,我们设定HVD的模态分解数为3。

(2) 网络隐藏层和节点数

由于深度学习网络自身的深层挖掘特性,因此需要在进行网络选择和训练时评估网络隐藏层及节点数对诊断性能的影响。表1统计了上述两个因素对系统模型表现性能的影响,由表1可知,当输入层为单元数为32 时,一个或两个隐藏层的设置明显要优于3个隐藏层,且表现稳定,随着隐藏层的增加,较深的网络结构会出现过拟合现象,导致诊断性能略有下降。当隐藏层数设定为2且节点数均为100时,网络的重构误差最小,表明此时的网络训练特征包含了更多的故障信息,模型表现出突出稳定的诊断性能。

基于上述试验,选择由32和4个神经元构造输入层和输出层,两个隐藏层均为100个神经元的网络结构,进行基于深度网络的特征学习。

图4 5个模态分量时频图Fig.4 Time-frequency diagram of 5 modal components

图5 指标趋势图Fig.5 Indicator trend chart

表1 网络隐藏层及节点设置

3 试验验证

3.1 试验设置

为了证明所提方法的稳定有效性,采用两个数据集进行算法验证。训练集、测试集均包含4种不同工况数据,如表2所示。

表2 试验数据描述

3.2 试验分析

(1) 凯斯西储数据集

图6所示是凯斯西储大学试验平台,试验台设置的详细信息可在文献[13]中找到。本文使用12 000采样频率下的电机载荷为0负载的4种运行状态的驱动端加速度数据(DE),另外,外圈的损伤点选择6点钟方向。试验设定每种故障各取30组,每组有3 000个样本点,等比例分配给训练集和测试集,其样本空间大小均为15×3 000。

图6 凯斯西储大学试验平台Fig. 6 The experimental platform of Western Reserve University

将本文所提方法与现有的SAE,DBN和原数据输入SDAE网络进行比较,4种模型6次分类精度平均值以及所需的诊断时间如图7所示。本文所提HWSDAE方法的平均准确率高达99.49%,单次诊断率可达100%。HWSDAE网络比原数据直接输入SDAE网络表现出更为突出的诊断性能,准确率提高最为明显,可达13.52%,导致该现象的原因是没有经过预处理的数据维度较高,含有更大比例的干扰噪声和其他冗余信息,且非线性信号不利于深度网络的训练学习。

图7 不同算法结果对比图Fig.7 Comparison chart of different algorithm results

(2) 实验室平台数据集

第二组振动数据是在如图8所示的实验室平台上采集的。在转速为1 500 r/min,3 kHz的采集频率下采集轴承的正常状态、内圈故障、外圈故障和滚动体故障的振动数据。试验设定每种故障各取30组,每组有1 800个样本点,等比例分配给训练集和测试集,其样本空间大小均为15×1 800。

图8 实验室设计试验平台Fig. 8 The experimental platform of laboratory design

图9为4种算法模型在第二组数据集上的试验结果对比图。相比第一组数据集整体准确率略有下降,但本文提出的HWSDAE算法的性能表现依然最为突出,准确率高达98.72%,且没有因为网络层的叠加造成时间消耗。由图7、图9可知,DBN网络的性能表现较为稳定,明显优于SDAE算法,但诊断时间和平均准确率都差于SAE和HWSDAE网络。HWSDAE与SAE网络相比获得了更稳定的训练时间,主要是因为数据破坏可以减少学习到的特征的反向传播时间,具有更好的鲁棒性。同时,平均准确率相比SAE网络提高了3.71%。试验结果表明,合适比例的噪声存在可以明显增强网络的鲁棒性,提高诊断性能,即本文提出的HWSDAE算法在风电机组的故障诊断上表现出更高的诊断性能,具有一定的实际意义。

图9 不同算法结果对比图Fig.9 Comparison chart of different algorithm results

4 结 论

(1) 本文提出了一种新的智能算法进行风机轴承的故障诊断,自适应挖掘振动数据的潜在特征。采用联合降维方法对信号进行特征提取,使故信息更具表现化,同时降低了故障诊断时间。

(2) 利用凯斯西储轴承数据和实验室试验平台数据为数据集,对所提出的HWSDAE方法和现有的3种深度学习网络进行了算法验证和试验对比。结果表明,本文提出的方案模型不仅在诊断时间方面优于其他3种模型,而且表现出高达99.49%的平均诊断准确率,有效识别轴承健康状况,显著提高了故障分类准确性。

猜你喜欢
波包编码器模态
基于BERT-VGG16的多模态情感分析模型
融合CNN和Transformer编码器的变声语音鉴别与还原
多模态超声监测DBD移植肾的临床应用
设定多圈绝对值编码器当前圈数的方法
基于支持向量机和小波包变换的EOG信号睡眠分期
跨模态通信理论及关键技术初探
转炉系统常用编码器选型及调试
基于动态阈值函数的改进小波包遥测信号去噪方法
舞台机械技术与设备系列谈(二)
——编码器
基于小波包的锅炉炉管声波信号自适应压缩感知