改进1DCNN 与相似性度量增强的齿轮箱故障识别

2022-05-21 03:10熊炘郑少帅杨世锡
振动、测试与诊断 2022年2期
关键词:齿轮箱准确率卷积

熊炘,郑少帅,2,何 俊,杨世锡

(1.上海大学机电工程与自动化学院 上海,200444)

(2.上海航天控制技术研究所 上海,201109)

(3.浙江大学机械工程学院 杭州,310027)

引言

齿轮箱在机械设备中起着连接和传递动力的作用,通常工作于变转速、变载荷的工况条件下。由于结构复杂,系统中零部件间的振动耦合和激励的不确定性变强[1]。此外,齿轮啮合时存在齿侧间隙、重合度时变等非线性因素,这些因素共同作用,导致振动加剧,诱发齿轮、轴承等零部件故障,且复合故障信号具有较强共性特征,使诊断变得困难。

针对上述问题,科研人员以机器学习和统计推断为主要手段,展开了广泛深入的研究。He 等[2]利用多传感器采集到的齿轮箱信号进行多域特征信息融合,并利用神经网络区分故障状态,取得了良好的效果。Wang 等[3]提出一种基于并行双参数优化共振算法的稀疏信号分解方法,通过多点优化最小熵解卷,实现齿轮箱复合故障的识别。李状等[4]以相对小波包能量作为风电机组齿轮箱振动信号的特征值,采用粒子群优化的模糊核聚类算法对特征信号进行分类。以上工作由于存在参数及特征选择的不确定性,使得诊断结果也具有一定的不确定性[5]。

近年来,深度学习技术的发展使人们开始关注其在机械故障诊断领域的应用,相关应用包括长短时记忆神经网络[6]、循环神经网络[7]和卷积神经网络[8]等。文献[9-10]综合分析了各类深度学习网络结构在故障诊断领域的适用性,指出一维卷积神经网络能够有效实现故障特征信息的自提取。Qiu等[11]采用1DCNN 对齿轮单一故障进行了诊断,但研究并未涉及齿轮轴承复合故障的诊断问题。Wang 等[12]提出多注意力1DCNN 算法用于滚动轴承故障识别,并通过方法横向比较,验证了所提方法的优越性。胡茑庆等[13]等将经验模式分解(empirical mode decomposition,简称EMD)与1DCNN 相结合,将EMD 所得的固有模式函数进行信息融合以自动提取特征,但该方法的有效性只在行星齿轮箱的单一故障信号上得到了验证。通过文献梳理,笔者拟将1DCNN 作为特征学习与分类的基本网络结构,用于多工况下齿轮、轴承单一和复合故障的诊断问题。在基本网络结构基础上,引入LeakyRelu激活函数[14]和LookAhead 优化器[15],以构建改进的1DCNN。此外,引入相似性损失度量函数,最终在考虑该度量函数的基础上提出一种新的sLL-1DCNN 网络,加强网络对同类特征的聚类,提高特征提取能力。

1 改进的1DCNN 方法

假设关于原始信号的时间序列样本集合为X={x(1),…,x(i),…,x(n)},1 ≤i≤n,其中:x(i)为m维样本序列;n为样本序列的个数。

1)对样本序列进行归一化

其中:为x(i)的 第j个元素(1 ≤j≤m);max(Xj)和min(Xj)分别为样本集合X第j行元素中的最大值和最小值;的归一化结果;为由构成的归一化样本集合。

2)卷积层的运算为

其中:wk为第k个卷 积层的卷积 核(1 ≤k≤K);ak为该层的偏置向量;Z为卷积运算的次数;Ck-1为第k个卷积层的输入(也表示第k-1 个池化层的输出);Czk-1的上标z表示Ck-1作为第k个卷积层的输入在该层中进行的第z次卷积运算;Ck为第k个卷积层的输出。

当k=1时,第1个卷积层的输入为包含n1(n1≤n)个批处理样本序列的归一化子样本集合。

f(*)表示将卷积运算结果做非线性映射的激活函数。工程中常用的激活函数有很多种[8],其中Relu 函数因运算简单、收敛速度快,在很多场合中被使用[11]。由式(3)可知,一旦出现*<0 的情况,fRelu(*)=0,神经元的功能便失效了,激活函数因此也无法收敛。为了避免该问题的发生,笔者引入LeakyRelu 激活函数,保证*<0 时的fLeakyRelu(*)有非零取值,避免了激活函数不收敛的情况。

3)池化层提取子区域最大特征的算法为

其中:d为池化长度;l为步长(子区域由d和l共同定 义);表示Ck从子区域(d,l) 到(d,l+1)的池化输入过程;Ok为第k个池化层的输出。

4)将特征OK输入至全连接层,按列排列成抽象特征矩阵Rs。利用式(5)中的Softmax 函数,计算样本序列x(i)可能归属于标签y(i)的隶属度

其中:Us为分类层中与第s个神经元相连的权值向量;bs为该神经元的偏置;表示从样本序列x(i)中提取的特征,即矩阵Rs的列向量。

5)利用梯度下降算法最小化交叉熵损失函数

其中:{ · }为指示函数,当·为真时,{·}=1;否 则{·}=0。

由于常用的网络参数优化器Adam 易收敛于局部极值[14],因此引入包含内、外双循环的改进LookAhead 优化器。外循环参数ω∈{wk,ak,Us,bs}为待更新网络参数;内循环则仍利用Adam 优化参数φ,并利用线性插值更新ω。优化器中预定义的参数包括内、外循环迭代次数q和p,ω初值ω0、损失函数L1、学习率α和Adam 优化器opt。伪代码如下:

2 相似性损失学习方法

网络优化的目标是使从同一类样本序列中提取的特征尽可能相似,而从不同类样本序列提取的特征尽可能差异大。特征间的相似性用核函数度量[16]。笔者选取高斯函数作为核函数,按照式(7)计算相似度矩阵P的元素

其中:g(·)为高斯核函数;σ为带宽。

由于每个样本序列包含m个样本点,而经过卷积、池化运算后的是m1个特征(m1<m),因此上述运算是一个降维过程。和表示从的样本序列和中提取到的m1维特征向量,其中(u,v)∈{1,2,…,n1}。然后,根据式(8)求解相似性损失函数

为使同类样本序列特征尽可能相似的约束条件与不同类样本序列特征差异尽可能大的约束条件具有同等重要性,令

式(8)中的Auv为理想相似度矩阵A的元素

其中:a为属于同类标签的样本序列间的相似性测度,0<a<1;b为属于不同类标签的样本序列间的差异性测度,0<b<1。

由于从同类样本序列中提取的特征向量间存在一定差异,因此a取0.9,0.8 或0.7;从不同类样本序列中提取的特征向量间仍存在一定的相似性,因此b取0.1,0.2 或0.3。

引入新的相似性损失度量函数L2后,定义网络的损失函数L为

综上所述,本研究在基于LeakyRelu 激活函数和LookAhead 优化器的改进1DCNN 之上,结合新提出的相似性损失函数,构建特征学习能力更强的sLL-1DCNN 网络,其算法流程如图1 所示。

图1 sLL-1DCNN 算法流程图Fig.1 Flow chart of the sLL-1DCNN algorithm

3 试验验证

利用图2(a,b)所示的齿轮箱故障模拟试验台进行齿轮、轴承单一和复合故障的模拟试验。齿轮轴的输入、输出端均由图2(c,d)所示的圆锥滚子轴承支承。调整制动器电流可模拟不同大小的系统负载。如图2(a)所示,在输入、输出端箱体上各安装一枚加速度传感器。

图2 齿轮箱故障模拟试验Fig.2 Experiments of simulated gearbox faults

试验分别在7 个转速下进行,每个转速分空载和带载两个工况,如表1 所示。试验模拟了5 种齿轮箱状态,因此样本序列标签数N=5。其中:s=1 为正常状态;s=2 为输出轴齿轮齿根裂纹;s=3 为输出轴齿根裂纹/输出轴输入端轴承外圈损伤的复合故障;s=4 为输出轴齿根裂纹/中间轴输入端轴承内圈损伤;s=5 为中间轴齿根裂纹。样本序列的划分规则为:每类标签均包含7 个转速下的空载和带载加速度信号,即包含14 种不同工况的加速度信号,5 种标签则包含70 组加速度信号,每组信号的采样时长为15 s。将每组信号不重叠地依次拆分为30个样本序列,即可得到每类标签下的420(30×14)个样本序列,而5 种标签将形成2 100 个样本序列。在保证训练、验证和测试集均包含5 种标签和14 种工况的前提下,从样本序列中随机抽取各类标签下的样本序列,得到训练、验证和测试用样本序列集合。

表1 试验参数Tab.1 Experimental parameters

由于试验台加速度信号高频噪声干扰大,考虑到大卷积核可有效抑制高频噪声,所以采用的sLL-1DCNN 在第1 个卷积层有较大的卷积核。为了加快网络特征提取速度,从第2 层开始均采用较小的卷积核[8-9]。图3 中的蓝色折线表示卷积层数不同时,sLL-1DCNN 在10 次测试集分类后的平均准确率,横坐标1~6 表示卷积层数。由图可知:当卷积层数小于3 时,网络分类准确率很低;当卷积层数增加至4 时,分类准确率提高到90%以上;当卷积层数为5 时,分类准确率已稳定在98%以上。因此,sLL-1DCNN 的卷积层数定为5。

图3 中的红色折线表示卷积层数为5 时,各层包含不同卷积核个数组合时的测试集分类准确率。横坐标1~6 分别表示各层卷积核个数组合为16-16-16-16-16,16-16-32-32-32,16-16-32-32-64,16-32-64-64-64,16-64-64-64-64 和64-64-64-64-64。由图可知,当卷积核个数为16-32-64-64-64(横坐标为4)时,获得最高分类准确率。综合参数分析结果,将试验数据分析时的sLL-1DCNN 的详细参数列于表2中,带宽σ=10[14]。

图3 不同卷积层数/卷积核组合对测试集分类结果的影响Fig.3 Test sets classification results under different number of convolution level and kernel combination

表2 网络结构参数Tab.2 Network parameters

相似性损失函数中相似度矩阵元素a和b的取值如表3 所示。为了消除小样本误差的影响,网络在各种(a,b)取值条件下均训练10 次。然后,用训练好的网络对测试集进行分类,得到10 次分类的平均准确率。其中,a=0.9 与b=0.1 时结果最优,所以sLL-1DCNN 相似度矩阵中a=0.9,b=0.1。

表3 (a,b)取值对测试集分类结果的影响Tab.3 Effects of (a,b) on classification results %

考虑学习率α对测试集分类结果的影响,若α取值过小,网络参数更新速度过慢[6]。分析不同α取值下的分类结果,得到如图4 所示的测试集分类准确率。当α增大到0.018 时,分类准确率出现显著下降,因此取α=0.01。同时发现,sLL-1DCNN 迭代50 次已经收敛,因此令p=50。

图4 不同学习率α 对测试集分类结果的影响Fig.4 Test sets classification under different learning rates α

图5 为批处理个数取不同值时的测试集分类准确率。当批处理个数较少时,网络参数更新过快,模型难收敛。随着批处理个数的增加,网络分类能力逐渐提升。根据图5 的结果,将批处理个数定为20。

图5 不同批处理个数对测试集分类结果的影响Fig.5 Test sets classification under different batch numbers

下面分析激活函数、优化器的选取及相似性损失度量函数的引入对测试集分类结果的影响。图6为训练集样本序列数量不同时,1DCNN(Relu+Adam),1DCNN(LeakyRelu+Adam),1DCNN(Leaky-Relu+LookAhead)和sLL-1DCNN 在10 次测试集分类后的平均准确率。当训练样本序列数量为210时,1DCNN(LeakyRelu+LookAhead)的分类准确率 为78.85%,比1DCNN(LeakyRelu+Adam)的80.58%要低,表明LookAhead 优化器在训练样本序列数量较少时性能比Adam 优化器略差;而1DCNN(Relu+Adam)77.81%的分类准确率要比1DCNN(LeakyRelu+Adam)的80.58%低,表明LeakyRelu激活函数性能优于Relu 激活函数。另一方面,sLL-1DCNN 的分类准确率为88.21%,表明与其他网络相比,sLL-1DCNN 在训练样本序列数量少的条件下具有更好的泛化能力。随着训练样本序列数量的增加,LookAhead 优化器的表现逐渐优于Adam 优化器,而LeakyRelu 激活函数的表现始终优于Relu激活函数。当训练样本数量增加到630 时,sLL-1DCNN 的分类准确率达到了97.93%。样本数量继续增加到1 260 时,sLL-1DCNN 分类准确率达到了98.82%,准确率偏差仅为0.53%。由此可知,sLL-1DCNN 在迭代相同次数后收敛于更高准确率,其分类能力优于其他3 种网络。

图6 不同训练样本序列数量对测试集分类结果的影响Fig.6 Test sets classification under different number of training sample series

当训练集样本序列数量为1 260 时,将4 种训练好的网络对同一测试集进行分类,分别得到相应的混淆矩阵,结果如图7 所示,其中混淆矩阵的行表示预测的样本标签,列表示样本的真实标签。其中:s=1 为正常状态;s=2 和s=5 为单一故障状态;s=3和s=4 为复合故障状态。由图7(a)可知,基于1DCNN(Relu+Adam)的网络进行测试集分类时,仅有2 个真实标签为s=2 的样本被误分类,说明传统1DCNN 能够有效识别齿轮箱的单一故障。当出现齿轮轴承复合故障,即s=3 和s=4 时,共有5 个真实标签为s=3 样本序列被误分类,对s=3 样本的分类准确率仅为94.57%。有7 个真实标签为s=4 样本序列被误分类,对s=4 样本的分类准确率仅为90.67%。因此,1DCNN(Relu+Adam)对复合故障的分类能力有限。由图7(b,c)可知,其他两种1DCNN 结构对复合和单一故障的误分现象越来越少,分类能力较1DCNN(Relu+Adam)有所改善。根据图7(d)的分类结果,在sLL-1DCNN 中,仅有1个真实标签为s=3 的样本被误分类,对s=3 样本的分类准确率达到98.9%,而对真实标签为s=4 的样本分类准确率为100%。因此,sLL-1DCNN 对不同工况下复合故障的识别能力最强。

图7 混淆矩阵比较Fig.7 Comparisons of confusion matrices

将基于sLL -1DCNN 的识别方法与基于CNNS[5]和短时傅里叶变换(short-time Fourier transform,简称STFT)+DCNN[17]两种方法的分类结果进行了对比,结果如表4 所示。其中,精确率表示所预测样本序列标签实际为该标签的概率,而召回率表示实际属于某一标签的样本序列被预测为该标签的概率。为使分类结果具有客观性,表4 所示结果均为10 次分类结果的平均值。由表可知,sLL-1DCNN 的分类精确率和召回率最高,且分类结果波动小,稳定性高,对齿轮箱不同故障状态的分类识别能力最强。

4 结束语

考虑到齿轮箱单一、复合故障信号具有较强共性特征的实际情况,提出了一种新的sLL-1DCNN网络,用于多工况条件下齿轮箱的故障识别。试验数据分析结果表明:引入LeakyRelu 激活函数和LookAhead 优化器构建而成的改进1DCNN,在训练样本达到一定数量后,能够提高齿轮箱中包含复合故障在内的各类故障的分类准确率。在改进1DCNN 结构中引入与交叉熵损失函数并行的相似性损伤函数后,构建了新的sLL-1DCNN 网络。该网络可在训练样本序列数量较少时,准确识别多工况下的样本标签。随着训练样本序列数量的增加,故障识别的准确性更高,鲁棒性更强,且该网络的故障识别能力优于CNNS 和STFT+DCNN。

猜你喜欢
齿轮箱准确率卷积
CJ-1型齿轮箱箱体强度分析
基于3D-Winograd的快速卷积算法设计及FPGA实现
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
风力发电齿轮箱设计制造技术
2015—2017 年宁夏各天气预报参考产品质量检验分析
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
卷积神经网络的分析与设计
从滤波器理解卷积
基于傅里叶域卷积表示的目标跟踪算法