利用改进卷积神经网络的滚动轴承变工况故障诊断方法

2021-12-03 03:16赵小强张亚洲
西安交通大学学报 2021年12期
关键词:特征提取准确率卷积

赵小强,张亚洲

(1.兰州理工大学电气工程与信息工程学院,730050,兰州;2.兰州理工大学甘肃省工业过程先进控制重点实验室,730050,兰州;3.兰州理工大学国家级电气与控制工程实验教学中心,730050,兰州)

随着“智能制造”战略的不断推进,现代化机械设备开始朝着自动化、高效化和智能化趋势发展。旋转机械是机械设备中最重要的组成部分,被广泛应用于国民经济的各个行业中。滚动轴承作为旋转机械中关键的零部件,其运行状态直接影响到整个旋转机械的工作进程[1-3]。因此,对滚动轴承进行更准确、更智能的故障诊断是减少经济损失的重要保障。

滚动轴承故障诊断包括数据采集、预处理、特征提取和故障分类等,其中特征提取和故障分类对诊断结果起到关键作用。传统故障诊断技术需依赖于专家和技术人员对采集的数据进行多步骤繁琐的人工特征提取,无法满足大数据时代的要求[4]。随着人工智能技术的发展,研究人员利用机器学习中支持向量机(SVM)[5]、BP神经网络[6]和K近邻法(KNN)[7]等方法进行滚动轴承的故障诊断,虽然这些方法具有一定的非线性拟合能力,并在故障诊断领域取得一定的效果,但因其浅层的网络结构难以提取到深层的特征信息而降低滚动轴承故障诊断准确率。

深度学习是近年来机器学习发展中新型的研究热点,由Hinton等于2006年提出[8],因其强大的特征自动提取能力被学者应用到故障诊断领域。其中,Sun等提出一种基于稀疏自编码器的单层网络模型,实现对感应电动机的故障分类[9];Li等基于深度置信网络(DBN)在滚动轴承故障诊断中取得较好的诊断精度[10]。

深度学习中的卷积神经网络(CNN)是一种有监督的深度学习算法,无需对原始采集到的故障数据进行预处理就能实现端到端滚动轴承故障诊断[11-14]。Zhang等提出基于自适应批量归一化(AdaBN)算法的卷积神经网络模型,利用卷积神经网络自特征提取,实现了变工况下轴承故障诊断[15];雷亚国等提出了基于深度学习的机械装备大数据健康监测方法,能够自适应地提取故障数据中的特征信息,实现智能诊断[16];Lei等提出了一种基于长短时记忆网络(LSTM)结合卷积神经网络的风力发电机故障诊断方法[17]。虽然上述方法在各自的故障诊断任务中取得了较好的故障分类效果,故障诊断准确率相比传统诊断方法和机器学习方法高,但也受到以下两个因素的限制:其一,这些方法采用单尺度的卷积层提取特征,而滚动轴承在变工况时,同种故障信息存在不同的频率变化,单尺度卷积网络不能有效提取到这些微小故障特征;其二,这些方法的网络结构较为复杂,未使用优化网络结构容易造成网络难以训练甚至退化等问题。

针对以上不足,本文提出了改进CNN的滚动轴承变工况故障诊断方法,设计了多尺度特征提取模块,能够有效挖掘故障数据中的特征信息;同时引入通道注意力机制,帮助网络获得更重要的特征信息;设计了带跳跃连接线的卷积模块,能够获取更多前层网络的特征信息,使得故障诊断准确率更高。

1 基本方法

1.1 卷积神经网络

在深度学习中,卷积神经网络(CNN)是一种前馈神经网络,具有强大的特征自动提取能力,通过构建多个卷积核将输入数据中的深层特征逐层提取出来,并且空间上降采样,达到降低输入维度的目的[18]。CNN典型结构图如图1所示,主要由卷积层、池化层(下采样)和损失函数Softmax或SVM等分类器的全连接层构成。

图1 卷积神经网络结构图

卷积层主要是对输入数据进行特征提取,其内部存在多个卷积核,组成卷积核的每个元素包含一个权重系数和偏差。图1中的卷积操作可视为卷积核与前一层特征图做卷积,并通过激励函数进行非线性变换形成输出特征图,具体计算如下

(1)

(2)

1.2 Inception网络结构

Inception模块是GoogLetNet神经框架中首次使用的优化模块[19],主要思想是利用不同大小的卷积核,通过堆叠的方式增加网络宽度,使其能够提取到丰富的特征信息,同时利用1×1尺度的卷积核,对输入的特征图进行降维,减少参数计算量,加快网络训练速度。目前,经过几个版本的迭代,Inception模块已经更新到Inception-v4和Inception-ResNet模块[19]。其中,Inception-ResNet模块通过结合ResNet中残差思想,使得网络层数更深。

1.3 注意力机制

注意力机制最初被成功应用于机器翻译领域[20],现在已成为深度学习领域中一个重要概念,并且是神经网络结构的重要组成部分。注意力机制通过借鉴人类的注意力方式被广泛应用在自然语言处理、统计学习及语音识别等领域中。

2 故障诊断方法

滚动轴承一般工作在强噪声、变负荷等复杂的环境中,采集的振动信号容易受到外界因素影响。为了充分发挥CNN网络特征提取能力,同时预防梯度消失和退化问题,本文提出了改进CNN的滚动轴承变工况故障诊断方法,设计了多尺度特征提取模块和跳跃连接卷积模块并引入通道注意力机制,实现对强噪声和变工况下故障数据的分类。

2.1 多尺度特征提取模块

为了从输入数据中最大化提取到特征信息,本文设计了一种多层多通道的多尺度特征提取模块。该模块的设计主要基于Inception模块,相比于传统CNN网络输入数据池化层,它具有较强的特征提取能力,其结构如图2所示:①在第1层分别用1×1、3×3和5×5并行的卷积层对输入故障数据进行不同尺度的特征提取,通道数设置为16、8、8;②第2层使用5×5和3×3的卷积层,并串接在3×3和5×5的卷积层后面,通道数都为16;③第3层使用2个1×1卷积层,通道数为32和16。为了优化故障数据,提升网络诊断效果,在每个卷积层后面都使用批量标准化和激活函数;然后通过Concat层将不同分支的特征维度堆叠拼接到一起,并使用通道注意力机制获得不同特征信息的重要程度,依据重要程度增强有用特征,抑制干扰特征;最后通过最大池化层输出提取到的特征信息。

图2 多尺度特征提取模块结构

2.2 带跳跃连接线的卷积模块

在传统卷积神经网络中,前一层的卷积层模块与后一层的卷积层进行端对端的首尾相连,不能有效利用该层输入向量与下一层之间的相关性,从而限制卷积网络对特征信息的学习效率。为此本文设计了带跳跃连接线的卷积模块,结构如图3所示。

图3中,在第1个卷积层输入向量和第2个卷积层之间添加了一条d倍的跳跃连接线,这样第2个卷积层不仅可以学习到第1个卷积操作后的特征信息,而且学习了前一层输入向量的传递信息,具有更高的学习效率。

图3 带跳跃连接线的卷积模块结构

假设跳线连接的卷积模块的输入为x,经过第1个卷积层输出为y1(x),第2个卷积层输出为y2(x),则

y1(x)=w1(x)+dx

(3)

y2(x)=w2(y1)+dy1=

w2(w1(x)+dx)+dw1(x)+d2x

(4)

由y2(x)输出可知,式(4)含有第1层卷积模块输入x和dw1(x),这使得下一个卷积模块接受到的特征信息增多,有利于将数据中微小故障特征提取出来,提高故障诊断的准确率。虽然跳跃连接能使每个卷积模块接受到更多的特征信息,然而这也导致整个网络模型最后的输出量很庞大,参数的计算量增加严重,不利于滚动轴承的故障快速诊断。因此,在Inception模块之后,我们只加两层带跳跃线连接的卷积模块,从而保证整个网络的轻量化。

2.3 网络模型框架

本文提出改进CNN模型的结构如图4所示。以重构二维数据作为输入,然后进入多尺度特征提取模块,通过不同尺度的卷积核和通道注意力机制,获得更多更有效的故障数据信息,整个多尺度特征提取模块相当于一个卷积块。第2个卷积块为Inception模块,由大小为1、3、5的卷积层和大小为3的最大池化层构成,通过对这些卷积层和最大池化层拼接,进一步提取故障数据中的特征信息。第3个卷积块为带跳跃连接线的卷积模块,主要作用是增加网络通道数,学习更多特征信息。最后,通过全连接层把前3个卷积块提取的特征转化成一维数据,经过交叉熵损失函数输出故障诊断结果。

图4 改进的CNN神经网络结构

3 实验验证与分析

为了评估本文提出的改进CNN模型对故障诊断的有效性和准确性,本文实验以滚动轴承为对象,采用来自美国凯斯西储大学(CWRU)的轴承数据[21]和东南大学变速箱数据集中的轴承数据进行实验验证[22]。

3.1 CWRU轴承故障数据集

3.1.1 故障数据集描述与处理 CWRU实验台由电机、扭矩传感器和测功器组成,被测试的故障轴承是驱动端轴承型号为SKF6205电机。采用电火花方法分别在内圈、滚动体和外圈的表面上依次加工出损伤直径为0.177 8、0.355 6、0.533 4和0.711 2 mm的单点凹槽,以模拟滚动轴承在实际运行中出现的磨损。本实验采样频率为12 kHz,分别采集了转速为1 797、1 772、1 750和1 730 r/min时,对应负载为0、0.745 7、1.491、2.237 kW状态下的加速度数据集,并将其标记为数据集A、数据集B、数据集C和数据集D。采集到的数据集根据不同位置以及损伤程度划分为16种状态标签,并且每种状态标签中的样本数量大致相同。采集的数据按照比例3∶1划分训练样本和测试样本,每段的采样点数设置为784点。实验变工况数据集描述见表1。

表1 变工况实验数据集

(1)重构输入数据格式。实验台采集的数据集为一维时间序列,为了适应改进CNN网络模型输入数据格式,有效地进行卷积和下采样操作,本文将采样点数为784的一维数据重构为[28,28]的二维输入特征图,具体操作如图5所示。将长度为784点数的一维时间序列进行等长截取,每段有28数据点,共28段,最终获得[28,28]的二维输入特征图。

图5 数据重构结构

(2)对输入数据进行标准化操作。为了更好地加快网络模型训练速度,让数据便于计算和获得更加泛化的结果,所以对输入数据做标准化处理,数学表达式为

(5)

为了进行变噪声实验,选取不同数据集下测试样本作为变噪声测试样本,并且在测试样本中加入不同信噪比的高斯白噪声(SNR)以获取变噪声测试样本。

(3)对诊断结果输出。为了评估归一化后的预测结果与对应样本标签之间的差异情况,采用交叉熵损失函数进行误差损失值的计算,相比于均方误差损失函数,交叉熵损失函数更适应于目标输出为位矢量的分类问题,数学表达式为

(6)

3.1.2 模型结构参数 实验是在配置Windows10系统、AMD锐龙5-4600H处理器、16 GB内存的计算机上,利用Pycharm平台,编程语言为Python,使用Tensorflow深度学习框架实现的。

网络模型的结构越深,对特征的表达能力越强,但是随着网络层数的增加,梯度爆炸以及退化问题就会表现出来。如滚动轴承的故障数据为一维时间序列,在转化成二维特征图像输入时,有效特征不如纯图像有效特征多,所以设计诊断模型时考虑网络的轻量化。在实验过程中,采用Adam自适应优化器不断更新网络训练参数,批次设置为64,迭代批数为2 200;使用动态学习率训练网络,学习步长设置为0.001,衰减率为0.9。该模型是在卷积神经网络的模型上构建的,因此参数设计与卷积神经网络类似,参数设计如表2所示。

表2 网络结构参数设计

表2中多尺度采样模块共有3个并行通道,分别从输入二维特征图中进行特征提取,如卷积层中参数(3,3,1)、(5,5,1)、(1,1,1)表示的是:首先使用3×3卷积核进行特征提取,步长设置为1;其次串接尺寸为5×5卷积核,步长为1;最后使用大小为1×1卷积核,步长为1。这样设计主要是减少计算参数,提升网络训练速度。Inception模块中卷积层(1,1,1)、(3,3,2)也是同样的设计方法,不过卷积核步长为2。

为了验证本方法在变噪声、变负荷和变工况实验中,是否能够获得较高的故障诊断准确率和较好的泛化能力,将本文实验结果与文献[23-24]的实验结果进行对比,文献[23]方法简称IRB,文献[24]方法简称AICNN,方法的网络结构如表3所示。

表3 不同方法的网络结构参数

3.1.3 变噪声故障诊断结果与分析 在实际工况中,滚动轴承不仅工作的环境里存在噪声,而且因自

身零件震动和相互磨损也产生噪声,这些因素往往会对采集到的振动数据产生污染,所以进行变噪声实验在滚动轴承故障诊断中必不可少。本文以数据集B下的滚动轴承数据作为训练样本,并且在该测试样本中加入信噪比分别为3、6、9和12 dB的高斯白噪声,最终将得到的实验结果与IRB和AICNN方法的诊断结果进行对比分析,实验结果如表4所示。

表4 不同方法的故障诊断准确率

由表4可以看到,在不同信噪比的实验结果中,本文方法诊断的准确率总是优于对比方法。基于Alexnet的方法因为缺乏跳跃连接卷积模块,导致特征信息在前向传递时被丢失,所以抗噪性能有一定下降;基于IRB的方法,虽然改进了数据池化层而增强了网络特征学习能力,但是没有引入注意力机制并且网络结构过多使用残差块,限制诊断的准确率;基于AICNN的方法输入数据池化层采用单尺度卷积核,对输入二维图像数据特征提取能力不足,当信噪比为6 dB时,故障诊断准确率为93.24%,相比于前两种方法准确率90.56%和92.29%提升不是很高;本文方法在数据池化层采用多尺度卷积模块,最大限度的提取了故障数据中的信息,在6 dB的噪声下故障诊断率达到97.70%,相比于前3种诊断方法其抗噪性能更强。图6是本文方法在不同信噪比下的故障诊断结果图,可以直观看到,在3 dB的强噪声环境下,测试集的诊断准确率达到88%以上。

图6 本文方法在不同信噪比下的诊断结果

3.1.4 变负荷故障诊断结果与分析 在实际工作中,滚动轴承经常工作在变负荷状态,所以要求故障诊断方法具有良好的泛化能力。为了模拟负荷变化情况,以数据集A、数据集B、数据集C和数据集D中的一种作为训练样本,另外3种负荷数据集作为测试样本。图7中A-B、A-C、A-D表示为以数据集A作为训练样本,分别以数据集B、数据集C和数据集D作为测试样本,变负荷实验结果如图7所示。

图7 变负荷故障诊断结果

由图7可以看到,本文提出的方法在变负荷实验结果中均高于其他3种方法,其中以数据集D作为训练样本,数据集A、数据集B和数据集C作为测试样本时,故障诊断准确率分别为92.16%、93.78%和96.62%,平均诊断率为94.19%,而基于AICNN方法的诊断平均值为89.26%。原因为,本文方法采用了跳跃连接和多尺度特征提取,能够充分提取故障数据中的信息,从而使故障诊断准确率得到显著提升。

3.1.5 变工况故障诊断结果与分析 在变工况情况下,本文方法的诊断具体过程为:以数据集B作为训练样本,以数据集A、数据集B、数据集C和数据集D作为测试样本并且向测试样本中分别添加6、9和12 dB的高斯白噪声,将取得的实验结果与IRB和AICNN比较,结果如表5所示。

表5 变工况故障诊断对比实验结果

由表5看到,本文所提方法在不同信噪比的噪声环境下,故障数据诊断准确率都是优于其他两种比较方法。当信噪比为6 dB时,不同负荷测试样本的准确率平均值为93.40%;以负荷2.237 kW为测试样本时,随着信噪比的减少,基于AICNN的诊断精度从88.10%降到了84.18%,而本文方法从93.91%降到了90.40%,诊断精度仍在90%以上。

为了检测所提方法的泛化能力,本文以不同的数据集作为训练数据并且加入6 dB的高斯白噪声,实验结果如图8直方图所示,直方图的横轴表示负荷变化,如A-B表示以数据集A为训练样本,数据集B作为测试样本,纵轴表示诊断准确率。由图8可知,本文方法的诊断准确率整体高于IRB和AICNN方法,并且诊断效果更加平稳,这说明本文方法诊断准确率更高,泛化能力更强。

图8 不同方法变工况下的诊断结果

3.2 变速箱数据集

3.2.1 故障数据集描述与处理 为了进一步验证所提方法的有效性,本文采用来自东南大学变速箱数据集中的轴承数据进行实验验证[22]。该数据从传动系统动力学模拟器(DDS)上获取,在转速负载设置为20 Hz-0 V和30 Hz-2 V两种工况下,共收集8个通道的数据。本实验采用通道2的数据,包括正常、滚动体故障、内圈故障、外圈故障和内外圈联合故障,每种故障选取600个样本,按照3∶1的比例划分训练集和测试集,整个数据集描述如表6所示。

表6 东南大学轴承数据集划分

3.2.2 故障诊断结果与分析 该部分实验的模型结构与采用美国凯斯西储大学轴承数据集类似,具体模型结构参数见表2所示。

在转速负载分别设置为20 Hz-0 V和30 Hz-2 V两种工况下,以轴承5种故障类型为基础,构建10个实验数据集。为了避免实验结果的偶然性,对5次实验结果求平均值,同时将实验结果与Alexnet、IRB和AICNN方法的结果作比较,结果如图9所示。

图9 不同方法故障诊断结果

由图9可知,本文所提方法的故障诊断准确率相比较其他方法具有显著优势,其诊断准确率达到99.54%。原因是,本文方法设计了跳跃连接模块和多尺度特征提取模块,能够充分提取故障数据中的信息,从而使故障诊断准确率得到显著提升。

为了更进一步考察本文方法对故障误判的情况,对测试结果做了混淆矩阵实验。从图10a中可知,IRB方法对于轴承滚动体故障和内圈故障的诊断准确率仅仅只有74%和91%。图10b中可知,本文所提方法除了将9%的Ball故障误诊为Outer故障外,其他状态均有较高的诊断准确率,其整体诊断准确率达97.80%。这表明本文所提方法在不同的实验数据集上,仍然具有较高的诊断准确率并且具有更好的泛化能力。

(a)IRB方法

4 结 论

本文提出的一种改进CNN的滚动轴承变工况故障诊断方法,是基于Inception网络结构设计数据池化层并引入注意力机制搭建而成,能够解决滚动轴承运行时负荷变化和强噪声干扰导致故障诊断率低和泛化能力差的问题。主要结论如下。

(1)设计了多尺度特征提取模块,通过多通道不同尺度卷积层从输入数据中进行特征提取,从而保证最大限度地提取到故障数据中的有效信息;在多尺度特征提取模块中的融合卷积层之后,引入通道注意力机制模块,以此实现自适应地增强有效信息、抑制干扰信息;在全连接层之前,设计带跳跃连接线的卷积模块,增强卷积模块对前一模块的特征学习效率,减少信息丢失;整个模型框架相当于由3个卷积块组成,易于训练,满足轻量化要求。

(2)由实验验证可知,与几种深度网络模型相比,本文方法不仅在强噪声和变负荷的环境里有着极高诊断准确率,而且在变工况环境中也有较高的准确率。

(3)由变工况实验可知,本文方法在不同训练集下,不同测试集的故障诊断准确率更高,这表明本网络的泛化性优于其它几种相比较的网络。

猜你喜欢
特征提取准确率卷积
同步定位与建图特征提取和匹配算法研究
基于全卷积神经网络的猪背膘厚快速准确测定
一种基于卷积神经网络的地磁基准图构建方法
基于3D-Winograd的快速卷积算法设计及FPGA实现
一种并行不对称空洞卷积模块①
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
多层螺旋CT技术诊断急性阑尾炎的效果及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
空间目标的ISAR成像及轮廓特征提取