基于深度信念网络的滚动轴承特征迁移诊断*

2022-05-21 03:10张建宇任成功
振动、测试与诊断 2022年2期
关键词:轴承准确率卷积

张建宇,任成功

(1.北京工业大学先进制造技术北京市重点实验室 北京,100124)

(2.北京市精密测控技术与仪器工程技术研究中心 北京,100124)

引言

作为机械系统必不可少的组成部件之一,滚动轴承健康与否对设备的整体性能有重要影响。由于运行工况的复杂多变,滚动轴承的振动信号往往呈现出非线性、非平稳等特点,故障特征的有效提取和精准辨识成为轴承诊断的关键。

近些年来,由于在高维非线性数据处理中拥有巨大优势,深度学习在故障诊断领域获得了广泛应用。其中,深度信念网络克服了其他算法易出现的梯度消失、陷入局部最优解等问题,因而更具分析优势。Shao 等[1]采用DBN 对变工况滚动轴承进行故障诊断,获得了较高的准确率和鲁棒性。张淑清等[2]将双树复小波与DBN 相结合,研究了轴承故障的分类辨识问题。李艳峰等[3]采用奇异值分解(singular value decomposition,简称SVD)与DBN 的结合方法,实现了滚动轴承故障程度和故障类型的准确识别。Zhao 等[4]利用变分模态分解(variational mode decomposition,简称VMD)的分析结果构造DBN 的输入向量,实现了滚动轴承故障类型的智能诊断。

尽管深度学习算法为故障智能诊断开辟了新的途径,但目前的智能诊断研究大多围绕同源数据(即同一设备、同种工况)展开,而真实场景下的智能诊断,实施难度则要大得多。现场运行的工业设备,能够采集到的训练样本类型单一,而且健康样本远远高于故障样本的数量。依靠同源数据进行模型训练,将缺少充足的样本支撑。与此同时,由于设备的集成度和智能化水平越来越高,智能诊断的需求却远高于历史上的任何一个时期。因此,需要一种方法将足量有标签数据所蕴含的特征迁移到实际工业环境下的机械设备,实现不同设备之间的特征迁移诊断。康守强等[5]将VMD,SVD 与半监督迁移成分分析相结合,实现了对凯斯西储不同工况数据之间的迁移诊断。郭亮等[6]建立了一维深度卷积神经网络,实现了不同设备监测数据特征知识的迁移适配。张根保等[7]建立了由栈式稀疏自动编码器和柔性最大值函数回归组成的迁移诊断模型,同样利用凯斯西储试验数据进行了算法验证。雷亚国等[8]建立了领域共享的深度残差网络,通过领域适配正则项约束实现了试验轴承与机车轴承之间的迁移诊断。Zheng 等[9]提出了一种基于迁移局部保持投影的故障智能辨识方法,通过多组齿轮箱及滚动轴承的试验数据验证了算法的有效性。

可见,迁移诊断的发展代表了智能诊断的未来。从上述文献的研究成果不难看出,在无监督学习的情况下(不管是否涉及深度网络模型),同一设备、不同工况之间的诊断准确率尚可达到95%以上;而一旦在不同设备之间实施迁移诊断,其诊断准确率只能维持在70%~85%之间。其原因在于,多数迁移诊断模型在样本训练过程中并未提炼同类设备在同种健康状态下的共性时频特征,这种共性特征在滚动轴承上体现得尤为典型。不同类型、不同工况的滚动轴承的工作方式类似,其表面损伤多会激起局部的结构共振,而故障信息则隐含其中。

最大相关峭度反卷积[10]能够通过反卷积滤波器提取振动信号的特征信息,抑制传递路径影响,突出信号周期性冲击成分,从而降低信号内的噪声干扰。唐贵基等[11]利用粒子群优化算法自适应对MCKD 的参数进行寻优,将其应用于轴承早期故障诊断中并取得了良好的效果。夏均忠等[12]将MCKD 与VMD 方法相结合,精确地分离了轴承故障信号的不同频率成分。

因此,笔者提出一种基于深度信念网络的滚动轴承特征迁移诊断方法,充分利用不同工况、不同轴承在同种故障状态下的共性特征。为了增强故障特征的泛化表达,采用MCKD 提高故障信号的冲击特性,构造以波形指标、脉冲指标、近似熵和分散熵为代表的共性特征提取参量,基于DBN 框架下的智能诊断模型,实现两种滚动轴承在不同工况下的故障聚类辨识。

1 迁移诊断数据集的构造

1)源数据集Y:6307 深沟球轴承。滚动轴承试验台的结构如图1 所示。

图1 6307 滚动轴承试验台Fig.1 Test bed of 6307 rolling bearing

采用化学腐蚀手段分别在试验轴承的内圈、外圈滚道加工点蚀缺陷,缺陷直径为2 mm,深度为1 mm。通过加速度传感器采集试验轴承的垂向振动信号,采样频率为15 360 Hz,电机转速恒定,为1 496 r/min。本研究将6307 轴承试验数据作为特征标记已知的训练数据,命名为源数据集Y。其中,包含3 种状态:正常数据、内圈点蚀和外圈点蚀数据。

表1 列出了试验轴承的主要结构参数,计算可知,6307 轴承的内圈故障频率为122.74 Hz,外圈故障频率为76.73 Hz。

表1 6307 滚动轴承参数Tab.1 Parameters of 6307 rolling bearing

2)目标数据集:SKF6205 深沟球轴承。

本研究选择美国凯斯西储大学公开的轴承试验数据作为测试数据集,其试验台如图2 所示,由一台变频电机拖动工作。驱动端和风扇端轴承均可作为试验对象,采用电火花技术在轴承的内圈、外圈滚道或滚动体表面加工点蚀缺陷,缺陷直径在0.017 8~0.102 mm 不等。考虑设备运行工况的变化,电机负荷设定为0~2 205 W 之间,转速分别为1 730,1 750,1 772,1 797 r/min 4 档。采集不同工况下的振动加速度信号,采样频率分别取12 kHz 和48 kHz。

图2 CWRU 滚动轴承试验台Fig.2 CWRU rolling bearing test rig

为了针对不同数据源建立普适性的诊断模型,笔者选取凯斯西储试验数据中的3 种工况作为测试目标数据集。试验轴承选择电机驱动端轴承,型号为SKF6205 深沟球轴承,该轴承的结构参数如表2所示。

表2 SKF6205 滚动轴承参数Tab.2 Parameters of SKF6205 rolling bearing

表3 为目标数据集的工况信息,各组数据采样频率均为12 kHz。其中:P为负载功率;R为电机转速;F为点蚀故障尺度。

表3 目标数据集说明Tab.3 Description of the target dataset

3 类数据集的故障频率如下:数据集A中,内圈故障频率为156.12 Hz,外圈故障频率为103.35 Hz;数据集B中,内圈故障频率为157.94 Hz,外圈故障频率为104.57 Hz;数据集C中,内圈故障频率为159.91 Hz,外圈故障频率为105.86 Hz。

源数据集与目标数据集尽管同为深沟球轴承,但结构参数、工作负荷/转速、故障尺度以及特征频率都有显著区别。而且,3 类目标数据集即便来自同一试验台,其运行工况也有差异。因此,若能在这几类不同数据源之间实现故障的迁移诊断,其模型将带有较强的普适性。

2 基于DBN 的轴承诊断模型

2.1 DBN 原理及其参数选择

深度信念网络具有强大的特征提取能力,通过低层描述原始数据细节,经过层与层之间的不断传递,在高层形成数据的属性类别。

DBN 的基本组成单元是受限玻尔兹曼机(restricted Boltzmann machine,简称RBM),图3 所示的DBN 模型由两个RBM 组成,每个RBM 由可视层(v)和隐含层(h)两层网络组成。各层内部神经元相互独立,两层之间双向连接,数据通过激活函数在可视层和隐含层之间相互转换[13]。

图3 DBN 的结构Fig.3 Structure of DBN

RBM 每层网络由若干神经元组成,层与层之间经过权重w相连,但是同层神经元之间相互独立。假设一个RBM 中可视层神经元个数为m,隐含层神经元个数为n。v=(v1,v2,…,vm)表示可视层的状态向量,h=(h1,h2,…,hn)表示隐含层的状态向量。RBM 的能量函数定义为

其中:θ={w,b,c},为网络的参数;w为可视层与隐含层之间的权重;b为可视层的偏置;c为隐含层的偏置。

由能量函数定义RBM 的联合概率密度得

由边缘概率密度可进一步推导出激活函数

RBM 的训练过程就是通过对参数不断调整,使神经元能够最大可能地拟合输入数据,从而使RBM体现的概率分布与输入样本的分布尽可能相似。

采用极大似然法求解参数θ

为提高计算效率,Hinton 等[14]提出对比散度算法,只需要少量训练就能够快速计算出RBM 的对数似然梯度,大大缩减了训练时间,而且能达到很好的训练效果。

深度信念网络搭建之后需要提前设定相关参数,包括DBN 模型的层数、RBM 的连接权重、动量因子和学习率等。

由DBN 的结构可知,输入层神经元个数取决于输入数据的维度,输出层神经元个数取决于最终的分类个数。对于隐含层神经元的个数,研究对象不同,则有不同的选择方法,笔者采用如下经验公式确定隐含层神经元个数Q

其中:η为系数,取值范围为1~10;m为输入层神经元个数;n为输出层神经元个数;d为常数,取值范围为1~10。

学习率λ的大小直接影响权重更新时梯度的下降速度,越大则收敛速度越快,但同时会导致重构误差过大,因此取值范围为0.001~0.1。为防止λ过小导致收敛速度变慢,在参数更新时引入动量因子,进而避免参数收敛到局部最优解。最终,θ的更新公式为

其中:k为动量因子,一般选择范围为0.5~0.9。

2.2 基于原始数据特征的诊断分析

由源数据集Y构造训练集,包含3 种状态数据,即正常、外圈点蚀和内圈点蚀。每种状态选择400个、共计1 200 个训练样本,每个样本包含1 024 个数据点。目标数据集A,B,C也按照相同长度构造样本文件,每种状态分别选择100 个样本,共计建立900 个测试样本。

考虑到滚动轴承在局部损伤激励下的共性特征,笔者选择波形指标、峭度指标、近似熵及分散熵作为DBN 模型的输入参量。其中,波形指标反映故障发生前后信号中的能量变化,峭度指标用来描述信号中冲击特性的变化。而滚动轴承发生故障后,其振动能量一般集中在特定频段,因此将近似熵和分散熵作为捕捉能量集中或发散的关键指标。分散熵[15]是近几年提出的一种新的熵值计算方法,该数值对同步频率、幅值和时间序列带宽的变化非常敏感,因此引入本研究的诊断模型。

由数据集Y训练好的DBN 模型用于A,B,C这3 类数据集的分类诊断。选择5 层结构的DBN 模型,根据输入样本的数量和待识别的故障类别,DBN 模型的输入层节点数m为1 024,输出层n节点数为3。为了降低特征维数,3 个隐含层的节点数分别设置为200,200,100。模型的其他参数设置为:动量因子为0.5;学习率为0.01;最大迭代次数为100。模型的最终识别结果为:Y→A的识别准确率为53.96%;Y→B的识别准确率为50.72%,Y→C的识别准确率为46.93%。

可见,单纯依靠原始数据特征,不同数据源之间的诊断准确率偏低。以分散熵为横坐标,近似熵为纵坐标,绘制3 类数据集在DBN 模型下的迁移诊断特征散点图,如图4 所示。其中:N为正常数据;OR 为外圈故障数据;IR 为内圈故障数据。可见,源数据集Y与A,B,C这3 个目标数据集之间存在明显的特征值交错混叠现象,亦即特征指标的聚类性较差,这是导致诊断准确率较低的根本原因。

图4 迁移诊断特征散点图Fig.4 Characteristic scatterr diagram of transferring diagnosis

从源数据集Y(6307 轴承)和目标数据集A(6205 轴承)中任选一组外圈故障信号,绘制频谱图如图5 所示。可见,尽管二者的故障尺度差异很大(分别是2 mm 和0.178 mm),但频谱中都形成了一定的能量聚集状态,前者主要集中在1 500~2 500 Hz 的频段内,而后者则集中在3 000~5 000 Hz 频段内,上述频段均对应轴承部件的某阶固有频率,代表损伤激励下的局部结构共振。从图中还可以看出,6307 轴承信号的噪声能量明显高于6205 轴承,这些都是导致诊断准确率不高的原因。

图5 源集Y 和目标集A 的外圈故障信号Fig.5 Out-race fault signal of data set Y and A

3 融合MCKD 的DBN 迁移诊断方法

由于信号的能量分布、噪声强度差异,导致通过原始特征获得的迁移诊断准确率偏低,因此有必要引入其他算法消除上述特征差异。由于机械结构本身的复杂性和传递途径的多样性,导致各冲击源信号通过卷积方式耦合在一起,使得传感器所测信号是各振源与传递路径卷积作用后的混叠信息。因此,引入反卷积技术,通过构造反卷积滤波器,消除传递路径对信号的影响,从混叠信号中最大限度识别出振源的原始冲击序列。图5 中的共振频带差异,体现的就是不同传递路径对系统的影响。因此,笔者将采用反卷积方法实现故障源的信息净化。

3.1 基于自适应MCKD 的特征强化方法

最大相关峭度反卷积,是在最小熵反卷积的基础上提出的一种新的突出周期性冲击成分的反卷积技术,其引入相关峭度替代传统峭度,作为优化目标函数,从而避免了伪冲击的出现。MCKD的基本思想如下。

针对某信号xn(n=1,2,…,N),其相关峭度公式定义为

其中:M为位移数;T为反卷积周期。

反卷积通过优化迭代过程,使式(8)表达的相关峭度获得最大值。其目标函数定义为

对相关峭度求导并令其等于0,即

求解wk并用矩阵形式表达为

实现MCKD 算法的关键参数,包括滤波器长度L和反卷积周期T。如果手动选择两个参数,不仅效率低,而且很难获得最优的反卷积结果。因此,笔者采用网格搜索法对MCKD 算法进行改进,从而实现L和T的自适应寻优。网格搜索法根据自变量的取值范围,按照步长逐一计算各个网格点的值是否满足约束条件,这就需要确定一个目标函数,通过计算网格的目标函数,从而确定最优解。排列熵[16]可以反映时间序列的不规则性和复杂性,由熵值变化能够判断信号所包含的冲击成分的变化。因此,笔者将排列熵作为网格搜索的目标函数,当其取最小值时即对应反卷积滤波器长度L和周期T的最优解。

据此原理,滤波器长度L和周期T的优化求解过程如下。

1)根据信号的故障频率和冲击成分,设定反卷积周期T和滤波器长度L的参数范围,本研究设定L的范围为[100,300],T的范围为[50,200]。

2)L由初值100 开始循环,直至达到终值300。T作为嵌套循环变量,针对每一个L值,T从50 循环到200。在保证结果足够精确的前提下,为了提高计算效率,二者的循环步长均设为2。

3)计算每一组L和T所对应的排列熵值,并保存、记录。

4)循环结束后,检索排列熵序列中的最小值,并将该熵值对应的L和T作为MCKD 算法的最优参数。

3.2 MCKD 处理前后的特征对比

针对Y,A,B,C这4类数据集中的各组状态信号,分别采用MCKD 算法进行处理,计算反卷积信号的特征参数,并统计各参数的平均值,结果如表4~6所示。

表4 正常轴承经MCKD 处理后的特征值Tab.4 Eigenvalues of normal bearing processed by MCKD

表5 外圈故障轴承经MCKD 处理后的特征值Tab.5 Eigenvalues of outer ring fault bearing processed by MCKD

表6 内圈故障轴承经MCKD 处理后的特征值Tab.6 Eigenvalues of inner ring fault bearing processed by MCKD

由表4~6 的对比可见,来自不同数据集的轴承信号,在经过自适应MCKD 算法处理后,同类状态数据之间存在趋同性,而不同健康状态之间仍然存在明显的差异性。因此,MCKD 算法的引入,显著增强了特征参数的聚类识别能力。

3.3 基于MCKD 和DBN 的诊断结果

融合MCKD 与DBN 的滚动轴承诊断模型如图6所示。

图6 MCKD+DBN 故障诊断流程图Fig.6 Fault diagnosis flow chart of MCKD+DBN

针对4 类数据集中的各组数据样本,自适应选择MCKD 的滤波器长度和反卷积周期,完成信号预处理和特征增强,计算波形指标、峭度指标、近似熵和分散熵等特征参数。使用DBN 模型对重构的特征参数进行识别,DBN 的参数选择与2.2 节相同。

其诊断结果为:Y→A的识别准确率为96.97%;Y→B的识别准确率为95.32%;Y→C的识别准确率为95.01%,诊断正确率均超过了95%。混合模型的识别结果如图7 所示。

图7 不同方法迁移故障诊断结果Fig.7 Transfer fault diagnosis results with different methods

为进一步验证MCKD+DBN 模型的诊断性能,同样将数据集Y作为训练集,A,B和C这3 类数据集分别作为测试集,以RBF 核函数作为基函数的SVM 模型对MCKD 处理后的特征参数进行分类诊断,将核函数参数g设置为0.03。

其诊断结果为:Y→A的识别准确率为37.12%;Y→B的识别准确率为34.52%;Y→C的识别准确率为35.26%。

图7 中亦对比了单一DBN 模型、MCKD+SVM 的识别结果,可见MCKD 预处理后DBN 模型诊断准确率有了明显提高,表明MCKD+DBN 模型在深沟球轴承的智能诊断方面具有较高的普适性。同时进一步证明了DBN 能够深度挖掘数据本质特征,相对于SVM 具有更好的故障诊断能力。

对迁移诊断的参数聚类性进行可视化,以分散熵和近似熵作为横纵坐标,获得源数据集与目标数据集之间的对比结果,如图8 所示。与诊断准确率的结果一致,MCKD 处理后的两类不同数据源之间,信号的聚类性相对图4 有了明显提升。

图8 迁移诊断特征散点图Fig.8 Characteristic scatter diagram of transferring diagnosis

4 结论

1)分别以6307 和6205 两类深沟球轴承为研究对象,构造了4 类数据集。其中,6307 滚动轴承为特征标记清晰的源数据集,选取3 种不同工况下的6205 轴承试验数据为目标数据集。构造以波形指标、峭度指标、近似熵及分散熵为代表的特征参数集,采用单一的DBN 模型获得了50%左右的诊断准确率。

2)通过特征参数对比和频率结构分析,表明上述准确率偏低的原因在于共振频带差异以及背景噪声的干扰。为了抑制传递路径影响和提取源冲击特征,建立了基于MCKD 的故障特征强化方法,并实现了关键参数的自适应选取。特征参数的对比表明,处理后的信号聚类性得以提高。

3)以MCKD 为预处理手段,构建了MCKD+DBN 的滚动轴承智能诊断模型,获得了超过95%的迁移诊断准确率,与单一DBN 模型相比,准确率大幅提升,为不同数据源之间的迁移诊断提供了一条可行的途径。

4)本研究结果仅局限于两类深沟球轴承之间的迁移诊断,是否可以推广到其他类型的滚动轴承,将是今后工作的研究重点。

猜你喜欢
轴承准确率卷积
轴承知识
轴承知识
基于3D-Winograd的快速卷积算法设计及FPGA实现
泵用电机水润滑轴承选择与应用
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
卷积神经网络的分析与设计
从滤波器理解卷积