基于深度学习理论的轴承状态识别研究

2016-08-04 06:16高宏力张一文黄海凤
振动与冲击 2016年12期
关键词:轴承编码神经网络

郭 亮, 高宏力, 张一文, 黄海凤

(西南交大通大学 机械工程学院, 成都 610031)

基于深度学习理论的轴承状态识别研究

郭亮, 高宏力, 张一文, 黄海凤

(西南交大通大学 机械工程学院, 成都610031)

针对滚动轴承振动数据耦合程度高,信号特征提取和识别模型建立困难的问题,提出了一种基于深度学习理论的状态监测方法。提取振动信号的时域、频域和时频域特征构成特征向量;通过稀疏自编码非监督学习网络对输入向量进行特征学习,并将单层网络叠加构成深度神经网络;最后采用少量有标签数据对整个深度神经网络进行微调训练,建立轴承状态监测模型。试验结果表明,提出的方法对于轴承状态识别准确率达到90.86%,且性能退化阶段识别率最高,能满足视情维修的工程需求。

深度学习;非监督学习;滚动轴承;视情维修

为减少维修时间,提高企业生产效率,机械设备采用视情维修是重要的措施。视情维修的基础是通过加强和完善监测手段,掌握设备的工作状态,及时发现问题并采取相应对策[1]。轴承是机械设备的重要组成部分,据统计,轴承的损坏故障在旋转机械的故障中约占30%,因此,对轴承进行故障诊断与状态监测的研究以提高其视情维修的比重非常重要。

近年来,国内外学者针对滚动轴承状态监测和故障诊断方面进行了大量的研究,取得了一定的成果。研究主要集中在特征提取和状态识别这两部分,这是轴承智能状态监测的核心组成部分。针对轴承振动信号的特点,先后提出了时域特征,频域特征和时频域特征等不同的特征类型。峰值,均方根值,峭度,峰值因子,裕度因子等时域特征计算简单,但是对于严重故障振动数据抗干扰能力差。幅值谱分析,功率谱分析,倒谱分析和包络谱分析等频域特征建立在信号的全局变换上,不能有效的分析非平稳信号。而短时傅里叶变换,小波分析,经验模式分解等时频分析方法可以表示非平稳信号的局部化信息[2]。提取的特征参数需要模式识别方法进行诊断。人工神经网络是一种具有非线性、自学习、自适应性等优点的广泛应用的模式识别方法。文献[3]应用BP神经网络和ART2神经网络进行滚动轴承故障的自动检测与定位。文献[4]提取了旋转机械轴承振动信号的时域特征,将其输入三层人工神经网络故障识别。并分别研究了不同预处理方法对识别率的影响。文献[5]应用时频分析方法-小波变换对旋转机械振动信号进行特征提取,并将小波变换特征输入具有无监督学习能力的自联想神经网络进行故障判断。虽然神经网络在轴承故障诊断和状态监测中取得了很好的效果,但是当前应用广泛的神经网络存在收敛速度慢和多层扩展困难等缺点。深度神经网络是近年来机器学习和人工智能研究领域的研究热点。深度神经网络很好的解决了特征学习、提取与深层网络训练局部极小值问题,而且深度神经网络非线性表达能力强,判别能力好,已在图像识别,声音识别,自然语言处理等领域取得了突破性的进展[6-9]。目前,在过程监控,铁路运行状态预测以及机械设备的状态等领域也有一些深度神经网络的应用[10-13]。然而,利用具有自学习能力的深度神经网络进行轴承状态监测的研究未见报道。

针对上述问题,我们提出了基于深度学习的轴承状态监测算法(Condition Motion based on Deep Learning, CMbDL),算法流程图见图1。提取振动信号的时域,频域和时频域特征构成特征向量,深度神经网络对提取的特征信号进行特征学习与特征识别,实现准确的轴承状态监测。将本文提出算法与其他模式识别方法进行了对比研究,结果表明,本文提出的方法,状态识别率高,自适应能力强,研究成果具有重要的实用价值。

图1 监测系统流程图Fig.1 Flowchart of monitoring system

1基于稀疏自编码的深度神经网络

基于稀疏自编码结构的深度神经网络基本组成单元是稀疏自编码(Sparse Auto-Encoder)结构。稀疏自编码结构分层训练并依次堆积构成深度网络,网络的顶层加入判别结构Softmax Regression,经过少量有标签数据的微调训练,得到具有特征学习能力和判别能力的深度神经网络结构。

1.1稀疏自编码结构

自编码结构见图2(a),整个系统由编码(Encoder)和解码(Decoder)两个网络构成。

编码网络属于降维过程,将高维原始数据降到具有一定维数的低维结构上;解码网络属于重构部分,可视为编码网络的逆过程,作用是将低维上的点还原成高维数据。编码网络与解码网络之间为隐含层,也称为“码字层”(Code layer),是整个自编码网络的核心。隐含层的数据能够反映高维数据集的本质规律。因此,自编码网络也是一种非线性降维过程。

图2 稀疏自编码深度神经网络Fig.2 Sparse auto-encoder deep neural network

(1)

式中:W为权值,b为偏差值,x为输入值,y为理论输出值。

编码网络阶段,输入信号为前一个自编码结构的“码字层”的值(第一层网络结构的输入层为原始输入信号)。其数学表达式如下:

a=f(z1)

(2)

(3)

解码阶段(即重构阶段)网络将重构出与原始输入信号最接近的输出值,其数学表达式如下:

(4)

z2=W2a+b2

(5)

由上述过程可知,分层网络训练不需要标签数据即为非监督训练,对于轴承的状态监测具有重要意义。轴承正常状态数据容易获取,但其故障状态的振动数据不易获取。非监督训练过程不需要有标签数据,因此可以通过转移学习,在某一状态的训练数据集中加入其他状态的训练数据集进行非监督预训练。

上述网络结构损失函数中未加入权重惩罚参数项,容易导致结构过拟合,并且造成学习得到特征的聚类能力不强,判别能力弱,为了更好的表达轴承状态监测信号的特征向量,本文采用稀疏自编码网络结构,其损失函数如下:

(6)

式中:λ为权重惩罚系数,控制网络的稀疏程度。稀疏自编码网络有天然的聚类性质,能够把概念上相类似的对象归集到一起,使得在高层网络层能够表达原始数据本质特征,并且具有强的判别能力。

1.2堆积稀疏自编码网络

稀疏自编码结构是一个3层的网络结构,其函数构造能力有限。为构成表达能力更强的函数,将浅层网络依次叠加构成深度网络结构,即堆积稀疏编码网络,见图2(b)。在这个过程中,每一个稀疏自编码网络的码字层作为下一个网络的输入层参与训练,完成预训练后,合并每一个网络结构的码字层构成一个多层的神经网络。因每一层预先分别训练,因此避免了传统深度结构容易陷入局部极小值的问题。

1.3Softmax回归

堆积自编码网络结构仅是一个深度网络结构,具有特征学习能力和特征聚类能力,并不能对不同类型信号进行分类,需要在深度结构的顶层加入具有判别能力的网络结构,本文采用Softmax回归模型。

Softmax 回归模型是逻辑回归模型在多类分类问题上的推广,在多分类问题上,类标签y可以取两个以上的值。Softmax回归模型的损失代价函数为:

(7)

式中:(x(i),y(i))为训练样本,m为样本个数,其中输入特征x(i)∈n+1,y(i)∈{1,2,…,k}。Θ为训练模型参数,使其能最小化代价函数。

1.4微调多层自编码算法

在非监督预训练阶段,训练每一层参数的过程中,会固定其它各层参数保持不变。所以,为提高网络识别准确率和泛化能力,在上述预训练过程完成之后,通过反向传播算法有监督训练整个模型,同时调整所有层的参数以改善结果,这个过程一般称为“微调”。

微调训练将分层自编码神经网络的所有层作为一个整体模型,每次迭代训练中,模型的每个参数均优化调整。因此,微调训练可以提高自编码深度神经网络的性能表现。

应用反向传播法进行微调时,所计算的偏导数为:

W(l)J(W,b;x,y)=δ(l+1)(a(l))T

(8)

b(l)J(W,b;x,y)=δ(l+1)

(9)

式中:对于输出层(nl)层,令δ(nl)=-(anl)×f′(z(nl)),对于l=nl-1,nl-2,…,2,令δ(l)=((W(l))Tδ(l+1))×f′(z(l))。a(l)为第l层的激活值。

2轴承全寿命周期实验与状态监测

2.1实验平台

轴承加速寿命试验台PRONOSTIA[16]见图3。PRONOSTIA由三部分组成,驱动模块,负载模块和数据采集模块。驱动电机功率1.2 kW,最大速度为6 000 r/min。测量轴承的尺寸参数为:滚珠直径:3.5 mm;滚珠数:13;外圈直径:29.1 mm;内圈直径:22.1 mm。轴承的横向和轴向分别安装加速度传感器(DYTRAN 3035B)。实验过程中,当加速度传感器的振动信号幅值超过20 g时,停止测试。

图3 轴承试验平台PRONOSTIAFig.3 Bearing experiment platform PRONOSTIA

图4为轴承全寿命周期的纵向振动信号幅值图。根据轴承性能状态,可将其服役分为四个阶段:正常状态,早期退化状态,性能退化状态和故障状态。正常状态轴承可以正常使用,早期退化状态为轴承有非常轻微的故障,但是并不影响使用,性能退化状态下轴承在特定条件下可以继续使用,需要进行视情维修,故障状态下轴承不能再继续使用,应立即更换。图5为测试轴承在正常状态和故障状态下的时域振动波形图。

2.2特征提取

为获取更多的故障信息,全面准确的反映轴承的运行状态,提取振动信号的时域,频域和时频域的特征。其中时域特征参数:最大值F1,平均值F2,峰-峰值F3,均方根F4,峭度F5,波形因子F6,峰值因子F7,峭度因子F8,脉冲因子F9,裕度因子F10。频域特征参数:重心频域F11,频域方差F12。轴承在不同的状态下其振动表现为在各个频段范围的能量分布发生改变,。小波包变换能将信号以多种时频分辨率分解到不同频段,本文对轴承振动信号进行满尺度的小波包分解,将各频段小波包能量作为特征向量(见图6)。图6(a)为正常状态下的振动信号小波包变换云图,图6(b)为故障状态下的振动信号小波变换云图。由图6可知,正常状态和故障状态下的小波变换云图有明显的差别。正常状态下轴承振动信号的小波系数能量主要集中在≈4 000 Hz,故障状态下轴承振动信号的小波系数能量主要集中在<2 000 Hz。正常状态下轴承的振动信号频带集中在系统的固有频带(载波)上,轴承出现故障后,冲击波(调制波)的能量逐渐增大。因此,在故障状态下,轴承的小波变换系数能量主要集中在<2 000 Hz。将[0,1 000),[1 000,2 000),[2 000,3 000),[3 000,4 000),[4 000,5 000),[5 000,6 000),[6 000,7 000)频段内的能量值作为特征值F13,F14,F15,F16,F17,F18,F19。表1为正常状态下和故障状态下的特征值,特征值未经过归一化处理。

图4 全寿命周期信号Fig.4Vibrationsignalofbearingfull-life图5 轴承正常和故障状态时域波形Fig.5Waveformofbearingwithnormalandfaultcondition

表1 正常状态和故障状态下轴承特征值

图6 小波包变换Fig.6 Wavelet package transform

2.3基于深度神经网络的轴承状态识别模型

3实验结果

采用两组同型号轴承的全寿命周期数据进行实验,第一组数据对确定了结构的网络进行训练,第二组数据用于测试性能检验。试验环境设置为:转速1 800 r/min,负载为4 000 N,加速度传感器的采样频率设置25.6 kHz,每10 s采集一次数据,采集时间0.1 s(2 560个数据点)。两组实验分别采集了2 800和870个样本。由图7(a)可知,网络的训练识别率为95.06%,其中正常状态的识别率最高,为96.857%,故障情况的识别率最低为84.667%。由图7(b),网络识别准确率为90.86%。其中,识别准确率最高的为性能退化状态,性能退化状态的识别是机械设备视情维修中最重要的阶段。由图可知,轴承的正常状态和故障状态在训练和识别过程都不会发生误判。

为进一步验证提出算法的有效性,设计不同的判别模型进行对比实验。特征向量F被分别输入BP神经网络[14],支持向量机(Support Vector Machine,SVM)判别器[15]和CMbDL模型进行训练。其中,BP神经网络和CMbDL模型四层网络神经元数量分别为15,10,8,4。BP网络采用反向传播算法训练,CMbDL模型先后进行无监督预训练和有监督的微调训练。训练过程BP神经网络,SVM判别器和CMbDL的准确率分别为:91.5%,92.4%,95.06%;测试过程准确率分别为:87.62%,88.5%和90.86%。

图7 训练和识别准确率Fig.7 Training and recognition accuracy rate

4结论

本文提出了一种基于深度神经网络的滚动轴承状态识别系统。以轴承振动信号为监测对象,提取时域,频域和时频域特征构成模型特征向量。特征向量输入Auto-encoder深度神经网络进行非监督特征学习,降低特征维度并确定网络参数(权重W和偏置b)初始值。文章分析对比了CMbDL算法应用在振动轴承状态识别的准确率。由实验结果可知,本文提出的算法识别准确率高,并且对于性能退化状态的识别具有很好的泛化能力,有利于提高轴承的视情维修可靠性。具有较强的工程推广价值。

[1] 高宏力, 李登万, 许明恒. 基于人工智能的丝杠寿命预测技术[J].西南交通大学学报,2010,45(5): 685-691.

GAO Hong-li, LI Deng-wan,XU Ming-heng.Screw life prediction based on artificial intelligence technology[J]. Journal of Southwest Jiaotong University,2010,45(5): 685-691.

[2] 朱可恒.滚动轴承振动信号特征提取及诊断方法研究[D]. 大连:大连理工大学,2013.

[3] Subrahmanyam M,Sujatha C. Using neural networks for the diagnosis of localized defects in ball bearings[J]. Tribology International, 1997, 30(10):739-752.

[4] Samanta B, AL-Balushi K R. Artificial neural network based fault diagnostics of rolling element bearings using time-domain features [J]. Mechanical Systems and Signal Processing, 2003,17(2):317-328.

[5] Sanz J, Perera R, Huerta C. Fault diagnosis of rotating machinery based on auto-associative neural networks and wavelet transforms[J]. Journal of Sound and Vibration, 2007,302(4/5):981-999.

[6] Yu Kai, Lin Yuan-qing, Lafferty J. Learning image representations from the pixel level via hierarchical sparse coding[C]//Computer Vision and Pattern Recognition (CVPR), 2011 IEEE Conference on. Providence,RI:IEEE, 2011.

[7] Dahl G E, Yu D, Deng L,et al. Context-dependent pre-trained deep neural networks for large-vocabulary speech recognition[J].Audio, Speech, and Language Processing, IEEE Transactions on,2012,20(1): 30-42.

[8] Glorot X, Antoine B,Bengio Y. Domain adaptation for large-scale sentiment classification: A deep learning approach[C]//Proceedings of the 28th International Conference on Machine Learning (ICML-11). Bellevue, WA,2011.

[9] Hinton G E, Osindero S, Teh Y W. A fast learning algorithm for deep belief nets[J].Neural computation,2006,18(7): 1527-1554.

[10] Verma N K, Gupta V K, Sharma M,et al. Intelligent condition based monitoring of rotating machines using sparse auto-encoders[C]//Prognostics and Health Management (PHM), 2013 IEEE Conference on. Gaithersbury, MD:IEEE, 2013.

[11] Lemme A, Reinhart R F, Steil J J. Efficient online learning of a non-negative sparse autoencoder[C]//European Symposium Artificial Neural Network. Bruges: ESANN,2010.

[12] Fink O, Weidmann U. Using deep belief networks for predicting railway operations failures[C]// Advances in Risk and Reliability Technology Symposium. Loughborough, UK, 2013.

[13] Moody J M. Process monitoring with restricted Boltzmann machines[M]. Stellenbosch:Stellenbosch University,2014.

[14] 赵元喜, 胥永刚, 高立新, 等. 基于谐波小波包和 BP 神经网络的滚动轴承声发射故障模式识别技术[J]. 振动与冲击, 2010, 29(10): 162-165.

ZHAO Yuan-xi, XU Yong-gang, GAO Li-xin,et al. Acoustic emission fault recognition of rolling element bearing based on harmonic wavelet package and BP neural network[J]. Journal of Vibration and Shock, 2010, 29(10): 162-165.

[15] 董绍江, 汤宝平, 张焱. 基于非广延小波特征尺度熵和支持向量机的轴承状态识别[J]. 振动与冲击, 2012, 31(15): 50-54.

DONG Shao-jiang,TANG Bao-ping,ZHANG Yan.Bearing running state recognition based on non-extensive wavelet feature scale entropy and support vector machine[J]. Journal of Vibration and Shock,2012, 31(15): 50-54.

[16] Nectoux P, Gouriveau R, Medjaher K, et al. PRONOSTIA: An experimental platform for bearings accelerated degradation tests[C]//IEEE International Conference on Prognostics and Health Management. Denvor, CO:PHM,2012.

Research on bearing condition monitoring based on deep learning

GUO Liang, GAO Hong-li, ZHANG Yi-wen, HUANG Hai-feng

(College of Mechanical Engineering, Southwest Jiaotong University, Chengdu 610031, China)

The vibration signal of rolling element bearing occurs with a high degree of coupling, which means that the features and recognition model are difficult to build. For solving these problems, we proposed a novel bearing condition-monitoring model based on deep learning. Time domain, frequency domain and time-frequency domain features are extracted. Then these feature vectors are entered into an unsupervised auto-encoder to learn the high-level features. At the same time, the middle layers of the auto-encoder network are stacked into a multilayered network. Finally, a small number of labeled training samples are used to fine-tune the deep learning network. The bearing condition recognition experiment shows that the proposed method achieves state-of-the-art results, and its high accuracy in terms of the performance degradation condition is very helpful when it comes to condition-based maintenance.

deep learning; unsupervised learning; antifriction bearing; condition-based maintenance

10.13465/j.cnki.jvs.2016.12.026

国家自然科学基金(NSF51275426)

2015-03-12修改稿收到日期:2015-06-23

郭亮 男,博士生,1988年生

高宏力 男,教授,博士生导师,1971年生

TH17

A

猜你喜欢
轴承编码神经网络
轴承知识
轴承知识
轴承知识
轴承知识
基于SAR-SIFT和快速稀疏编码的合成孔径雷达图像配准
《全元诗》未编码疑难字考辨十五则
子带编码在图像压缩编码中的应用
神经网络抑制无线通信干扰探究
基于神经网络的中小学生情感分析
Genome and healthcare