高 谦 肖 维
(1.河海大学 南京 210000)(2.深圳大学 深圳 518000)
液压缸的复杂工况导致其具有故障多发、寿命短暂的特点,工程作业中液压缸的失效将导致工程事故或停产,进而造成一定的经济损失[1]。因此,建立可靠的寿命预测系统对液压缸的寿命进行精确预测以提前更换即将失效的液压缸可有效地避免这些问题。由于系统需采集液压缸整个生命周期的数据,且各监测点的采样频率较高,因此系统采集到的数据规模很大,致使液压缸的寿命预测需要用大数据的方法解决[2]。
深度学习是大数据分析技术中的杰出代表,但是在液压设备寿命预测领域中应用较少[3]。因此,本文提出了基于深度学习的液压缸寿命预测方法。该方法相比传统的机器学习方法,其优势在于:通过建立深度学习模型,摆脱了对大规模数据处理技术和行业专家知识的依赖,直接从大量数据中自适应地进行特征提取与特征选择,实现更具鲁棒性与泛化能力的液压缸寿命预测方法[4]。
深度学习区别于传统的模式识别方法在于它能够从大规模数据中自适地进行特征提取与特征选择,而非采用人工方法[5]。特征提取与特征选择都是通过改变数据分布的方法从原始特征中寻求最有效的特征,以提高模式识别系统的性能。而特征提取与特征选择的区别在于:特征提取的方法通过改变属性间的关系来改变数据分布,原有的特征空间发生了变化;特征选择的方法则是从原始特征集中选择出最有效的特征子集,原有的特征空间没有发生变化[7]。
在液压缸寿命预测领域,BP 神经网络模型应用最为广泛。其单隐层的浅层结构限制了分类器的特征提取与特征选择的能力,而采用具有多隐层的深度结构会导致训练出的分类器易陷入局部最优。深度学习将底层特征进行组合并构成更加抽象的高层表示,以挖掘出更加有效的特征表示,使得深层网络的训练问题有了很大的改善。深度学习用于液压缸寿命预测的方法:先以非监督学习算法对网络模型进行预训练,以获得更加有效的信号特征表示。然后利用监督学习算法对信号特征进行分类,使得网络结构具有预测能力[8]。本文使用DAE 算法作为预训练阶段的非监督算法,并将Adaboost算法作为分类阶段的监督算法。
DAE(Denoising autoencoder)算法模型又被称为降噪自动编码机,该模型通过在训练数据中加入随机噪声来训练神经网络,神经网络可以习得无噪声的输入特征以及噪声的主要特征[9]。该方法能够使神经网络在测试数据中表现出更强的泛化性,使得神经网络具有去噪以获取无噪声数据的能力。因此,本文选择DAE 作为特征提取算法的目的在于提高模式识别系统对噪声的鲁棒性。
DAE 算法的结构如图1 所示,其训练过程:加噪网络通过噪声函数fθ向输入样本XR中加入随机噪声,获得含噪样本:
tf为加噪网络的激活函数;θ为加噪网络的参数集,且θ={W,b};R为样本的特征维度。然后编码网络通过编码函数hφ对含噪样本进行编码,获得编码样本:
sh为编码网络的激活函数;φ为编码网络的参数集,且φ={V,d};R'为编码样本的维度,此过程中,样本维度发生了改变。然后解码网络通过解码函数对编码样本进行解码重构,获得解码样本:
为解码网络的激活函数,φ'为解码网络的参数集,且φ'={V',d'} ;经过解码重构,解码样本的维度与输入样本XR的维度一致。最后,网络将根据输入样本XR与解码样本X^R计算出重构误差
图1 DAE算法模型结构
Adaboost 算法的思想是合并多个弱分类器的输出构成强分类器以获得更加有效的分类,本文选择BP 神经网络模型作为弱分类器,经Adaboost 算法合并构成BP-Adaboost 强分类器作为深度网络分类阶段特征选择的监督算法[10],其结构如图2 所示。
该方法需按规则将训练数据进行分组,并将各组数据输入多个弱分类器进行迭代运算,对于分类失败的样本个体赋予较大的权值,下一次迭代运算时将着重关注。强分类器则采用加权多数表决的方法合并弱分类器,分类结果越好的弱分类器,其对应的权重越大[11]。该算法的训练过程如下。
1)给出特征维度为R 的样本空间(XR,Y),从中搜索出 2R-1 个可能的非空特征子集{Xt} =(X1,t,X2,t,…,Xs,t),并将 (Xt,Y)作为各弱分类器的训练数据集,其满足:
t为各训练数据集和对应弱分类器的序列,且t=1,2,…,2R-1;s 为样本空间中的样本个数,均布各训练数据集的初始权值:
然后根据特征子集的维度确定各BP神经网络模型的结构以及迭代次数N。
2)使用权值为Dn,t的训练数据集进行学习,得到弱分类器Gn(X),n为迭代序列,且n=1,2,…,N。
3)计算Gn(X)的在训练数据集上的分类误差:
4)计算Gn(X )在强分类器中的权值:
5)计算下一轮迭代运算的权值:
Bn为权值系数,可使权值的比例与总和保持不变;Xi,t∈{Xt} ,且i=1,2,…,s。
6)将弱分类器函数进行加权合并获得强分类器函数:
有效的特征数据所训练出的弱分类器分类效果较好,在强分类器加权合并时将获得较大的权值,以此达到特征选择的目的[12]。而携带噪声的样本在弱分类器迭代运算时将会表现出较差的分类效果,并会被赋予较大的权值,进而对分类器的性能产生不良影响[13]。因此,利用DAE 算法对数据进行去噪声预处理,可有效解决这一问题。
图2 强分类器结构
提出方法将多个DAE 模型逐层堆叠作为深度网络预训练阶段的无监督算法[14],并将训练结果输入BP-Adaboost 强分类器,作为分类阶段的监督训练数据,深度网络的结构如图3所示。
本文以液压缸的寿命预测方法为研究对象,所以应采集液压缸整个生命周期的数据用来训练深度网络[14]。通过对液压缸寿命影响因素及表现形式进行分析,提出将安装在液压缸上的传感器所监测到的数据作为深度网络的输入变量,其形式可以表示为X={x1,x2,x3,x4,x5} 各元素含义如表 1 所示;将液压缸的生命周期按时间降序分级作为深度网络的输出变量,表示为Y={y1,y2,y3,y4,y5,y6} ,各元素含义如表2所示。
图3 深度网络的结构
表1 深度网络输入变量
表2 深度网络输出变量
本次实验从客户端的液压缸采集了2000 组均布在整个生命周期内的数据,随机选取其中的1600 组对深度网络进行训练,利用剩余数据对学习器进行测试。
为了验证提出方法的特征提取性能,利用主成分分析法提取数据特征的前三个主成分[14],分析结果如图4 所示。图4(a)为提出方法特征提取的主成分散点图,可以看出液压缸的同一寿命等级散点很好地聚集在一起,不同的寿命等级散点被有效的分离,可知提出方法的特征提取效果显著。图4(b)为多隐层BP 神经网络模型特征提取的主成分散点图,可观察到,部分同一寿命等级的散点聚集较好,但是与不同寿命等级散点之间存在交叉,因此多隐层BP 神经网络的特征提取性能存在不足。图4(c)为单隐层BP神经网络模型特征提取的主成分散点图,可以看出不同寿命等级的散点相互交叉,分布的规律性较差,因而单隐层BP神经网络模型特征提取性能最差。
上述分析表明,DAE算法可根据传感器信号自适应地提取有效的特征,而BP 神经网络由于其结构的限制,特征提取性能较差[15]。
图4 主成分分析散点图
为了验证提出方法的特征选择性能,在Matlab环境下对BP-Adaboost 强分类器与BP 弱分类器进行仿真实验,并对比两者的测试结果,测试结果如图5 所示。横坐标为测试样本的编号;纵坐标为分类器预测误差的绝对值,分类器的预测值为液压缸的寿命值,范围为[0 , 100 ];星形标识代表强分类器的预测结果;圆形标识表示弱分类器的预测结果。从图中可以看出,对于绝大部分的测试样本,强分类器的预测误差远小于弱分类器的预测误差。且强分类器的预测误差值大都小于5,可得强分类器的预测精度可到达95%,该精度可满足实际工程应用的要求。因此,提出方法的特征选择性能可靠。
图5 分类器测试结果
论文简述了深度学习理论的特点,指出传统机器学习在液压缸寿命预测方面的不足。并提出基于特征提取与特征选择的深度学习方法,该方法改善了传统机器学习算法在处理深层网络时的不足,可以更准确地对液压缸的寿命状况进行预测。