一种GAF-CNN行星齿轮箱故障诊断方法

2020-12-15 05:12庞新宇仝钰魏子涵
北京理工大学学报 2020年11期
关键词:齿轮箱齿轮行星

庞新宇,仝钰,魏子涵

(1. 太原理工大学 机械与运载工程学院,山西,太原 030024;2. 煤矿综采装备山西省重点实验室,山西,太原 030024)

由于行星齿轮箱同步齿轮数量多,传动结构复杂,传统的诊断技术往往面临鲁棒性差的缺陷,因此行星齿轮箱中齿轮的故障诊断一直是故障诊断领域中一个特有的难题. 行星齿轮箱的故障诊断大多采用振动分析的方法,观察状态监测指标的变化和趋势[1],或利用经验模态分解[2]、小波分析等信号分解技术[3],对缺陷频率进行检测,以揭示频率特征. 近年来,各种智能诊断方法逐渐被用于机械设备的故障诊断,其中卷积神经网络(CNN)在语音以及图像分类任务中已得到成功应用[4],与深度信念网络(DBN)[5]、深度自编码(DAE)[6]和限制玻尔兹曼机(RBM)[7]等深度学习方法相比,由于CNN采用权值共享、接受域和子采样策略,使得待优化参数的数量显著减少,在故障诊断领域的应用也日益增加.

一维数据和二维图像均可作为数据集输入至CNN执行分类任务. Wu等[8]比较了卷积神经网络中1D输入和2D输入的分类性能在ECG数据集上的表现. 在1D-CNN中,Swish激活较其他激活函数具有更高的准确性和鲁棒性,可用于ECG的分类. 在相似的2D-CNN模型中,使用在ImageNet上预先训练的权值来初始化模型,有效地缓解了模型过拟合的问题. 与1D-CNN中的信号输入法相比,2D-CNN可以对大数据库进行微调,实现了更高的精度和鲁棒性. 此外,大多数已知的CNN架构需要输入2D图像才能充分发挥该算法的性能,因此在使用该算法时,一个重要的问题是如何将原始的1D信号转换为清晰且良好的2D图像表示. Lü等[9]采用模糊函数将不同状态下的齿轮振动信号表示为二维时频图像,之后通过改进的Hu不变矩对图像特征进行提取完成故障诊断. Zheng等[10]将原始振动信号转换为灰度图像后,利用FAST-Uniented-SIFT直接提取特征,并根据提取的特征建立字袋模型,实现故障分类.

基于以上分析,本文采用一种新的2D图像编码手段,即格拉姆角场(GAF)时间序列编码方式,并与CNN结合,构造GAF-CNN模型用于行星齿轮箱齿轮故障诊断,最终通过调整模型参数达到较高的识别精度.

1 GAF 图像编码

(1)

(2)

通过上述变换可将原始时间序列转换为沿对角线对称的特征图,由于特征图像蕴含时间相关信息,因此也可利用特征图对时间序列进行重构. GAF可以通过不同的方程生成两幅图像. 式(3)定义了格拉姆角和场(GASF),式(4)定义了格拉姆角差场(GADF),其区别在于三角函数的转换,其中GASF基于余弦函数,GADF基于正弦函数.

(3)

(4)

为了进一步说明该方法的优点,对采集到的振动信号进行GAF图像编码,如图1所示.在时域波形中存在两个较为明显的波峰,在波形初始振幅较小,当出现第一个波峰时在GADF与GASF特征图呈现出颜色较浅的交叉特征(见图1中标注位置),而峰值较大的部分呈现的特征更为明显. 此外,时域波形中的振荡部分均在编码后的特征图中进行了完整的表示. 在波形图结尾部分同时出现两组连续振幅值较大的信号特征,而在特征图中也可获得准确表示. 因此,在二维图像中,可以通过GADF与GASF中相应位置的颜色、点、线等不同特征对振动信号进行完整映射.

2 卷积神经网络

卷积神经网络(CNN)是一种分层神经网络,将输入与其内核按照指定步长进行滑动卷积,提取输入局部区域的特征. 然后对卷积后的特征图进行池化,以减少网络参数,通过构建若干“卷积池化”层完成对目标的特征提取.

2.1 卷积层

卷积层利用不同大小的卷积核将输入图像进行卷积. 加入偏置后,通过激活函数提取输入图像的抽象纹理特征,实现特征增强. 卷积运算可以表示为

(5)

2.2 池化层

池化层又称子采样层,通常位于卷积层之后,利用子采样功能可以减少冗余特征,进一步避免过拟合,降低网络参数. 数学模型可以描述为

(6)

式中down(.)表示子采样函数. 通常,此函数对输入图像中每个不同的n×n块求和,这样输出图像在两个空间维度上都要小n倍. 每个输出映射都有自己的乘法偏置β和加法偏置b. 文中选用的子采样函数为最大采样,其主要原理是将输入图像分割成一组不重叠的矩形,对于每个这样的子区域输出最大值.

2.3 全局均值池化层

全局均值池化[12]的思想是在执行分类任务时,在最后一个卷积层执行结束后,为每个对应类别生成一个特征图. 不同于全连接层添加在特征层顶部,全局均值池化是取每个特征图的平均值,然后将所得的向量直接输入Softmax层.

使用ADADELTA优化算法[13]训练CNN. 该方法只使用一阶信息,随时间动态调整,计算量小,仅次于随机梯度下降法. 该方法不需要手动调整学习速率,并且对噪声梯度信息、不同的模型架构选择、不同的数据模式和超参数的选择具有很强的鲁棒性. 本文所采用的网络结构如图2所示.

2.4 GAF-CNN故障诊断方法

GAF-CNN故障诊断方法为:①对所采集的振动信号进行分割,将每段信号按照GADF或GASF编码方式转换为2D图像,并划分训练集与测试集;②将特征图输入构建好的CNN模型并进行参数调优,使其可以自适应提取图片特征中的相关信息,获取不同类型的齿轮故障信息;③通过Softmax分类器将其与相应故障类型建立映射关系,实现故障诊断.

3 试验研究

3.1 数据采集及图像编码

采用DDS型动力传动故障诊断综合试验台进行试验,如图3所示. 试验所用行星齿轮箱为单排行星齿轮机构,其中有4个行星轮,内齿圈固定,太阳轮为输入件,行星架为输出件,整个行星轮系的减速比为4.571. 表1为行星齿轮箱及平行轴齿轮箱的相关参数,其中Zs,Zp,Zr,Z1,Z2,Z3和Z4分别表示太阳轮、行星轮、齿圈以及平行轴齿轮箱中二级减速器相关齿轮的齿数. 采用行星轮预设5种不同的齿轮状态(正常、齿根裂纹、磨损、断齿、缺齿)进行试验. 利用振动加速度传感器采集齿轮箱振动信号,采样频率10 kHz,设置2种扭矩(0,40 N·m)、2种转速(1 800,2 400 r·min-1)组成4种运行工况进行试验.

表1 行星齿轮箱及平行轴齿轮箱相关参数

将振动信号顺序等分截取为不同的小段,每个片段的长度确定为500个样本. 每类信号特征构造1 200个样本,之后采用One-hot编码方式分别为5种不同行星齿轮工作状态进行标签,设置随机种子数为20 000,并按照7∶3的比例划分为训练集与测试集.

传统的时域分析难以准确识别行星齿轮的损伤程度和故障类型的特征,因此,利用GAF编码方式在时间序列上映射的唯一性,对原始振动信号进行编码,产生特征明显的故障图,如图4所示.之后再结合CNN对5种故障特征图进行分类.

3.2 GADF-CNN与GASF-CNN对比试验

在进行GADF-CNN与GASF-CNN对比试验前,首先分析GADF与GASF在行星齿轮数据集上的表现. 采用“卷积-池化-卷积-池化-卷积-池化-全局均值池化-Softmax分类器”结构的模型,其中卷积核的数量分别为8,16,32,大小为3;每个卷积层后统一连接最大池化层,其大小为2,步长为2. 在CNN迭代了100轮后获得准确率曲线如图5所示.

分析图5数据可知,GADF-CNN在训练集上准确率达到了0.991,测试集也达到0.985,而GASF-CNN虽然在训练集上数据表现为0.997,但其在测试集的表现较差,在迭代100轮后达到0.931. 观察损失值曲线可知,GASF-CNN在迭代10轮后,测试损失值曲线不再收敛,由0.2增加至0.4,导致GASF-CNN模型产生过拟合现象. 鉴于GADF-CNN模型在对行星齿轮数据分析时所取得的效果明显优于GASF-CNN模型,因此在后续试验中,主要针对GADF-CNN模型进行分析.

3.3 GADF-CNN参数及结构优化

为探究网络参数、不同网络层以及不同诊断方法对故障诊断模型的影响,设置一系列不同的参数值研究模型的最优组合. 模型运行的软件环境均为PyCharm,硬件环境为Intel Core i5-8300H处理器和GTX 1050Ti显卡,准确率为5次结果的平均值.

3.3.1网络参数对模型效果的影响

针对影响模型诊断准确率的三个核心参数进行对比分析,探究该模型的最优超参数. 对5种行星齿轮状态进行诊断,试验整体识别率结果如表2所示.

表2 网络参数对模型识别率的影响

不同参数对模型的运算效率、梯度下降方向以及权重更新次数均产生重要影响. 从表2看出,采用GADF作为输入样本并结合CNN网络所达到的诊断效果良好,准确率均保持在97%以上. 当Batch Size=6,Epoch=110以及Kernel Size=6时模型效果最好,当前的CNN网络以Kernel Size=3为主,多数开发框架均对卷积核大小为3时进行主要优化,因而忽略了偶数型内核对网络效果的发展,根据文献[14]建议,设置一系列不同的卷积核值,并采用对称填充的方式对卷积后的特征图进行增补,当卷积核参数为6时所达到的准确率最高(98.82%),模型在此时具有较为满意的诊断效果与泛化能力.

3.3.2不同网络层对模型效果的影响

根据上述试验获得的最优网络参数,为了探究将全连接层分别替代为全局均值池化层和全局最大池化后GADF-CNN模型的效果,本节将主要从计算效率(采用单步计算时长确定)、网络参数、准确率以及是否发生过拟合等方面进行分析,具体结果如表3所示.

表3 全连接层替换结果

分析表3数据,将全连接层替换为全局均值池化层后计算效率更高,网络参数大幅减少,准确率相比前者提高约1%,且无过拟合情况发生,表明将全连接层替换后模型泛化性能进一步提高. 究其原因,全局均值池化是将每个特征图取平均值,得到的向量直接输入Softmax层. 与全连接层相比,全局均值池化层不仅可通过加强特征映射和类别之间的对应以更适合于卷积结构,而且没有需要优化的参数,有效避免了模型过拟合. 而将全连接层替换为全局最大池化层后,虽然网络参数较少,但其准确率低,且存在过拟合现象,并不适用于该模型.

3.4 对比分析

3.4.1与其他图像编码方式对比

为了表明该编码方法的先进性,基于传统图像编码方式[15]将1D信号转化为灰度特征图,并利用CNN进行特征提取与故障分类. 与本文方法相比,该方法将振动信号中每个样本的振幅归一化为0~1,并将振动信号第i个样本转化为像素点(j,k),其中j=i/M,k=i/N,M为M×N数据的列数,N为M×N数据的行数,每个样本的归一化振幅为对应像素的强度. 根据该方法将长度为484的数据转化为22×22的灰度图(见图6),每类行星齿轮故障生成1 200张特征图,训练集与测试集仍按7∶3比例进行分割. 将灰度特征图输入同等规模的CNN进行分析后发现其准确率为97%,明显低于GADF图像编码方式的识别精度.

3.4.2不同诊断方法对模型效果的影响

为验证所提出算法的有效性,本节将采用不同诊断方法进行对比试验. 试验数据依然采用编码后的GADF特征图作为输入,增加BP网络、堆栈自动编码器(SAE)以及支持向量机(SVM)算法进行测试,同样把训练集与测试集按7∶3的比例进行分割,识别率如图7所示.

分析图7可知GADF编码方式在与CNN相结合时达到最高的识别率为98.8%,而SAE作为一种优秀的深度学习算法,虽然也能自适应地提取出故障特征进行分类,但针对该特定分类任务所取得的识别率略低于CNN. 而BP网络与SVM所取得的分类精度不足90%,且在算法运行时收敛速度慢,易于陷入局部最优解,因而不适于行星齿轮箱的故障诊断问题.

4 结 论

文中提出了一种GAF-CNN模型,并将其应用于行星齿轮箱故障诊断. 该模型在对行星齿轮信号编码时考虑了不同时间间隔相关性的综合集成,因此在利用CNN自适应地提取信号特征与故障分类时可以更加全面地进行分析,克服了浅层特征对故障信号表征能力不足的问题.

进一步研究发现GADF对原信号特征的表达能力优于GASF与灰度编码方式. 在对CNN模型进行优化时,将CNN中的全连接层替换为全局均值池化层使得参数量大幅降低,计算效率显著提高,有效减少了过拟合状况,通过参数调优,模型最终达到较高的诊断准确率. 对比分析结果表明GADF与CNN结合的故障诊断模型在行星齿轮故障分类中具有良好的可行性与可靠性.

猜你喜欢
齿轮箱齿轮行星
CJ-1型齿轮箱箱体强度分析
风力发电机组齿轮箱轴承故障诊断分析
风力发电齿轮箱设计制造技术
关于齿轮的有趣问答
流浪行星
你找到齿轮了吗?
异性齿轮大赏
骑车上班日
风力发电齿轮箱运维现状以及发展趋势
行星呼救