基于稀疏自编码神经网络的抽油机井故障诊断

2018-08-10 10:48仲志丹樊浩杰李鹏辉
西安科技大学学报 2018年4期
关键词:示功图抽油机编码器

仲志丹,樊浩杰,李鹏辉

(1.河南科技大学 机电工程学院,河南 洛阳 471003;2.洛阳乾禾仪器有限公司,河南 洛阳 471000)

0 引 言

目前,有杆泵抽油机井在中国石油开采中占有举足轻重的地位[1]。抽油机井发生故障时,不仅会造成石油开采不能有序的进行,影响进度目标,严重时还会造成安全事故。因此,准确地对抽油机井故障进行诊断很有必要。

抽油机井故障诊断主要是根据抽油机悬点处载荷和位移的变化数据所绘制的示功图的形状来判断。传统方式中巡井工人根据平时的经验来识别示功图形状,但这种方法效率和准确度低、不能满足油田现代化生产的需要[2-3]。近年来,随着计算机识别技术的发展,越来越多的计算机识别模型被应用在示功图识别上,如反向传播(Back Propagation,BP)神经网络[4-5]、支持向量机(Support Vector Machine,SVM)[6-7]等。这些模型识别示功图主要通过人工预先选取示功图几何特征,然后根据特征进行示功图分类识别。人工选取的示功图不变矩、矢量曲线等几何特征,经常受到人为因素的干扰,导致特征提取不准确,降低了分类精度。并且这些模型都是利用有监督学习的方式,用大量有标签的示功图数据(即已知示功图类别)进行模型训练。这些有标签示功图数据的获取需要大量的人力和专家知识对示功图进行标定,造成人力浪费以及人为可能标定失误带来的识别错误率上升。

近年来,随着人工智能的热浪袭来,Hinton等提出一种“自编码器”的深度学习模型受到人们的关注[8]。该模型采用无监督学习[9]的方式,用大量不需要标签的图像数据(未知图像类别)来学习输入图像特征且能够从高维输入图像数据学习出低维图像特征,被广泛应用于人脸识别[10]、医学图像检测[11]等各个领域,取得了显著的成果。其中,稀疏自编码器[12-13](SAE)不仅能够自动提取图像像素特征,解决了人工选取示功图几何特征的不准确,还能够利用无监督方式学习得到数据特征的稀疏简明表达,节省了给图像赋予类别标签的人力劳动且降低分类任务的复杂度,提高了后续softmax分类器的分类精度[14]。基于此,提出一种基于稀疏自编码神经网络的示功图识别模型,对抽油机井故障进行智能诊断。

1 稀疏自编码神经网络

稀疏自编码神经网络(SAENN)是由稀疏自编码器和softmax分类器组成。稀疏自编码器主要负责自动提取图像稀疏特征过程,softmax分类器负责特征分类过程。

1.1 稀疏自编码器

图1 自编码器结构Fig.1 Auto-encoder structure

自编码器提取的特征不能简明表达输入层数据。于是Olshausen等提出了一种稀疏编码的理论,通过研究人类大脑的非监督学习过程,发现人类通过大脑中的神经元学习外界事物的过程中,大部分神经元都是处于休眠状态,只有少部分神经元受到刺激而被激活,即神经元的响应是稀疏的[17]。正因为如此,人脑才具有更好学习数据特征的能力,这对于自编码器同样适用。加上稀疏性限制后构成稀疏自编码器能够学习到特征的稀疏表达,使提取的特征更具有可分性。稀疏性限制就是当神经元输出函数的值无限接近于1的时候,输出被激活,无限接近于0的时候,输出被抑制,大部分输出被抑制的情况叫做稀疏性限制。

自编码器的损失函数为

增加惩罚因子后进行稀疏性限制的稀疏自编码器的损失函数表示为

式中β为控制稀疏性惩罚因子的权重;s为隐藏层节点的数量。

重构误差的大小间接体现了编码过程提取稀疏特征的有效性。由于以稀疏自编码器的损失函数来评价重构误差的大小,故通过反向传播算法最小化公式(4)可以得到最优的权重矩阵W偏置矩阵b,最终可以得到输入数据的隐藏层稀疏表达特征[19]。

1.2 softmax分类器

由图1隐藏层学习到的更具稀疏可分性的特征作为分类器的输入,通过分类器可最终得到分类结果,这一过程是有监督学习的。由于文中研究的是多种工况下示功图的识别,所以这是一个多分类问题,故选用softmax分类器根据稀疏自编码器学习到的特征对示功图进行分类。

softmax分类器是逻辑回归分类器在多分类问题上的推广[20],在多分类问题上类别标签可以取多个值。经过softmax分类器的分类,可以在输出层计算出输入示功图属于各分类标签的概率,其中概率最大的即为分类结果。

2 示功图实验样本

2.1 获取示功图数据

通过安装在延长油田抽油机上的120台QH101-2型无线远程示功图测量仪(如图2所示)每隔一定时间进行数据采集,把采集的数据压缩打包后,通过自身所带的SIM900A模块利用GPRS网络传输给远程数据服务器中心。通过计算机登陆服务器就可以看到保存在服务器中的示功图数据。

图2 QH101-2型无线远程示功图测量仪Fig.2 QH101-2 wireless remote indicator dynamometer

2.2 示功图数据预处理

原始的示功图数据是测量的抽油机上下冲程过程中n个采样点的悬点位移和悬点载荷。然后分别以位移作为横坐标,载荷作为纵坐标,将测量的n个采样点绘制在直角坐标系中并连成一条封闭的曲线,即示功图,图3为供液不足工况下的示功图,不同形状的示功图直接反应了抽油机井的不同工作状况。

图3 抽油机井供液不足示功图Fig.3 Indicator diagram of insufficient liquid supply in pumping well

为了减少稀疏自编码器训练时间,提高网络学习中收敛速度,保证示功图的形状不变,实验中通过MATLAB仿真软件将测量的示功图原始数据处理成64pixel×64pixel的二值化示功图图像。

2.3 选择示功图样本

选择从延长油田获取的示功图数据并处理后的8 000张二值化示功图图像作为样本。其中,有3 200张8种典型工况的无标签样本作为稀疏自编码器无监督训练的训练样本。余下的4 800张8种不同工况的有标签样本,每一种工况有600张示功图图像。这8种不同工况类别的示功图分别为正常示功图、供液不足、气体影响、示功图异常、气锁、油井结蜡、活塞脱出、固定凡尔漏失,具体示功图形状如图4所示。每一种工况样本的2/3作为softmax分类器有监督训练的训练集,1/3作为测试集。那么所有工况的有标签训练集样本为3 200,测试集样本为1 600.

图4 8种不同工况类别示功图形状Fig.4 Shapes of indicator diagram in eight different working conditions

3 示功图识别流程

1.1节与1.2节已经介绍了稀疏自编码器与softmax分类器,本节将主要介绍稀疏自编码神经网络在示功图识别中的具体流程,如图5所示。详细步骤如下

3.1 利用3 200张无标签示功图样本X1训练稀疏自编码器来学习特征

1)设定期望平均稀疏激活度参数ρ,训练学习速率η,随机初始化权重矩阵W和偏置矩阵b;

2)设定前向传播中分批次训练样本数、训练迭代周期次数等,执行前向传播过程;

3)对输出层的每一个节点,计算加入稀疏性限制之后的损失函数;

4)使用反向传播算法求出最终输出层与各层神经元的“残差”,利用梯度下降法不断更新权重矩阵W和偏置矩阵b,最终得到最优的W和b.

3.2 利用3 200张有标签示功图训练集样本(X2,Y2)对softmax分类器进行有监督训练

1)用(1)中得到的权重矩阵W(1)和偏置矩阵b(1)等参数初始化稀疏自编码器特征提取层;

2)设置softmax分类器正则化参数λ,输出层节点数,执行前向传播算法,提取特征并进行分类;

3)使用反向传播算法求出最终输出层与各层神经元的“残差”,利用梯度下降法不断更新权值和偏置,对整个稀疏自编码神经网络进行微调。

3.3 利用1 600张有标签示功图测试集样本(X3,Y3)测试稀疏自编码神经网络的性能

1)计算输入数据属于每个分类标签的概率,选取概率最大的作为分类结果;

2)用输出分类结果与实际输入结果作对比,计算识别准确率。

4 实 验

本实验所用硬件平台为Intel i5-3210M 2.5 GHz CPU,内存8 GB的64位计算机,所使用的软件平台为Matlab2014a.

4.1 参数选择与优化

稀疏自编码神经网络的参数选择与示功图识别精度息息相关。文中稀疏自编码器输入层神经元个数由示功图图像像素点个数决定即64×64=4 096.令稀疏自编码器的隐藏层神经元个数为600,softmax分类器输出层神经元个数为8,根据文献[7]设置学习速率η=0.5.稀疏自编码器迭代次数达到200次时,重构误差趋于稳定,因此设定迭代次数为200.在实验中发现不同的期望平均稀疏激活度参数ρ和正则化参数λ对实验结果产生很大影响,图6反映的是不同期望平均稀疏激活度参数ρ对测试集样本识别准确率的影响。从图6可知,期望平均稀疏激活度参数ρ=0.035的时候示功图识别精度最高。

图5 稀疏自编码神经网络识别示功图流程Fig.5 Flowchart of sparse auto-encoder neural network for indicator diagram recognition

图6 期望平均稀疏激活度参数对识别准确率影响Fig.6 Influence of expected average sparsity activation parameter on recognition accuracy

在ρ=0.035的条件下,softmax分类器不同正则化参数与训练集样本识别准确率、测试集样本识别准确率的关系,如图7所示。当λ=1×10-5时训练集样本识别准确率和测试集样本识别准确率都已达到峰值,故设定优化后的正则化参数λ=1×10-5.

图7 正则化参数与识别准确率的关系Fig.7 Relationship between regularization parameter and recognition accuracy

4.2 实验结果与性能分析

利用1 600张实测示功图测试集样本对训练完成后的稀疏自编码神经网络模型进行测试,由于篇幅限制,选取了部分示功图故障识别结果,见表1.

为了评价稀疏自编码神经网络模型的识别性能,通过把相同的1 600张测试集样本分别输入到BP神经网络、支持向量机(SVM)、稀疏自编码神经网络模型进行测试对比,测试结果见表2.其中BP神经网络采用单隐层结构(600个隐藏层神经元),SVM采用径向基函数作为核函数。BP神经网络需要人工选取示功图不变矩特征,支持向量机需要人工选取示功图矢量曲线特征,二者都不能实现对示功图的准确表达,而稀疏自编码器通过网络学习自动提取图像稀疏特征,能够实现对示功图简明有效表达。而提取的稀疏特征能够准确地区分不同示功图之间差别,大大提高了softmax分类器的识别精度。由实验结果可知,稀疏自编码神经网络模型测试识别准确度高达99.44%,性能远优于BP,SVM等识别模型,故该模型在抽油机井故障诊断中具有明显优势。

表1 实测示功图故障识别结果Table 1 Fault recognition result of actual indicator diagrams

表2 各种模型识别性能对比Table 2 Comparison of various models’s recognition accuracy

5 工程应用

将基于稀疏自编码神经网络的抽油机井故障诊断方法应用于通过Labwindows/CVI开发环境开发的抽油机井故障智能诊断系统中,该系统已经在胜利油田、江汉油田、新疆油田得到应用,系统可视化界面如图8所示。该系统可以对实测示功图数据进行实时绘制,并根据绘制的示功图及时给出诊断结果与处理建议。油田工作人员可以根据诊断结果对抽油机井故障及时进行处理,极大程度降低了由故障造成的油田停产、减产、抽油设备损坏等现象。

图8 抽油机井故障智能诊断系统Fig.8 Intelligent fault diagnosis system for pumping well

6 结 论

1)借助人工智能思想,提出稀疏自编码神经网络模型识别示功图。稀疏自编码器训练过程采用无监督学习方式,代替了传统有监督模型训练需要人工标定大量示功图标签的过程,大大减少了人力劳动,避免了人为标定错误;

2)稀疏自编码神经网络自动提取示功图数据特征,避免了BP神经网络、支持向量机等传统模型人工预先提取示功图几何特征的繁琐与特征选取的不当;

3)稀疏自编码神经网络提取的稀疏可分性示功图数据特征能够提高示功图的识别准确率,为抽油机井故障诊断带来了新思路,解决了长期以来困扰油井工作人员不能有效地诊断抽油机井故障的难题,提高了油田作业效率,进一步提升了石油产量。

猜你喜欢
示功图抽油机编码器
抽油机井泵效影响因素的确定方法*
融合CNN和Transformer编码器的变声语音鉴别与还原
示功图诊断单井液量异常的系统建设分析
浅谈示功图在油田节能监测工作中的应用
幼儿园旁的抽油机伪装成了长颈鹿
基于CNN迁移学习的示功图图形分类预警
基于模式识别技术的油井工况诊断
基于双增量码道的绝对式编码器设计
21油田丛式抽油机井群集中控制系统的设计
基于数字信号处理的脉冲编码器