基于STFT图像特征的天然气管道预警技术研究

2023-04-26 08:38姚瑞煦张訢炜张家瑞张鼎博范斌斌王伟峰翟小伟

计算机测量与控制 2023年4期

姚瑞煦，李俊，张訢炜，张家瑞，张鼎博，范斌斌，马天，王伟峰，翟小伟

(1.西安科技大学安全科学与工程学院，西安 710054；2.陕西省煤火灾害防治重点实验室，西安 710054)

0 引言

石油天然气管道(以下简称“管道”)是能源运输的重要基础设施，是经济社会发展的“生命线”。根据国家规划，计划到2025年管道网络布局将形成 “五纵五横”，形成遍布全国的一张网，这将会极大的提高油气管道的运输里程和速度，预示着我国管道发展进入了新的阶段。管道运输具有油气运输量大、成本低、方便管理、占地少，同时对环境污染少等优点，一直是油气资源输送的首要选择，是保证经济发展的重要基石，但若管道在使用过程中有所损坏，比如占比40%以上管道事故的主要原因为自然灾害或者第三方施工，容易导致管道发生泄漏或者偷盗油气，不仅影响油气输送的速度，也会危害周边的居民生命安全和环境安全，因此需要全方位的确保管道运行的安全性、可靠性、灵活性，对管道沿线发生的各类事件进行实时准确的预警[1]。

目前传统的管道安全监测方法大多属于事后检测[2]，无法对危险提前进行预警，导致现场安全风险大。根据目前管道安全的应用要求，有学者提出了一种基于相位敏感光时域反射仪(Φ-OTDR，phase-sensitive optical time-domain reflectometer)的分布式长距离光纤传感系统。此系统利用现场管道埋的伴行光缆进行振动数据的采集，然后系统的每个模块对采集的数据进行自适应滤波，去除现场噪声等干扰信号，最后再判断现场发生的振动事件[3-4]。对于目前管道保护的研究来说，最重要的是如何准确地进行振动信号的识别分类，以便于减少现场识别振动事件的误报。

国内朱汪友等提出进行特征四分类，并使用神经网络(BP，back-propagation)分类器、支持向量机(SVM，support vector machine)分类器及BP-SVM融合分类器的识别率分别为75.2%、68.5%、81.4%[5]，张景川等[6]提出了小波能谱和小波信息熵两种方法相结合的特征提取方法，总体识别率达 98.5%。T.Marie等提出使用TFDC时频域特征识别光纤振动，使用SVM确定光纤振动模式识别事件的大小[7]，第一、第二和第三个典型事件的识别准确率为99.60%，94.74%和96.02%，平均识别率为96.78%。L.H.Jiang[8]等提出了从输入信号中选取包含入侵信号的片段，并通过小波变换和设定合适的阈值去除噪声。然后使用小波包分解来抽取频域特征。最后使用 BP 神经网络对入侵信号进行识别，其实验结果显示识别率为96.8%。

Y.Shi[9]提出使用卷积神经网络(CNN，convolutional neural network)的深度学习算法，预处理过程只需简单的带通滤波和灰度变换，基于5 644个事件样本的实验结果表明，该网络对5种事件的分类准确率达到96.67%。 H.Q.Qu[10]提出，利用随机配置网络(SCN，stochastic configuration networks)对3种事件进行识别，数据在无噪声情况下识别率达到99.55%，数据在有噪声情况下识别率达到77.35%。此外还有结合图像处理方法的信号识别等，但深度学习大多采用实验室数据样本，没有采用现场实际的数据对识别算法进行应用验证。

目前实际现场分析使用最成熟的应用算法是BP、SVM等传统机器学习方法，软件编写应用方便，识别率高。因此本文通过对确认发生危险事件地段的现场，采集管道附近的振动信号，进行连续时间帧的短时傅里叶变换(STFT，short-time fourier transform)图像化，并提取相应的特征值，结合BP等分类方法，进行时间-空间维度上的识别，区分噪声、机械破环、人工挖掘、榔头敲击、人跳跃以及人踏步通行六类事件，测试得到基于STFT的BP分类模型的振动识别率并与其他算法进行对比，BP六类总分类准确率为99.5%高于随机森林的88.3%，K近邻(KNN，K-nearest neighbor)的84.2%以及SVM的73.3%，以及GoogLeNet的93.3%，另外人工挖掘的误报率0%优于随机森林的10%，KNN的10%以及SVM的25%，与GoogLeNet持平，因此BP算法相较于其他算法的总识别正确率以及人工挖掘的误报率最优。

1 管道预警分类算法实现

1.1 分类算法整体流程图

现场采集的振动信号，经过滤波预处理后，通过STFT算法进行时频域图像化，提取图像的特征值后，最后采用不同的算法进行分类测试，算法训练过程由python和Matlab混合编程实现，主要步骤如下：

1)数据预处理。采集现场六类事件的原始振动数据，然后进行小波硬阈值滤波，使数据减少波动，减少干扰。

2)振动信号图像化。将采集的六类事件的振动数据进行STFT分析，按照1 s的时间间隔生成图片，生成图片时注意根据信号频率的大小调整不同事件图片的Y轴的大小。

3)提取特征值。针对传统的机器学习，需要对六类现场图像数据进行特征值的提取，比如灰度特征、不变矩特征、共生矩阵特征等，深度学习则直接对图片进行训练。

4)生成训练测试样本，对六类现场图像数据提取的特征值进行标签分类，噪声标签为0；机械破环标签为1；人踏步通行标签为2；人跳跃为3；人工挖掘为4；榔头敲击为5。

5)使用不同的算法进行训练。分别使用BP、随机森林、KNN、SVM、GoogLeNet算法对训练数据进行数据模型的生成。

6)输出测试结果。通过对不同分类算法的数据模型进行测试，并输出六类测试样本的分类结果。

1.2 算法介绍

管道保护法第三十五条等条款规定，施工单位、管道企业和地方管道保护主管部门，都是保障管道外部安全的法律责任主体，任何一方履职不到位，都有可能造成管道第三方损坏事件。实际管道线路短则十几千米，长则上百前米，如果人工进行巡查监测，费时费力效率低下，因此基于分布式光纤传感，利用机器学习以及深度学习的方法，可以实时的保护管道安全。

1.2.1 小波硬阈值滤波

目前一般使用信噪比(SNR，signal-to-noise ratio)衡量信号被噪声污染的程度，当SNR较小的时候，噪声比较大，会导致实际需要的信号识别困难，为了抑制和防止现场复杂环境对于振动信号的干扰，本次实验先使用小波硬阈值的滤波方法进行信噪分离，提取出真实有效的现场数据，然后再进行后续的分析处理。

小波去噪的基本原理是基于噪声小波变换后平均功率与尺度成反比，真实信号小波变化后平均功率成正比这一特性，去除信号中的噪声，主要流程是对信号进行预处理，然后通过小波变换进行多尺度分解，之后对各尺度上的小波系数进行去噪，最后通过小波逆变换重构还原信号。但直接进行小波去噪有可能去掉一部分真实信号，因此一般使用小波阈值去噪的方法[11]。

小波阈值去噪方法就是在小波去噪的基础上，对信号进行小波变换多尺度分解，找到一个合适的阈值，保留大于阈值的信号，去除小于阈值的信号，最后再通过小波重构还原出真实有用的去噪信号。

其中硬阈值函数的数学表达如下：

(1)

1.2.2 STFT算法

众所周知任何周期信号都可以由一系列正弦和余弦信号的线性组合而成，离散傅里叶变换(DFT，discrete fourier transform)可以描述一个信号由哪些波叠加而成，并给出每个分量的频率、幅值与相位。然而直接对一个非平稳信号做DFT无法得到信号变化的时序信息，例如在某段时间内，信号先出现后消失，直接对信号进行DFT无法判断出不同信号出现的先后顺序，而STFT可以每次取出信号中的一小段加窗，然后进行DFT来反映信号随时间的变化[12]。本次实验将现场去噪后的振动信号通过STFT算法得到连续时间帧的时频域图像。

STFT的主要流程是首先取出一段信号称为一帧数据，每两帧数据之间的间隔称为HopSize，然后对一帧数据进行DFT，然后重复这个步骤，直到整个信号的每一帧都完成DFT，最后将每一帧的结果拼接到一起，就可以得到整个信号的STFT结果。进行STFT最主要的参数就是一帧的长度，长度太短，所选取的信号也会太短，导致频率分析信息不够准确，长度太宽，会导致信号的时域分辨率低。一般来说对于非平稳信号，高频适合短长度，低频适合宽长度，STFT算法的主要优点是可以展示不同时刻内信号的各个成分的频率信息以及捕捉突变的信号，因此适合用于管道入侵现场的数据分析，本次实验采用宽度为256的汉宁窗，重叠值为50，效果良好。

1.2.3 分类算法

BP算法由Rumelhart，Hinton和Williams于1986年提出[13]，是一种按照误差反向传播算法训练的多层前馈神经网络，基于梯度下降的误差函数优化，因为利用了神经网络的层次结构，显著提高了计算效率，一般分为3种层次，有输入层、隐藏层、输出层。其中输入层，输出层一般只有1层，而隐藏层取决于具体实例的学习进程，可以设置多层次。激活函数采用sigmoid函数，在前馈网络中，输入信号经输入层输入，通过隐层计算由输出层输出，输出值与标记值比较，若有误差，将误差反向由输出层向输入层传播，在这个过程中，利用梯度下降算法对神经元权值进行调整。通过多次调整权值(神经元节点权系数)来实现在多组输入值情况下，输出值与预期值的逐渐拟合(即使两者间误差函数减小)，是当前工程应用最广泛的一种人工神经网络。

2001年Breiman提出了随机森林算法[14]，随机森林属于集成学习的一种，集成学习主要通过生成多个弱分类器，每个分类器各自单独地学习并做出预测，然后将这些预测结合成组合预测，从而实现一个预测效果更好的分类器。通过样本和特征生成大量的决策树构成随机森林，每棵决策树会有一个预测结果，最后投票最多或者取平均得到最终的预测结果。随机森林适合进行回归或者分类任务。

1968年Cove、Hart 提出KNN 算法[15]，属于监督学习的一种，主要原理是当预测了一个结果时，通过多数表决计算结果距离最近的K个点的类别归属，然后判断结果属于哪个类别。主要思想就是“人以类聚，物以群分”，算法主要关注距离度量、分类决策以及K值的选择，其中K值的选择直接会影响预测结果，一般通过交叉验证选择最优的K值。KNN算法操作简单，易于理解和完成，尤其适合于多分类问题。

在1995年，C.Cortes 和 Vapnik等人首次提出SVM算法[16]，是机器学习典型的分类方法之一，SVM在处理小样本数据中有很强的优越性，因此在广泛领域中有所应用。主要思想是在特征空间中寻找间隔最大的分类超平面，从而进行数据二分类。由于SVM是一个凸优化问题，因此线性和非线性的问题都适用，所求的解是全局最优解，同时理论基础比较完善，算法思想成熟，也适用于高维样本空间，但不适合超大数据集。

GoogLeNet[17]是2014年C.Szegedy提出的一种CNN的变种网络模型结构，由于VGG、LeNet等算法都是由不同神经网络模块串联而成，神经网络深度不断增加导致模型参数巨大并且容易过拟合，而GoogLeNet采用并联网络块Inception，通过结构优化来提升模型泛化能力并降低模型参数。1×1卷积核能提取到更丰富的特征，因此若要大批量计算核卷积，可以使用1×1 卷积进行合理降维。GoogLeNet网络包括22个带参数的层，独立成块的层主要有100个左右，另外网络中间的层次生成的特征很有区分性。目前通过不断迭代，发展出了Inception-V1、Inception-V2、Inception-V3、Inception-V4、Inception-ResNet等版本。

1.3 分类测试结果

现场测试管道距离控制室554米，现场附近有行车通道，属于山区，较为安静，平时机械破环和人行走事件比较多，若有列车经过或者动物经过会出现干扰，用于此次实验测试的数据在现场同一个位置进行采集，此采集点埋深较浅，干扰信号较小，非常适合用于信号采集。

如表1所示，BP运行总准确率99.5%，榔头敲击有一次误报成人跳跃可能是由于动作频率接近，导致混淆。在实际运用过程中，人跳跃行为误报发生的概率比较低，现场大多数人都是正常行走。

表1 BP算法混淆矩阵结果对比 %

如表2所示，根据混淆矩阵计算可知随机森林运行准确率88.3%，噪声、人跳跃、人工挖掘均有不同程度的误报。

表2 随机森林算法混淆矩阵结果对比 %

如表3所示，根据混淆矩阵计算可知KNN运行准确率84.2%，六类事件均有不同程度的误报。

表3 KNN算法混淆矩阵结果对比 %

如表4所示，根据混淆矩阵计算可知SVM运行准确率73.3%，六类事件均有不同程度的误报。

表4 SVM算法混淆矩阵结果对比 %

如表5所示，GoogLeNet运行准确率93.3%，机械破环有一次误报为榔头敲击，噪声有三次误报为人工挖掘，人跳有一次误报为人工挖掘，三次误报为榔头敲击。

表5 GoogLeNet算法混淆矩阵结果对比 %

综上分析，分类准确率较高的为BP和GoogLeNet算法，机械破环和人工挖掘以及人跳跃有一些混淆误报。其中BP系统测试稳定性好，可以良好地用于现场事件分类。

2 测试方案及现场测试

2.1 实验测试方案

2.1.1 Φ-OTDR实验原理

由Taylor 等[18]首次提出的Φ-OTDR 系统，与传统光时域反射计(OTDR，optical time-domain reflectometer)相比，其注入光为强相干光，输出为后向散射光的相干干涉光。当外界压力或者变化作用于某一点的传感光纤时，传感光纤的折射率会发生变化，导致这点的瑞利散射受到影响产生了相位调制，整个传感光纤系统就是通过解调现场测试每个点的瑞利散射光脉冲信号的强度或相位信息，最后测量输出光电流的变化进行分布式传感。由于这一特性，使得Φ-OTDR系统能够探测出现场一些微弱的扰动。

Φ-OTDR系统使用激光器经声光调制后，将相干脉冲光通过环形器注入现场的传感光纤，当测试现场发生扰动后，传感光纤产生的后向瑞利散射光返回至光纤前端，然后瑞利散射光通过环形器，其中强度解调型 OTDR，环形器的光通过光电探测器进行接收后通过解调单元进行外界扰动事件的还原，主要用于定位外界应变，而对于相位解调型Φ-OTDR，环形器的光通过干涉仪进行解调或者相干解调，因此外界发生的事件与干涉信号的相位成正比，主要用于确定外界应变的大小、相位和频率。当现场光纤线路上入侵位置发生扰动[19]，入侵位置的光强将与前一时刻没有入侵时的光强不同，通过当前时刻的信号与前一时刻信号连续相减，确定现场线路实时的光强差异，可以定位线路上的入侵位置[20]。

2.1.2 Φ-OTDR实验方案

由于Φ-OTDR系统的激光器的线宽越窄，测试灵敏度越高，测试现场外界扰动的效果也越好。本次实验采用激光线宽为100 Hz的窄线宽激光器，激光器中心波长为1 550 nm、功率为20 mW。激光器的光通过耦合器，设置比例9：1，再通过光纤声光调制器形成光脉冲，通过循环器传送至传感光纤中，将返回的瑞利散射光通过耦合器，设置比例3：3，最后将光电转换后的信号，通过滤波器，经过解调电路进行解调，输出最终结果。系统光纤放大器的增益均为15 dB，数据采集卡采用简仪科技PCle-9802DC，数据采集卡和声光调制器采用同一发生器进行调制，脉宽设置为100 ns，数据采集卡采样频率设置为250 MSa/s，布置传感光纤的总长度为12 000 m，采用单模光纤，纤芯光折射率为1.48，采样点12 000个。每一次采样的间隔是重复频率，每次采集的数据量不变。

2.1.3 现场测试背景介绍

目前现场管道发生事故原因的很多，有的是因为管道质量未达标，比如管道本身有缺陷或者焊接质量不佳容易损坏，这是由于管道自身的问题导致发生事故，也有管道遭到外界的影响导致发生事故，比如腐蚀、人工挖掘、自然灾害等等。这其中由外在原因或第三方施工破坏引发的管道事故，例如机械破环会钻破管道，可能使石油大量泄漏，导致环境污染并引发爆燃，是目前管道维护中，最频繁、最重要的问题，约占事故总数的49.7%，给管道安全可靠运行带来了最严峻的挑战。导致第三方施工破坏的原因主要是施工单位管理不到位、施工作业人员安全意识不强、赶工期、施工作业不规范、违规施工等，由于管道第三方施工破坏的形式是复杂的、多样的，具有不可控制性和随机性。因此，需要对管道现场进行各种外界事件的实时监测，是进行管道保护的重要手段。

中石油某管道敷设处于川南地震活跃带，土地资源稀缺，管道占压与非法机械破坏风险较大，尤其对管道附近小型施工活动难以及时发现。此次实验以管线里程桩为基础，30～50米为一个测点间隔，沿线逐一标定光缆实际位置在系统中的位置信息。以1米为振动跨距间隔，4米为埋深找到信号最强烈的点，在系统中对应实际光缆的位置信息，进行全程标定。

图1为分布式光纤振动监测预警系统[14]，其监测范围20公里。通过和管道同沟敷设光缆中的一芯光纤连接各个场站的设备将数据传送至放置在天然气压气站中控室内的主机，最后将主机的数据上传至监控终端完成整个系统的预警显示。

图1 现场监测系统布置示意图

现场中控室主要包括显示器、光学解调系统及工控机等。监控终端使用自主研发的软件，系统软件负责信号处理、威胁事件识别、数据存储、报警管理等任务。系统软件主要包括如下功能模块：系统权限、告警显示、断缆监测、故障报警、报表统计、事件定位等功能。

基于Φ-OTDR的分布式光纤传感系统对油气管道附近的现场振动信号进行了采集，分别包括噪声、机械破环、人工挖掘、榔头敲击、人跳跃以及人踏步通行6类事件，共计100组数据。其中机械破环持续时间为1分钟。

在现场测试中，对于每类振动信号，保存多组测量数据，以便于进行信号分析。在管道上施加各类信号的测量结果进行分析比较。在不同振动信号的施加过程中，解调仪获取的光纤光栅中心波长变化范围不同。对信号进行STFT分析，首先通过基于 “wname”的正交小波函数，对信号进行硬阈值滤波，然后每间隔一秒，对信号添加窗长256的汉宁窗，最后进行重合点数为250，快速傅里叶变换(FFT，fast fourier transform)点数为256，信号采样率为3 000 Hz的STFT函数分析，生成时频域图片，六类事件的时频谱大小皆不同，能够满足对以上几类事件的频谱区分。傅里叶变换只能获取信号总体上包含哪些频率的成分，而STFT处理可以对各成分出现的时刻加以展现。另外对于信号中的突变，傅里叶变换很难及时捕捉。而STFT可以捕捉信号的突变，可以得到不同事件的不同信号图。

通过图2～7可以看出，噪声的波形图随机无规律，频率在15 Hz左右，机械破环有周期规律，频率40 Hz左右，人踏步通行和人工挖掘都是1 s左右进行一次实验，能明显从频率图上看出，有土壤进行缓冲，信号逐渐衰减，人踏步通行频率在20 Hz左右，人工挖掘频率在20～60 Hz左右，人跳跃频率在40～100 Hz左右，榔头敲击衰减慢一些，跟土壤接触面积大，频率从0～100 Hz都有。

图2 噪声振动信号变化图

图3 机械破坏振动信号变化图

图4 人踏步通行振动信号变化图

图5 人跳跃振动信号变化图

图6 人工挖掘振动信号变化图

图7 榔头敲击振动信号变化图

3 测试结果及对比分析

3.1 BP与传统方法对比

如表6所示，通过对比分析BP的总分类准确率99.5%最好，机械破环误报率0%和人工挖掘的误报率0%最低，由于BP神经网络具有高度自学习和自适应的能力，通过学习自动提取输出、输出数据间的“合理规则”，并自适应地将学习内容记忆于网络的权值中，通过权值的不断迭代可以达到一个比较好的分类效果。随机森林可能有很多相似的决策树，掩盖了真实的结果影响结果稳定性，KNN中k值大小的选择影响实验结果，SVM通过对特征空间划分的最优超平面，特征平面选择会限制影响最终结果。

表6 机械破坏和人工挖掘效果对比 %

3.2 BP与深度学习方法对比

如表7所示，通过对比分析BP机械破环和人工挖掘误报率最优，并且总分类准确率BP高于GoogLeNet，小样本条件下的深度学习容易过拟合，分类效果也容易受影响，结果不稳定，同样的数据量下，BP的分类结果比GoogLeNet更稳定一些。综合来看BP方法简单成熟，最终分类的效果适用实际现场应用。

表7 机械破坏和人工挖掘效果对比 %

4 结束语

本文提出了一种基于STFT对振动事件进行图像化的监测方法，并搭建了现场监测系统。利用OTDR分布式传感的方法来监测管道周围的振动情况，阐述了振动信号监测的原理，并在中石油西南某管道上进行现场实验。测试过程中将采集到的振动信号预处理后通过短时傅里叶变换转换成时频域图像，通过BP、SVM、GoogLeNet等方法对噪声、机械破环、人工挖掘、榔头敲击、人跳跃以及人踏步通行6种基本类型的现场事件进行分类测试，使用BP算法进行分类，机械破环的预警误报率低至0%，人工挖掘的预警误报率低至0%，随机森林算法误报率为10%，KNN算法机械破坏和人工挖掘的误报率都为10%，SVM算法机械破坏的误报率为10%，人工挖掘的误报率为25%，因此BP算法的误报率最低。

现场测试结果表明实际工程应用中可以基于BP系统对管道附近发生的噪声、机械破环、人工挖掘、榔头敲击、人跳跃以及人踏步通行6种现场振动信号进行监测。本系统的优势在于对现场复杂多事件发生情况下，系统对于机械破环以及人工挖掘事件的误报率依然非常低，能够满足现场的实际应用，避免管道非法开挖、第三方破坏及其引发次生灾害事故的发生，实时地监测现场管道周围发生的各类事件，确保管道的安全运行，减少人力物力等维护成本，保护人民的生命财产安全以及周边环境。