基于变分模态分解和改进模糊支持向量机的汽轮机故障诊断方法

2019-03-23 01:20
关键词:故障诊断聚类模态

, ,

(上海电力学院自动化工程学院, 上海200090)

汽轮机是现代工业生产中不可或缺的设备, 与此同时, 汽轮机产生故障的危险性也不可避免。 例如当汽轮机出现转子不平衡故障时, 会造成转子局部损坏, 缩短设备使用寿命, 因此, 对汽轮机的运行状态进行及时监测与分析具有十分重要的意义[1-3]。

信号特征提取是利用人工智能技术进行故障诊断的初始步骤,目前应用在汽轮机故障诊断上的特征提取方法主要包括快速傅里叶变换、经验模态分解(empirical mode decomposition, EMD)等,这些方法大都存在不足,比如EMD在分解中存在端点效应和模态混叠现象,影响故障诊断的识别精度。 Dragomiretskiy等[4]通过理论推导提出变分模态分解(variational mode decomposition, VMD)方法,可以将不同中心频率的各个模态估计出来,其本质是一组自适应维纳滤波器,区别于EMD采用的非递归模式分解,避免了递归模式下包络线估计误差的不断累加,能够抑制模态混叠现象的发生,有效地提高故障诊断的准确度。

支持向量机(support vector machine, SVM) 是一种基于统计学习理论的机器学习方法,具有严格的数学统计基础。在多年的研究和发展后,SVM已经在振动故障诊断领域有了一定的应用基础[5-6],但是,这种方法存在亟待优化之处。首先,SVM的训练样本通常过多过杂,导致部分样本和最优超平面的距离较远,影响样本分类精度;其次,SVM的参数选择也会干扰分类的结果。

针对以上传统SVM存在的问题,Lin等[7]和赵克楠等[8]提出了模糊支持向量机(fuzzy support vector machine, FSVM) 算法。这种算法通过给不同的样本加上不同的模糊隶属度值,进而反映不同样本间的重要程度,但是,该算法中没有明确定义模糊隶属度值的计算方法。张战成等[9]研究了一种加快支持向量机分类的算法,其通过训练SVM并对支持向量集采取模糊C均值聚类(fuzzyCmean, FCM),将获得的聚类中心当作新的支持向量来优化分类,但是,这一方法对影响FSVM算法结果的参数没有进行优化处理。

基于上述研究, 本文中提出了基于VMD和FSVM的汽轮机故障诊断方法。 首先,采用VMD从振动信号中分解模态分量,计算各分量的样本熵值,构造特征向量;其次,通过核模糊C均值(kernel fuzzyCmean, KFCM)算法求取向量的模糊隶属度值,建立基于FSVM的故障识别模型,并应用粒子群优化(particle swarm optimization, PSO)算法来解决FSVM的参数优化问题;最后,通过RK4转子试验台模拟汽轮机故障,获得实验数据,将本文中提出的诊断模型与传统支持向量机和经过粒子群优化算法优化的支持向量机的诊断模型相比较,以验证本文中所提出的算法在减少训练时间、提高故障诊断效率方面的优越性。

1 变分模态分解

1.1 变分模态分解原理

VMD将输入信号s(t)分解为若干个中心频率为ωk的模态分量uk(t),uk(t)即为调幅- 调频信号[10]。

uk(t)=Ak(t)cos[φk(t)]

(1)

假设每个模态都具有中心频率的有限带宽,变分问题描述为寻求k个模态函数uk(t),使得每个模态的估计带宽之和最小,约束条件为模态相加之和的原始输入信号s(t)。对于每个模态信号首先通过Hilbert变换得到uk(t)解析信号,之后加入预估中心频率e-jwkt,使频谱调制到相应的基频带

(2)

通过计算解调信号梯度的平方L2范数,估计出分解的各个模态信号的带宽,变分问题表示为

(3)

VMD中采用交替方向乘子法(alternate direction method of multipliers, ADMM)解决变分问题,二次惩罚因子α和拉格朗日乘法算子λ(t)将约束性问题变为非约束性问题,其中,α可以在高斯噪声存在的情况下保证信号的重构精度,拉格朗日乘法算子使得约束条件保持严格性。扩展的拉格朗日表达式为

(4)

(5)

中心频率的更新方法为

(6)

1.2 样本熵

样本熵是基于近似熵的一种用于度量时间序列复杂性的改进方法,样本熵的计算不依赖数据长度,计算速度快,精度高,可以对振动信号进行有效分析[11]。

样本熵S的计算公式为

S= -ln[Bm+1(r)/Bm(r)]

(7)

式中:m为整数, 表示比较向量的长度;r为实数, 表示相似度的度量值;Bm(r)、Bm+1(r)分别为m、m+1时的数据平均相似度。通过实验对比可知,参数m一般取1或2;参数r=0.1~0.25std,其中std表示原时间序列的标准差。

2 基于模糊支持向量机的故障诊断模型

2.1 KFCM算法计算模糊隶属度值

KFCM聚类算法是通过隶属度确定每个数据点属于某个类的程度,从而划分数据点类别[12-13]。输入样本集X={x1,x2, …,xi, …,xn},应用高斯核函数把X映射至特征空间T中展开聚类。

在空间中KFCM的目标函数表达式为

(8)

式中:V为聚类中心矩阵;vj是第j个聚类中心;d2(xi,vj) =k(xi,xi) -2k(xi,vj) -k(vj,vj),表示xi到vj的距离;m(0≤m≤1)为模糊指数;U为隶属度矩阵;μji表示第i个样本属于第j类的隶属度,它满足约束条件

(9)

通过式(8),使用Lagrange法求解Jm,计算出隶属度μji以及聚类中心vi的表达式,

(10)

(11)

KFCM的详细计算过程如下:

步骤1 初始化聚类的个数c、模糊参数m(0≤m≤1),确定终止参数ζ;

步骤2 由式(10)更新聚类中心矩阵V;

步骤3 根据式(11)计算模糊隶属度μji;

2.2 FSVM算法

为了降低特征不明显的样本对SVM的分类准确性造成的影响,FSVM利用模糊隶属度函数来模糊化输入的样本,对于重要程度不一样的样本赋予不一样的隶属度值[14]。假设每个样本所在类的隶属度为μi,则模糊化的输入样本为S={(x1,y1,μ1),(x2,y2,μ2), …, (xn,yn,μn)},样本中xi∈n,yi∈{-1,1}。σ≤μi≤1(i=1,2,…,n),其中σ是足够小的正数,μi表示向量xi属于类别yi的程度。在非线性情况下引入变换φ(xi):n→T,把样本从输入空间n映射到高维特征空间T,将求解FSVM最优超平面问题转换为规划问题

(12)

其约束函数为

yi[ωφ(xi)+b]≥1-ζi,ζi≥0,i=1,2,…,l,

(13)

式中:ω是分离超平面的向量;F代表惩罚因子;ζi表示对FSVM错误分类的统计,模糊隶属度值μi越小,其对应的样本点xi对上述规划问题的目标函数所起的作用就越小。这个规划问题可以通过构造拉格朗日表达式并将其转化为二次规划问题来解决。

(14)

等式的约束条件为

(15)

式中αi≥0,是Lagrance乘子。

相较于传统的支持向量机的二次规划问题, 上述二次规划问题的不同之处在于约束条件的改变, 隶属度μi作为权值加入等式中, 假设输入样本显示为αi>μiF, 则该样本不属于这一分类。 在等式中,k(xi,xj)为核函数,本文中选取RBF核函数,它的表达式为

(16)

式中σ为核带宽。这样可以得到FSVM的模型表达式

(17)

2.3 多分类FSVM模型构建

FSVM本质上是为二元分类而设计的。为了构造能够进行多分类诊断的FSVM,采用一对多(one-against-other)的方法用于构造多分类FSVM模型。

首先,优先级最高的一类被认为是正类,其余的H-1类别被认为是负类。 构建一个名为FSVM1的二进制FSVM分类器。其次,排除第1个正类,将分类器变成H-1类分类问题。剩余类别优先级最高的一类被认为正类,剩下的(H-1)-1设为负类。构建第2个二进制FSVM分类器FSVM2。 重复这些步骤直到构建了名为FSVMH-1的最后一个二进制FSVM分类器。这样,H-1个二进制FSVM可以构造用于H类分类问题的情况。

图1显示了采用一对多方法的多类FSVM分类器的故障诊断框架。 如果需要诊断未知故障样本xi(i=1,2,…,n), 则首先将xi的故障特征输入到FSVM1。 当FSVM1的输出为1时,xi被诊断为故障类型1并且分类过程结束。 如果FSVM1的输出为-1, 则将xi的故障特征输入到FSVM2。 按照这个定律, 故障诊断过程将继续进行, 直到FSVMH-1为1, 否则xi被诊断为故障类型H, 分类过程结束。

2.4 PSO算法优化FSVM的相关参数

在FSVM模型中,需要优化的主要参数包括核带宽参数σ以及惩罚因子F。其中参数F是用来权衡损失和置信范围之间的权重, 参数σ则可以反

FSVM—模糊支持向量机。图1 多分类模糊支持向量机分类器的故障诊断框架

映训练样本的特征[15]。这2个参数对模型的分类精度会产生较为明显的影响,传统FSVM算法采用交叉验证的方法来对参数进行优化,但是这种方法寻优花费的时间较长,本文中采取PSO算法来寻找FSVM中的有关参数。

通过PSO算法对FSVM的2个参数F和σ优化。寻优的具体步骤如下。

步骤1 设置粒子群的惯性权重、学习因子、迭代次数以及种群规模,确定需要优化的2个参数的极值以及迭代速度的范围。

步骤2 定义适应度函数。本文中采取基于G倍交叉验证的方法来确定适应度值f。

,

(18)

步骤3 对粒子进行速度和位置更新,比较更新粒子的个体最优适应度值和群体最优适应度值。

步骤4 确定是否达到终止条件,满足则结束运算输出最优解,否则返回步骤3。

2.5 故障诊断的具体步骤

基于KFCM及PSO的FSVM对汽轮机进行故障诊断的具体步骤如流程图2所示。

VMD—变分模态分解;KFCM—核模糊C均值;FSVM—模糊支持向量机;PSO—粒子群优化。图2 基于KFCM及PSO算法的FSVM实现流程框图

1)采用VMD算法对信号进行分解,选择包含故障信息的前m个IMF,分别计算出各模态分量的样本熵,将其作为特征值构造特征向量,并将其划分为训练集和测试集。

2)采取KFCM算法对特征向量训练集进行聚类划分。 按式(9)、(10)更新模糊隶属度值以及聚类中心, 直到满足条件后, 保存每个样本的隶属度值μji。

3)建立基于FSVM的故障诊断模型,通过PSO算法优化相关参数,将特征向量输入模型进行训练。

4)将测试样本输入故障诊断模型中检验模型精度。

3 故障诊断实验

3.1 故障模拟实验

发电系统是一个大功率系统, 很难直接在真实的汽轮机组运行环境中验证所提出的方法, 因此本文中提出的方法是在模拟实验台上进行验证。 如图3所示, 本文中采用本特利RK4转子模拟实验台对汽轮机转子故障进行模拟, 分别模拟转子不平衡、 转子不对中和动静碰磨3种常见故障状态和正常状态, 通过电涡流探头组件提取振动信号, 设置电机的转速为3 000 r/min, 数据采集系统的采样频率为4 000 Hz, 在每一种工况下采集40组数据实验数据,其中的20组样本组成训练集, 20组样本组成测试集。

图3 本特利RK4转子模拟实验台

3.2 仿真及实验结果分析

本文中采用VMD方法分解实验样本数据,选择可以明显表示故障特征的IMFS分量, 并计算这些分量的样本熵值构造特征向量。 以转子不对中为例, 其原始振动信号如图4所示, 振动信号经VMD分解为一系列从高频到低频的信号, 选取包含主要故障信息的前4个IMFS分量, 如图5所示。 故障特征向量定义为T=(E1,E2,E3,E4), 其中E为各模态分量的样本熵值, 然后将特征向量输入到改进的FSVM诊断模型中进行训练和测试, 结果如图6所示。

图4 转子不对中故障原始信号

为了更好地验证本文中提出的算法在汽轮机故障诊断上的优化程度,下面分别采用VMD结合SVM、EMD结合PSO - SVM这2种诊断方法进行对比实验,图7、8所示分别为VMD - SVM、 EMD - PSO -SVM的诊断结果。从图中可以看出,这2种故障诊断准确率与本文中提出的算法存在差距。图9为转子不对中故障数据通过EMD所得到的模态分量和频谱图。从图5中可以看出,VMD可以很好地将仿真信号各个成分分离开,且各个分量和仿真信号都很接近, 而利用EMD方法处理后得到5个IMF, 但是在图9中看到IMF1、 IMF2存在模态混叠现象,相比之下通过VMD提取模态特征效果更好。

(a)模态分量 (b)频谱图图5 转子不对中原始振动信号经变分模态分解后的模态分量及其频谱图

图6 变分模态分解- 粒子群优化-模糊支持向量机训练测试集分类对比

图7 变分模态分解结合支持向量机方法的训练测试集分类对比

图8 经验模态分解- 粒子群优化- 支持向量机方法的训练测试集分类对比

用3种方法将故障分类的成功率与分类时间进行对比,结果如表1、2所示,其中分类精度是估计分类器性能的主要指标,每个类的分类精度Ac和平均分类精度Aac分别定义如下。

(19)

(20)

(a)模态分量 (b)频谱图图9 转子不对中故障数据经过经验模态分解后的模态分量波形及其频谱图

表1 不同诊断模型的分类结果

表2 不同诊断模型的结果

表1中的参数F和σ是采用3种不同的算法对样本数据进行分类后所得的参数,其中SVM采用的是交叉验证的参数优化策略,后两者利用PSO算法对模型的参数进行优化。从表1、2中数据可以看出,EMD - PSO - SVM与VMD - SVM相比, 分类准确率更高,但是在经过优化寻找SVM相关参数的最优值后它的分类时间略高于VMD - SVM;VMD - PSO -FSVM跟PSO - SVM相比,经过VMD算法提取故障特征以及核模糊C均值算法计算隶属度以优化故障诊断模型后,无论是不同种类的分类准确率还是总体测试样本的分类准确率都有提升,而且改进的FSVM能够更快地找到最优适应度值,使算法进行分类的时间减少。综上所述,VMD - PSO - FSVM在提高分类效率和准确率方面都更好,综合性能更佳。

4 结论

在传统故障诊断方法的基础上,本文中采用VMD算法来分解故障样本,通过样本熵提取故障特征值,能够有效地改善EMD中存在的模态混叠现象,为建立故障诊断模型打下良好的基础。采用核模糊C均值聚类算法和粒子群优化算法的模糊支持向量机算法对汽轮机常见振动故障数据进行识别。这种新算法中FSVM为分类模型,其核函数选择RBF核函数;VMD算法结合样本熵用于提取故障特征向量,KFCM算法用于确定FSVM训练样本的模糊隶属度值; PSO算法用于优化FSVM的2个重要参数(惩罚因子、核带宽参数)。仿真结果表明,本文中提出的算法能够准确地对故障进行分类,且在提高训练速度的同时,能够保证分类的准确率,对于汽轮机故障诊断的研究展示了一种新的思路。

猜你喜欢
故障诊断聚类模态
基于BERT-VGG16的多模态情感分析模型
多模态超声监测DBD移植肾的临床应用
基于包络解调原理的低转速滚动轴承故障诊断
跨模态通信理论及关键技术初探
基于K-means聚类的车-地无线通信场强研究
数控机床电气系统的故障诊断与维修
基于高斯混合聚类的阵列干涉SAR三维成像
基于Spark平台的K-means聚类算法改进及并行化实现
因果图定性分析法及其在故障诊断中的应用
基于改进的遗传算法的模糊聚类算法