基于EEMD-kNN的工业过程微小故障检测

2023-05-08 03:15郭小萍滕佳岐
计算机应用与软件 2023年4期
关键词:误报率变量样本

郭小萍 滕佳岐 李 元

(沈阳化工大学信息工程学院 辽宁 沈阳 110142)

0 引 言

在工业生产过程中,随着某些设备老化、元器件磨损等情况的发生,可能会出现一些从小到大、自弱至强缓慢变化的、早期特征不明显的异常状况,文献中通常称其为微小故障,这种微小故障的及时有效检测,将会避免严重的系统事故或造成停工等状况出现[1-2]。数据驱动故障检测方法得到了广泛应用并取得了可喜的成果,如主成分分析(Principal Components Analysis, PCA)、独立主元分析(Independent Component Analysis,ICA)和kNN等[3-4]。然而,这些方法在从过程数据中提取局部微弱特征信息方面存在不足,不能及时识别过程发生的微小故障。葛志强等[5]提出MCUSUM-ICA-PCA方法,将传统的单变量累积和控制图扩展为多变量形式,并结合了ICA和PCA,改善了检测效果。邓晓刚等[6]提出一种双层局部核主元分析(Double-Level Local Kernel Principal Component Analysis, DLKPCA)的故障检测方法,通过用贝叶斯融合算法,对每块的结果进行融合,并从样本和变量两个角度发掘数据的局部信息。Du等[7]将EEMD与PCA相结合应用于过程微小故障检测。然而,这些方法都通过结合PCA等线性方法完成,将其用于具有较强非线性特征的过程进行微小故障的检测时,检测效果会受到影响。

针对非线性过程微小故障的检测,本文提出一种基于EEMD-k近邻的故障检测方法。该方法在EEMD分解原始建模数据获得的本征函数(Intrinsic Mode Function, IMF)空间引入kNN规则,通过构造的加权因子,更好地提取原始建模数据的非线性特征,实现原始样本的重构。然后,在重构空间再一次采用kNN提取样本的非线性等特征,同时构建k近邻统计量并计算其累积和,通过核密度估计法确定统计量控制限。最后通过一个数值案例和TE(Tenessee Eastman)过程的仿真实验验证了所提方法的有效性。

1 基础理论

1.1 集合经验模态分解

集合经验模态分解通过引入白噪声解决了模态混叠问题,该算法基本步骤为[8]:

(1) 向原始信号中加入个高斯白噪声得到,即:

y(t)=x(t)+σn(t)

(1)

式中:n(t)是高斯白噪声。

(2) 通过EMD计算y(t)的q个IMF分量ci(t),i=1,2,…,q。

(3) 重复前两步L次,得到IMF的集合:

(2)

其中,每次的高斯白噪声不同,但个数相同。

(4) 求IMF的平均值:

(3)

1.2 kNN规则

kNN规则的基本思想是利用样本与其局部邻域之间的累积距离来度量样本间的差异。在训练样本集中,正常样本都是相似的,但故障样本应与正常样本不同。kNN利用样本局部最近邻的累积距离来表示样本间的相似度,并通过式(4)计算样本与其前k个近邻样本的距离平方和[9]。

(4)

1.3 累积和(CUSUM)方法

(5)

2 基于EEMD-kNN的故障检测方法

图1为EEMD-kNN方法的流程,包括离线建模和在线监视两个部分。

图1 EEMD-kNN方法流程

2.1 离线建模

(1) 采用EEMD方法进行数据分解。

将m个变量的q个IMF按照顺序排序,获得q个数据集为:

(6)

(7)

(3) 构造加权因子γj(t),表示为:

(8)

式中:b为大于1的数值。

i=1,2,…,m,j=1,2,…,q

(9)

2.2 在线检测

(1) 对测试数据y进行EEMD分解,分别获得q个IMF平均分量。

3 仿真实验

3.1 数值案例

采用的数值模型[11-12]如式(10)和式(11)所示。

(10)

t(k)=0.811t(k-1)+0.193w(k)

(11)

式中:x1、x2、x3为过程变量,t为内部变量。ei(i=1,2,3)服从期望为0,标准差为0.01的高斯分布,w服从a=0.01,b=2的均匀分布。本文通过式(9)和式(10)收集400组样本作为训练样本。产生两种带故障的测试样本,每种400组。两种故障的设置规则分别为:

故障1:从第101个样本开始,在x2中加入振幅为-0.5的小阶跃偏差;

故障2:从第101个样本开始,在x1中加入斜率为0.003的斜坡变化。

以故障2为例,采用传统kNN、EEMD-PCA和本文所提的EEMD-kNN方法的故障检测结果如图2所示。

图2 故障2检测结果

图2(a)和图2(b)显示,EEMD-PCA方法的两个统计量的检测率分别为10.67%和33.67%,由图2(c)可以看出,传统kNN方法对故障2的检测效果不太理想,检测率为59.33%,大部分故障没有被检测出来。图2(d)显示EEMD-kNN方法检测效果明显提高,并且有着较低的误报率,第187时刻检出故障,故障检测率为71%。

采用三种方法对两种故障进行故障检测实验的误报率和检测率汇总如表1所示。由表1看出,EEMD-kNN有着较低的误报率以及更高的检测率,验证了本文所提方法的有效性。

表1 数值案例误报率检测率汇总表(%)

3.2 TE过程

田纳西-伊斯曼(Tennessee Eastman, TE)过程被广泛用于模拟实际复杂的工业过程系统,并且验证各种故障检测方法。该过程包括41个测量变量、12个操作变量和20种故障,去除搅拌速度常用变量共有52个。文献[13]已经介绍了该过程的详细描述、工艺流程图以及其故障形式。许多过程故障检测方法通过TE过程验证方法的有效性,然而对该过程的故障3、9、15的检测效果不佳[13], 这三种类型的故障传统方法较难检测,其中:故障3是在D进料口温度加一个阶跃类型的故障,由于该故障对过程影响较小,导致许多传统方法检测到该故较为困难;故障9是D进料口温度发生随机变化,也是属于对TE过程影响较小的一种故障,传统的检测方法很难检测到它;故障15是冷凝器冷却水阀门粘住,属于静摩擦类型故障,同样对过程的影响微乎其微[12]。

故障类型与描述汇总如表2所示。

表2 TE过程故障

本文采用TE过程的生产模式1验证本文所提方法的有效性,用于建模的正常工况样本数为480,用于在线监视的故障样本为故障3、故障9和故障15,每一种故障样本的样本数为960,其中前160是正常的,后800为有故障的[13]。

采用本文所提方法对3种故障进行仿真实验,并与kNN方法以及EEMD-PCA方法进行了比较,其中各种参数值的选取通过交叉验证法获得。以故障3为例,给出了较详细的检测结果,如图3所示。图3(a)和图3(b)为EEMD-PCA方法的检测结果,两个统计量的检测率分别为100%和92.13%,但是T2统计量的误报率较高,为70.13%。图3(c)为kNN方法的检测结果,D2检测率只有30.38%,大部分故障没有被检测出来,检测效果不是很好。图3(d)为EEMD-kNN方法的检测结果,检测率为95.62%,误报率为1.25%,有着较高检测率的同时,还保证了误报率。本文所提方法检出故障发生的时间为第195个采样时刻,相比前几种方法,更接近实际故障发生的时刻,体现了本文方法的有效性。

图3 故障3检测结果

三种方法检测三种故障的误报率和检测率汇总如表3所示。进一步可看出,EEMD-kNN方法在保证了较高检测率的同时误报率较低,其中对故障3的误报率仅有1.25%,检测率为95.62%,检测效果比较好。EEMD-PCA方法的T2统计量对故障3的检测率为100%,但是误报率为70.13%。对于故障9而言,kNN方法的检测率较低,未检测到故障,EEMD-PCA方法的T2统计量的检测率虽然为100%,但与EEMD-kNN方法相比,后者的误报率较低。对于故障15,EEMD-kNN的检测率最高,EEMD-PCA方法的两个统计量误报率为0%,但其检测率较低,而且EEMD-kNN的误报率只有3.75%。综上,本文所提方法EEMD-kNN相比其他几种方法,检测效果最好,而且只采用了一个统计量完成,简便有效。

表3 TE过程误报率及检测率汇总表(%)

4 结 语

本文提出了一种基于EEMD和k近邻指标累积和的非线性过程故障的检测方法。该方法采用EEMD方法提取过程变量的本征模态,并通过k近邻距离统计量构造加权因子重构出建模样本。利用重构样本建立k近邻故障检测模型,计算距离统计量并与累积和方法相结合,检测过程出现的早期特征变化不明显、传统方法较难检测的故障。采用数值案例和TE过程进行方法有效性的验证,并与EEMD-PCA和kNN方法进行比较,结果表明本文方法在处理非线性过程故障问题中有着更好的检测效果。所提方法在多工况过程的应用,将是下一步工作重点。

猜你喜欢
误报率变量样本
原始数据动态观察窗法在火灾特征信号融合提取中的应用研究
家用燃气报警器误报原因及降低误报率的方法
抓住不变量解题
用样本估计总体复习点拨
也谈分离变量
钻杆管体超声波探伤误报分析及措施
推动医改的“直销样本”
随机微分方程的样本Lyapunov二次型估计
村企共赢的样本
神经网络技术在网络入侵检测模型及系统中的应用