基于ICA混合模型的多工况过程故障诊断方法

2016-10-14 00:05徐莹邓晓刚钟娜
化工学报 2016年9期
关键词:贡献度贡献变量

徐莹,邓晓刚,钟娜



基于ICA混合模型的多工况过程故障诊断方法

徐莹,邓晓刚,钟娜

(中国石油大学(华东)信息与控制工程学院,山东 青岛 266580)

针对工业过程数据的多模态和非高斯特性,提出一种基于独立元混合模型(independent component analysis mixture model, ICAMM)的多工况过程故障诊断方法。该方法将独立元分析与贝叶斯估计结合,同时完成各个工况的数据聚类和模型参数求取,并建立基于贝叶斯框架下的集成监控统计量实时监控过程变化。在检测到故障后,针对传统的变量贡献图方法无法表征变量之间信息传递关系的缺点,提出基于信息传递贡献图的故障识别方法。该方法首先计算各变量对独立元混合模型统计量的贡献度,进一步通过最近邻传递熵描述故障变量之间的传递性,挖掘故障变量之间的因果关系,从而确定故障源变量和故障传播过程。最后对一个数值系统和连续搅拌反应釜(CSTR)过程进行仿真研究,结果验证了本文所提出方法的有效性。

ICA混合模型;多工况过程;后验概率;传递熵;贡献图

引 言

随着现代工业装置日益复杂化、大型化,如何利用过程监控与故障诊断技术保障其安全稳定运行成为过程控制领域的重要研究课题。由于计算机控制系统的广泛应用,现代工业数据库中存储了大量历史和实时数据,因此基于多元数据统计分析的故障诊断方法成为目前的研究热点,该类方法又称多元统计监控方法,典型的方法包括主元分析方法(PCA)、偏最小二乘方法(PLS)、独立元分析方法(ICA)等[1-2]。其中,ICA方法能够有效处理非高斯性的过程数据,引起了研究人员的广泛关注。

传统的多元统计监控方法假设过程仅在一个正常操作工况条件下运行,然而由于原料变化、市场需求及季节改变等因素,实际的工业过程中往往存在多个正常操作工况。针对该问题,文献[3-4]提出了基于PCA和PLS的多模型方法。该类方法采用多模型策略,通过模型聚类和统计建模两步完成离线建模。文献[5-7]利用局部标准化消除模态之间的差异,从而将多模态数据转化为单模态数据。文献[8-9]通过构造概率PCA模型监控多工况过程。文献[10-12]引入贝叶斯推理方法建立监控统计量的全局监控模型。文献[13]引入间歇过程处理思路,构造模态聚类和模态展开的综合监控框架。文献[14]将高斯混合模型与PCA方法结合起来解决多工况过程监控问题[15-16]。目前的多工况过程故障检测方法多数基于PCA和PLS方法,未考虑到过程数据的非高斯特性。且现有的多工况过程故障检测方法多数涉及到多模态数据的聚类、每个模态数据的统计建模两个独立步骤,两者未能有机融合,从而影响了监控效果。

在检测到故障后,故障变量识别是诊断故障源的有效手段。贡献图法是一种广泛使用的故障变量识别方法,在贡献图中,最高贡献度所指向的变量代表故障根本原因。为提高故障识别精度,许多学者提出了各种改进贡献图方法。文献[17]提出了2和SPE的联合贡献度。文献[18]提出了基于局部全局统计量的故障模式识别方法,弥补了传统统计量的高阶信息的缺失。文献[19]构造了统一相对贡献度,通过故障状态下的贡献度相对正常时刻贡献度的变化来确定最大贡献度。文献[20-21]提出一种二维贡献度方法,使用颜色变化描述贡献度大小。虽然许多学者针对贡献图开展了大量的深入研究,但是现有的贡献图只能提供变量贡献量的数值变化,忽视了故障变量之间的传播关系挖掘。如果能够在现有贡献图的基础上,进一步给出故障变量之间的因果关系,将对有效诊断故障源提供巨大帮助。

针对上述问题,本文提出一种基于ICA混合模型和信息传递贡献图的多工况过程故障检测和识别方法。该方法的主要工作包括两点:(1)针对过程数据的多模态特性和非高斯性,建立一种基于ICA混合模型的故障检测方法,该方法能够将模态数据聚类和统计建模融合在同一个优化算法中,并在贝叶斯框架下建立集成监控统计量。(2)针对故障变量源识别问题,提出一种信息传递贡献图法,在传统贡献图基础上利用最近邻传递熵计算变量统计量之间的传递关系,分析故障根本原因。

1 基本ICA方法

ICA方法起源于盲源信号分离,因为其能够有效提取过程数据中的非高斯特征,引起了过程监控领域许多研究学者的关注[1-2,22]。

ICA优化的目的在于根据原始观测数据获得独立元的估计,如

2 基于ICA混合模型(ICAMM)的多工况过程故障检测方法

传统的ICA方法假定过程仅涉及一个正常操作工况条件,但是实际生产过程往往在多个正常操作工况下运行。如果使用传统方法的单ICA建模策略监控混合多工况的多模态数据,其监控效果并不理想,因此有必要建立一种基于改进ICA的多工况过程监控方法。ICA混合模型(ICAMM)结合独立元分析、概率混合模型和贝叶斯推理,能够有效处理多模态非高斯数据无监督分类问题[23-24],为解决多工况过程监控问题提供了新的思路。

2.1 ICA混合模型

其中,()是数据集中第个样本,为概率密度函数,是密度函数的参数。

在多工况情形下,假设观测数据集来自个正常操作工况,即,表示第个模态,则概率密度函数可用式(4)中的概率混合模型[24]描述。

ICAMM有效地处理了非高斯分布的多工况过程数据的问题,该模型的优化求解目标如式(6)所示

上述优化问题具体求解过程可参考文献[23-24]。

优化求解过程中,可以得到每类模态数据的后验概率为

ICAMM使用ICA模型来描述数据分布情况,聚类过程同时也是识别局部ICA模型参数的过程,可以同时完成数据聚类和ICA统计建模。

2.2 基于ICA混合模型的故障检测

进一步融合全部模态信息,构造集成监控统 计量

3 基于信息传递贡献图的故障识别方法

3.1 基于ICAMM的变量贡献度

当系统检测到故障后,基于传统的贡献图故障识别思路[19],构建适合于多工况过程情形的变量贡献图。测量变量对两个监控统计量的贡献值计算公式为

3.2 基于最近邻传递熵的信息传递贡献图

传统的贡献图在检测到故障后可以识别故障变量,但是却无法给出变量之间的信息传播关系。因此本文通过计算故障变量之间的传递熵,挖掘变量之间的传播关系,构建信息传递贡献图。

(1)传递熵的基本概念

传递熵(transfer entropy)是一种基于信息熵并且可以量化变量之间传递信息的方法[26]。假设给定两个随机序列和,变量传递到的信息流定义为

传递熵具有方向性,因此需要同时计算从传递到的信息流,记为。综合起来,变量到变量的传递熵表示为

(2)最近邻传递熵

传递熵方法计算量大、运行速度慢、精度低。Kraskov等[27]提出了近邻互信息方法估计传递熵,避免了大量的概率密度估计,减小了计算量。根据近邻互信息方法,首先将变量传递到变量的信息流分解为4种不同的信息熵

信息熵的计算需要使用最近邻估计器,称为KL估计器,其表达式如下

式(17)中的4种信息熵中不同维度空间中相同的参数会有不同的,因此在式(18)的基础上需要对低维空间的KL估计公式进行改进[27]

由此,综合式(17)~式(19),可以得到变量传递到变量的信息流

(3)因果矩阵

4 基于ICA混合模型(ICAMM)的多工况故障诊断方法流程

本文提出的故障诊断方法有离线建模、在线监控、故障识别3个部分,如图1所示。具体的步骤如下。

图1 基于ICA混合模型的故障诊断方法框架图

离线建模:(1)对多工况数据集进行数据预处理。(2)进行ICA混合模型学习,完成数据聚类和模型参数求取。(3)对测试数据,在贝叶斯框架下建立集成监控统计量。(4)利用核函数估计方法计算各统计量的95%置信限作为控制限。

在线监控:(5)对实时数据进行数据预处理。(6)在贝叶斯框架下计算集成监控统计量。(7)判断是否超出控制限,超出控制限故障报警。

故障识别:(8)发生故障后,计算变量贡献度。(9)正常平均贡献度与故障平均贡献度对比,取贡献度较大的变量。(10)计算各变量的最近邻传递熵,构建变量因果矩阵。(11)得到信息传递贡献图,确定故障最根本原因。

5 仿真实例

5.1 数值仿真

为进一步验证本文方法的有效性,采用如下的数值例子[29]进行仿真分析。

以该故障为例,将本文方法和ICA方法、PCA混合模型(PCAMM)方法的监控结果进行比较。针对多工况过程,PCA混合模型方法运用高斯混合模型(GMM)对过程数据聚类,并与PCA方法相结合建立PCA混合模型,构建归一化的统计量实现对多工况过程的监控[15-16]。图2为3种方法的监控性能对比结果,其中(a)为ICA方法的监控效果;(b)为PCAMM方法的监控效果;(c)为ICA混合模型方法的监控效果。为方便方法比较,在绘制监控图时,所有监控统计量均除以各自的控制限以使得图中控制限为1。在下面的分析中,故障检测率为超出控制限的故障样本占实际故障样本的百分比。

对于基本的ICA方法,两个监控统计量分别在第407和第401个采样时刻检测到故障,但故障检测率为72.50%和84.75%。对于PCA混合模型方法,2统计量检测故障失败,SPE统计量在第427个采样时刻检测到故障。从故障检测率上看,2统计量的故障检测率为16.75%,SPE统计量的故障检测率为81.50%。相比较,ICAMM方法中两个监控统计量GMI2和GMSPE均在第401个采样时刻发出报警信号,并且各自的故障检测率分别为97.25%和96.5%。从图2中3种方法监控效果对比上可以看出,基于ICA混合模型的方法要优于ICA和PCAMM方法。

图2 3种方法对故障的监控图(数值仿真)

检测到故障后,故障发生后GMI2统计量400个样本的平均贡献图如图3所示。在图中,直方图表示发生故障后GMI2统计量的平均贡献度,折线表示正常时刻GMI2统计量的平均贡献度。图中最大贡献度都是变量,而故障变量应该为。故障源变量定位错误。图4是GMSPE统计量在发生故障后400个点内的平均集成贡献图,其中具有最高贡献度的变量是。两种贡献图中,识别到的故障源不一致,因此需要进一步分析变量之间的因果关系,确定故障源。

图3 检测到故障后的GMI2平均贡献图(数值仿真)

图4 检测到故障后的GMSPE平均贡献图(数值仿真)

针对GMI2和GMSPE平均贡献度,本文比较故障发生后与正常时刻的平均贡献度,得到超出正常时刻贡献度水平的变量,即变量、、。本文计算3个变量之间的传递熵,得到因果矩阵如表1所示。由表1得到信息流从变量传递到变量,然后从变量传递到变量。图5表示故障发生后的信息传递贡献图,其贡献值是两个统计量贡献值的平均,箭头方向表示变量之间信息传递的方向。变量、和之间的传递关系为。由此可以判断故障的最根本原因是变量,与真实的故障情况一致。因此,在基于传统贡献图的故障识别基础上加入最近邻传递熵能够准确高效识别故障源。

表1 因果矩阵(数值仿真)

图5 信息传递贡献图(数值仿真)

5.2 CSTR仿真实例

以连续搅拌反应釜(CSTR)为例,验证本文方法的有效性。在反应釜内发生一级不可逆放热方应,通过夹套冷却剂带走多余热量[5,30]。图6为CSTR系统双串级控制图,分别对反应器的液位和反应器的温度加串级控制,保持液位和反应釜温度稳定。CSTR系统有4个操纵变量,6个测量变量,见表2。为出口物料的浓度,为反应釜温度,为冷却水出口温度,为反应釜液位高度,为出口流量,为冷却水流量,为入口物料的浓度,为入口物料的流量,为冷却水入口的温度,为入口物料的温度。

图6 CSTR系统串级控制图

表2 CSTR系统的变量表

对于图6所示的CSTR系统,建立其机理模型并进行编程仿真,相关机理描述和仿真参数可参考文献[7,30]。对CSTR系统3种不同操作工况进行仿真,分别采集960个样本的数据构成离线建模数据。为测试算法故障监控性能,在正常操作工况仿真过程引入故障生成故障数据集,故障描述如表1所示。所有故障的引入时刻均为第301个采样时刻,每个故障数据集包括960个样本点。

表3 故障情况表

以故障F1为例对本文方法进行分析验证。图7为3种方法对故障F1的监控结果,对于基本的ICA方法,2统计量在第302个采样时刻发出报警信号,SPE统计量没有检测出故障,并且2统计量的故障检测率为77.31%,而SPE统计量的故障检测率为0;对于PCA混合模型方法,统计量2在第303个采样时刻发出报警信号,SPE统计量在第327个采样时刻检测到故障,2统计量的故障检测率为94.86%,而SPE统计量的故障检测率为66.87%;对于ICA混合模型方法,GMI2和GMSPE统计量均在第301个采样时刻检测到故障,并且将故障检测率提高到99.70%和99.85%。因此,在故障F1的监控中,ICAMM方法要比基本的ICA和PCAMM方法的监控效果好。

图7 3种方法对故障F1的监控图(CSTR)

再以故障F2为例进行分析,图8为3种方法对故障F2的监控图。基本ICA方法的2统计量在第641个采样时刻监测到故障,其故障检测率为48.11%,但是SPE统计量检测失败;对于PCAMM,2统计量在第404个采样时刻监测到故障,SPE统计量在第398个采样时刻发出报警信号,故障检测率提高到86.67%和90.47%;与前两种方法比较,ICAMM方法的两个统计量分别在第354和第369个采样时刻检测到故障,故障检测率各自提高到92.74%和91.07%。总体而言,ICAMM能够比ICA和PCAMM方法更好地检测故障F2。

图8 3种方法对故障F2的监控图(CSTR)

综合对比6种故障的检测效果,见表4。从表中可以看出,基于ICAMM方法具有更高的故障检测率。基本ICA方法的2统计量平均故障检测率为78.97%,而SPE统计量的平均故障检测率只为5.04%。PCAMM方法中2统计量的平均故障检测率为91.45%,而SPE统计量的平均故障检测率为67.88%。相比较而言,基于ICAMM的多工况故障检测方法效果优于ICA和PCAMM方法,GMI2和GMSPE统计量的故障检测率分别提高到95.66%和94.78%。综上,本文提出的方法能够更准确地检测到故障。

表4 3种方法的故障检测率

以故障F2为例,检测到故障后的GMI2、GMSPE平均贡献图如图9和图10所示。直方图表示故障发生后统计量平均贡献度,折线表示正常时刻的平均贡献度。GMI2和GMSPE平均贡献度最高的贡献度所指变量均是变量6,即夹套冷却剂入口流量,而实际引起故障F2的故障变量应该是进料浓度af。因此,传统贡献图无法获得真正的故障源。采用本文的信息传递贡献图方法,取故障时刻平均贡献度大于正常时刻变量贡献度的变量,即变量c、c和af,并计算三者之间的传递熵,构造出的因果矩阵如表5所示。

图9 检测到故障后GMI2平均贡献图(CSTR)

图10 检测到故障后的GMSPE平均贡献图(CSTR)

表5 因果矩阵(CSTR)

图11 信息传递贡献图(CSTR)

6 结 论

针对多工况工业过程的故障检测和故障识别问题,本文提出一种基于ICAMM和信息传递贡献图的故障诊断方法。该方法使用ICAMM描述带有非高斯特征的多模态过程数据,在贝叶斯框架下建立集成监控统计量进行故障检测。当检测到故障后,在传统贡献图的基础上分析故障变量之间的信息传播过程,通过最近邻传递熵计算变量的因果矩阵,建立信息传递贡献图,确定故障的根本原因。最后,在一个数值例子和连续搅拌反应釜系统上的仿真结果说明,本文所研究的方法能够更有效地监控过程变化,并准确识别过程故障原因。

References

[1] YIN S, DING S, XIE X,. Review on basic data-driven approaches for industrial process monitoring [J]. IEEE Transactions on Industrial Electronics, 2014, 61 (11): 6418-6428.

[2] GE Z, SONG Z, GAO F. Review of recent research on data-based process monitoring [J]. Industrial & Engineering Chemistry Research, 2013, 52 (10): 3543-3562.

[3] ZHAO S, ZHANG J, XU Y. Performance monitoring of processes with multiple operating modes through multiple models [J]. Journal of Process Control, 2006, 16 (7): 763-772.

[4] ZHAO S, ZHANG J, XU Y. Monitoring of processes with multiple operation modes through multiple principle component analysis models [J]. Industrial & Engineering Chemistry Research, 2004, 43 (22): 7025-7035.

[5] 宋冰, 马玉鑫, 方永锋,等. 基于 LSNPE算法的化工过程故障检测 [J]. 化工学报, 2014, 65 (2): 620-627.
SONG B, MA Y X, FANG Y F,. Fault detection for chemical process based on LSNPE method [J]CIESC Journal, 2014, 65 (2): 620-627.

[6] 钟娜, 邓晓刚, 徐莹. 基于 LECA 的多工况过程故障检测方法 [J].化工学报, 2015, 66 (12): 4929-4940.
ZHONG N, DENG X G, XU Y. Fault detection method based on LECA for multimode process [J]. CIESC Journal, 2015, 66 (12): 4929-4940.

[7] DENG X, TIAN X. Multimode process fault detection using local neighborhood similarity analysis [J]. Chinese Journal of Chemical Engineering, 2014, 22 (11/12): 1260-1267.

[8] GE Z, SONG Z. Mixture Bayesian regularization method of PPCA for multimode process monitoring [J]. AIChE Journal, 2010, 56 (11): 2838-2849.

[9] 卢春红, 熊伟丽, 顾晓峰. 基于贝叶斯推理的 PKPCAM的非线性多模态过程故障检测与诊断方法 [J]. 化工学报, 2014, 65 (12): 4866-4874.
LU C H, XIONG W L, GU X F. Fault detection and diagnosis for nonlinear and multimode processes using Bayesian inference based PKPCAM approach [J]. CIESC Journal, 2014, 65 (12): 4866-4874.

[10] YU J. A new fault diagnosis method of multimode processes using Bayesian inference based Gaussian mixture contribution decomposition [J].Engineering Applications of Artificial Intelligence, 2013, 26 (1): 456-466.

[11] ZHAO Z, LI Q, HUANG B,. Process monitoring based on factor analysis: probabilistic analysis of monitoring statistics in presence of both complete and incomplete measurements [J].Chemometrics and Intelligent Laboratory Systems, 2015, 142 (15): 18-27.

[12] JIANG Q, YAN X. Nonlinear plant-wide process monitoring using MI-spectral clustering and Bayesian inference-based multiblock KPCA [J]. Journal of Process Control, 2015, 32: 38-50.

[13] TONG C, AHMET P, YAN X. An adaptive multimode process monitoring strategy based on mode clustering and mode unfolding [J]. Journal of Process Control, 2013, 23 (10): 1497-1507.

[14] XU X, XIE L, WANG S. Multimode process monitoring with PCA mixture model [J]. Computers and Electrical Engineering, 2014, 40 (7): 2101-2112.

[15] 许仙珍, 谢磊, 王树青.基于 PCA混合模型的多工况过程监控 [J]. 化工学报, 2011, 62 (3): 743-752.
XU X Z, XIE L, WANG S Q. Multimode process monitoring method based on PCA mixture model [J]. CIESC Journal,2011, 62 (3): 743-752.

[16] 孙贤昌, 田学民, 张妮. 一种基于 GMM的多工况过程故障诊断方法 [J]. 计算机与应用化学, 2014, 31 (1): 33-39.
SUN X C, TIAN X M, ZHANG N. Multimode process fault diagnosis method based on GMM [J]. Computers and Applied Chemistry, 2014, 31 (1): 33-39.

[17] YUE H, QIN S. Reconstruction-based fault identification using a combined index [J].Industrial & Engineering Chemistry Research, 2001, 40 (20): 4403-4414.

[18] ZHANG H, TIAN X, DENG X,. A local and global statistics pattern analysis method and its application to process fault identification [J]. Chinese Journal of Chemical Engineering, 2015, 23 (11): 1782-1792.

[19] DENG X, TIAN X. A new fault isolation method based on unified contribution plots [C]//The 30th Chinese Control Conference. 2011: 4280-4285.

[20] ZHU X, RICHARD D B. Two-dimensional contribution map for fault identification [J]. IEEE Control System Magazine, 2014, 34 (5): 72-77.

[21] JIANG B, HUANG D, ZHU X,. Canonical variate analysis-based contributions for fault identification [J]. Journal of Process Control, 2015, 26 (2): 17-25.

[22] LEE J M, YOO C K, LEE I B. Statistical process monitoring with independent component analysis [J]. Journal of Process Control, 2004, 14 (5): 467-485.

[23] LEE T W, LEWICKI M. SEJNOWSKI T. ICA mixture models for unsupervised classification of non-Gaussian classes and automatic context switching in blind signal separation [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2000, 22 (10): 1078-1089.

[24] PALMER J A, KREUTZ-DELGADO K, RAO B D. Newton method for the ICA mixture model [C]//IEEE International Conference on Acoustics, Speech and Signal Processing. 2008:1805-1808.

[25] TONG C, AHMET P, YAN X. Improved ICA for process monitoring based on ensemble learning and Bayesian inference [J]. Chemometrics and Intelligent Laboratory Systems, 2014, 135 (15): 141-149.

[26] BAUER M, COX J W, CAVENESS M H,. Finding the direction of disturbance propagation in a chemical process using transfer entropy [J]. IEEE Transactions on Control Systems Technology, 2007, 15 (1): 12-21.

[27] KRASKOV A, STOGBAUER H, GRASSBERGER P. Estimating mutual information [J]. Physical Review E, 2004, 69 (6): 1-15.

[28] VICENTE R, WIBRAL M. Directed Information Measures in Neuroscience [M]. Heidelberg: Springer Berlin, 2014: 37-58.

[29] GE Z, SONG Z. Multimode process monitoring based on Bayesian method [J].Journal of Chemometrics, 2009, 23 (12): 636-650.

[30] DENG X, TIAN X. Sparse kernel locality preserving projection and its application in nonlinear process fault detection [J].Chinese Journal of Chemical Engineering, 2013, 21 (3): 163-170.

A fault diagnosis method for multimode processes based on ICA mixture models

XU Ying, DENG Xiaogang, ZHONG Na

(College of Information and Control Engineering, China University of Petroleum, Qingdao 266580, Shandong, China)

For the nature of multimode and non-Gaussian distribution in industrial process data, a fault detection method was proposed for multimode processes based on independent component analysis mixture model (ICAMM). In this method, Bayesian inference and independent component analysis (ICA) were combined to create a probability mixture model; the mode classification of each observation by Bayesian inference and ICA model parameters’ setting were accomplished simultaneously; and the global monitoring statistics were established within the Bayesian framework to monitor real-time process changes. In order to solve the problem that traditional variable contribution plot could not indicate the relationships of information transmission among fault variables after fault detection, a fault recognition method for multimode processes was further proposed on the basis of information transfer contribution plot. Three steps were developed in the fault recognition method, including the calculation of variable contributions to the independent component analysis mixture model, the determination of cause-and-effect relationships of fault variables through variable transfer capability and the nearest neighbor transfer entropy, and the finding of fault source variables and fault propagation process. Simulation study on a numerical example and continuous stirring tank reactor (CSTR) system showed effectiveness of the proposed approach.

ICA mixture model; multimode process; posterior probability; transfer entropy; contribution plot

supported by the National Natural Science Foundation of China (61273160, 61403418) and the Natural Science Foundation of Shandong Province (ZR2014FL016).

date: 2016-01-20.

Prof. DENG Xiaogang, dengxiaogang@ upc.edu.cn

TP 277

A

0438—1157(2016)09—3793—11

10.11949/j.issn.0438-1157.20160094

国家自然科学基金项目(61273160,61403418);山东省自然科学基金项目(ZR2014FL016)。

2016-01-20收到初稿,2016-05-23收到修改稿。

联系人:邓晓刚。第一作者:徐莹(1990—),女,硕士研究生。

猜你喜欢
贡献度贡献变量
中国共产党百年伟大贡献
抓住不变量解题
为加快“三个努力建成”作出人大新贡献
也谈分离变量
充分把握教育对经济社会发展的贡献度
基于贡献度排序的肾透明细胞癌串扰通路分析
贡献榜
海洋贡献2500亿
武器装备体系能力贡献度的解析与度量方法
分离变量法:常见的通性通法