基于稀疏性非负矩阵分解的故障监测方法

2015-08-21 07:00王帆杨雅伟谭帅侍洪波
化工学报 2015年5期
关键词:原始数据投影编码

王帆,杨雅伟,谭帅,侍洪波

(华东理工大学化工过程先进控制和优化技术教育部重点实验室,上海 200237)

引 言

随着现代工业过程变得越来越复杂,许多工业过程,如化工过程,通常包含大量高维并且互相关联的数据。在这种情况下,多元统计过程监控(MSPM)方法已经被提出,用来从过程数据中提取有用信息,并将其用来进行系统的故障监测。传统的基于数据的多元统计过程监控方法主要包括主成分分析方法(PCA)、偏最小二乘方法(PLS)、独立成分分析方法(ICA)。这些方法已经被成功地用于化工过程的故障监测。

主成分分析是过程监测与故障诊断研究应用最广泛的一种方法,它通过将得到的样本数据方差进行最优线性降维处理,解决了变量之间的相关性[1]。主成分分析方法提取的特征可以反映出原始数据的全局信息[2]。基于PCA 来进行故障监测的成果已有很多[3-5]。

然而,基于PCA 的故障监测方法,假定过程的潜变量服从多元高斯分布,这与实际的工业情况是不符的,实际过程的一部分变量并不服从高斯分布,这样用PCA 对过程进行监控,势必会导致监测性能不好[6]。而且经过PCA 处理之后,潜变量是互相正交且不相关的。最近出现了一种新的降维方法,叫做非负矩阵分解(NMF)[7],它没有对潜变量的性质进行假设,除了要求其非负。NMF 通过从原始数据中找到一个低秩矩阵逼近,可以产生对原始数据的局部特征的稀疏表示。NMF 在最近几年吸引了越来越多的关注,在许多应用中都有良好的表现,比如数据挖掘和模式识别[8-9]。非负矩阵分解的方法要求非负性,这样在进行分解时就只允许加而非减的组合,使非负矩阵分解方法可以学习局部的基于部分的表示[10]。每一个潜变量激活一个可见变量的子集,或者说是激活一个“部分”。所有的潜变量激活作用叠加在一起,产生一个整体[2]。从这个角度看,NMF 可以找到一个中间表示(基于部分的),介于数据的局部和全局结构之间[11]。

在化工过程故障监测领域,非负矩阵分解方法的应用很少。Li 等[11]提出了应用传统的非负矩阵分解方法进行非高斯过程的故障监测,用仿真实验证明了非负矩阵分解方法可以用于化工过程的故障监测,而且比基于主成分分析的方法有更广泛的应用能力。随后,Li 等[2]又改进了PNMF(投影非负矩阵分解),提出了GNMP(广义非负矩阵投影),主要目的是减轻对原始数据的非负约束。但是,Li 等虽然在文中提到了NMF 可以增强对数据的压缩性和可解释性是由于其基于部分的稀疏表示,也提到了稀疏性是数据压缩的关键属性,但并没有提出关于施加稀疏性的改进。因此,本文提出了采用SNMF(稀疏性非负矩阵分解)[12]方法来进行化工过程故障监测。由于在非负矩阵分解基础上引入了稀疏编码(sparse coding)方法,SNMF 可以得到对数据集更稀疏的表示。另外,对传统的非负矩阵分解得到的原始数据低秩近似矩阵,即系数矩阵H,进行正交化处理,从而在降维时除去变量中的冗余信息,得到更少的投影方向。因为施加了稀疏性和正交化,信息集中到了更少的投影方向上,所以相比于传统的非负矩阵分解方法具有优越性。同时,本文提出的稀疏性非负矩阵分解,其算法中的目标函数和更新策略不同于Li 等所使用的方法。最后用仿真实验证明了在应用于故障监测时,基于稀疏性非负矩阵分解(SNMF)的方法具有可行性。

1 稀疏性非负矩阵分解

1.1 非负矩阵分解

非负矩阵分解是一种线性的、非负的近似数据表示。给定一个非负数据矩阵X⊂Rm×n,NMF 可以找到一个近似的分解,将X分解为两个非负矩阵的乘积,如式(1)所示,

其中,W⊂Rm×k,H⊂Rk×n,k通常选择为(m+n)k≤mn[7]。W是由基向量wi组成的基矩阵,H是由系数向量hi组成的系数矩阵。经过这种分解方法得到的基矩阵W和系数矩阵H都具有一定的稀疏性[7]。

这样,非负矩阵分解问题就归结为一个非线性优化问题,用一个目标函数来测度低秩近似的效果。Lee 等[10]定义了两种简单的目标函数,如式(2)、式(3)所示

Li 等[2,11]使用的是式(2)所示的目标函数,本文使用的是式(3)所示的目标函数。目标函数的不同,决定了相应的更新策略也是不同的。Lee 等[10]提出了一种迭代方法来解决这个问题,如式(4)、式(5)所示

这个方法叫做乘法更新(MU)算法,可以保证非负性,但是有可能会卡在非平稳点[13]。使用乘法更新算法解决优化问题,就可以得到W和H。基矩阵W保留了原始数据的空间关系和数据结构,系数矩阵H可以被看作是原始数据矩阵的低秩近似。从统计过程监测方法的角度来看,需要观察矩阵H来反映工业过程的状态[11]。因此,基于非负矩阵分解(NMF)的监测模型如式(6)所示

1.2 稀疏编码

稀疏编码的概念指的是一种代表方法。在这种代表方法中,少数单位就可以有效地代表典型数据向量,这就意味着,在表示时,大部分单位的价值接近于零,只有少部分单位作用明显,价值是显著的非零值[14]。经过非负矩阵分解后得到的矩阵本身具有稀疏性特点,因此,将稀疏编码的方法与非负矩阵分解结合是很合理的。对非负矩阵分解施加一定的稀疏性约束,可以得到更稀疏的表示。

线性稀疏编码模型的思想如下:假设观察到的数据集是一些基向量的线性组合,基于这些基向量的系数代表了为作进一步分析的新的特征向量。稀疏编码方法假定这些潜变量呈现出稀疏性,然后通过寻找一种特定形式的低熵编码来最大化稀疏性,这种低熵编码的概率密度的高峰出现在零周围并且有严重的厚尾性[15]。

用 I(x,y) 来表示一个图像,它可以表示为一些基函数的线性组合[12],如式(9)所示

其中,fi(x,y)是基函数,a i是系数。如上所述,线性稀疏编码可以表示为一个优化问题,通过最小化式(10)这个损失函数[12]

其中,λ是正常数,决定了第2 项相对于第1项的重要性。第1 项测度了编码描述图像的好坏,由式(11)来表示[15]

1.3 稀疏性非负矩阵分解

传统的非负矩阵分解方法,只对矩阵元素施加了非负约束,然而,对矩阵元素施加稀疏性约束,就可以得到更稀疏的表示,即降维后得到更少的投影方向。因此,把稀疏编码和非负矩阵分解结合在一起就可以得到稀疏性非负矩阵分解。进而,考虑到传统的非负矩阵分解得到的原始数据低秩近似,即系数矩阵H,不具有正交性,这就意味着变量之间存在冗余信息,从而考虑对其进行正交化处理。这样在降维时,可以将变量中的冗余信息除去,得到更少的投影方向。使信息集中到更少的投影方向上,与稀疏性的思想也是契合的。此时需要解决的优化问题如式(12)所示[12]

相应的乘法更新(MU)方法如式(13)~式(15)所示

这种方法是通过最小化所有Hkj的和来进行稀疏性的限制,从而对传统的非负矩阵分解方法施加了稀疏性,将其改进成为稀疏性非负矩阵分解。对矩阵H的正交化处理体现在约束条件中的HHΤ=I,在更新算法求解过程中,体现在式(15)。没有对矩阵H施加正交处理时,式(15)原本应该是,在迭代更新时以HXΤ代替WΤ,从而得到式(15)所示的更新迭代公式。这样代替是因为X=WH,两边转置得到XΤ=HΤWΤ,两边左乘矩阵H得到HXΤ=HHΤWΤ,约束条件HHΤ=I,所以在迭代更新时以HXΤ代替WΤ,这样可以保证其正交性。

然后就可以得到如式(6)所示的监测模型。相应地,监测指标如式(7)和式(8)所示。

1.4 稀疏度比较

本文使用的稀疏性定量表示是基于L1 范数和L2 范数之间的关系[14],如式(16)所示

其中,W⊂Rm×k,Wi是基矩阵W的列向量。稀疏度的值会有两种极端情况:如果Wi中所有元素都相等且是非零值,则稀疏度为零;如果Wi中只有一个元素是非零值,其余元素值都为零,则稀疏度为1。

对于基矩阵W,其稀疏度由式(17)计算

使用随机生成的矩阵进行计算验证。用MATLAB 随机产生100×10 的矩阵进行计算。NMF和SNMF 两种方法条件相同,都取k为5,循环次数为1000 次。对矩阵W和H的初始化都采用随机初始化方法。在SNMF 方法中,α的值选取为10。每个方法运行10 次,通过式(16)和式(17)来计算基矩阵W的稀疏度,最后选用10 次数据的平均结果。计算结果如表1所示。

表1 NMF 和SNMF 方法中W 的稀疏度Table 1 Sparseness of W in NMF and SNMF

如表1所示,在随机计算中,经过SNMF 方法得到的基矩阵W的稀疏度大于传统NMF 方法得到的稀疏度。通过稀疏度比较可以证明,由于施加了稀疏性的约束和进行了正交化处理,SNMF 可以得到比传统NMF 更加稀疏的表示,从而具有了对数据更好的表示能力。

2 基于稀疏性非负矩阵分解的故障监测方法

基于上述提出的稀疏性非负矩阵分解,这里提出一种新的故障监测方法。

2.1 初始化

作为一种迭代算法,对W和H的初始化就显得很重要。因为不同的初始化条件可能会导致不同的结果。正随机数初始化和奇异值分解(SVD)是比较常见的初始化方法,其中SVD 是初始化基矩阵W的较好方法[16]。

本文采用PCA 中的负荷矩阵P的绝对值作为基矩阵W的初始化,这样做方便了两种算法的比较,而且PCA 选取主元的数目可以作为选择基矩阵W维数大小的参考。系数矩阵H的初始化采用正随机数的方法。

2.2 监测指标

如前文所示,基于稀疏性非负矩阵分解(SNMF)的监测模型如式(6)所示。相应地,监测指标如式(7)、式(8)所示。

2.3 控制限

核密度估计(KDE)被用来确定两个监测指标N2和SPE 的控制上限。核密度估计是一类数据驱动的技术,用于密度函数的非参数估计。这是一个很有力的工具,可以从给定的样本集中得到密度函数的经验分布[17]。N2和SPE 两个统计量都是单变量,所以很适合用KDE 这个方法来进行计算。

样本集X={xi,i=1,2,…,n},密度函数为P(x),可以用式(18)表示

对单变量核估计的KDE 方程如式(19)所示[18]

2.4 故障监测流程

基于稀疏性非负矩阵分解(SNMF)方法的故障监测流程如下。

建模:

(1)初始化,正常样本数据X经过PCA 后得到负荷矩阵P,用来初始化W。H用正随机数方法来进行初始化;

(2)用稀疏性非负矩阵分解(SNMF)方法来计算得到W和H;

(3)根据式(7)和式(8)分别计算统计量N2和SPE;

(4)使用KDE 计算出两个监测指标N2和SPE的控制上限。

监测:

(1)根据测试数据得到新的系数矩阵H;

(2)根据式(7)和式(8)分别计算新的N2和SPE;

(3)通过比较新的N2和SPE 与相应的控制上限,判断其是否为故障。

3 仿真实验

3.1 TE 过程

TE 过程可以人为设定21 种故障,已经被广泛地用于评估和比较过程监测方法的有效性。TE 过程主要包括反应器、冷凝器、循环压缩机、解吸塔和气液分离器5 个单元。有4 种反应物和2 种产品,此外,还包含1 种副产品和1 种惰性气体。该过程共有41 个测量变量和12 个操作变量。41 个测量变量中,22 个是连续的过程测量变量,19 个是非连续的过程测量变量。Downs 等[19]给出了关于TE 过程的详细信息。TE 过程的工艺流程图如图1所示。

TE 过程可以仿真正常工作状态和21 种故障情况。21 种故障类型如表2所示。

仿真数据的采样间隔为3 min,每一个样本数据集包括52 个变量。正常数据作为训练数据用来建模。对每一个故障情况,进行960 次采样,故障从第161 次采样开始产生,这样就得到了测试数据集。

这里分别将基于PCA 的监测方法、基于NMF的监测方法和基于SNMF 的监测方法,应用于TE过程,进行比较。在基于PCA 的方法中,选择方差贡献度为85%,此时,对应的k值为27。所以在基于NMF 和基于SNMF 的方法中,相应地将k值选取为27。另外,这两种方法的循环次数都是1000次。在SNMF 方法中,α的值选取为10。这是因为,由迭代更新公式(13)~式(15)可以看出,当α的值选取为0 时,SNMF 退化为传统的NMF;而当α的值选取过大时,不利于迭代算法的进行。α的取值过小和过大都对结果有不利的影响,所以经过尝试,α的值选取为10。

图1 TE 过程的工艺流程Fig.1 Process flow sheet of Tennessee Eastman process

表2 TE 过程21 种故障类型Table 2 Process faults for TE process

表3 PCA,NMF,SNMF 3 种方法在TE 过程的故障监测率Table 3 Fault detection rates of PCA,NMF and SNMF in TE process

3.2 结果讨论

故障监测率作为评价监测好坏的标准。3 种方法的监测结果如表3所示。

由于故障3、9 和15 的测试数据在均值、方差和高阶矩上没有可观察的变化,所以统计方法的故障监测率都很低[20],这里没有进行分析讨论。对于故障18,由于NMF 和SNMF 这两种方法的误报率过高,所以不予讨论。对于故障21,由于PCA 的监测指标SPE 的误报率过高,所以也不予讨论。对于其余的故障情况,基于NMF 和SNMF 的方法,误报率始终在5%以内,而基于PCA 的方法的SPE指标,在故障8、12、17 和19 时,误报率都稍微超过了5%。可以从表3中看出,对于故障1、2、6、7、8,3 种方法得到的结果基本相同,这是因为这些故障情况的故障程度很明显,所以3 种方法都能取得很好的故障监测率。

对于故障4、5、10、16、19 和20,基于SNMF的方法都好于基于PCA 的方法。有些情况下,SNMF的结果不如PCA,这是因为SNMF 降维后的投影方向相当于PCA 的主元,因为稀疏性约束和正交化处理,基于SNMF 的方法将信息集中到了较少的投影方向上,可能会丢失一些与这些投影方向相关性差的信息。而PCA 的主元数较多,相比之下,包含更多的信息。但同时也注意到,在这些情况下,SNMF的结果与PCA 相差不多,说明SNMF 用很少的投影方向依然捕捉到了相关信息。

对于故障4、5、10、11、13、14、16、17、19和20,基于SNMF 的方法都好于基于NMF 的方法。故障4、11、16 和20 的N2指标,SNMF 相比于NMF有很明显的提高(超过10%),在故障11 上提高了26.125%。最值得注意的是在故障4 上的表现,基于PCA 的方法,监测指标T2的故障监测率很低,而基于NMF 和SNMF 的方法,监测指标N2有较高的故障监测率。在故障4 的监测上,也可以很明显地体现出基于SNMF的方法好于基本的NMF方法。3 种方法对故障4 的监测情况如图2所示。

从整体上看,基于NMF 和SNMF 的方法好于基于PCA 的方法,而且由于加入了稀疏性的约束和正交化的处理,基于SNMF 的方法可以得到更稀疏的表示,因此其监测效果较基于传统的NMF 的方法,有了一定程度的提高。

4 结 论

图2 PCA,NMF 和SNMF 对故障4 的监测结果Fig.2 Monitoring results of PCA,NMF and SNMF for fault 4

相比于主成分分析(PCA),非负矩阵分解(NMF)是一种更普遍的方法,因为这种方法对潜变量没有除了非负要求之外的任何假设。在非负性限制的基础上,再加入稀疏性约束和正交化处理,可以更好地提高这种方法对数据集的表示能力。本文提出了使用稀疏性非负矩阵分解(SNMF)的方法来进行化工过程的故障监测,因为将稀疏编码的概念引入到传统的非负矩阵分解方法上,所以可以得到对数据集更稀疏的表示能力,另外,又对低秩近似矩阵进行正交化处理使得降维时除去了变量的冗余信息,将信息集中在更少的投影方向上,进而在故障监测时得到更好的效果。仿真实验的结果表明,在TE 过程的监控上,基于稀疏性非负矩阵分解(SNMF)的故障监测方法好于传统的非负矩阵分解(NMF)方法和主成分分析(PCA)方法。然而,非负矩阵分解的方法在近几年还在不断的发展中,以后会出现更多关于此方法的改进。另外,关于该方法应用于化工过程的故障监测时,还有一些值得考虑的问题,比如初始化问题和收敛性问题。

[1]Xia Luyue (夏陆岳),Pan Haitian (潘海天),Zhou Mengfei (周猛飞),Cai Yijun (蔡亦军),Sun Xiaofang (孙小方).Process monitoring and fault diagnosis of propylene polymerization based on improved multiscale principle component analysis [J].CIESC Journal(化工学报),2011,62 (8):2312-2317

[2]Li Xiangbao,Yang Yupu,Zhang Weidong.Statistical process monitoringviageneralized non-negative matrix projection [J].Chemometrics and Intelligent Laboratory Systems,2013,121:15-25

[3]Ge Zhiqiang,Song Zhihuan.Distributed PCA model for plant-wide process monitoring [J].Industrial & Engineering Chemistry Research,2013,52:1947-1957

[4]Ge Zhiqiang,Song Zhihuan.Mixture Bayesian regularization method of PPCA for multimode process monitoring [J].AIChE Journal,2010,56:2838-2849

[5]Jia Mingxing,Xu Hengyuan,Liu Xiaofei,Wang Ning.The optimization of the kind and parameters of kernel function in KPCA for process monitoring [J].Computers and Chemical Engineering,2012,46:94-104

[6]Ge Zhiqiang (葛志强),Song Zhihuan (宋执环).New online monitoring method for multiple operating modes process [J].Journal of Chemical Industry and Engineering(China) (化工学报),2008,59 (1):135-141

[7]Lee D D,Seung H S.Learning the parts of objects by nonnegative matrix factorization [J].Nature,1999,401:788-791

[8]Shang Fanhua,Jiao L C,Wang Fei.Graph dual regularization non-negative matrix factorization for co-clustering [J].Pattern Recognition,2012,45:2237-2250

[9]Zeng Kun,Yu Jun,Li Cuihua,You Jane,Jin Taisong.Image clustering by hyper-graph regularized non-negative matrix factorization [J].Neurocomputing,2014,138:209-217

[10]Lee D D,Seung H S.Algorithms for non-negative matrix factorization //Advance of Neural Information Process System[C].MIT Press,Cambridge,MA,USA,2001

[11]Li Xiangbao,Yang Yupu,Zhang Weidong.Fault detection method for non-Gaussian processes based on non-negative matrix factorization [J].Asia-Pac.J.Chem.Eng,2013,8:362-370

[12]Liu Weixiang,Zheng Nanning,Lu Xiaofeng.Non-negative matrix factorization for visual coding//Proceedings of 2003 IEEE International Conference on Acoustics,Speech,and Signal Processing[C].2003,3:293-296

[13]Gonzalez E,Zhang Y.Accelerating the Lee-Seung algorithm for nonnegative matrix factorization[R].Technical Report TR-05-02,Rice University,2005

[14]Hoyer P.Non-negative matrix factorization with sparseness constraints [J].Journal of Machine Learning Research,2004,5:1457-1469

[15]Olshausen B A,Field D J.Emergence of simple-cell receptive field properties by learning a sparse code for natural images [J].Nature,1996,381:607-609

[16]Albright R,Cox J,Duling D,Langville A N,Meyer C D.Algorithms,initializations,and convergence for the nonnegative matrix factorization[R].NCSU Technical Report Math 81706,North Caroline State University,2006

[17]Chen Q,Wynne R J,Goulding P,Sandoz D.The application of principal component analysis and kernel density estimation to enhance process monitoring [J].Control Engineering Practice,2000,8:531-543

[18]Botev Z I,Kroese D P.The generalized cross entropy method,with applications to probability density estimation [J].Methodology and Computing in Applied Probability,2011,13:1-27

[19]Downs J J,Vogel E.A plant-wide industrial process control problem [J].Computers and Chemical Engineering,1993,17:245-255

[20]Yu Jianbo.Local and global principal component analysis for process monitoring [J].Journal of Process Control,2012,22:1358-1373

猜你喜欢
原始数据投影编码
GOLDEN OPPORTUNITY FOR CHINA-INDONESIA COOPERATION
基于SAR-SIFT和快速稀疏编码的合成孔径雷达图像配准
解变分不等式的一种二次投影算法
受特定变化趋势限制的传感器数据处理方法研究
《全元诗》未编码疑难字考辨十五则
基于最大相关熵的簇稀疏仿射投影算法
子带编码在图像压缩编码中的应用
找投影
找投影
Genome and healthcare