基于复杂网络的化工过程状态监测方法

2021-01-18 01:42崔超宇郭丽杰康建新
燕山大学学报 2021年1期
关键词:工况系数建模

崔超宇,郭丽杰,*,康建新

(1. 燕山大学 河北省应用化学重点实验室,河北 秦皇岛 066004;2. 燕山大学 环境与化学工程学院,河北 秦皇岛 066004)

0 引言

化工生产通常处于高温高压的生产环境,原料或产品往往涉及易燃易爆、有毒有害的物质,一旦发生事故后果不堪设想。正是由于化工生产安全的重要性,为了确保生产的安全,对大型化工装置普遍采用状态监测的方法,因而也得到大量有价值的过程监测数据。近年来,过程状态监测和故障诊断技术得到迅速发展,总的来说,分为3种:基于知识的方法、基于解析模型的方法和基于数据驱动的方法[1]。其中,基于知识的方法[2]需要决策者具有较高的知识水平,基于解析模型的方法[3]对于大型复杂系统建模十分困难,且精度较低,这两种方法在使用时往往会受到制约。基于数据驱动的方法通过挖掘过程数据潜在信息来发现系统的故障情况,且对于建模精度和操作者的知识水平要求不高而得到广泛使用[4]。郭金玉等[5]提出基于加权差分主元分析算法,实现了对多模态和非线性过程数据进行故障检测;马贺贺等[6]针对数据多模态分布的特性,结合多元统计监控(Multivariate Statistical Process Monitoring,MSPM)方法提出了马氏距离局部离群因子(Mahalanobis Distance-based Local Outlier Factor,MDLOF)方法进行故障检测;Wang等[7]提出了用于过程监控的分区主成分分析方法(Probabilistic Principal Component Analysis,PPCA),实现了对模型的局部变化行为进行监控;Gao等[8]针对化工数据高维性结合主成分分析法(Principal Component Analysis,PCA)与网格搜索方法(Grid Search,GS)对支持向量机参数进行优化,有效提高了诊断的准确性。Zhang等[9]根据化工数据非线性与多模态的特点,提出了一种基于核熵分量分析(Kernel Entropy Component Analysis,KECA)的非线性化工过程监测方法。

在基于数据驱动的方法中,复杂网络建模由于对过程监测数据不需要满足线性、符合高斯分布等要求,而且可以以图形化的方式直观地表示系统的整体结构特征,近年来不论是在工程应用还是在学术研究领域都取得了长足进步[10-11]。陈雨等[12]利用偏相关系数确定复杂变量间的邻接矩阵并建立网络模型用于过程故障诊断;Jiang等[13]将整套化工过程建模为复杂网络模型,并通过拓扑特性来对故障进行分析,找出易引起系统崩溃的重要节点;李果等[14]对化工系统进行了网络拓扑特性的研究,并利用蚁群算法有效地找出系统中的脆弱节点;杜海峰等[15]将故障诊断聚类问题转化为复杂网络子网络探测问题,并提出一种基于模块合并的故障诊断聚类算法;王政等[16]将化工过程系统结合符号有向图抽象为复杂网络拓扑结构,对化工生产中易产生故障的部位进行了研究。但目前,复杂网络在应用中要通过观察网络结构来评判系统的状态,缺乏定量化的评价依据,结果可能引起误判,而且效率低。为了有效地从过程监测数据中提取故障特征,本文建立了基于复杂网络节点异常系数的化工过程状态监测方法,首先对建立复杂网络建模的数据样本数量进行优化,然后建立复杂网络,提出节点异常系数用于定量识别系统状态,最后以TE过程作为应用实例进行验证。

1 基于复杂网络的化工过程状态监测方法

复杂网络是近年来研究的热点之一,在解决数据复杂性问题中有着出色的表现,已在电力系统、社交网络、交通规划、病毒传播等方面得到广泛应用[17-21]。以复杂网络理论为基础的状态监测是通过计算各节点之间相似度得到节点的关联性,由关联性建立复杂网络模型,通过对比实时工况与正常工况网络结构,即主要分析网络节点和连边的增减,来判断系统的运行状态。本方法包括优化复杂网络建模和基于节点异常系数的状态监测两部分。

在建立复杂网络时,如果样本数量不足,所建立的复杂网络不可能表示系统的真实状态,从而会造成误判,影响监测结果;但数据样本数量过于庞大时,会大大增加运算的工作量。在最佳样本容量下进行复杂网络建模时,不仅可以保证模型精度,还可以减小运算工作量,从而减少建模时间,提高诊断效率。优化复杂网络建模就是要寻找建立复杂网络所需的最佳样本数量,最佳样本数量是通过网络模型的稳定性来确定的。

在已有的复杂网络状态监测方法中,评判故障发生的依据仅仅是通过观察复杂网络拓扑图来得出,存在一定的局限性。因为在实际生产中,一整套化工过程的监测节点数目巨大,仅仅通过肉眼观察复杂网络拓扑图很难准确判断出故障是否发生。本文构建了节点异常系数,目的是为化工过程状态监测建立定量化的评判依据,从而提高状态监测的准确性和效率。

1.1 复杂网络的建立

化工过程复杂网络建模是把工艺监测变量作为节点,通过节点之间的相关性建立邻接矩阵,形成网络图形[22]。文献[12]采用偏相关系数法计算节点之间的相关性,根据相关性阈值定义节点之间的强弱相关关系,得到邻接矩阵A。邻接矩阵A中,若节点i与节点j存在相关关系,则Aij=1,否则Aij=0。之后,根据邻接矩阵建立复杂网络模型。例如,若A为一个五阶矩阵:当Aij=1时,则节点i和j之间存在一条连边;当Aij=0时,节点i和j之间不存在连边。图1为由上述邻接矩阵A建立的复杂网络拓扑图。

图1 由邻接矩阵A建立的复杂网络拓扑图Fig.1 Complex networks topology of adjacency matrix A

平均节点度与平均聚集系数是复杂网络的两个重要的基本特征度[23]。

节点度Di(Degree)是指节点i与其他节点之间连接的个数,平均节点度越大,网络的鲁棒性越好,研究表明,网络的鲁棒性与稳定性有着正相关的关系,整个网络的平均节点度表示为

(1)

式中,kij为与节点i连通的节点;N为复杂网络节点总数。

聚集系数Ci(Clustering Coefficient)是指在网络中与同一个节点相连的两个节点也相连的概率,它是复杂网络聚集程度的判断指标,整个网络的平均聚集系数表示为

(2)

式中,Mi表示与节点i相连的节点之间的连接数;Di为节点i的节点度;N为复杂网络节点总数。

复杂网络的建立和特征参数的计算可以通过Pajek软件实现,将邻接矩阵输入到Pajek软件中,使用绘图功能直接根据邻接矩阵建立复杂网络拓扑图,并利用其内置的特征参数计算方法可以得到平均节点度与平均聚集系数。

1.2 用于复杂网络建模的最佳数据样本数量

最佳样本数量主要是通过复杂网络的稳定性来确定。当样本数量S小于最佳样本数量N0时,网络处于未稳定状态,节点分布比较稀疏,网络平均聚集系数较小;当样本数量S接近或者等于最佳样本数量N0时,平均网络节点度较大,网络节点之间的连通性进一步增强,故网络具有较大的平均聚集系数,此时复杂网络结构变化程度开始变得缓慢,网络逐渐趋于稳定状态,并且具有较强的鲁棒性;当样本数量S大于最佳样本数量N0时,网络处于稳定状态,若收集更多的正常数据对网络结构几乎不会产生影响,并且随着样本数量的增加,建模过程的计算量也随之增加,影响诊断效率。

确定正常工况最佳样本数量N0的步骤如下:

1) 在正常工况下,把采集到的每个时刻的工艺变量数据作为一个样本,按照每次10个样本的速度逐渐增加,并进行复杂网络建模,之后分别利用式(1)、(2)计算网络平均节点度、网络平均聚集系数。

2) 观察复杂网络模型结构的稳定性,以及复杂网络平均节点度和平均聚集系数。

3) 若网络状态评定结果为稳定状态则停止增加样本数量,此时的样本数量为最佳样本数量N0。

1.3 基于复杂网络节点异常系数的状态监测

在化工生产中,监测的工艺变量数值往往会存在一些小的波动,有些变量的波动有时表现为突然变大但又迅速消失,这种情况对化工生产影响较小,生产可以继续进行。但是这些波动可能会直接影响所建立复杂网络的结构,从而造成操作和管理人员对系统状态的误判。为了避免工况波动的影响,为状态监测提供准确定量化评判依据,本文提出了基于复杂网络的节点异常系数法,计算公式如下:

(3)

(4)

采用统计学中的迭代法对部分变量的波动数据构建了节点异常系数阈值T0。首先在最佳样本数量下,从正常工况历史数据中找出波动较大的采样点,记录这些采样点并删除,然后将这些采样点依次按照不同的组合输入回原样本空间中建立复杂网络,并计算相应的节点异常系数T,其中最大的节点异常系数就作为节点异常系数阈值T0,计算步骤如下:

1) 分别找出各个监测节点中出现较大扰动的采样点x个,记录并从样本空间中删除这些采样点,此时样本数量为N0-x个,设m为加入的扰动样本数量,初值令m=0,进行复杂网络建模,并通过式(3)计算节点异常系数T0,1;

2) 将出现较大的扰动点分别以一次m=1的形式加入到样本数量为N0-x的样本中,进行复杂网络建模,并通过式(3)计算节点异常系数T1,1,T1,2,…;

3) 将出现较大的扰动点分别以一次m=2个的形式加入到样本数量为N0-x的样本中,进行复杂网络建模,并通过式(3)计算节点异常系数T2,1,T2,2,…;

4) 将出现较大的扰动点分别以一次m=x-1个的形式加入到样本数量为N0-x的样本中,进行复杂网络建模,并通过式(3)计算节点异常系数Tx-1,1,Tx-1,2,…;

5) 按照上述计算方法完成x-1次迭代计算后结束运算,节点异常系数最大的值为节点异常系数的阈值,即T0=max {T}。

1.4 基于复杂网络的化工过程状态监测

基于复杂网络的化工过程状态监测包括离线建模和在线监测两个部分,流程如图2所示。

离线建模过程:

1) 确定复杂网络的最佳样本数量N0,并对过程数据进行标准化处理;

2) 建立正常工况下的复杂网络模型,计算出正常工况复杂网络节点度D0;

图2 基于复杂网络的化工过程状态监测流程Fig.2 Procedure of condition monitoring based on complex network for chemical process

3) 计算复杂网络的节点异常系数阈值T0。

在线监测过程:

1) 对实时工况数据进行复杂网络建模并计算节点异常系数T;

2) 在状态监测中,当T≤T0时,虽然复杂网络状态发生改变,但并没有产生很大影响,此时为正常工况;当T>T0时,说明工况波动对复杂网络结构影响较大,此时为故障工况。

3) 对于故障工况,通过分析复杂网络结构特征确定引起故障的网络节点,即辨识故障原因。

2 实例分析

2.1 TE过程简介

TE过程又称为田纳西-伊斯曼(Tennessee-Eastman)过程,是根据Eastman化工公司的一套真实的化工过程开发的模型,由于其为化工过程控制和监测提供了出色的模拟平台,在故障检测领域得到广泛应用[24]。因为TE过程本身是一个复杂的化工系统,具有多变量相互作用性较强的特点,应用复杂网络理论可以以图形化的方式直观地表示它的整体结构特征,所以本研究以TE过程作为实例来验证所提出方法的有效性。TE过程共包括41个测量变量和12个控制变量以及预先设定的20个故障,其中测量变量包括22个连续测量变量和19个组分测量变量。考虑到组分变量采样时间较长,不符合状态监测的及时性,所以本文不予考虑,仅对22个连续测量变量进行研究。过程数据为间歇式采集,采集时间间隔为3 min。对22个连续测量变量的说明见文献[24]表2.5,故障编号与故障描述见文献[24]表2.7。

2.2 TE过程优化复杂网络建模

在本文中,首先选取正常工况下样本数量为100、200、300、400、450、500、550的化工过程监测数据,分别建立复杂网络,不同数量样本的复杂网络平均节点度以及平均聚集系数如表1所示。

从表1可以看出,当样本数量为100时,虽然此时复杂网络平均节点度达到4.71,但聚集系数较小,仅为0.474,复杂网络结构比较稀疏且分散。当样本数量达到300时,网络部分节点消失,导致平均节点度降低、网络聚集系数降低,与样本数量为100、200的网络状态相比,网络的聚集程度在不断升高。当样本数量增加至450时,复杂网络平均节点度与平均聚集系数均达到峰值,说明复杂网络达到最稳定的状态。

表1 不同样本数量下的复杂网络特征参数Tab.1 Characteristic parameters of complex networks with different sample numbers

根据不同数量样本建立的复杂网络拓扑图如图3所示。从图3可以看出,随着样本数量的逐步增加,复杂网络的网络结构也随之变化。当样本数量从100增加到450时,复杂网络结构一直在发生变化,当样本数量从450增加到500、550时,复杂网络结构稳定,不再发生变化。

根据上述复杂网络特征参数与复杂网络拓扑图可以得出结论,当样本数量为450时复杂网络开始进入稳定状态,此时的样本数量可作为最佳样本数量N0。本文为了避免偶然性等不利因素,确定最佳样本数量为500,并在此样本数量下进行复杂网络建模。

2.3 基于复杂网络的TE过程状态监测

2.3.1离线建模

取500个正常工况采样点的数据进行复杂网络建模,所建立的复杂网络拓扑图如图4(a)所示,从图中可以直观地看出工艺变量之间的相互作用关系。经计算,正常工况复杂网络节点度D0为56。根据1.3中所给出的计算步骤进行计算,得到最大的节点异常系数所对应的复杂网络拓扑图如图4(b)所示。通过计算各个节点的节点度变化得出,节点10与节点13、节点10与节点18、节点9与节点21分别减少一条连边,节点20与节点21增加一条连边,节点度变化幅度为8,节点异常系数阈值T0最后确定为14.3%。复杂网络模型的节点异常系数阈值与化工过程的监测变量、监测数据和网络结构有关,不同化工过程的监测变量和数据存在差异,建立的复杂网络结构也不同,因而在每一个化工过程建立复杂网络时,都需要单独计算其节点异常系数阈值。

图3 不同样本数量下的复杂网络拓扑图Fig.3 Complex networks topology with different sample numbers

图4 复杂网络模型变化比较Fig.4 Comparison of changes of complex networks model

2.3.2在线监测

TE过程中故障类型较多,本文仅以TE过程中已经设置好的故障4和故障5来为实例进行分析。故障4为反应器冷却水入口温度异常,故障5为冷凝器入口温度异常。在TE过程正常工况后的第501个采样点分别引入故障。

对于故障4的第501个采样点进行复杂网络建模,计算出节点异常系数T501为71.4%,大于节点异常系数阈值14.3%,此时可以判断TE过程为故障状态。第501个采样点的复杂网络拓扑图如图5所示,与图4(a)中的正常工况拓扑图相比,网络聚集程度降低,边缘节点增多,由图6可以看出,在故障4发生后,一共22个节点发生不同程度的变化,其中节点9变化幅度最大,节点9为反应器温度的监测点,反应器内发生放热反应,当冷却水发生故障时,造成反应器温升,相关工序都受到影响,节点9的监测数据如图7所示。从图7可以看出,在第501个点时该温度发生了非常明显的阶跃,并且远远超过控制上限,由此可以说明本方法的状态监测结果与TE过程预设的故障相符。

同样的,对于故障5,在第501采样点进行复杂网络建模并计算节点异常系数为0%,此时未检测出故障。对第502采样点采集的数据按照上述的方法进行复杂网络建模,如图8所示,此时节点异常系数为82.1%,已超出节点异常系数阈值,即可判断为非正常工况。与图4(a)中的正常工况拓扑图相比,网络聚集程度大幅度提高,并且出现了多个较大节点度的节点,由此判断由于故障5的加入造成了多个监测节点数据异常。由图9可知,故障5发生后大部分节点的节点度都发生了变化,其中节点11和22的变化幅度最为明显。图10和图11分别为节点11和22的过程监测数据。TE过程在前500个时刻为正常工况,当第502个采样点时节点11与12的监测数值超出控制限上限,因而确定由于节点11与22共同故障导致了整个系统故障的发生。

图5 故障4时的复杂网络模型Fig.5 Complex networks model for the 4th fault

图6 故障4引起的节点度的变化Fig.6 Changes of node degree caused by the 4th fault

图7 节点9的采样数据Fig.7 Sample data of the 9th node

图8 故障5时的复杂网络模型Fig.8 Complex networks model of the 5th fault

图9 故障5引起的节点度的变化Fig.9 Changes of node degree caused by the 5th fault

图10 节点11的采样数据Fig.10 Sample data of the 11th node

图11 节点22的采样数据Fig.11 Sample data of the 22nd node

3 结论

1) 首先以复杂网络结构的稳定性作为确定最佳样本数量的依据,对建立复杂网络的样本数量进行优化;之后,进行复杂网络建模;最后根据复杂网络结构特性提出节点异常系数法,解决已有研究中利用复杂网络理论进行故障检测时缺少量化的问题。

2) 把本文所提出的方法应用于TE过程,结果表明,采用该方法能够及时、准确地监测到故障,验证了该方法的有效性。复杂网络以图形化的形式刻画出变量之间的相互作用关系,为后续的故障诊断提供可靠的依据。

3)本文提出的基于复杂网络的化工过程状态监测方法在一定程度上提高了监测与诊断的准确性,但是目前仍采用手动建模,下一步需要研究整合建模、监测和诊断过程,开发自动故障诊断程序,从而提高分析速度。

猜你喜欢
工况系数建模
热网异常工况的辨识
物理建模在教与学实践中的应用
在经历中发现在探究中建模
不同工况下喷水推进泵内流性能研究
误使用工况下儿童安全座椅安全性的开发与验证
联想等效,拓展建模——以“带电小球在等效场中做圆周运动”为例
汽车行驶工况识别模型搭建的方法研究
求距求值方程建模
小小糕点师
苹果屋