基于时间序列和神经网络的电力设备状态异常检测方法

2024-02-21 09:36丁江桥文屹吕黔苏张迅范强黄军凯
电测与仪表 2024年2期
关键词:电力设备神经元聚类

丁江桥,文屹,吕黔苏,张迅,范强,黄军凯

(贵州电网有限责任公司电力科学研究院,贵阳 550002)

0 引 言

电网是经济和社会发展的重要基础设施,也是能源产业链中的重要纽带[1]。在坚强智能电网框架下,智能输变电设备逐渐成为建设未来电网必不可少的环节。但输变电设备存在过载、过压、老化等现象,导致设备缺陷和故障等[2]。随着大数据时代的到来,大数据技术逐渐成熟并应用到各个领域。应用大数据技术对数据本身的内在规律进行挖掘,从而对设备状态进行更加全面和详细的分析。因此,对基于大数据技术的电力设备异常状态检测方法进行研究具有重要的现实意义。

目前,国内外对设备异常状态检测方法进行了大量的研究。但在电力行业,大数据技术在设备异常检测中的应用尚处于起步阶段。主要包括时间序列分析、马尔可夫模型和分类算法等。在文献[3]中,提出了一种基于无监督学习的数据挖掘方法,使用自回归模型,提出了契合度指标,并在正常工作时间序列上进行了欧氏距离分析,最后通过实例验证了该方法的准确性。在文献[4]中,提出一种通过大数据技术深度挖掘与分析电力变压器状态数据的方法,分析当前的应用现状以及决策优化的典型场景。在文献[5]中,提出一种采用移动时间窗划分状态数据的方法,结合空间位置坐标形成时空联合数据,采用模糊C均值聚类方法对数据进行聚类,判断电力设备运行状态。在文献[6]中,根据变电站设备状态监测和评估的手段,对新一代智能变电站设备状态监测与评价的大数据处理方法进行分析。从建立设备异常知识库和状态评估两个方面展望大数据技术在设备检测中的应用前景。但是以上电力设备异常检测方法利用的数据量小,没有充分考虑到历史数据的作用。

在此基础上,文中提出了一种基于时间序列和神经网络的电力设备状态信息异常检测方法。通过自回归时间序列模型和自组织映射神经网络将连续的监测数据进行离散化,找出历史数据随时间的变化规律,以此为基础完成数据的快速异常检测。最后通过实验验证了该方法在实际电力设备状态诊断中的有效性。

1 评估全景信息模型

电力设备状态评估数据包括实时状态数据,如在线监测信息等;准实时状态数据,如日常巡检、预防性试验和维护等;静态原始数据,如设备台帐等[7]。巡检数据包括运行巡检数据,并且在每次检查后更新数据。在线监测数据包括现场所有监测设备实时或定期向中心发送的数据,并实时更新数据;预防性试验数据包括各种周期性离线试验数据;检修数据包括检修后设备各部分的最新状态,并在每次检查后更新数据。

基于电力设备不同维度的状态信息,从电力设备的状态监测信息、测试信息和电网运行信息等全景信息的特征信息。电力设备状态全景信息模型如图1所示。

图1 全景信息模型

2 异常检测

文中研究的异常检测方法主要是对在线监测的状态信息,集合历史数据和设备类型数据,从纵向时间跨度、横向电网和设备跨度这三个方面对设备的全景状态信息进行综合分析。然而,大数据技术为异常状态检测提供了新的解决思路和技术手段。

2.1 单状态量时间序列自回归模型

由于电力设备在运动过程中动态性较低,具有较强记忆力的自回归(Auto Regressive,AR)时间序列模型被广泛用于评估[8]。在一般情况下,电力设备的状态变量有两类[9]。第一类是平稳序列,一阶AR可以直接拟合,如接地电流和导线张力等。另一类为状态变量周期变化,但由于幅度较小,也可以调整后使用一阶AR进行拟合,例如油温、环境温度等。因此,采用一阶AR模型来拟合设备数据。如式(1)所示:

(1)

式中xt为监测数据t时刻的时间序列;α为自相关系数;et为t时刻的白噪声,遵循正态分布et~N(μe,λ2);μe为该分布的数学期望;λ为该分布的标准差。因此,xt服从N(μ,σ2)正态分布,并且μ和σ满足式(2)和式(3)所示:

μ=μe/(1-α)

(2)

(3)

正常运行时设备状态量在阈值范围内,因此,假定xt在区间[a,b]内。

在采样时t+1,t+2,…,t+k时刻可以判断其量化是否属于同一区间。仅当式(4)成立时,有a≤xt+k≤b[10]。

-αkxt+α≤et+k+αet+k-1+…+αk-1et+1≤-αkxt+b

(4)

式中et~N(μe,λ2),只有当α<α0时,整个序列才能满足区间[a,b]。

但是,仅用AR模型无法准确检测超过状态变量阈值的异常数据[11]。这主要是由于设备之间的数据不一致,当设备性能逐渐下降并存在潜在故障时,异常数据通常在规定阈值内,这会导致错误的状态评估。

2.2 自组织神经网络对时间序列的量化

自组织映射(Self Organized Maps,SOM)是一种神经网络,在数据聚类和降维中应用较多[12]。工作原理如图2所示。在输入层通过输入样本进行模型训练。训练过程会不断更改输入数据的权重,趋于平稳输入实时数据,将输入输出神经元比较,只有一个输出层神经元将成为获胜者。

图2 SOM神经网络结构

由于SOM可以执行无监督分类,将xt作为SOM的输入,而该序列C={C1,C2,…,Cn}将用作网络的输出。那么每一个xt训练其属于节点Cj的公式,判别通过为欧几里得距离,如式(5)所示[13]:

j=i(xt)=argmind(xt,Ci(t))

(5)

连续输入数据后,改变权值以最小化xt与最终输出节点的距离,如式(6)所示:

(6)

在式中,γ(t)为SOM神经网络的学习率,随t的增加逐渐降低,取值在[0,1]之间。

输入状态序列xt到SOM神经网络模型中,分类后,xt就变为线性空间中的离散点时间序列Ct∈{C1,C2,…,CN},如式(7)所示[14]:

Ct=Ci(xt)

(7)

式中Ct为t时刻最接近xt的节点。

2.3 时间序列变化过程的大数据分析

因为SOM在竞争层节点相关关联,所以每个神经元节点与其邻域节点有很强的相关性,而与区域外节点的相关性较弱。可以视为拓扑结构中一个神经元到另一个神经元的转移,挖掘数据时间变化规律。

(1)神经元的概率密度函数

当使用一阶转移概率P概率来表示神经元之间的相关性时,AR(N)模型中的神经元之间的一阶传递概率P[ct+1|ct,ct-1,…,c1],AR(1)模型中的神经元之间的一阶传递转移概率可以简化为P[ct+1|ct]。

令{C1,C2,…,CN}的取值为{1,2,…,N},t时刻的概率可以通过式(5)推导,ct的取值为CI的概率如式(8)所示[15]:

P[ct=CI]=P[i(xt)=I]

(8)

由式(7)和式(8)导出的概率密度函数如式(9)所示:

(9)

由于x和c是一维数组,因此令a=(CI+CI+1)/2,且b=(CI+CI-1)/2,由于xt服从正态分布,xt概率分布函数可以表示为标准正态分布函数,如式(10)所示[16]:

(10)

当I= 1 时,如式(11)所示:

(11)

当I=N时,如式(12)所示:

(12)

(2)神经元之间的传递

AR过程中数据较为平稳。二阶概率分布函数如式(13)所示:

P[ct=CI1,ct+k=C12]=P[xt∈(b1,a1),xt+k∈(b2,a2)]

(13)

式中CI1,CI2∈{C1,…,CN},I1=(a1,b1),I2=(a2,b2)。因为xt服从正态分布,所以xt的二阶正态分布函数如式(14)所示[17]:

(14)

式中ρ(k)=αk为一阶AR过程的自相关函数。

在该模型中,神经元仅转移一步,故式(13)可由式(12)和式(14)转化为式(15):

(15)

2.4 关联状态特征提取

在实际的操作过程中,由于设备属性、操作条件和环境的差异,很难用准确、统一的函数来表示设备状态监控参数。例如,变压器热点温度和底油温度、顶油温度、环境温度和负荷等参数之间的关系主要由热平衡方程式给出。热平衡方程具有许多参数,并且在高温下常常不准确,从而难以检测异常热点温度。

为了解决多维参数融合的问题,采用具有噪声的基于密度的聚类方法(Density-Based Spatial Clustering of Applications with Noise,DBSCAN)完成多维在线监测数据的聚类,简化了不同参数之间的复杂关联[18]。

2.5 检测流程

通过以上提取算法,可以快速检测在线监视数据流中的异常。具体步骤如下:

步骤一:根据每个参数的历史数据,使用AR模型和SOM神经网络算法计算单参数转移概率矩阵{X1,X2,…,XN}[19]。

步骤二:使用DBSCAN算法对所有参数的历史数据进行聚类以获得m个正常聚类簇。

步骤三:用步骤一中的转移概率矩阵替换在线监测实时数据流,得到各参数的转移概率序列,然后判断每个时间点的数据是否属于m个聚类簇。

步骤四:根据步骤三的结果执行异常检测,逻辑如下:

(1)如果每个参数的转移概率序列不为零,数据流中的数据属于m个簇,则该数据段正常。

(2)如果具有少量参数的转移概率序列为零个,数据流中有一小部分数据不属于m个簇,则认为该数据有少量噪声,为可以忽略的传感器异常。

(3)如果k个参数的转移概率序列中有一段为0,数据流中有一小部分数据不属于m个簇,则设备参数异常,设备运行状态异常。

(4)对于逻辑(3)的异常操作状态,从每个参数的转变概率序列的过零确定参数的异常发生时间。检测过程如图3所示。

图3 检测流程

3 实验结果与分析

3.1 油温和负荷实验

在当地监测中心取220 kV主变压器正常运行时的在线监测数据,以变压器油温、设备负荷、环境温度等为例评估设备的状态,取2019年的数据,以7月15日—7月22日为样本,并取7月23日12点—20点数据为待测样本。以每分钟采集一次这些状态变量,总计480组。通过AR(1)模型拟合后参数为λ=0.01、α=0.85、μe=0,设置 SOM 的神经元个数为 12,两相邻时刻的数据属于同一神经元的概率最大。如图4所示,设备负荷和油温在380点后上升趋势平稳。

图4 变压器检测信号

通过文中方法进行异常检测结果如图5所示。可以得到以下结论。

图5 变压器异常检测结果

(1)观测时刻80 min处油温有0点,这种情况下的聚类结果也显示异常值,但是由于时间传递概率高,聚类结果正常,判断为传感器异常引起,可忽略[20]。

(2)油温和负荷的推移概率在观测时为0。在观测时刻(390~410)min处,转移概率序列的值上下波动,并且有很多零点。聚类结果还表明,在观测时刻(390~500)min处大多数观测数据不属于常规聚类。因此,从观测时间384 min处(对应于时间18:20)开始运行异常,出现油温和负荷快速升高的现象。并且偏离正常值,此时应发出异常运行状况的早期预警。

在查看日志和记录后,在7月23日18:15,变压器收到调度命令,在高负载系数1.1~1.2下,工作75分钟后,在7:30恢复正常运行。检测与实际相同,文中方法能够完成变压器异常检测。

在变压器状态评估中没有油温、负荷、环境温度的阈值标准 。使用阈值判定方法,根据经验选择1.2倍。即如果测量数据超过正常值的1.2倍,则判断为异常,有以下结果。

(1)在观测时刻80 min处油温异常;

(2)观测时刻450 min(相当于18:50)以后,油温和负载同时异常。阈值判定方法的异常检测结论滞后于实际情况,无法杜绝传感器异常引起的误判。

3.2 覆冰实验

在当地监测中心选择500 kV的输电线路覆冰数据。每年11月至2月,冰层覆盖率最高,将2019年处于重冰覆盖的9月至11月附冰装置采集数据作为训练样本。数据如图6所示。从2019年12月到2020年1月数据为待测样本,设备的采样周期为一小时。

图6 输电线路覆冰监测数据

在对SOM网络和集群进行训练之后,将图6数据作为输入,通过文中检测流程,得到如图7所示转移概率序列和聚类结果。可以得到以下结论。

图7 输电线路异常检测结果

(1)在观测时刻345 h时,具有大量接近0或为0的数据。在观测时刻(380~400)h段,导线拉力和倾角几乎都为0点,从聚类结果来看,该数据段不属于常规聚类,在观测时刻(400~580)h段有聚类异常。因此,在观测时刻380 h时(12月17日)就存在覆冰异常,可判断当天输电线路状态异常。

(2)观测时间在(590~610)h段(12月26日)导线张力、倾角和风速的转换概率序列中有很多零点,聚类结果介于正常和异常之间,从而确定覆冰厚度异常增大,线路检测异常,每日覆冰均有记录。线路的结冰厚度从去年12月以来,约为2 mm。16日,由于天气(寒冷,小雪,大雾),线路的冰层厚度迅速增加。在18日对冰上的涂层进行特别检查时,发现监控设备附近的冰厚度超过10 mm。线路检查员向有关部门报告后,主管部门发出了异常检测信息,与异常检测结果相一致。12月26日以后,检测出异常,但覆冰厚度仅为8.7 mm,这可能是风速增加导致的张力异常,非覆冰引起。

在评估输电线路状态时,将早期覆冰厚度预警值设置为10 mm。根据该预警值,采用阈值判断方法进行异常检测。图8所示覆冰厚度的时变曲线。阈值异常仅在观察时刻446 h处(对应于12月20日)出现,预警时间晚于文中的方法,并且在观测时间(570~610)h段也出现阈值异常,与实际不同。可以得出文中方法优于阈值判断方法。

图8 覆冰厚度变化曲线

4 结束语

文中结合大数据分析技术和设备评估技术,提出了一种基于时间序列和神经网络的状态数据异常检测方法。通过AR时间序列模型和SOM神经网络将连续的电力设备数据离散为单个序列,计算状态变量在时间轴上的转移概率。通过实验对该方法的合理性和有效性进行验证。结果表明该方法可以快速、有效地检测电力设备异常状态。后续将针对不断增长的电力设备数量和数据规模,完善基于大数据技术的电力设备异常状态检测模型。

猜你喜欢
电力设备神经元聚类
《从光子到神经元》书评
加强电力设备运维云平台安全性管理
跃动的神经元——波兰Brain Embassy联合办公
基于DBSACN聚类算法的XML文档聚类
基于高斯混合聚类的阵列干涉SAR三维成像
电力设备运维管理及安全运行探析
基于压缩感知的电力设备视频图像去噪方法研究
基于二次型单神经元PID的MPPT控制
毫米波导引头预定回路改进单神经元控制
一种层次初始的聚类个数自适应的聚类方法研究