基于大数据分析的输变电设备状态数据异常检测措施

2016-11-21 11:32钟燕
中国高新技术企业 2016年29期

钟燕

摘要:文章结合相关的研究工作,提出了一种基于大数据分析手段下的检测方法,由数据的演进过程、数据关联等角度实现了对于异常情况有效检测,并进一步提出了异常检测体系,使其能够使用在输变电设备的状态监测数据流中,促使数据流当中的异常状况能够得以及时测出。

关键词:大数据;输变电设备;异常检测;时间序列;神经网络 文献标识码:A

中图分类号:TM764 文章编号:1009-2374(2016)29-0128-02 DOI:10.13535/j.cnki.11-4406/n.2016.29.058

在输变电设备的日常运行过程中常常会遭受到负荷、过电压、内部绝缘老化、自然环境等多方面异常状况的影响,此类异常状况往往会致使设备出现缺陷情况,因而针对设备状态实施异常检测十分重要,应当引起人们的重视与思考。

1 单状态量数据流特征量提取

1.1 自回归模型

时间序列的自回归模型大多应用在许多工业过程之中,其主要的特点即为具备有极强记忆能力的AR系统,在时间维度的t值上往往需借助于从前时刻行为,这和设备运行过程当中的低动态性完全符合。输变电设备在日常运行过程当中其一部分状态量的改变程度相对较小,例如导线拉力、接地电流等内容,这些状态量的数据信息往往从属于平稳序列,能够直接应用于AR拟合;此外还有一部分的状态量会伴随时间的推移而呈现出周期性的改变,但改变的幅度相对较小,例如油温、环境温度等情况,将其日周期性的改变因素排除后亦可借助于AR进行拟合,因而针对状态数据则可利用一阶AR进行模型拟合。

1.2 时间序列量化

自组织神经网络具体的运行机制是借助于无监督学习方式,来促使竞争层当中不同的神经元可以利用竞争和输入模式予以匹配,最终仅保留一项神经元即为获胜者,此种获得神经元的输入方法即为输入模式分类法。因为无监督学习的训练样本不具备有期望输出情况,没有任何的经验知识,因而较适用在数据量大、不含有标签的状态监测数据当中。

采用SOM可以实时无监督分类,进而促使整体序列成为SOM的一项输出节点,其中序列是其中一项输出节点,针对每一项训练其专属于节点的公式可表述为:

进行持续性的循环与改进,以保障距离所属节点的距离值能够达到最小。

1.3 时间序列变化过程

与径向基、反馈型等神经网络所不同的是,SOM神经网络的输出节点之间是互相关联的,其相互间的关系可以借助于网络拓扑结构来表达。在拓扑结构中,因为SOM在训练过程当中的竞争性,使得每一项神经元节点和邻域当中的节点存在明显的关联性,和邻域外部的节点关联性较弱。也正是基于SOM神经网络的此种特性,在量化之后的时间序列可被视作为拓扑结构中一项神经元到另一项神经元的转移,进而挖掘出数据伴随时间发生改变的规律性。

第一,计算神经元所属概率密度函数。借助于第一阶段的转移概率P值来达标神经元间的相关性,AR模型当中神经元的一阶转换概率可表述为,据此可求出AR模型在位于一阶转移之时的概率即为。

第二,计算神经元间的转移概率。因为AR过程较为稳定,距离相对较近的神经元之间发生转移的概率也就相对较大,距离较远的神经元之间出现转移的概率相对较小。利用变压器油温正常状况之下的在线监测数据进行举例说明,首先使数据可以借助于AR模型予以拟合表述,进而得出相应的模型参数值即为,,,而后将数量点的温度数据值录入至包含有12项神经元的SOM当中予以拟合训练,进而得到训练完成的SOM神经网络系统。截取出其中的一段温度数据值,如图1(a)所示,同时将之录入到完成拟合训练的SOM当中进而取得量化输出,即为图1(b)所示。

依据AR模型参数,求得SOM神经元之间的转移概率值,如图2所示。通过观察图2可以发现,位于对角线当中的转移概率值最大,并且在灰色区域当中的转移概率要显著大于灰色区域之外的转移概率,此即表明AR过程之中的数据在神经元间的转移概率和神经元距离呈现出反比状况,神经元间的距离越大,相应的数据信息也就越难发生转移。

通过将温度数据伴随时间推移而产生的动态性改变,利用转移概率序列来进行表达,如图1(c)所示。通过观察可以明显的发现在一般状况下,数据的转移概率都较大,并且通常都是由图2当中的灰色区域进行数值选取,此即表明温度数据会伴随着时间的改变而逐渐趋于平稳。相反若序列当中的一段数据转移概率在灰色区域之外时,则表明这一段数据在神经元间的转移相对更加频繁,因此即可判定状态量出现了异常。

2 多状态量数据流特征提取

在日常的设备运行时,因受设备属性、运行工作状况、环境差异等因素的影响,通常会使得设备的状态监测量,多为参量间的相关性往往无法做出明确的函数表达。例如变压器的热点温度、油温、环境温度以及负荷量等参数值往往需要借助于热平衡方程予以表达,但是热平衡方程参数数量较多并且在高温环境下也会出现计算不准确的情况,进而使得热点温度值出现异常无法做出准确测定。

通过输电线路覆冰举例说明,将在线监测的参量值Z作为一项三维数组,进而借助于DBSCAN算法進行类型聚合处理。如果一项三维数组与所有簇中点的距离均超过了某一特定值R,那么即表明这一数据不属于任何一项簇组。因而,在某一参量值发生异常情况进而使得这一多维数组当中的Z不属于任何一簇之时,即可判别这一时刻的多维数据发生了异常状况。

3 异常检测步骤

依据上文内容当中的时间序列特征量提取算法,针对在线监测数据实施以异常检测的流程如图3所示。

第一,对于每一项参量的历史数据信息,借助于单状态量数据流特征量的提取算法来就其转移概率的矩阵模型进行计算处理。

第二,对于每一项参量的历史数据信息,借助于多状态量数据流特征量的提取算法针对多元时间序列予以聚合处理,从而使得历史数据可以被聚集为m个簇。

第三,将实时监测所得到的数据流信息导入至转移概率矩阵当中,从而取得不同参量的转移概率序列,进而就不同时间点当中数据是否为多状态量数据流特征量的m聚类予以判别。

第四,依据上述判定结果针对数据流采取异常检测,其中异常检测的逻辑表述如下:(1)在不同的参量值转移概率序列均不具备0值之时,并且数据流之中不同时间点数据从属于m簇当中的1项之时,则这一段的数据即不存在异常状况;(2)在铬参量的转移概率序列存在有少量的0值之时,同时数据流当中少数时间点数据均不为m簇,那么这一段落数据当中则存在有少量的几个噪声点,此为传感器状态异常,可忽略不计;(3)若k个参量的转移概率序列存在有一连续的整段0值时,那么数据流当中的一大段时间点数据则均不属于m簇,相应的即可判定设备出现了异常运行状况;(4)针对设备所出现的异常状况,可依据参量转移概率序列经过0点位置的情况,判定出设备发生异常情况的具体时间点。

4 结语

本次研究所探讨的方法其优点即为能够结合多元状态量的历史数据及目前数据,同时可以实现对动态数据的异常检测,相较于一般的阈值判定方法而言准确率相对较高。在设备被检测出异常状态后,此项检测方法同时也存在有一定的缺陷,在今后的工作当中进行不断改进与完善,从而避免由于外界环境异常所带来的不利影响。

参考文献

[1] 王佳明,刘文颖,魏帆,等.基于寿命周期成本管理的输变电设备状态检修策略研究[J].电力系统保护与控制,2014,(5).

[2] 孙才新.输变电设备状态在线监测与诊断技术现状和前景[J].中国电力,2015,(2).

[3] 孙鹏,李剑,张劲,等.基于Markov过程的输变电设备一体化智能监测装置可靠性评估[J].高电压技术,2015,(12).

(责任编辑:小 燕)