基于GRU神经网络的电网告警信息分类研究∗

2019-07-10 08:18徐家慧肖林朋周雅爽
计算机与数字工程 2019年6期
关键词:预处理神经元向量

徐家慧 张 昊 肖林朋 何 慧 张 宇 耿 艳 周雅爽

(1.南瑞集团(国网电力科学研究院)有限公司 南京 211100)(2.北京科东电力控制系统有限责任公司 北京 100192)

(3.国网冀北电力有限公司 北京 100053)(4.华北电力大学 北京 102206)

1 引言

多年来,我国电网输变电设备运检模式主要是依据相应章程进行按期排查以及检修[1]。但此种模式存在种种弊端如过渡维修、维修不足等,不仅带来资源浪费,而且使得电力设备的可靠供电大打折扣,并且还存在增加设备隐患的可能性。随着电力系统规模的不断扩大,大型变电站的数量逐步增加,其自动化程度也越来越高,对变电站后台监控系统的要求更是日益上升[2],主要体现在其告警信息处理能力上[3]。遥信是将被监视厂站的设备状态信号远距离传给调度,通常用于测量开关的位置、变压器内部故障、保护装置的动作、通信设备运行状况等[4]。这些信息均以自然语言的形式记录,为分析这些告警信息对电网的影响程度,首先要对其进行基本的属性分类。目前,变电站后台监控系统存在的主要问题主要是缺乏对丰富的信息量的进一步处理,监控系统采集到各种模拟量、开关量信息后,只简单依照时间次序显示,没有做进一步的分析判断[5]。

机器学习领域包含了很多较为成熟且可以解决文本分类问题的算法,目前流行的有支持向量(SVM)[6~7]、K-近邻法(KNN)[8]、朴素贝叶斯[9]、决策树[10]等方法。这些方法也可以分为三大类:有监督学习、无监督学习和半监督学习。唐慧丰等人详细研究了中文情感分类问题,并对目前的有监督学习方法做了对比分析[11];李婷婷等从文本数据中人工构建若干特征,再利用传统的机器学习方法进行文本分类[12];李荣陆等利用最大嫡模型实现了中文文本分类[13]。相比于传统的机器学习算法,深度学习可以通过加深模型层级数量模拟人脑的信息处理过程,从而能够在输入的特征中进一步提取出更加抽象的层级特征,使得模型最终分类时所依赖的信息更加可靠。

本文开发了基于电网监控数据的设备风险运行评估系统,系统结构图如图1 所示。首先将收集到的设备故障指标导入系统,形成了设备故障指标体系;然后对告警信号进行预处理及语义分析操作;最后提出了一种电网告警信息分类模型,通过GRU 神经网络将信号按照其对电网影响程度大小进行分类。

2 电网监控数据语义分析

2.1 电网监控数据描述

电网监控数据主要包括电网目前是否正常运行,异常元件及其动作的信息等。告警信息按照其对电网的影响程度可分为五类:异常、事故、越限、变位、告知。其中,告知信号是提示类信息,不影响系统的正常运行,调度运行人员将重点放在异常、事故、越限、变位4 类上。事故及异常信号是需实时监控、立即处理的重要信号;越限信号主要反映遥测量超出报警的上下限区间;变位是需实时监控的重要信息。遥信信号通过自然语言描述表达电网的告警信息,是电网故障诊断的基础数据,表示电网内部产生故障或出现异常情况。遥信信号主要分为异常、事故、变位、告知四类,地区电网可采集的遥信信息往往会多达数万条甚至几十万条。

图1 设备风险运行评估系统结构图

2.2 数据预处理

以某电网近五年来的遥信信号为例,共包含3万条记录,经过剔除无效样本、人工标注日志类别、分词、过滤停用词等数据预处理步骤后,分为变位、告知、事故、异常四类类别,共27793 条有效数据。将文本数据以及停用词词库导入系统,并通过结巴分词的进行预处理。例如一条标签为“异常”的告警信息:“宽都二线CSC 纵联电流差动保护装置通信中断”,预处理结果为“CSC 纵联电流差动保护装置通信中断”。

2.3 语义分析

Word2vec 能够将文本词语转化为向量空间中的向量,而向量的相似度可以表示文本语义的相似度。Word2vec 包含CBOW 和Skip-Gram 两种训练模 型[14]。 本 文 采 用 的 是Skip-Gram 模 型 ,Skip-Gram 模型认为相似的词语具有相似的上下文语境,它使用一个大小为2l+1 的滑动窗口来对输入文本进行处理。在每个滑动窗口中,模型使用窗口最中间的词wk来预测它的上下文词汇wk-l,wk-l+1,…,wk+l,如图2所示。

Skip-Gram 使用一个优化的神经网络模型来训练词向量,它使用的神经网络只有三层结构:输入层,投影层,输出层[15]。其中输入层与传统的神经网络有所不同,输入的节点不再是一个标量值,而是一个向量,向量的每一个值为实数,训练过程中要对其更新,这个向量就是每一个词汇所对应的词嵌入(Word Embedding)。对于词汇量为N的语料,Skip-Gram 训练得到的词汇向量结果集是一个矩阵Md×N,其中d是结果向量的维数。M 的第k列向量ewk即为词汇的词向量。wk上下文wk+j出现的概率可用Softmax函数计算,如式(1)。对于整个语料数据,Skip-Gram 的目标是最大化公式(2)中的目标函数。

其中,θ是要学习的参数,j∈[-l,l],为输入向量,是输出向量。

图2 Skip-Gram模型结构图

遥信信号经过预处理之后利用Skip-Gram 模型进行计算,结果可作为告警信息分类算法的输入。图3 为文本分析的二维语义空间展示,在语义空间中的坐标距离越近,表明它们在日志中上下文越相像。

图3 二维空间中的语义相似度计算结果展示

3 电网告警信息分类模型

3.1 GRU神经网络

随着深度学习的研究和应用的兴起,研究者提出了将LSTM 神经网络应用于分类的方法,这种方法可以自动学习特征,有效建模长距离依赖信息,但是该模型较复杂,并存在着模型训练和预测时间长的缺陷。Cho,et al.于2014 年提出GRU 神经网络,旨在解决该问题,虽然GRU 如今应用不是很广泛,但该方法继承了LSTM 模型可自动学习wk特征,并能有效建模长距离依赖信息的优点,不仅在速度上有显著提升,且具有与LSTM 神经网络中文分词相当的性能[16]。

GRU 神经元中仅包含两个门结构:更新门和重置门,GRU 网络结构如图4 所示。对于更新门zt,取值越大表示当前神经元的要保留的信息越多,而上一个神经元的要保留的信息越少。对于重置门rt,当等式取值为0 时,表示要抛弃上一个神经元传来的信息,即只要当前神经元的输入作为输入,这样就可以使当前的神经元抛弃一些上一个神经元无用的信息。

图4 GRU神经元结构图

式(3)~(6)为GRU 神经网络的神经元数学表达公式。其中,zt表示更新门(Update Gate),rt表示重置门(Reset Gate),ht-1表示上一个神经元的输出,xt表示本次神经元的输入,Wz表示更新门的权重,Wr表示重置门的权重,σ表示Sigmoid 函数,ht表示本次神经元的输出值,h表示本次神经元中待定的输出值。

为验证GRU 神经网络模型的分类效果,本文与以下两种模型进行实验对比。

1)支持向量机(Support Vector Machine,SVM)

SVM是一种二分类的模型,其基本模型是在特征空间中定义了间隔最大的线性分类器。SVM 的学习策略是使间隔最大化,可形式化为求解凸二次规划问题,相当于正则化的合页损失函数的最小化问题[4]。

2)K最近邻(K-Nearest Neighbor,KNN)

KNN 是最简单的机器学习算法之一,也是理论上较为成熟的方法。该方法思路是如果一个样本在特征空间中有K 个最邻近的样本,且这些邻近样本中的大多数属于某一类别,那么该样本也属于这个类别[5]。

3.2 实验与分析

3.2.1 实验设计与评价指标

将5000 条告警信号分为训练集数据和测试集数据,比例为9:1。首先对数据进行剔除无效样本、人工标注日志类别、分词、过滤停用词等预处理操作;然后由上一步的分词结果作为Skip-Gram 模型的输入,进行词向量的训练;最后将得到的词向量作为GRU 神经网络模型的输入,进行训练得到电网告警信息分类模型。使用测试集数据对模型进行结果验证,并利用SVM、KNN模型验证GRU神经网络的效果。

完成分类后,使用混淆矩阵对结果进行评估,如表1 所示。混淆矩阵通过将模型预测的结果与测试数据进行对比,使用准确率(P),召回率(R)和度量值(F1)指标对模型的分类效果进行评估,指标计算方法如式(7)~(9)。

表1 混淆矩阵

3.2.2 实验结果与分析

表2 为三种模型的告警信息分类结果。实验结果表明,KNN 在短文本分类中准确率较低,GRU较SVM、KNN模型有较好的准确率,并且GRU要训练的参数少,在收敛的时间和需要训练的数据量上,也会更胜一筹,同时实验也验证了GRU 神经网络结构在电力设备风险运行评估领域的适用性。

表2 告警信息分类结果

4 结语

本文开发了电力设备风险运行评估系统,并在其基础上提出了电网告警信息分类模型。首先建立故障指标体系,然后对报警信号进行预处理,使用Skip-Gram 模型对报警信号进行训练,得到词向量后,将其用于GRU 神经网络分类,共分为变位、告知、事故、异常四类。实验结果表明了电网告警信息分类模型的有效性,该模型进一步提高了电网监控的自动化程度,省去了人工分类所浪费的各类资源,每个类别对电网影响程度大小都不同,自动化分类之后可以按照其对电网影响程度采取不同的解决措施,对电网的安全稳定运行具有十分重要的意义。

猜你喜欢
预处理神经元向量
KR预处理工艺参数对脱硫剂分散行为的影响
求解奇异线性系统的右预处理MINRES 方法
向量的分解
聚焦“向量与三角”创新题
污泥预处理及其在硅酸盐制品中的运用
AI讲座:神经网络的空间对应
仿生芯片可再现生物神经元行为
基于预处理MUSIC算法的分布式阵列DOA估计
这个神经元负责改变我们的习惯
研究人员精确定位控制饮酒的神经元