基于可变噪音的高压电缆局部放电样本扩充

2020-10-23 01:55刘文浩李文泽王洪雨吴毅江王干军AshfaqueAhmedBhatti彭小圣
广东电力 2020年9期
关键词:局放模式识别噪音

刘文浩,李文泽,王洪雨,吴毅江,王干军,Ashfaque Ahmed Bhatti,彭小圣

(1.广东电网有限责任公司中山供电局,广东 中山528400;2.强电磁工程与新技术国家重点实验室(华中科技大学),湖北 武汉 430074)

高压电缆作为电能传输的主要设备之一,是输配电系统不可或缺的组成部分[1-4]。对局部放电(partial discharge,PD,以下简称“局放”)的检测在高压电缆的检测与诊断技术领域获得了广泛的发展和应用[5-8],可以及时发现高压电缆存在的潜在故障,保障其安全运行[9-10]。但是局放类型复杂多样[7],对电力设备的危害程度也有所不同,需要有效的方法对其进行识别[8]。

高压电缆局放模式识别是局放检测与诊断的重要环节之一[10-12],如果模式识别过程中采用局放样本的数量相对不足,训练得出的识别模型往往泛化识别能力差,准确率低,而对局放样本进行扩充可以解决该问题[13]。根据模式识别理论,局放样本扩充可以提高模型的识别精度,一方面扩大训练数据的覆盖范围,使模型得到更充分的训练,另一方面有利于减少模型过拟合[10-11]。数据扩充主要有2种思路:一种是通过在实验室进行多批次实验,获取局放样本数据,但该方法主要靠人力完成,需要大量人力物力;另一种是基于实验室已有局放样本特点生成相似的新样本,或创造出全新的局放样本[14]。

文献[15]提出利用HR-DCGAN法来扩充样本,以解决帕金森等疾病判别时患者声纹样本偏少的问题;文献[16]提出Faster R-CNN算法,将威胁电网安全运行的隐患目标与背景图像按照一定规则进行融合,达到批量扩充样本集的目的;文献[17]中提出一种借助真实背景及真实物体来合成样本的方法,发现相比于全部使用真实样本,借助合适的方式自动生成样本加入训练集,可以有效扩充样本数据;文献[18]中Michiels等面对属性协变量数据缺失时的总体参数估计问题,采用模式混合模型和选择模型构建似然函数;文献[19]通过训练统计系统调用的频率信息,扩充传统异常检测算法的数据源。

目前,上述数据扩充方法在高压电缆局放模式识别领域的应用和研究还不多,本文提出基于可变噪音的高压电缆局放样本扩充的方法。与上述方法相比,可变噪音能够在不依赖任何先验假设的情况下,通过无监督学习,在较短的时间内快速获得样本数据间的潜在分布规律并合成或生成新的局放样本[20]。本文基于从实验室采集到的已有局放样本,基于可变噪音的方法来扩充局放样本数据。采用随机森林(random forest,RF)、支持向量机(support vector machine,SVM)、逻辑回归(logic regression,LR)3种模式识别的方法来验证本文所提方法的有效性。结果充分证明,通过数据扩充可以得到与原始样本具有高相似度的局放样本,利用较少的样本即可对局放模式进行识别,从而解决在局放模式识别模型训练过程中样本不足的问题。

1 局放样本获取及其分布规律

1.1 局放样本获取

本文采用的实验系统为IEC 60270系统,设置5种电缆人工缺陷进行加压实验(加压到11 kV),保持10 s,开始记录数据。每种人工缺陷各采集560个样本,一共获取2 800个局放样本。实验系统如图1所示。实验使用高速示波器对局放原始数据进行采集,为了能够采集1个周期内的工频信号,设定示波器采样时长为20 ms,采样率为100 ms/s。所采用的电缆为长度3 m的11 kV乙丙橡胶电缆(EPR),5种缺陷类型如图2所示。

实验针对每种人工缺陷分别开展加压测试。图1中,Zn为保护阻抗,Ck为耦合电容,Zm为检测阻抗,HFCT为高频电流互感器;图2中PVC为聚氯乙烯。

图1 PD实验系统Fig.1 PD experimental system

图2 5种局部放电缺陷类型Fig.2 Five types of PD defects

5种缺陷类型包括:类型1为电缆绝缘层空隙缺陷,类型2和类型3均为尖刺缺陷,类型4为外半导电层缺口缺陷,类型5为电缆终端沿面放电缺陷。缺陷类型的具体制作过程见文献[21]。本文使用的局放脉冲参数包括放电量、峰值电压、电压平均值、相位角、测试电压、等效带宽、小波参数(ED1—ED5,EA5,Ea1—Ea5,Ed1—Ed5)等34个特征,见表1。这34个特征的含义见文献[13]。

表1 局放样本的34个特征Tab.1 34 features of PD samples

1.2 局放样本的分布规律

局放相位图谱分析是局放分析的主要手段,本文基于第1.1节实验所获取的高压电缆5种类型人工缺陷局放数据,绘制不同类型局放的相位图谱,如图3所示。

图3 不同类型局放的相位图谱Fig.3 Phase resolved patterns of different types of partial discharges

通过局放相位图谱分析可知5种局放信号的电压幅值分布存在一定的差异性,具体结论如下:①局放类型1、2、3在电压幅值为0~30 mV范围重叠较大;②局放类型4、5在电压幅值为100~200 mV范围重叠较大;③放电类型5电压幅值分布范围最广,最大放电幅值可接近1 200 mV;④放电类型2的电压幅值范围最小,最大放电电压不超过30 mV。

2 可变噪音样本扩充方法

本文基于可变噪音方法,对实验室获取的2 800个局放样本数据进行扩充,扩充出另外2 800个局放样本。局放样本扩充流程如图4所示。

图4 局部放电样本扩充流程Fig.4 Flowchart of PD samples augmentation

该流程由局放样本获取、局放样本扩充、扩充验证和结果分析4部分构成。局放样本获取后依次进行人工缺陷设置和高压测试,在得到的原始数据中提取局放原始样本;在样本扩充阶段,设定局放样本噪音的正态分布参数,得到噪音的正态分布,然后将噪音与原始样本叠加,得到扩充后的局放样本数据;在数据扩充验证阶段,将对扩充后的样本通过RF、SVM、LR这3种方法进行模式识别;最后,对局放样本扩充结果开展对比分析。

正态分布的噪音水平概率密度函数为

式中:x为噪音水平值;μ为噪音正态分布均值(本文取0);σ为噪音正态分布的标准差。不同标准差下噪音水平的分布如图5所示。

图5 不同标准差下的噪音分布Fig.5 Distribution of noise with different standard deviations

3 局放样本扩充结果分析

3.1 基于可变噪音的局放样本扩充验证

图6为原始样本和扩充后样本的相位分布变化情况,其中图6(a)为原始样本分布情况,图6(b)为采用标准差为0.01的正态分布噪音水平扩充后的样本分布情况。由图6可知,数据扩充前后的样本整体分布比较接近,即通过数据扩充可以得到与原样本具有高相似度扩充样本。

图6 原始样本和扩充样本的分布情况Fig.6 Distribution of original and augmentation samples

局放的关键特征包含:放电量、峰值电压、等效宽度等。表2为在数据扩充前的分布情况,表3为局放样本扩充后的分布情况,表4为数据扩充前后的分布变化率。表4中大多数局放关键特征的变化微小,不超过1%,这也说明通过数据扩充可以得到与原样本具有高相似度扩充样本。

表2 数据扩充前关键特征的分布Tab.2 Distribution of key features before data augmentation

表3 数据扩充后关键特征的分布Tab.3 Distribution of key features after data augmentation using variable noise

表4 数据扩充后关键特征分布变化率Tab.4 Changing of key features after data augmentation using variable noise %

3.2 可变噪音扩充样本对提高模式识别精度的有效性验证

本文选取的34个特征参数的分布范围会随着噪音水平的变化而变化,因此会导致识别精度变化。本文采用RF、SVM、LR这3种方法验证所提方法的可行性。将5种缺陷类型共2 800个原始样本的75%作为训练集,25%作为验证集。在样本扩充之前,3种方法对5种缺陷类型的平均识别率分别为73.29%、84.14%、88.29%;样本扩充之后,新扩充的2 800个样本增加到训练集,验证集保持不变。3种方法在不同标准差下的正态分布噪音水平对5种缺陷类型的平均识别精度见表5,表6为识别精度的提升情况。

表5 不同噪音水平下的平均模式识别精度Tab.5 Average pattern recognition accuracy under different noise levels

表6 不同噪音水平下模式识别精度的提升Tab.6 Pattern recognition accuracy improvement of different training data sets under different noise levels

由表5和表6可以看出:①在噪音水超过0.1之前,基于可变噪音的样本扩充方法对3种模式识别方法的精度均有所提升,这充分证明了本方法对局放样本扩充的有效性;在噪音水平超过0.1之后,部分模式识别模型精度反而有所下降,建议该方法用于局放样本扩充时,将噪音水平控制在0.1以内。②本方法应用于LR模型,其识别精度在噪音水平为0.5之前提升了大约1.5%,在噪音水平为0.5之后,识别精度开始降低,识别精度的提升效果不理想,原因还有待进一步研究。③本方法应用于SVM模型,其识别精度在噪音水平10-7~10之间均有不同程度的提升,但是在噪音水平0.5之后,提升效果比噪音水平在0.5之前相对减弱。④本方法应用于RF模型时,局放模式识别精度除了在噪音水平5外,其他均有提升;在噪音水平为0.01时,识别精度提升至91.44%,提高了3.15%。

4 结论

本文将可变噪音方法应用到高压电缆局放样本的数据扩充中,得出以下结论:

a)通过数据扩充可以得到与原始样本具有高相似度的局放样本,且绝大多数局放关键特征分布的变化率都不超过1%,这从样本相似度的角度证明了基于可变噪音的样本扩充方法的可行性。

b)在噪音水平10-7~0.1之间,基于可变噪音扩充后的样本对RF、SVM、LR这3种方法的精度均有所提升,从模式识别的角度证明了可变噪音方法对局放样本扩充的可行性。

c)在噪音水平超过0.1之后,部分模式识别方法精度反而有所下降,所以建议可变噪音方法用于局放样本扩充时,将噪音水平控制在0.1以内。

d)基于可变噪音的数据扩充法应用于LR模型时,识别精度的提升效果不理想,其原因还有待进一步研究。

e)基于可变噪音的数据扩充应用于RF模型,噪音水平为0.01时,识别精度提升了3.15%,提升效果最大。

猜你喜欢
局放模式识别噪音
单局放传感器电缆局部放电源点定位方法研究
噪音,总是有噪音!
无法逃避的噪音
GIS特高频局放检测技术的现场应用
基于ATP-EMTP的电力电缆局放信号传播特性仿真分析
UPLC-MS/MS法结合模式识别同时测定芪参益气滴丸中11种成分
噪音的小把戏
白噪音的三种用法
第四届亚洲模式识别会议
可拓模式识别算法中经典域的确定方法