不平衡条件下基于WGAN-DT的变压器故障诊断研究

2023-08-21 04:19王锦
现代信息科技 2023年12期
关键词:决策树故障诊断变压器

摘  要:变压器作为电压转换设备,一旦发生故障,直接影响设备性能。然而在设备运行过程中,变压器系统大多处于正常状态,故障发生频率较低,所监测到的正常状态数据远远多于故障状态数据,存在样本不平衡问题。在变压器系统故障诊断技术和不平衡样本处理技术的基础上,研究了基于Wasserstein生成对抗网络与决策树相结合的WGAN-DT故障诊断技术。结果表明,样本平衡时,采用WGAN-DT模型在测试集上的故障诊断准确度高达96.00%。

关键词:变压器;故障诊断;不平衡数据;生成对抗网络;决策树

中图分类号:TP39;TM432 文献标识码:A 文章编号:2096-4706(2023)12-0043-05

Research on Transformer Fault Diagnosis Based on WGAN-DT under Unbalanced Conditions

WANG Jin1,2

(1.School of Electronics and Information, Xi'an Polytechnic University, Xi'an  710048, China;

2.State Grid Xi'an Gao Ling District Power Supply Company, Xi'an  710299, China)

Abstract: As a voltage conversion device, a transformer can directly affect the performance of the device if it malfunctions. However, during the operation of the equipment, the transformer system is mostly in a normal state, with a low frequency of faults. The monitored normal state data is far more than the fault state data, resulting in sample imbalance issues. On the basis of transformer system fault diagnosis technology and imbalanced sample processing technology, WGAN-DT fault diagnosis technology based on Wasserstein generative adversarial network and decision tree is studied. The results indicate that the fault diagnosis accuracy of using the WGAN-DT model on the test set is as high as 96.00% when the sample is balanced.

Keywords: transformer; fault diagnosis; unbalanced data; generative adversarial network; decision tree

0  引  言

變压器作为大型设备电源系统的关键组成部分,对机载用电设备的稳定性发挥着重要作用。随着设备智能化、自动化的飞速发展,变压器系统也呈现出大功率、不间断的特点,表征变压器系统的运行参数也呈现出海量、高维等特征。然而在设备运行过程中,变压器系统大多处于正常状态,故障发生频率较低,所监测到的正常状态数据远远多于故障状态数据[1],存在样本不平衡的问题。

针对以上问题,通过Wasserstein生成对抗网络(Wasserstein Generative Adversarial Network, WGAN)拟合数据的特点,构造用于训练决策树(Decision Tree, DT)故障诊断模型的增强样本集,通过改善样本集的不平衡情况来提升故障诊断效果。实验结果表明,随着生成样本的增多,故障诊断准确度不断提升,最高可达到96.00%。与经典的故障诊断模型和采样方法相比,所提的WGAN-DT方法在不平衡样本故障诊断问题上具有显著优势。

1  WGAN-DT基本理论

针对变压器系统故障诊断领域存在的样本不平衡问题,以及传统重采样方法存在的生成数据质量差、类间重叠度高、多样性不足等问题[2],提出一种基于WGAN-DT的故障诊断方法,对样本不平衡条件下变压器的故障类型进行准确分类。

1.1  WGAN

生成对抗网络(Generative Adversarial Network, GAN)基于零和博弈的思想,生成器和判别器在双方的对抗中不断更新达到纳什均衡。生成器和判别器的损失函数设置如式(1)和式(2)所示[3]:

其中:V(D, G)表示目标函数;D表示判别器;G表示生成器;x表示真实样本的数据;z表示输入的随机噪声,Pdata(x)表示x的数据分布,Pz表示z的数据分布。

GAN虽然能够生成与真实样本近似的生成样本,但在实际应用中仍存在训练过程不稳定、梯度消失等问题,且生成器生成的样本缺乏多样性,存在模式崩溃等问题。因此Arjovsky等人[4]将Wasserstein距离引入到判别器和生成器的损失函数中,用于度量两个分布之间的距离,解决了GAN中KL散度和JS散度突变带来的损失函数不连续、训练不稳定以及模式崩溃等问题。

1.2   WGAN-DT

在各类DT模型中,C4.5算法[5]适于处理变压器系统的连续型参数值,并根据各类参数的信息增益率选取各个节点的分类规则,因此选用C4.5算法构建用于变压器系统故障诊断的DT模型,能够有效提高变压器系统的故障诊断准确度。

在采用故障诊断模型对变压器系统的各类典型故障模式进行学习分类之前,使用WGAN生成各种少数类故障状态样本,增加故障状态样本的数量和多样性,构造平衡数据集作为DT故障诊断模型的输入,避免由于样本不平衡而导致模型过拟合,提升变压器系统的故障诊断准确度。不平衡样本条件下基于WGAN-DT方法的变压器故障诊断流程如图1所示。

2  不平衡样本条件下基于WGAN-DT的故障诊断技术

将正常样本作为多数类样本,其余8类故障状态作为少数类样本,分别是变压器电枢绕组单相开路故障、电枢绕组相间短路故障、电枢绕组单相对电机外壳短路故障、交流励磁机电枢绕组单相开路故障、交流励磁机电枢绕组相间短路故障、旋转整流器单个二极管开路故障、交流励磁机励磁绕组开路故障、交流励磁机励磁绕组对电机外壳短路故障,以此构造不平衡数据集,作为后续基于WGAN-DT方法实现样本不平衡条件下故障诊断的数据基础。研究将不平衡比例设为100:1,开展不平衡样本条件下的故障诊断技术研究。

按照一定的信噪比SNR向初始仿真数据加入噪声,增加样本的多样性,进而保证WAGN方法生成的数据具有多样性。

其中,PS表示信号能量,PN表示噪声能量。

2.1  基于WGAN的样本生成模型构建

根据多层感知机实现非线性函数拟合的特点,构建WGAN的生成器和判别器,实现生成样本真假判定值的非线性映射。WGAN算法的伪代码如下:

WGAN算法:更新k次判别器后更新1次生成器(设置k = 3),生成器迭代次数为t。

1)随机初始化生成器和判别器的参数θ0、w0。

2)输入:少数类故障状态样本data,随机噪声数据z。

3)对0→t次迭代。

4)对0→k次迭代。

5)从故障状态样本data中选取m个样本{x1, x2,…, xm}。

6)从噪声数据z中选取m个样本{z1, z2,…, zm}。

7)基于判别器损失值更新参数:

8)w - α×RMSProp(w, gw)→w。

9)结束。

10)从噪声数据z中选取m个样本{z1, z2,…, zm}。

11)基于随机梯度下降法更新生成器参数:

12)θ - α×RMSProp(w, gw)→θ。

13)结束。

14)输出:完成训练的WGAN模型。

在基于WGAN的样本生成模型中,生成器由两层全连接层构成,判别器由三层全连接层构成。WAGN模型采用RMSprop作为优化器,学习率为0.001,批量样本数量大小设置为40,迭代次数设置为10 000次,样本归一化范围为0到1,生成器輸入的随机噪声范围为0到1。

2.2  基于WGAN的故障状态样本生成

针对变压器系统存在的样本不平衡问题,采用WGAN模型生成的少数类故障状态样本,对原始不平衡样本集中的少数类样本进行扩充,共训练96个WGAN模型。图2以交流励磁机A相电枢绕组电流这一参数为例,将其中4种典型故障状态下真实样本的参数波形和基于WGAN模型得到的生成样本参数波形进行展示。

通过对比变压器系统8种典型故障状态,交流励磁机A相电枢绕组电流的真实样本和生成样本波形的变化趋势、周期、幅值等与真实样本具有较高的相似度,WGAN很好地学到了不同故障模式间原始参数的特征,生成效果良好,为后续扩充样本集,实现故障诊断提供良好的数据基础。

3  结果分析

3.1  基于增强样本集的故障诊断实验

基于训练好的WGAN模型生成变压器系统8种典型故障状态(故障代号为F1-F8)的各类监测参数,用于扩充原始不平衡样本集中的少数类故障状态样本。通过在原始不平衡样本集的每类故障状态样本中分别加入数量为10、90、190、990的生成样本,构造不平衡比例分别为50:1、10:1、5:1和1:1的增强样本集。

为验证基于WGAN模型生成的变压器系统故障状态样本对于改善样本集不平衡情况以及提升故障诊断的有效性,采用上述完成8种少数类故障状态样本扩充的增强样本集,训练DT故障诊断模型,并采用测试集对完成训练的DT模型进行测试,训练集和测试集的故障诊断准确度变化如图3所示,原始不平衡样本与增强样本集故障诊断结果的混淆矩阵对比如图4至图8所示。

由图3至图8可知,随着WGAN生成的少数类故障样本的不断补充,原始样本的数量和多样性都得到了提高,此外,样本的不平衡比例随之减小,样本不平衡对模型诊断性能和泛化能力的影响不断降低,因此,DT故障诊断模型在测试集上的故障诊断准确度得到不同程度的提升。在最原始的样本不平衡比例100:1条件下,故障诊断模型在测试集上的准确度仅为62.22%,随着生成样本的不断增加,基于增强样本集训练的DT故障诊断模型在测试集上的诊断准确度不断提升,最终基于平衡的增强样本集训练的DT模型,在测试集上的准确度可以达到96.00%,充分说明生成样本在很大程度上增强了各类故障状态样本的多样性,提升了故障诊断模型的性能。

3.2  故障诊断方法对比实验

为验证WGAN-DT故障诊断方法的有效性,将故障诊断领域常用的支持向量机模型、K近邻模型和DT模型与之进行对比。此外,为显示WGAN模型在变压器系统少数类故障状态样本生成方面的优势,将经典的重采样方法与DT模型相结合,构建不平衡样本条件下的变压器系统故障诊断方法。选取的重采样方法包括随机过采样、SMOTE、随机欠采样、Tomek Link以及SMOTE和Tomek相结合的混合采样方法等,用于对样本集进行平衡化处理。方法对比的故障诊断结果如表1所示。

通过与其他模型、重采样方法和DT模型相结合的故障诊断方法进行对比可知,WGAN-DT方法在变压器系统的不平衡样本集上的故障诊断准确率最高,达到了96.00%,比RUS-DT的方法高出7.33%,表现出明显的优势。经典故障诊断模型直接基于原始不平衡样本集进行训练,存在过拟合、泛化能力差等问题,使得诊断的正确率不高,而WGAN-DT训练增强样本集,避免了样本数据不平衡导致的模型过拟合,对少数类样本诊断正确度低的问题。

4   结  论

在不平衡样本条件下,本文提出基于WGAN-DT的故障诊断技术,构造不同不平衡比例的增强样本集,并对比基于不同不平衡比例的增强样本集进行训练后,DT模型故障诊断准确度的变化情况。结果表明,采用WGAN模型能够生成接近真实故障样本概率分布的生成样本,实现少数类故障状态样本数量和多样性的增加,有效提升了故障诊断模型对少数类故障状态样本的识别率,从数据层面解决了经典故障诊断模型在不平衡样本条件下诊断准确度较低的问题,显著提升了故障诊断模型的准确度。

参考文献:

[1] 邓永成,萧伟云,李伟,等.变压器的运行状态检测方法、装置、计算机设备和存储介质:CN 111524118 A [P].2020-08-11.

[2] 苏磊,徐鹏,黄华,等.一种考虑不平衡数据样本的变压器故障诊断方法及系统:CN 110133146 A [P].2019-08-16.

[3] GOODFELLOW I J,POUGET-ABADIE J,MIRZA M,et al. Generative Adversarial Nets [C]//Proceedings of the 27th International Conference on Neural Information Processing Systems.Montreal:MIT Press,2014:2672-2680.

[4] ARJOVSKY M,CHINTALA S L. Wasserstein generative adversarial networks [C]//Proceedings of the 34th International Conference on Machine Learning. Sydney:JMLR.org,2017,70:214-223.

[5] QUINLAN J R. C4.5 Programs for Machine Learn-ing [M].San Mateo:Morgan Kaufmann Publishers Inc,1992.

作者簡介:王锦(1996—),女,汉族,陕西西安人,助理工

程师,硕士研究生,研究方向:电力设备故障诊断、模式识别与深度学习。

猜你喜欢
决策树故障诊断变压器
理想变压器的“三个不变”与“三个变”
一种针对不均衡数据集的SVM决策树算法
决策树和随机森林方法在管理决策中的应用
开关电源中高频变压器的设计
基于决策树的出租车乘客出行目的识别
一种不停电更换变压器的带电作业法
变压器免维护吸湿器的开发与应用
因果图定性分析法及其在故障诊断中的应用
基于肺癌CT的决策树模型在肺癌诊断中的应用
基于LCD和排列熵的滚动轴承故障诊断