基于大数据挖掘的电力变压器健康状态差异预警规则策略

2024-02-21 09:41王晓蓉
电测与仪表 2024年2期
关键词:增长率预警聚类

王晓蓉

(陕西省地方电力(集团)有限公司,西安 710061)

0 引 言

变压器是电力系统中必不可少的电气设备,其可靠性直接影响到电力系统的安全[1],溶解气体分析(Dissolved Gas Analysis,DGA)技术是判断变压器状态的主要方法。与局部放电监测方法相比,它具有更强的抗干扰能力,在世界范围内得到广泛应用[2]。DGA在线监测系统可在一个监测周期内获得8种气体浓度,根据这些实时监测值,报警系统将实时瓦斯浓度及其上升率与设定的报警阈值进行比较,来判断变压器的运行状态。因此,合理设置预警阈值是保证预警准确率的关键[3]。

对于预警阈值的设置,已经存在多种方法,文献[4]提出了一种新的图解法,基于所有8种气体,一氧化碳(CO)和二氧化碳(CO2)作为重要指标。文献[5]也提出了一些新的指标,为克服传统图论方法的矛盾,采用基于特征气体的图形化技术对变压器故障进行了诊断。以上基于图论和新准则的方法可以克服一些局限性,但解决模糊边界问题仍然是一个挑战。

除了传统方法,人工智能技术的兴起,如人工神经网络和支持向量机等,也得到了广泛应用。文献[6]提出了一个基于模糊逻辑的强大专家系统。此外,文献[7]将基于模糊逻辑的自适应神经模糊推理系统应用于DGA。文献[8]使用深部信念网络(Deep Belief Network,DBN)来反映溶解气体比率与转换断层之间的数学相关性。人工神经网络、DBN、SVM和模糊逻辑等智能算法虽然可以取得较好的精度,但它们需要大量的样本数据和专家经验,并且耗费了大量的计算时间[9]。除此之外,这些方法忽略了变压器个体之间的差异特征。

为解决上述问题,提出了一种基于大数据挖掘的电力变压器健康状态差异预警规则策略。考虑了变压器个体之间差异设置预警阈值。实验结果验证了提出方法的有效性。

1 变压器分类

1.1 分变压器属性分类

由于属性和运行环境的差异,任何变压器都与其他变压器不同。这些属性包括电压等级、油型、结构、材料、容量、连接方式、制造等。运行环境包括区域、安装位置、使用年限、海拔、气候、负载等。但是,变压器在每个属性或运行环境中并未显示出明显的差异。因此,选择最佳分类属性作为差异分析的基础。选择最佳分类属性的原则是,这些最佳分类属性应能够最大程度地反映变压器之间的差异。根据文献[10]可知在对现场溶解气体大数据进行分析的基础上,区域、使用年限、电压等级、安装位置和油型是变压器分类的影响较大的候选属性。

1.2 候选分类属性聚类中心的计算

根据五个候选分类属性划分了共82,948,872条记录,每个属性下的详细分类如表1所示。

表1 根据候选属性对收集的溶解气体数据进行分类

对于每个候选属性,可以应用聚类方法来获取它们的聚类中心。基于聚类中心之间的欧氏距离,可以实现最佳的分类属性。考虑了四种聚类方法,包括k均值,自组织映射(Self Organizing Maps, SOM)和模糊C均值(Fuzzy C-means, FCM)[11-14]。但是,当考虑聚类效果和计算效率时,FCM是最合适的聚类方法。另一方面,复杂的现场操作环境会导致由变压器DGA在线监测系统获得的数据波动很大,而FCM中的模糊方法刚好可以处理这些波动。因此选择FCM作为聚类方法最为合适。

(1)

(2)

式中λj,j=1,2,…,n表示拉格朗日乘数。

最小化新目标函数的必要条件如下:

(3)

(4)

式中m表示模糊度,控制聚类中心的模糊重叠。并且满足1.5≤m≤2.5。

以H2、CO、CO2、CH4、C2H6、C2H4、C2H2和TH为数据集X。根据变压器的性质,将X分为c类。然后采用FCM来计算每个类别的聚类中心。结果显示在表1中。为了更直观地说明,在三维(3D)空间中绘制了不同电压等级分类下的三种典型溶解气体(H2、C2H2和TH)的聚类中心,如图1所示。小球代表实际数据,大球代表聚类中心。三维空间中的所有气体数据均采用最小-最大归一化方法进行处理。

图1 3D空间中各种电压等级下H2、C2H2和TH的聚类中心

1.3 最佳分类属性

如表2所示,由于每个候选属性下的子组件数不同,因此在不同候选属性下的聚类中心数目也不同。因此,使用平均欧氏距离来识别一种分类属性下聚类中心之间的离散度。C={c1,c2,…,ct}(t大于1)包括数据集X={x1,x2,…,xn}(n>t)的t个聚类中心。C的平均欧氏距离定义为:

(5)

表2 八种气体的聚类中心作为预候选属性

式中‖·‖ 表示L2-范数;t表示聚类中心的数量。

也就是说,如果一个分类属性的平均欧氏距离较大,则该分类下的数据更加分散,这表明该分类属性对溶解气体数据的影响更大。如果距离较近,则认为不能根据此分类属性对溶解气体数据进行有效分类,并且不能很好地反映变压器之间的差异。经过最小-最大标准化后,表3中显示了聚类中心之间的距离及其平均欧氏距离。在3D空间中绘制了三种典型溶解气体的聚类中心及其欧氏距离,如图2所示。

图2 H2、C2H2和TH聚类中心在3D空间中的欧氏距离

表3 分类属性的欧氏距离

根据表3,变压器的电压等级、使用年限和油型对设备的影响远大于区域和安装位置。换句话说,电压等级、使用年限和油型可以更有效地反映变压器之间的差异。因此,选择这三个属性作为最佳分类属性。

2 计算差异预警阈值

2.1 验证和建立分布模型

在每个分类属性下的溶解气体记录的数量非常大。在文中,将每种分类属性下的每种气体浓度数据放入“计算集”中。“计算集”包含从变压器投入运行的第一天到变压器状态改变的所有数据。选择所有时间的数据,而不是仅仅选择一段时间的数据,后者无法反映故障的动态和累积特征,因为缺陷和故障发展过程是动态的、累积的并且经常受多个因素影响[15]。

对于每个选定的“计算集”,根据适当的类宽度将计算集的范围划分为几个间隔,并对每个间隔内的气体浓度数据的频率进行计数。以气体浓度为X轴,频率/类宽度为Y轴,绘制频率分布直方图。以220 kV变压器的H2和500 kV变压器的TH的频率分布直方图为例,如图3和图4的深色区域所示。结果表明,从定性的角度看,气体浓度数据的分布符合Weibull分布。然后,如图3和图4中的圆点和线所示,使用Weibull概率图来验证该结果。X轴表示对数形式的气体浓度,Y轴表示Weibull百分位数。圆点是实际气体浓度,线代表标准的Weibull分布,其形状和比例如图3和图4所示。从圆点和线之间的关系可以看出,实际气体浓度符合Weibull分布,置信度为99.9%。图3和图4中带有明显形状和比例参数的Weibull概率密度曲线的黑线进一步证明了这一结论。

图3 220 kV变压器H2的频率分布直方图和Weibull概率图

图4 500 kV变压器TH的频率分布直方图和Weibull概率图

仅根据溶解气体的浓度,仍然很难对故障的严重性做出正确的判断,因为故障通常始于低能量和潜伏放电。还必须考虑故障点的气体增长率。IEC 60599标准以一年中气体浓度的绝对增加作为增长率。GB/T7252考虑了变压器的体积、油密度、气体浓度,以得出绝对的气体增长率。IEC 60599中定义的时间跨度太长,这使得实时分析变得困难。很难从DGA在线监测系统获得变压器体积和油密度。根据电力负荷的波动特征和现场经验,采用当前浓度和附近的六个历史值来计算气体增长率。根据最小二乘法,线性拟合七个样本数据以获得趋势曲线,并将曲线的斜率作为气体增长率。

对于气体浓度样本数据Y={y1,y2,…,y7},附加了时间戳T={1,2,…,7}。气体浓度的趋势符合式(6):

y=f(t)=at+b

(6)

其中a和b是未知参数。Y中每个样本点的残差如下:

Ei=yi-(ati+b),i=1,…,7

(7)

目标函数定义为:

(8)

根据波峰定理,当a和b满足等式(9)时,目标函数F(a,b)达到最小值:

(9)

将该曲线的斜率(式(9)中的a)设定为第7次时间戳的气体增长率。当斜率为负时,气体增长率等于零。如图5所示,获取了一个变压器的所有H2数据以计算气体增长率,其中放大的图片显示了拟合过程。

图5 变压器中H2的气体浓度和增长率曲线

使用上述方法,采用220 kV和500 kV变压器中C2H2和C2H6的气体增长率来绘制频率分布直方图和Weibull概率图,如图6和图7所示。根据这两张图,气体增长率数据也符合Weibull分布,置信度为99.9%。

图6 220 kV变压器C2H2增长率的频率分布直方图和Weibull概率图

图7 500 kV变压器C2H6增长率的频率分布直方图和Weibull概率图

2.2 溶解气体分布特征与缺陷/故障率的关联分析

对于变压器,其与溶解气体有关的异常状况可分为两种不同的类型,一种是“缺陷”,另一种是“故障”。“缺陷”表示变压器有故障,但仍可以正常运行。“故障”表示变压器处于非常严重的异常状态,需要进行离线实验和中断维护。缺陷率和故障率是电网中整个变压器稳定性的关键指标。因此,在文中提出的差异预警系统中,分别为“缺陷”和“故障”定义了溶解气体的“注意值”和“报警值”。“注意值”和“报警值”是两个不同的预警阈值,后者大于前者。变压器状态与气体浓度和增长率之间的关系按式(10)进行分析:

(10)

式中C和R分别代表气体浓度和气体增长率;CAttn和RAttn分别是气体浓度和气体增长率的注意阈值;CAlm和RAlm分别是气体浓度和气体增长率的报警阈值。

绘制图8中的式(10)表示的关系,可清楚地看到溶解气体分布特征与缺陷/故障率之间的关联关系。透明的浅色表示实际数据的直方图。黑线是实际数据的拟合曲线,各区域分别表示来自正常、缺陷和故障变压器的数据。颜色不同区域的比例分别代表正常率、缺陷率和故障率。

图8 溶解气体分布特征与缺陷/故障率之间的关联

2.3 预警阈值的计算

根据以上分析,气体浓度和增长率数据符合Weibull分布,其特征与缺陷/故障率有关。 因此,可以根据Weibull分布获得预警阈值。

Weibull分布是可靠性分析和寿命测试的基本理论。它广泛应用于可靠性工程中,特别适用于金属材料、电子元器件和其他工程领域的疲劳寿命问题。Weibull分布的概率密度函数定义为式(11),其累积概率分布函数如式(12)所示:

f(x)=(β/η)(x/η)β-1e-(x/η)β

(11)

F(x)=1-e-(x/η)β

(12)

式中β代表形状参数;η代表缩放参数。这两个参数可以唯一确定Weibull分布模型。最大似然法通常用于估计这些参数。

对于气体浓度数据集或气体增长率数据集X={x1,x2,…,xn},n表示X的数量,θ表示参数列(β,η)。对数似然函数为:

(13)

似然方程为:

(14)

当组合式(13)和式(14)时,可以获得参数β和η。对于任何分布,如果给出了累积概率,则可以通过使用逆累积分布来获得与此累积概率关联的响应值。Weibull分布的逆累积分布为:

x=F-1(p|η,β)=-η[ln(1-p)]1/β,p∈[0,1]

(15)

式中p是累积概率;x是估计值。

根据上述关联规则,当累积概率等于1-故障率时,可以获取报警值。当累积概率等于1-故障率-缺陷率时,可以获得注意值。

2.4 预警阈值结果

对选定的三个最佳分类属性的缺陷率和故障率进行计算并显示在表4中。根据挖掘的计算规则来计算这三个最佳分类属性的注意值和报警值,如表5所示。

表4 最佳分类属性的缺陷率和故障率

表5 在使用年限、电压等级和油型分类下的注意值和报警值

3 差异预警规则的挖掘

对于每个变压器,可以获得总共24组气体浓度和增长率的预警值,涵盖了八种溶解气体和三种选定的最佳变压器属性。每种气体在不同属性下的预警值的交点被当作最终的差异化预警值。气体数据与注意/报警值之间的关系可以分为注意值以下、注意值与报警值之间以及超过报警值。可以根据那些差异预警值和预警关系来挖掘差异预警规则。将实时气体浓度和气体增长率值与不同的预警阈值进行比较,可以分别获得变压器的状态。将气体浓度和气体增长率作为二维相关规则,如式(16)所示,可以最终确定变压器的运行状态。

(16)

式中C和R分别代表气体浓度和气体增长率;CAttn和RAttn是注意阈值;CAlm和RAlm是报警阈值。

根据此规则,变压器的运行状态可以分为四个阶段:正常、注意、异常、严重,如表6所示。实际上,一旦检测到实时溶解气体数据,便可以启动预警过程。利用所选变压器属性的差异化的预警阈值,可以实现差异预警过程。

表6 差异预警规则

4 验证实例

现场使用了一个变压器来验证提出的差异预警规则。根据离线实验,该变压器在2014年3月16日-5月25日之间被诊断为高温故障。该变压器在220 kV电压下工作,充满25#变压器油,使用寿命为10年-20年。根据该变压器的属性,可以获得一系列预警值,如表5所示。选择这些预警值的交点作为最终预警值,如表7所示。提取该变压器的在线监测数据以计算气体增长率。图9和图10绘制了2月22日-6月12日气体浓度和增长率的趋势图。在图9中,“严重”信号将在3月16日和5月25日左右发出,因为C2H4的浓度超过注意值,并且其增长率超过3月16日的报警值,并且C2H4的浓度和增长率都超过了5月25日左右的报警值。从图10可以看出,在3月16日和5月25日也会发出“严重”信号,这是因为3月16日前后总碳氢化合物的浓度超过了注意值,并且其增长率超过了报警值,并且浓度和增长率都超过了5月25日的报警值。但是,如果使用150 μL/ L作为IEC 60599标准中提出的注意值,则这些预警信号很容易被忽略。总之,与现有标准相比,差异化预警规则可以更准确地检测故障。

图9 C2H4浓度和增长率趋势图

图10 TH浓度和增长率趋势图

表7 验证变压器的最终预警值

为了进行更广泛的验证,选择了诸如ANN、DBN、SVM和模糊逻辑方法之类的智能算法,以与所提出的差异预警规则进行比较。在验证之前,将变压器分为训练集和测试集。训练集中有815个案例,其中800个正常案例和15个异常案例。测试集有528例,包括514例正常和14例异常。验证结果如表8所示。

表8 使用ANN、DBN、SVM和模糊逻辑智能算法进行验证

选择准确率、误报率和漏检率来定量验证该预警规则。准确率是反映正确识别正常和异常案例的比例的指标。计算公式为:

(17)

式中μaccuracy代表准确率;numn-n代表被判为正常的正常例数;numa-a代表被判为异常的异常例数;numtotal代表总例数。

误报率是代表正常案例被判定为异常的比例的指标。计算公式为:

(18)

式中μfp表示误报率;numn-a表示判断为异常的正常例数;numnormal表示正常案例总数。

漏检率是代表被判断为正常的异常案例比例的指标。计算公式为:

(19)

式中μfn代表漏检率;numa-n代表被判断为正常的异常例数;numabnormal代表异常案例总数。

除了上述准确性指标外,计算时间对于变压器预警方法也很重要。计算时间过长,无法满足预警的及时性要求。由IBM生产的、配置为Intel-Xeon(R)CPU E5-2630 v3 @ 2.40 GHz×32 RAM 128 GB的计算服务器和CentOS 7操作系统被用作验证的计算平台。构建了MATLAB 2017b软件作为分析平台。

分别对差异预警规则、常规预警规则、ANN、DBN、SVM和模糊逻辑的准确率、误报率、漏检率和计算时间进行比较,结果如表9所示。

表9 不同方法在准确率、误报率、漏检率和计算时间上的比较

根据表9,可以看出,尽管差异预警规则与常规预警方法相比花费更多时间,但是准确率显著提高,并且漏检率和误报率显著降低。每台变压器的差异预警规则的平均预警时间为2.78 s,可以满足及时性要求。

与智能算法相比,尽管ANN、DBN和模糊逻辑方法可以产生与差异预警规则相似的准确性,但漏检率和误报率较高,计算时间明显更长。特别是,需要大量训练的ANN和DBN会浪费大量时间,无法满足及时性要求。综上所述,差异预警规则在各个方面都是极好的,并且更适合于变压器的预警。

5 结束语

文章探讨了差异化的预警规则,以获得具有不同属性和工作条件的电力变压器的细致和个性化的预警结果。提出了最优分类属性的选择方法和差异预警阈值的计算规则,在此基础上,挖掘了差异预警规则。实践证明,挖掘预警规则能够较好地实现对电力变压器运行状态的预警。该方法的优点可以总结如下:

(1)将FCM和欧氏距离方法应用于溶解气体大数据中,挖掘出对溶解气体数据影响最大的最佳变压器属性,从而更好地表征变压器之间的差异。确定了三种最佳变压器属性包括电压等级、使用年限和油型;

(2)经验证,根据分布直方图和概率图,气体浓度和气体增长率均符合Weibull分布。通过分布特征与缺陷/故障率之间的关联分析,可以计算出三种选择的最佳分类属性下的气体浓度和气体增长率的预警阈值;

(3)结合气体浓度预警阈值和气体增长率预警阈值,可以得到差异预警规则。与传统的阈值诊断方法和智能诊断方法相比,可以得出差异预警规则不仅在较短的计算时间内准确率高达98.21%,而且需要较少的故障案例。此外,差异化预警规则可以有效降低误报率和漏检率,具有较强的鲁棒性。

猜你喜欢
增长率预警聚类
2020年河北省固定资产投资增长率
2019年河北省固定资产投资增长率
法国发布高温预警 严阵以待备战“史上最热周”
园林有害生物预警与可持续控制
基于DBSACN聚类算法的XML文档聚类
国内生产总值及其增长率
基于高斯混合聚类的阵列干涉SAR三维成像
货币供应量同比增长率
机载预警雷达对IFF 的干扰分析
一种层次初始的聚类个数自适应的聚类方法研究