基于改进K-means的电力数据异常检测算法

2020-08-04 11:30吴蕊张安勤田秀霞张挺

吴蕊 张安勤 田秀霞 张挺

摘要: 异常检测方法在电力领域有着广泛的应用, 如设备故障检测和异常用电检测等. 改进了传统Kmeans聚类随机选择初始聚类中心的策略; 结合数据对象的密集度与最大近邻半径, 选择更加接近实际簇中心的数据点作为初始聚类中心, 并在此基础上提出了一种基于改进K-means 算法的电力数据异常檢测新方法. 实验表明, 上述算法具有更优的聚类效果和异常检测性能, 并且在应用于电力领域时, 算法可以有效地检测出异常电力数据.

关键词: 初始聚类中心; 密集度; 异常检测

中图分类号: TP393 文献标志码: A DOI: 10.3969/j.issn.1000-5641.201921012

0 引言

随着智能电网的不断发展, 现代电力技术正在向智能化、信息化、数字化方向高速发展[1]. 电力系统中各类设备实时数据的增加导致电网数据量飞速增长, 这些数据不仅增加了统计分析的难度, 而且数据异常、冗余、遗漏等问题严重影响了电网安全[2].智能电网容易受到信息及网络方面的攻击. 比如, 乌克兰和委内瑞拉停电事件, 都对当地社会造成巨大影响[3]. 因此, 如何在海量的日常数据中准确检测出异常的信息, 包括外部攻击数据和系统内部隐患数据, 对保证智能电网的安全运行具有重要意义.