数据驱动下窃电智能分析系统的研究

2020-07-12 07:34刘宝云张晓华生西奎
吉林电力 2020年3期
关键词:功率因数用电量用电

刘宝云,崔 文,张晓华,生西奎,吕 曈

(国网延边供电公司,吉林 延吉 133000)

随着我国经济的快速发展,工业生产和居民用电需求不断增大,用电数量逐年攀升,有部分用户通过各种的手段窃取电能。传统的窃电检查一方面由于用户数量多,现场逐户排查工作量大,效率低;另一方面由于窃电手段多样,用电检查人员现场检查有时难以发现,造成电量持续丢失。

近年来,窃电手段新颖多变,一般有以下几种常见的窃电方式:欠压法、欠流法、移相法、扩差法等[1-3],现阶段关于窃电检测方法主要有统计学方法、支持向量机、聚类分析等[4-5],如文献[6]基于离群点算法对窃电方法进行研究。随着云计算、物联网、人工智能等信息化技术的快速发展,以海量数据挖掘为代表的大数据技术得到了空前的发展,在很多行业得到了广泛的应用[7-9]。近年来,电网企业在信息化建设和应用方面较为突出,在多个专业领域建成并应用了多套业务系统,包括用电信息采集系统和SG186系统等[10],这些信息化系统在应用过程中产生了海量的电网运行数据,具有大数据应用的典型特征:数据量大、数据类型多、价值密度低等特点[11-12]。将大数据技术应用到智能电网领域,是泛在电力物联网的具体应用,也是国家“一带一路”战略的重要组成部分[13]。

本文采用人工智能和大数据技术,基于智能电表数据远程采集技术和用电信息采集系统海量的多元数据,从用电信息采集系统和SG186系统中的海量数据中提取出窃电用户的关键特征,依据关键特征构建用户窃电的关联性多维度分析模型,实现自动判断用户是否存在窃电行为。

1 系统总体框架

数据驱动下的窃电数据分析系统主要包括三个模块:数据预处理模块、窃电评价指标体系模块、窃电识别检测模块。数据预处理模块将用电信息采集系统中多元化的数据进行关联性分析、降维处理、归一化处理以及数据填充等,得到量化的电气特征参量作为窃电评价指标模块的输入;窃电评价指标模块将量化的电气特征参量通过算法确定参数和量化权重,从而使评价指标集能够准确表征窃电行为所具有的规律,建立窃电数据分析所需要的专家样本数据;窃电识别检测模块基于样本数据采用神经网络算法建立窃电分类预测模型,得到窃电检测结果。整个流程见图1 。

2 窃电关联性多维度评价指标

随着智能电表的推广,实现了分钟级(15 min)的数据采集,用电信息采集系统中采集到的用电负荷数据(各相电流、电压、功率因数、台区线损等)以及用电异常(终端报警及违约窃电处罚信息等)等数据信息能够反映用户的用电情况,同时,用户每日、每月的用电量及用电异常情况也反映了用户的用电行为。

用电信息采集系统中能够采集到各相电流、电压、功率因数等用电负荷数据以及用电异常数据,系统中包含了各类用电用户的实时及历史电能信息(如计量在线监测、线损分析等),计量在线监测采集用户电能信息进行对比分析,对各类异常事件进行告警提示,并与营销系统进行闭环处理,因此,通过分析用电信息采集系统的电气特征参量,建立电气特征参量与窃电模型特征的关联性关系,为甄选窃电模型的多维度特征值提供分析依据。

通过调研发现,用电行业类别与窃电有着一定的关系,对计量数据根据用电行业采用决策树算法进行验证,证实了用户用电行业、用电量、用电时间与窃电有着密切的关系,因此按行业类别如非工业用户、居民用户、供热用户、酒店餐饮用户、普通工业用电用户等进行有针对性的构建窃电预测模型,将大大提高预测的准确性。

将采集系统中的电气参量与窃电模型特征参量按类别进行分类和对应,共分为三类:I类为物理电能数据(如相电压、相电流、日用电量、有功功率等),II类为越限和线损率(如功率因数、线损及线损值变换率、电压/电流不平衡度越限等),III类为异常事件记录(如电流回路异常、电压回路异常、电能表开盖记录、电压断相等)。

通过海量数据,建立用电信息采集系统中各类数据、异常事件与窃电有关的关联性关系,从中提取窃电用户的关键特征,根据窃电多维度特征值,构建窃电关联性多维度评价指标(见图2),为供电企业反窃电稽查提供窃电预警模型的数据支撑。

三相电流不平衡率和三相电压不平衡率表征的是用电过程中电压和电流的波动情况。用户改变计量电流是窃电中常用的一种方式,在三相供电系统中,正常用户的电流和电压基本保持平衡,若存在三相电流(电压)不平衡率较大,则表明该用户存在窃电嫌疑,其计算方式为三相电流(压)的最大值与最小值之差比上最小值。

线损率作为衡量供电线路的损失比例,通过台区线损结合局部线路拓扑关系,可计算出用户所属线路在某天的线损率。鉴于用户每天所用电量存在一定的波动,采用统计该用户t天的线损平均值,根据前后t天的线损增长率是否大于1%,从而判断该用户是否存在窃电行为。

功率因数异常是一个相对稳定值,而且与用户电量使用时间无关,因此,可将功率因数作为窃电的一个主要的参考评价依据。《功率因数调整电费办法》中规定,工业用户功率因数应大于0.8,考虑到系统其他行业用户,可将功率因数异常的阈值进行调整,比如0.6,统计功率因数异常大于阈值的次数作为模型评价指标。

异常次数是用电异常事件的总和,异常事件主要包括电流回路异常、电压回路异常、电能表开盖事件记录等,统计与窃电相关的异常事件的次数,作为窃电模型评价指标。

用户日用电量是表征电量使用最具代表性的指标特征,用户窃电最终表现在用电量下降这一表象上,正常用户的用电量相对平稳,窃电用户的用电量则会出现陡降趋势,因此,电量降幅应作为窃电评价指标中一个重要的特征指标。因节假日的关系,用户电量降幅采用统计连续5天的日用电平均值的斜率作为衡量指标。

3 数据预处理

数据预处理包括数据清洗、缺失数据值处理、数据归一化处理等。

数据清洗是将样本数据中特别离谱的数据、标注不明确的无效数据等进行剔除,将赘余的数据过滤掉。

原始数据中不可避免的出现缺失值的现象,尤其是用户电量、功率等参数的缺失将直接影响窃电分析和预测的准确性,常用的数据插补算法有K近邻填充(KNNI)算法、拉格朗日插值算法等。本文采用最小二乘法的拟合算法对用户日用电量进行缺失数据插补。

数据归一化处理是根据窃电评价指标将原始数据进行标准化,一般将样本数据处理为0~1的数,数据归一化的公式如为:

(1)

式中:xi为样本数据中任意第i个样本值;xmin为样本数据中的最小值;xmax为样本数据中的最大值。

4 模型构建

神经网络作为人工智能中经典的算法,具有自适应能力和很强的鲁棒性、容错能力,本文利用神经网络结合数据技术构建基于海量数据的窃电识别检测模型,预测用电窃电嫌疑。

BP神经网络是一种按误差逆传播算法训练的多层前馈网络(输入层、隐含层、输出层),通过反向传播不断调整网络的权值和阈值,使网络的误差平方和最小。

算法实现过程如下:有k个输入样本x(k);期望输出值为d(k);实际输出值为y(k);设定误差函数e为:

(2)

计算隐含层各神经元的激活函值sj:

(3)

式中:wji为输入层到隐含层的连接权值;θj为隐含层各单元的阈值。

激活函数采用S型函数:

(4)

计算隐含层j单元的输出值bj:

(5)

计算输出层第k个单元的激活值sk:

(6)

式中:vkj为输出层到隐含层的连接权值;θk为输出层各单元的阈值。

修正输出层和隐含层的权值和阈值,输出层的校正误差为:

dk=(ok-yk)yk(1-yk)

(7)

式中:yk为实际输出,ok为希望输出。

最终得到神经网络的全局误差E:

(8)

设定BP神经网络的输入节点数为3,输出节点数为1,隐层节点数为10,将表征用户历史用电数据的评价指标数据作为输入,将窃电结果(是否窃电0或1)作为期望目标输出,对BP神经网络进行训练,当模型训练达到精度要求时,将待检测的用户数据输入到训练好的模型中,进行窃电嫌疑预测。

5 系统测试验证

因用户行业类别与用电量、电费、用电时间密切相关,根据模型测试,发现用电行业与窃电行为有着一定的关联,所以本文根据模型特征,将数据分为供热用户、餐饮用户、居民用户、工业用户进行模型检测,提高模型预测的精确度。

以某供电局2014年1月至2018年12月的用电信息采集系统中的数据作为测试对象,经现场勘查取证,确认窃电用户数8个,系统模型预测结果见表1 。

表1 系统模型预测结果

从表1也可知预测窃电的预测值与实际窃电有很高的吻合度,在一定程度上反映了模型预测的准确性,为大数据背景下开展窃电侦查工作提供了技术依据。

6 结论

随着智能电表的推广及用电信息采集系统建设的逐步完善,电网公司积累了海量用户用电数据,为大数据技术在电力领域的应用提供了基础。本文提出一种基于神经网络和决策树算法的窃电预测模型,从试验比对和验证结果看,基于优化的神经网络能更快的收敛并且准确性也相对提高。

猜你喜欢
功率因数用电量用电
02 国家能源局:1~7月全社会用电量同比增长3.4%
01 国家能源局:3月份全社会用电量同比增长3.5%
安全用电知识多
国家能源局:3月份全社会用电量同比下降4.2%
对输配电及用电工程的自动化运行的几点思考
为生活用电加“保险”
用电安全要注意
一种高精度功率因数测量电路
低压大电流开关电源的功率因数校正技术
单级功率因数校正技术的研究