用户用电行为分析技术研究

2015-06-24 08:14谢晓华
电气技术与经济 2015年5期
关键词:用电量用电聚类

谢晓华

(广东电网有限责任公司湛江供电局)

0 引言

近年来,在电力用户分类方面已经有一部分学者展开了相关的研究,冯晓蒲[1]等基于传统行业划分,对用户进行聚类分析研究,但其不足之处在于忽略了用户间不同的用电方式;王璨[2]等主要从用户价值体现方面进行分类,不足之处在于划分方式过于宏观;李培强[3]等从变电站负荷出发,采用均值聚类方法进行用户用电的分类,该方法效果较好;阮文骏[4]等也针对电价进行研究,但并未把用户分类差别考虑 在内。

本文首先分析和整合了用户用电量的相关数据,然后基于云计算的聚类算法进行用户个性化分类研究;并在此基础上设计模型进行非介入式用电负荷分解与识别研究,以期挖掘出用户类型,帮助电网公司制定相应的需求相应,达到节能减排的目的。

1 用户电量数据分析与整合

1.1 用户电量数据分析

以现在的小区为例,用户的用电信息历史数据主要包含以下类型:家庭地址、单元门号等家庭基本数据信息;电表序号、居民用电量以及电量抄记日期等用户用电信息采集数据;天气、温度等相关环境数据;家电类别、用电量与用电时长等家居数据。假设有100万户家庭,仅仅一天产生的数据量就高达将近60GB的数据。本文希望能采用数据挖掘技术,从这些存储的海量数据中把其中更高价值的知识挖掘 出来。

1.2 用户电量数据整合

在整合用户电量信息数据时,本文以用电量为指标,建立了用电基本数据表、用电设备表以及用户信息表,分别从用电时长、用电家居信息以及用户数据方面存储并整合采集到的用户电量信息数据,为数据挖掘的开展提供数据基础[6]。用电基本数据表包括电表序号、设备ID、用电时长以及总用电量,据此可以建立数据仓库模型;用电设备表内容主要由设备ID、设备类型以及生产厂家等,便于对用户需求的进一步分析;用户信息表主要用来存储用户基本信息,其中的用户ID号与用电基本数据表中的电表序号相对应。

2 用户个性化分类研究

2.1 用户用电框架分析

本文在对用户用电信息数据进行个性化分类时,采用的是云计算与聚类算法并行的技术。在聚类算法中,本文选自了非常经典的K-means划分方法,在大规模数据聚类中,该算法具有高效的特点[5]。本文在对用户用电行为进行分析时,主要采用下图所示的框架图,包含以下三个模块的内容:数据采集、数据处理以及行为分析。数据采集主要是采集不同地点用户不同设备的用电信息数据;数据采集结束之后集中传输到云数据处理,进行数据的存储和管理,奠定最后分析用户用电行为的数据基础。

2.2 基于云计算的聚类算法研究

传统的K-means算法步骤为:选取数据集中的数据赋给初始的聚类中心;计算样本点与聚类中心之间的欧式距离,进行获取该样本点的所属类别;重新计算聚类中心;重复上述两个步骤,直至准则函数收敛。而基于云计算的K-means算法更有助于大规模数据的开发和并行处理,不仅更可靠,而且还具备高效和扩容能力强的特点。其中的云计算平台是由分布式文件系统以及计算模型组成,通过前者可以把海量的信息数据存储在数据库中,后者可以提供类SQL接口对数据进行高效分析。重新标记阶段是新中心店坐标的获得阶段,并在云计算平台的文件系统中更新阶段,并继续迭代至算法收敛。

图 用户用电分析结构示意图

3 非介入式用电负荷分解与识别研究

3.1 模型设计

本文设计的非介入式电力负荷分解模型主要用来完成两项任务:用电设备工作状态的检测和辨识;按照设备或设备类分解负荷总耗电量。根据以上需求,设计用电负荷分解模型如下:

其中,式(1)和(2)分别是在t时刻的用电总负荷的有功总功率以及无功总功率,式(3)中变量表示电器的工作状态,是布尔型变量。值得注意的是,在该模型中,式(1)和(2)的PL(t)和QL(t)都是已知量,是由实际中实测得到的;用电负荷分解的目标是每个用电设备的有功功率和无功功率;工作状态监测和辨识的目标是用户每个用电设备的工作状态标志;用电负荷分解的目标以及工作状态监测和辨识的标志均为未知量;用电设备在t时刻仅能表现出一种工作状态,还有总负荷不存在用电设备的情况,所以式(3)的约束条件必须要满足该模型才能成立。

3.2 分解与识别原理

对模型求解是为了估计用电设备功率和辨识用电设备工作状态。当已知用电设备工作状态时,常用分解法和差量估计法估计用电设备的用电功率,其中分解法是由公式直接估计每种用电设备的用电功率,差量估计法是在满足一定条件的基础上,由单位时间内的负荷功率变化量对用电设备的用电估计进行估计。辨识用电设备工作状态时,要明确LS是由何种工作状态产生的,还要确定在当前的用电总负荷中确实有LS集合的一个子集存在。对于不同类型的LS,其处理思路和方法往往有所不同,本文暂不赘述。

4 模拟结果与分析

4.1 指标定义

在对检测性能进行评价时,本文选用了以下指标:在估计用电设备的用电功率时,用到了功率检测绝对误差、功率监测相对误差以及功率监测绝对值,这些每一项指标都分为有功功率误差以及无功功率误差;在辨识用电设备工作状态时,用到了用电设备的准确辨识率、漏检率、错检率以及用电设备工作状态赚准确辨识率。

4.2 模拟结果分析

本文选定某小区的600户用户作为实验数据来源,首先采集了用户的用电信息数据,然后运用并行K-means算法完成用户的分类。根据用电规律来看,共可分为五类如下表所示,分别命名为空置房用户(A类)、老人家庭(B类)、上班族家庭(C类)、老人+上班族家庭(D类)以及商业用户(E类),其中A类用户的特点是用电量较低,波动不明显;B类用户的特点是白天用电量稳定,用电量下降趋势出现时段较早;C类用户的特点是有明显的波峰和波谷的用电量,夜晚用电量较多而且用电量下降趋势出现时段较晚;D类用户的特点是B、C两类用户特点的综合;E类用户全天都处在较高用电量的状态。

表 用户分类及用电特征

5 结束语

在云计算平台基础上探讨了并行K-means算法,综合提出多个电力特征,通过特征权重的计算,对用电用户进行分类,发现所用聚类算法达到了90%以上的准确率。从模型出发分析了模拟结果,能很好地把不同用电设备处在何种工作状态辨识出来,适用于用户电力负荷的分解,证明基于云计算的聚类算法的用户用电行为分析模型是行之有效的。

[1]冯晓蒲, 张铁峰. 基于实际负荷曲线的电力用户分类技术研究[J]. 电力科学与工程, 2010, 26(9): 18-22.

[2]王璨, 冯勤超. 基于价值评价的电力用户分类研究[J]. 价值工程, 2009(5): 64-66.

[3]李培强, 李欣然, 陈辉华, 等. 基于模糊聚类的电力负荷特性的分类与综合[J]. 中国电机工程学报, 2005, 25(24): 73-78.

[4]阮文骏, 王蓓蓓, 李扬, 等. 峰谷分时电价下的用户响应行为研究[J]. 电网技术, 2012, 36(7): 86-92.

[5]孙燕花, 李杰, 李建. 基于CURE算法的网络用户行为分析[J]. 计算机技术与发展, 2011, 21(9): 35-38.

猜你喜欢
用电量用电聚类
02 国家能源局:1~7月全社会用电量同比增长3.4%
01 国家能源局:3月份全社会用电量同比增长3.5%
安全用电知识多
国家能源局:3月份全社会用电量同比下降4.2%
基于K-means聚类的车-地无线通信场强研究
对输配电及用电工程的自动化运行的几点思考
为生活用电加“保险”
用电安全要注意
基于高斯混合聚类的阵列干涉SAR三维成像
基于Spark平台的K-means聚类算法改进及并行化实现