基于支持向量机的某地区电网短期电力负荷预测

2016-03-03 05:52万强王清亮王睿豪黄朝晖白云飞陈大军栗维勋
电网与清洁能源 2016年12期
关键词:数据挖掘向量变电站

万强,王清亮,王睿豪,黄朝晖,白云飞,陈大军,栗维勋

(1.国网石家庄供电公司,河北石家庄 050000;2.西安交通大学电气工程学院,陕西西安 710049)

基于支持向量机的某地区电网短期电力负荷预测

万强1,王清亮1,王睿豪2,黄朝晖1,白云飞1,陈大军1,栗维勋1

(1.国网石家庄供电公司,河北石家庄 050000;2.西安交通大学电气工程学院,陕西西安 710049)

负荷预测是电力系统安全经济运行的前提。随着电力系统的市场化和能源互联网的研究与发展,高质量的负荷预测显得愈发重要。分析了影响负荷预测的因素,对数据进行收集及挖掘,采用了基于支持向量机负荷预测算法对区域负荷进行短期预测,并进一步开展了针对城区的精细化负荷预测研究。结合某地区案例,对该算法进行验证,结果表明,该算法预测结果优越,相对误差率较小。

短期负荷预测;数据发掘;支持向量机

负荷预测是为了确定未来某时间区间的负荷数据,在进行负荷预测时需要考虑多种因素,比如天气气候、居民生活习惯、以及电力系统实际运行特性等。其中负荷是指电力需求量(功率)或用电量。由于电力生产和消费逐渐市场化,这就要求负荷预测要做到实时性、准确性、可靠性以及智能性。现在负荷预测已经成为现代电力系统运行和管理中的一个重要研究领域[1]。

短期负荷预测技术总体分为传统和现代智能2类方法。传统的短期负荷预测方法有回归分析法,时间序列法[2]和灰色预测法等[3]。回归分析法是基于线性的数学方法,不适用于非线性系统,需要样本数据较多;由于影响负荷的因素很多,该模型在初始化时难度较,一般需要依据以往经验并且具备比较好的工程能力。时间序列法适用于负荷曲线平滑、波动较小的情况,当负荷发生较大变化时,预测精度明显下降,并且该模型对实际生产中出现的不确定因素考虑较少。灰色预测法进行负荷预测的前提条件是负荷曲线要满足指数变化规律,要求数据连续平滑,离散程度越大,预测结果可靠性降低。现代智能算法包括专家系统法[4],人工神经网络法[5]和模糊预测法[6]等。其中专家系统法开发的专家系统都是针对某具体系统的,不具有一般性,当系统结构发生变化时将不再适用。人工神经网络法的神经网络的层数以及神经元个数一般根据以往经验得到,不能准确的确定内部结构,并且学习速度慢,有时不能得到全局最优点。模糊预测法需要大量的历史数据,在实际应用中有时数据有限,预测结果较差。

基于上述算法的不足,支持向量机被提出。在历史数据有限、系统非线性、不确定因素较多的情况下,支持向量机可以很好地解决上述问题,因此本文采用此方法进行负荷预测。

负荷预测的基础是历史数据的收集与挖掘。基于对数据的挖掘,通过有效的算法建立负荷预测模型,完成负荷的准确预测则是负荷预测的关键。本文首先介绍影响负荷预测的主要因素;其次介绍常用的数据挖掘技术,采用基于支持向量机的负荷预测算法,对未来1 d内的短期电力负荷进行预测,最后将算法应用于某地区电网。

1 负荷预测的主要影响因素

负荷预测受到多种因素的影响,主要包括气候[7]、时间、地理以及随机因素等。气候因素中以温度因素的影响最大。随着居民生活质量的提高,空调已经成为必备的家庭电器。在居民用电中,空调是大功率电器。在夏季温度很高的时候,就会出现空调的大规模使用,很容易产生负荷高峰。本文考虑的气候因素包括当地的气压、温度、相对湿度[8]、风速及降水量。时间因素对负荷的影响越来越大。本文考虑的时间因素包括小时和周。

2 数据挖掘技术与支持向量机

2.1 数据挖掘技术

现在人类已经进入信息化时代,互联网的应用无处不在。人们在生产生活中会产生大量的数据,这些数据通过时间的积累,就会具有统计学的一般规律。通过数据挖掘技术,将隐藏在巨大数据背后的潜在规律找出来,就可以更好地指导生产,为市场经济规划、工业生产计划提供依据[9-10]。

2.2 支持向量机

支持向量机(SVM)是数据挖掘技术的发展,它将输入样本转换到高维空间,有利于数据的分类。支持向量机找一个核函数K(x,y)使其满足K(x,y)=(φ(x),φ(y)),代替在特征空间中内积(φ(x),φ(y))的计算。

给定样本{(xi,yi)}(i=1,2,…,m),m为样本容量,xi是输入矢量,yi为相应目标输出数据。大多数情况下样本呈非线性关系,估计函数f可通过以下方法确定:将每一个样本点用一个非线性函数φ映射到高维特征空间,再在高维特征空间进行线性回归,从而取得在原空间非线性回归的效果。应用此法时函数f为:

式中:w为权值矢量;b为偏差(bias);(w,φ(x))为内积。

SVM采用结构风险最小化原理,这里的风险是用Vapnik的ε不敏感损失函数来度量的。ε不敏感损失函数的定义如下:

式(2)表明,当预测值与实际值之差的绝对值不大于ε时,忽略这部分不计;当差的绝对值大于ε时则令其大小为超出ε的部分。为训练w和b,需要极小化下面的泛函:

式(3)中第一项为经验误差项;第二项为正规化项;c称为正规化常数,须预先指定,它确定了经验误差项与正规化项之间的某种平衡关系,c值越大,经验误差项在式(3)中所起的作用越大。

对于式(3),由于其特征空间维数高且目标函数不可微,故几乎不可能直接求解。故引入核函数k(x,xi),利用Wolfe对偶技巧,将上述问题转化为下面的对偶问题[10]:

于是,用式(1)表示的回归函数表达式可写成:

式中:称k(x,xi)为核函数,一般有多项式核函数、RBF核函数等。于是,式(5)中的函数f完全由ai、a*i决定。根据支持向量机回归函数的性质,只有少数的ai、a*i不为0,这些参数对应的向量即称之为支持向量机。

3 基于支持向量机的多节点短期负荷预测算法

3.1 整理数据

将收集到的数据整理成所规定的数据格式,检验和训练数据的格式如下:

其中label为目标值;index为特征值编号;value为特征值。所采用的算法专门针对有限样本情况的,其目标是得到现有信息下的最优解而不仅仅是样本数趋于无穷大时的最优解。

3.2 归一化

因为原始数据可能范围过大或过小,并且原始数据是不同类型的数据,包括气压、温度、降水量以及时间等。可以先将数据重新缩放到到适当范围,这样可以使训练与预测速度更快。在这里用到的数据是已经整理好的数据,即算法可以识别的数据。归一化公式为

式中:xi,x*i分别为数据归一化前后的值;xmin,xmax分别表示样本数据中的最小值和最大值。

3.3 模型训练和预测

机器学习需要不断积累,这样它分析处理得到的结果就会更准确。模型训练其实就是一个不断优化的过程,采用一种数学模型,选择合适的数据,定义一种代价函数或者叫损失函数,然后用数学方法得到使得代价函数或损失函数最小的过程。通过样本数据来优化计算框架中的参数,使计算框架得到的结果更符合自身需求。

选取适当的核函数K(x,y)以及适当的精度ε>0和惩罚参数c>0求解规划问题:

从而构造决策函数:

通过对训练模型所采用的参数进行优化,本文提出的算法具有良好的泛化能力,能够适用于电力系统不同节点各具特点的负荷特性,实现电力系统多节点负荷的快速预测,算法复杂度不随样本数据维数变化。

4 算例分析

通过负荷预测影响因素分析、数据收集及挖掘,基于支持向量机负荷预测算法,本文进一步开展了某地区电网精细化负荷预测研究,开发了负荷预测程序,并部署在该地区负荷精细化预测与分析系统中。

4.1 预测对象

算例针对某地区电网的42座变电站,开展了变电站总有功和无功的短期预测,变电站及其主变容量信息如表1所示。

表1 某城区变电站列表Tab.1 A list of substations in an urban area

通过分析和预测变电站的总有功和无功功率,能够精细化反映该城区的负荷状况,为该城区电网的规划和运行提供重要的参考依据。为验证算法的有效性,采用该城区35座变电站2016年7月1日-7月23日的有功数据(7座变电站数据暂无),2016年7月1日-7月23日该地区的气候数据(7月10日部分数据缺失)作为训练模型的输入数据。对2016年7月24日该城区35座变电站的有功进行预测,并将预测结果与实际有功数据进行了对比。

4.2 数据挖掘

开发了负荷精细化预测与分析系统,通过与某地区电网的oms系统进行通信,收集了预测对象的历史负荷数据,并通过mysql数据库存储,数据库历史数据表的截图如图1所示。

图1 变电站各主变的历史数据表Fig.1 Sheets of historical data of the main transformers in the substation

以变电站为单位对负荷有功和无功功率进行预测,因此首先对原始数据进行处理,计算变电站中低压母线总有功和无功功率,得到处理后的数据表,如图2所示。

图2 变电站负荷历史数据表Fig.2 Historical load data of the substation

此外,建立的系统还从oms系统接收了天气数据,通过数据挖掘,确定了天气数据中的主要影响因素,包括:温度、相对湿度、风速、降雨量等。天气数据的数据库表格如图3所示。

基于上述历史数据,可以采用基于支持向量机算法建立负荷预测的模型。当接收到新的天气数据时,系统将自动根据最新的天气预测数据对负荷进行预测。

4.3 负荷预测

通过上述数据挖掘过程,负荷预测所需的数据均已存储在数据库中,根据svm算法的要求进一步形成数据文件,即可针该城区的不同变电站分别建立负荷预测模型,实施负荷预测。负荷预测的具体流程如图4所示。

图3 历史天气数据表Fig.3 Historical weather data

图4 负荷预测流程图Fig.4 Load forecasting flow chart

负荷预测完成后,预测数据将再次写入数据库,供负荷预测与分析系统进一步进行负荷分析,例如根据预测数据进行变电站平均负载率的计算,对结果进行可视化处理等。输出结果的数据库表格如图5所示。

图5 负荷预测结果数据表Fig.5 Load forecast results

4.4 预测精度定义

本文采用相对预测误差率RER[11]和绝对预测误差AE衡量结果的准确性,二者的定义分别如下:

式中:pt为t时刻的有功预测值;pt0为t时刻的实际有功值;N为预测的时段数,本文中T取为24。

4.5 算例结果分析

35座变电站有功预测误差如表2所示。

表2 有功预测误差表Tab.2 Table of active load prediction errors

由表2可知,大部分站点预测的相对误差率不超过10%,如果用于训练模型的历史数据更加多的话,预测结果的精度有望进一步提高。

选取CJ变电站,站点24 h预测结果如图6所示(有功以流出变电站为负,因此结果均已负数表示)。由图6可知,预测曲线很好的反映了实际有功值的变化趋势,3时到8时的下降曲线和12时到21时的上升曲线几乎重合在一起,实际有功值在12时由下降趋势转为上升趋势,随后有功预测值在13时也开始由下降趋势转为上升趋势。这都表明有功预测值对实际有功值有较好的同步跟随特性,算法得到的结果是可靠的。

图6 CJ变电站24 h有功预测结果Fig.6 The Result of 24-hour forecast of active load in CJ substation

表2中,相对误差率最大的站点是SL,为17%,站点24 h有功预测结果如图7所示。

图7 SL变电站24 h有功预测结果Fig.7 The Result of 24-hour forecast of active load in SJ substation

由图7可知,预测曲线较好的反映了实际曲线的变化规律,预测的绝对误差仅为1.674 9 MW,也较好的反映了这一点。

由表2可知,绝对误差最大的站点是YC,为5.483 8 MW,图8展示了YC 24 h有功预测结果。

实际曲线的变化趋势。YC的有功功率绝对值较大,因此绝对误差较大,其相对误差率只有8.82%。

图9展示了TS变电站的预测结果。

图8 YC变电站24 h有功预测结果Fig.8 The Result of 24-hour forecast of active load in YC substation

图9 TS变电站24 h有功预测结果Fig.9 The Result of 24-hour forecast of active load in TSsubstation

由图9可知,预测曲线基本反映了实际曲线的变化趋势,但有较为明显的误差。图10展示了TS变电站7月23日和7月24日的有功曲线。

如图10所示,TS变电站7月24日的有功功率曲线较23日有明显的不同,可见TS变电站对24日的运行方式应该进行了较大的调整,而基于24日之前的历史数据训练得到的预测模型显然无法反映这一变化,因此预测的结果产生了较大的误差。如果新的运行方式下持续几天,累积更多的有功样本数据,可以对预测模型进行更新,那么预测结果也将明显改善。

图10 TS变电站7月23日和7月24日的实际有功曲线Fig.10 Curves of the actual active load of TSsubstation on July 23 and July 24

5 结语

本文提出了基于支持向量机的负荷预测算法,对未来1 d内的短期电力负荷进行预测,该方法适用于多节点,对历史数据要求不高,样本需求量较少,在负荷变化不均匀的情况下预测效果较好,考虑到了多种不确定因素,算法复杂度与样本维数无关,寻找到的是全局最优点。结合某地区案例,对该算法进行验证,结果表明该算法预测结果优越,相对误差率较小。该方法还可以用于其他系统。

[1]康重庆,夏清,张伯明.电力系统负荷预测研究综述与发展方向的探讨[J].电力系统自动化,2004,28(17):1-11.KANG Chongqing,XIA Qing,ZHANG Boming.A survey of power system load forecasting and its deve lopment[J].Automation of Electric Power Systems,2004,28(17):1-11(in Chinese).

[2]朱陶业,李应求,张颖,等.提高时间序列气象适应性的短期电力负荷预测算法[J].中国电机工程学报,2006,26(23):14-18.ZHU Taoye,LI Yingqiu,ZHANG Ying,et al.Shortterm load forecasting algorithm for improving time series meteorol-ogical adaptability[J].Proceedings of the CSEE,2006,26(23):14-18(in Chinese).

[3]史德明,李林川,宋建文.基于灰色预测和神经网络的电力系统负荷预测[J].电网技术,2001,25(12):14-17.SHI Deming,LI Linchuan,SONG Jianwen.Power system load forecasting based on gray prediction and neural network[J].Power System Technology,2001,25(12):14-17(in Chinese).

[4]于希宁,牛成林,李建强.基于决策树和专家系统的短期电力负荷预测系统[J].华北电力大学学报,2005,32(5):57-61.YU Xining,NIU Chenglin,LI jianqiang.A short-term load forecasting system based on decision tree and expert system[J].Journal of North China Electric Power University,2005,32(5):57-61(in Chinese).

[5]何耀耀,许启发,杨善林,等.基于RBF神经网络分位数回归的电力负荷概率密度预测方法[J].中国电机工程学报,2013,33(1):93-97.HE Yaoyao,XU Qifa,YANG Shanlin,et al.Probabilistic density forecasting method of power load based on RBF neural network quantile regression[J].Proceedings of the CSEE,2013,33(1):93-97(in Chinese).

[6]严华,吴捷,马志强,等.模糊集理论在电力系统短期负荷预测中的应用[J].电力系统自动化,2000:67-72.YAN Hua,WU Jie,MA Zhiqiang,et al.Application of fuzzy set theory in power system short-term load forecasting[J].Automation of Electric Power Systems,2000:67-72(in Chinese).

[7]杨旭,刘自发,张建华.考虑气候因素的城市电力负荷预测[J].现代电力,2008,25(3):28-32.YANG Xu,LIU Zifa,ZHANG Jianhua.Urban power load forecasting considering climate factors[J].Modern Electric Power,2008,25(3):28-32(in Chinese).

[8]毕圣.基于数据挖掘技术的短期负荷预测[D].北京:北京交通大学,2016:17-22.

[9]沈海澜.基于数据挖掘技术的电力负荷预测研究[D].长沙:中南大学,2003:10-12.

[10]王奔,冷北雪,张喜海,等.支持向量机在短期负荷预测中的应用概况[J].电力系统及其自动化学报,2011,23(4):115-121.WANG Ben,LENG Beixue,ZHANG Xihai,et al.Application of support vector machine in short-term load forecasting[J].Proceedings of the CSU-EPSA,2011,23(4): 115-121(in Chinese).

[11]王小君,毕圣,徐云鹍,等.基于数据挖掘技术和支持向量机的短期负荷预测[J].电测与仪表,2016,53(10):62-67.WANG Xiaojun,BI Sheng,XU Yunkun,et al.[J].Electrical Measurement& Instrumentation,2016,53(10):62-67(in Chinese).

(编辑 李沈)

Short-Term Load Forecasting of a Regional Power Grid Based on Support Vector Machine

WAN Qiang1,WANG Qingliang1,WANG Ruihao2,HUANG Zhaohui1,BAI Yunfei1,CHEN Dajun1,LI Weixun1
(1.State Grid Shijiazhuang Power Supply Company,Shijiazhuang 050000,Hebei,China;2.School of Electrical Engineering,Xi’an Jiaotong University,Xi’an 710049,Shaanxi,China)

Load forecasting is a prerequisite for safe and economical operation of power system.With the market reform of power system and research and development of the energy Internet,high-quality load forecast becomes increasingly important.This paper analyzes the factors that influence the load forecasting,collects and excavates the data,uses the support vector machine load forecasting algorithm to forecast the regional short-term load,and further develops the fine load forecasting research for the urban area.According to a test of this forecasting algorithm for a case in an urban area,the result shows that the better the forecasting result,the lower the relative rate.

short-term load forecasting;data mining;support vector machine

2016-03-09。

万 强(1985—),男,本科,工程师,从事电网调度和配网抢修研究;

王清亮(1984—),男,硕士,工程师,从事电网调度和智能电网研究;

王睿豪(1993—),男,硕士研究生,主要研究方向为综合能源系统、电力系统规划与可靠性。

国家自然科学基金资助项目(51607136)。

Project Supported by the National Science Foundation of China(51607136).

1674-3814(2016)12-0014-07

TM715

A

猜你喜欢
数据挖掘向量变电站
向量的分解
聚焦“向量与三角”创新题
探讨人工智能与数据挖掘发展趋势
关于变电站五防闭锁装置的探讨
超高压变电站运行管理模式探讨
基于并行计算的大数据挖掘在电网中的应用
220kV户外变电站接地网的实用设计
智能变电站与综自变电站区别综述
向量垂直在解析几何中的应用
一种基于Hadoop的大数据挖掘云服务及应用