电力大数据处理平台及应用

2017-04-27 16:04庞九凤陈亮
电子技术与软件工程 2016年15期
关键词:单耗电耗用电量

庞九凤++陈亮

摘 要 智能电网作为电力系统的研究热点和未来发展趋势,实现电力流、信息流、业务流的高度融合,将带来大量的生产、营销、管理数据。本文提出了电力大数据处理平台,从电力企业内部和外部的海量数据中洞察规律、提取知识,并通过宏观经济、产值电耗、城镇化三者与电力需求之间关系的案例分析,展示数据背后所蕴含的价值。

【关键词】智能电网 大数据

电力工业作为国民经济的基础产业,也是重要的能源工业,它的发展与经济的发展密切相关,一方面电力是国民经济发展的动力,电力供应不足会严重制约经济的健康发展,另一方面国民经济发展的速度和质量对电力需求的增长、电力供需的变化起着决定性的影响。

智能电网作为电力系统的研究热点和发展趋势,是以信息通信平台作为支撑,具有信息化、自动化、互动化等特征,包含电力系统的发电、输电、变电、配电、用电和调度各个环节,实现电力流、信息流、业务流的高度一体化融合,是电网运行和管理的“中枢神经系统”。海量的生产、营销、管理数据将成为智能电网的核心资源,结合经济、政策、气象、地理等外部数据源,充分发掘隐藏在这些数据背后的价值,将为企业的生产、营销、管理提供辅助决策支撑。

本文结合电网的实际情况和业务需求,提出集数据预处理、数据分析与挖掘、知识库生成于一体的数据分析平台,并阐述了在宏观经济、产值电耗、城镇化三者与电力需求之间的关系分析中的应用。

1 电力大数据处理平台

电力大数据处理平台包括数据收集、数据预处理、数据挖掘与分析、解释与决策支持等,平台架构如图 1所示。

1.1 数据来源及特点

电网数据大致分为三类:

(1)电力企业生产数据,如装机容量、发电利用小时数等数据。

(2)电力企业运营数据,如阶梯电价、用电客户、全社会用电量等数据。

(3)电力企业管理数据,如ERP、协同办公等数据。电网数据,尤其是生产数据大多来自于分布在各处的现场采集装置,具有数据质量差、种类混杂、类型不一致的特点。

外部数据的来源更多,包括国民经济、宏观政策、法律法规、气象、地理、水文等对电力生产、运营和管理可能产生直接或间接影响的各个方面。外部数据源的统计口径多样,一些数据例如国家政策无法直接参与建模,在数据的收集和使用方面存在诸多挑战。

1.2 数据预处理

针对数据质量问题,电力大数据处理平台集成了数据预处理模块,实现数据清理、数据集成与变换、数据规约与压缩等功能。数据预处理作为各类数据源进入数据库之前的必要环节,不仅有效提高数据挖掘的质量,而且降低挖掘所需要的时间。

数据清理去除数据中的噪声,纠正不一致。数据变换通过平滑、概化、规范化、属性构造等方法将数据转换成适合挖掘的形式。数据集成将多个数据源合并成一致的数据存储。数据规约通过聚集、删除冗余特性等方法来压缩数据。

1.3 数据挖掘与分析

挖掘出信息、提炼成知识并入库,是电力数据平台发挥价值的关键所在。

(1)基础统计分析功能:包括均值分析、频率分析、参数检验等。

(2)高级数据挖掘功能:包括分类、聚类、预测、关联分析、孤立点分析等。

数据挖掘与分析必须建立在对挖掘对象深刻认识的基础上,结合电力生产、经营、管理的实际需要,选择合适的数据挖掘技术。通过对历史数据的分析,可以实现对电网规模、全社会用电量等方面的趋势预测;判断全社会用电量是否与国民经济数据存在相关关系需要关联分析;找出线损率与其他省份存在明显差异的省份则采用孤立点分析。

2 电力大数据分析应用

2.1 宏观经济与电力需求

全社会用电量与国家宏观经济及宏观政策调控息息相关。首先分析宏观经济指标与用电量之间的相关系数,筛选出相关性较强的宏观经济因素指标,建立量化预测模型,预测年度用电量。

将1995~2011年的宏观经济类指标与全国全社会用电量通过皮尔森(Pearson)相关系数算法进行相关性分析发现,国民生产总值、社会消费品零售總额等经济指标与用电量之间的相关系数达到了0.99以上,并且呈现较强的线性关系。通过RBF神经网络和线性回归建立全社会用电量预测模型,并对2012年和2013年用电量进行预测。在预测2012年用电量时,RBF-4*神经网络预测误差为0.97%,线性回归模型预测误差率为0.19%。两个模型在预测2013年全社会用电量时,误差相差在6%以内。综合两个模型预测结果,可以得出2013年全社会用电量大约为54000亿千瓦时。与2012年相比,预测2013年全社会用电量增长率保持在8%左右。

2.2 产值电耗

产值电耗是反映能源消费水平和节能降耗状况的主要指标。1990年以来,我国产值电耗(单位GDP的全社会用电量,即GDP单耗)总体呈下降趋势。2011年产值电耗为994kWh/万元,比1990年的3301kWh/万元(按当年价格计算)下降了70%,如图 3所示。

第一产业单耗和第三产业单耗变化幅度不大,总体呈下降趋势。第二产业单耗的变化趋势与GDP单耗的变化趋势基本一致,是决定GDP单耗变化的主要影响因素原因。1990年以来我国产值单耗总体分为三个阶段:一是1990年~1999年快速下降期,虽然第二产业在GDP所占比重有所上升。但由于科技进步的力度较大,重工业等行业的生产效率明显提升,促使GDP单耗显著下降;二是2000年~2005年缓慢上升期,我国工业增长明显转型以重工业为主导的格局以化工、建材、钢铁冶炼、有色金属为代表的高耗能行业得到较快发展,产值电耗有较大幅度的上升;三是2006年至今缓慢下降期,面对日益严峻的环境形势,我国出台节能减排政策,淘汰产能低下的设备,有效遏制了第二产业电耗上升趋势,促使产值单耗呈逐年下降。

基于孤立点分析和单样本均值校验等数据统计分析方法,挖掘出产值单耗异常的重点省份。青海的历年产值电耗与其他省份存在显著差异。进一步剖析青海的产业结构,青海的第一和第三产业比重呈整体下降趋势,而第二产业比重上升明显(38.5%->58.4%),这主要源于青海省重工业和高耗能行业的快速发展。虽然第二产业单耗从1990年到2011年呈逐年总体下降趋势,但仍远远高于同期全国平均水平,其中高耗能行业用电量位居全国前十。

2.3 城镇化与电力需求

城镇化水平的提高和人民消费水平的升级带来了城镇居民用电和商业用电的增加,同时带动相关的原材料生产、制造行业快速发展,间接促进了工业用电的增长,促使全社会用电量的不断增长,从而带动人均电量的快速增长,如图 4所示。因此,随着城镇化进程的不断加快,城镇化率的提高是促进经济发展、促进电力需求增长的动力之一。

基于电力大数据处理平臺对城镇化率和全社会用电量进行相关性分析。城镇化率同全社会用电需求具有正向相关性,其相关系数高达0.95(越接近于1,正相关程度越高)。在城镇化率上升较快的时期,用电量增长也相应较快。2000~2011年全社会用电量年均增速高于1990~1999年年均增速。这一时期也是城镇化水平快速提高的阶段,城镇化率由2000年的36.22%提高到2010年的49.95%,并且在2011年达到51.27%,城镇人口首次超过农村人口,这标志着我国的城镇化进程已经进入了新的历史阶段。

3 结论

在信息时代,面对智能电网的飞速发展,我们所缺少的不是数据,而是处理数据的能力。本文介绍的电力大数据处理平台是从电力企业内部和外部的海量数据中洞察规律、提取知识的工具,通过对宏观经济、产值电耗、城镇化等主题的统计分析与数据挖掘,使得对电力供需与外部影响因素有了较为明确和定量化的了解,有助于为电网发展规划提供辅助决策支持。

参考文献

[1]朱靖恺,章渊,陈明.基于数据挖掘技术的电网调度运行分析系统[J].上海电力,2008.

[2]仲红,谢荣传.基于Web的数据仓库[J].安徽师范大学学报(自然科学版),2002(02).

[3]谭显东,胡兆光,李存斌,丁伟,刘达.基于改进BP神经网络的全社会用电量预测模型研究[J].华北电力大学学报,2007(03).

[4]Jia Wei H M K.数据挖掘概念与技术[M].北京:机械工业出版社,2007.

[5]单葆国,胡兆光.国民经济用电单耗变化解析[J].中国电力,2007(09).

作者单位

国家电网公司信息通信分公司 北京市 100761

猜你喜欢
单耗电耗用电量
降低回转式阳极炉天然气炉前单耗的生产实践
02 国家能源局:1~7月全社会用电量同比增长3.4%
01 国家能源局:3月份全社会用电量同比增长3.5%
浅析影响选煤厂电耗的因素与对策
基于数理统计的卷烟物料供应商选择研究
目标电耗优化对某水利泵站的节能改造分析
1~10月全社会用电量累计56552亿千瓦时同比增长8.7%
2014年全社会用电量
乙炔硫酸清净中硫酸单耗的影响因素
600 MW亚临界燃煤机组单耗分析