“新经济”态势下基于数据挖掘的用电需求结构分析与预测

2022-02-22 03:25赵永清王文文
能源与环保 2022年1期
关键词:新经济用电量预测值

鞠 晨,赵永清,王文文

(神东煤炭集团公司,陕西 神木 719315)

“新经济”是由新一轮产业革命和供给侧结构性改革所生成的经济形态。大力发展“新经济”是适应我国生产力发展的客观要求,由现阶段我国社会主要矛盾所决定,符合习近平新时代中国特色社会主义新发展理念,是推动旧动能转换为新动能、实现经济高质量发展的必然选择[1-6]。随着党的十九大报告对中国经济发展做出的重大判断:“我国经济已由高速增长阶段转向高质量发展阶段”,用电需求结构也随之转变,结合“新经济”发展态势,应用复合数理分析方法对新经济、新业态经济指标发展及用电情况进行深度分析[7-9],开展用电需求拉动监测及影响研究,对加强区域电力电量平衡分析、科学研判电力市场结构走势具有重要意义。

1 “新经济”态势下用电需求结构分析

1.1 “新经济”态势下的用电现状

新时代、新动能、新经济,是习近平新时代中国特色社会主义经济思想“五大发展理念”的客观基础,是马克思主义与中国经济发展实践相结合的理论创新。在经济由高速增长阶段转向高质量发展阶段的过程中,“新经济”的发展是推动质量变革、效率变革和动力变革的关键所在。“新经济”是以技术变革和知识创新为动力的经济,促进“新经济”的发展,可以在经济增长的基础上实现更高层次的经济发展,提升经济增长的质量和效益。一方面,发展“新经济”可以有效推动和催生新技术,牢牢把握新一轮科技革命和产业革命的发展契机;另一方面,发展“新经济”能促进新产业、新业态、新模式的迅速发展,提升经济内生性增长动力,实现新旧动能转换和发展方式的转变[10-11]。

电力行业为国民经济发展提供了重要的动力源泉,用电分类数据的分析与研究为国家经济政策的制定、编制及经济发展状况的监测起到了辅助支撑作用。当前,“新经济”产业已逐步成为用电“大户”。根据国家统计局统计,2018年10月发电量为5 330亿kWh,同比增长4.8%,增速较上月加快0.2%,日均发电171.9亿kWh。1—10月发电量为55 816亿kWh,同比增长7.2%,同时,用电量数据的增长幅度也和发电量类似,前三季度,全国全社会用电量5.11万亿kWh、同比增长8.9%,增速同比提高2.0%。其中,一、二、三季度分别增长9.8%、9.0%和8.0%,增速连续9个季度保持在5.5%~10.0%的增长区间。相较于用电量总量数据,用电结构的变化显示一季度新旧产业的经济增长形势出现较大分化,中高端制造业正在成为推动制造业增长的主导力量。GDP统计方面,前三季度GDP为650 899亿元,按可比价格计算,同比增长6.7%。分季度看,一季度同比增长6.8%,二季度增长6.7%,三季度增长6.5%。分产业看,第一产业增加值42 173亿元,同比增长3.4%;第二产业增加值262 953亿元,增长5.8%;第三产业增加值345 773亿元,增长7.7%。从用电量来看,第三产业的增长幅度已经远超第一产业和第二产业,经济增长的质量在提升,结构调整初显成效,加快促进经济转型。因此,研究“新经济”对用电需求结构拉动力监测是主动融入转型发展的有力举措。基于以上分析,本文归纳出“新经济”态势下的主要电力用户有:居民采暖、生产制造、交通运输、电力供应与消费、三大运营商、华为、腾讯、信息传输、软件和信息技术服务业等,“新经济”态势下的主要电力用户如图1所示。

图1 “新经济”态势下的主要电力用户Fig.1 Main power users of "new economy"

1.2 “新经济”产业用电相似度与因子分析模型

针对“新经济”态势下众多的电力用户,本文构建电力用户的用电相似度指标,从而找出不同用户的共性并将它们归类,由于“新经济”态势下的电力用户的用电需求与GDP、电力客户数DPP、人均可支配收入RJGDP以及行业比重SDDP相关,因此本文构建了一种用电相似度评价指标a,其计算公式:

(1)

式中,Pi为该电力用户第i季度的电力需求;CGDPi为该电力用户第i季度的GDP产值;NDDPi为该电力用户第i季度的用电总人数;CRJGDPi为该电力用户第i季度的人均可支配收入;ηSDDP为该电力用户的行业比重;n为样本季度数。

因子分析法的基本思想为:根据相关性的大小把变量分组,使得同组内的变量之间相关性较高,不同组的变量相关性较低。下图很好地阐释了公共因子和变量之间的关系,公共因子本质上是各变量之间相关性的体现,虚线部分便是各变量在该因子上的载荷,可以视作公共因子对该变量的作用大小[12-13]。

图2 公共因子与各变量的关系Fig.2 Relationship between common factors and variables

因子模型假定X线性地依赖于少数几个不可观测的随机变量F1,F2,…,Fm(m

(2)

式中,lij为第i个变量在第j个因子上的载荷,这也是本文所用到的主要数据参考,用p+m个不可观测的随机变量F1,F2,…,Fm,ε1,ε2,…,εp表示p个偏差X1-μ1,X2-μ2,…,Xp-μp。

1.3 基于数据挖掘的电力用户结构化

首先假设有m个季度的电力用户用电相似度指标数值,n为电力用户个数,其中a′ij表示第i个电力用户在第j个季度的经标准化后的用电相似度指标数值。指标的标准化计算:

(3)

由此可以得到指标的数据矩阵:

(4)

其次,对其进行统一化处理,得到的数据矩阵:

Z=(zij)m×n

(5)

(6)

其中,

(7)

然后建立相关矩阵R,并计算其特征值和特征向量:

(8)

求得R的特征值,并将相应的特征向量作标准化正交变换,得:

ei=(αi1,αi2,…,αin)T

(9)

由1.2节可知,主成分模型可以设为:

Fi=αi1A1,αi2A2,…,αinAn

(10)

式中,Ai为第i个指标,为矩阵A的列向量;Fi为第i个主成分;αik为对应特征值为λi的特征向量的第k个分量。

计算主成分Fi对原始指标数据的方差贡献率:

(10)

将特征值λi按从大到小的顺序排列,计算主成分的累计贡献率,并设置临界累积贡献率β临界。

累计贡献计算公式:

(11)

当累积方差贡献率β(i)>β临界时,选取前k个特征值对应的主成分,得到第i个指标在第j个主成分上的因子载荷为:

(12)

最后对因子载荷作坐标轴旋转,让所有的点都落在第一象限,这样做是为了达到一种理想的情况,即每个变量仅在一个因子上有较大的载荷,而在其他因子上的载荷比较小。这样,便将“新经济”态势下众多的电力用户主体归纳为少数几个不同的用电结构主体,便于接下来的“新经济”态势下不同用电结构主体的用电量预测。

2 基于ARMA的“新经济”用电需求预测

2.1 数据平稳性检验

使用ARMA模型要求时间序列必须是平稳的,所以第一步是对原始数据进行平稳性检验。假设当一个自回归过程如下所示[14-16]:

yt=byt-1+a+εt

(13)

式中,如果滞后项系数b为1,就称为单位根。当单位根存在时,自变量和因变量之间的关系具有欺骗性,因为残差序列的任何误差都不会随着样本量(即时期数)增大而衰减,也就是说模型中的残差的影响是永久的。这种回归又称作伪回归。如果单位根存在,这个过程就是一个随机漫步(random walk)。因此文中模型使用ADF和KPSS来检测数据的平稳性。

2.2 基于ARMA预测模型阶数

自回归移动平均模型(ARMA)适用于实际数据具有一定复杂性的预测模型,其数学模型为:

yt=a+b1yt-1+b2yt-2+…+bpyt-p+εt-θ1εt-1-θ2εt-2-…-θqεt-q

(14)

式中,yt为随机变量;bp为自回归系数;εt为随机干扰项;θq为移动平均系数;p、q为ARMA模型的阶数。

对于p、q的求解,文中分别采用自相关函数和偏自相关函数求解,具体方法可参考文献[16]。延迟k阶的自相关函数:

(15)

式中,N是序列长度。

由{yt}的前k个时刻的数据估计yt的最小方差,其中的第k个系数akk为偏相关函数。其公式为:

(16)

2.3 模型残差检验

为了确保确定的阶数合适,还需要进行残差检验。残差即原始信号减掉模型拟合出的信号后的残余信号。如果残差是随机正态分布的、不自相关的,这说明残差是一段白噪声信号,也就说明有用的信号已经都被提取到ARMA模型中了。

对于文中的用电需求预测模型进行残差检验,需要检验εt(t=1,2,…,N)是否为白噪声信号,由式(14)可得:

εt=yt-(b1yt-1+b2yt-2+…+bpyt-p-θ1εt-1-θ2εt-2-…-θqεt-q)

(17)

上述误差序列的检验量为:

(18)

式中,Q服从χ2(M)分布,Mχ2(M)}=α时的χ2(M)。仅当Q<χ2(M)时,ARMA模型才可使用。

2.4 用电需求预测

基于ARMA模型的“新经济”用电需求预测需要用到历史用电数据,同时需要指出的是若某一年发生产业调整,有可能导致预测精度受到影响,导致最终的预测值发生偏差,综合模型自身也有相应的精度水平,本文设置“新经济”经济用电需求预测的置信区间,在运用模型计算出用电需求预测值的同时,也会给出预测需求值在给定置信区间内的波动范围,相比于传统的预测方法,本文中的基于ARMA的“新经济”用电需求预测更具有实用性和可靠性。

3 算例分析

文中以天津市从2011—2019年共计36个季度的“新经济”产业用电数据作为算例分析的数据源,首先对“新经济”态势下产业用电结构进行分析,利用产业用电相似度指标,以及因子分析模型找出“新经济”态势下的主要电力的共性,并将它们进行归类,能够得到天津市在“新经济”形势下的不同电力用户的用电结构特征,具体见表1。

表1 “新经济”态势下的用电相似度分类Tab.1 Power consumption similarity classification under the situation of "new economy"

接下来,本文再对“新经济”形势下的3种不同用电结构主体的用电需求进行ARMA模型预测,本算例中,将前30个季度的用电数据作为历史数据输入,将后6个季度数据作为预测数据,通过将预测值和实际值相比较来检验本问所提模型的有效性。

首先针对电能替代这一用电结构主体,其仿真结果如3图所示。首先是模型的平滑性检验和残差检验,由图3能够看出,在ARMA预测模型下,历史数据取2阶差分时趋于稳定。同时,由图3可知,ARMA预测模型的阶数p=2,q=1,最后是残差值检验,易知该预测模型的残差值是符合随机正态分布的。因此ARMA预测模型可用。

图3 针对电能替代用电需求ARMA预测模型检验Fig.3 Test of ARMA prediction model for electricity demand substitution

由以上分析可知,ARMA预测在电能替代用电需求预测中是可行,于是得到其后6个季度的预测值大小,如图4所示。

图4 针对电能替代用电需求ARMA预测结果Fig.4 ARMA forecast results for electricity demand substitution

本文中的ARMA预测模型还设置了95%的预测值置信区间,也即预测值围绕预测精准值波动,并落在95%的预测置信区间之内,从图4中可以看出,“新经济”形势下,电能替代的用电量在最初几个季度内变化不大,这是因为这段时间内,电动汽车、港口岸电等并未得到大范围应用;随后电能替代的用电量呈平稳上升趋势,这也是因为电动汽车、港口岸电等电能替代用电主体的不断增加。因此,上述关于电能替代的用电量变化趋势和预测结果符合实际。

然后是针对数据中心和传统行业这2个用电结构主体的用电量预测,其模型的差分阶数和p、q值分别见表2。

表2 数据中心和传统行业预测模型检验Tab.2 Data center and traditional industry forecast model test

由表2可知,数据中心和传统行业的用电需求ARMA预测模型均满足随机正态分布,因此是可行的。接下来,针对这2个不同结构分别进行ARMA模型用电量预测,得到图5和图6结果。同样,针对这2个不同的用电结构,其预测模型也设置了95%的预测值置信区间。

图5 针对数据中心用电需求ARMA预测结果Fig.5 ARMA forecast results for power demand of data center

图6 针对传统行业用电需求ARMA预测结果Fig.6 ARMA forecast results of power demand for traditional industries

从图5、图6可以看出,“新经济”形势下,数据中心的用电量在前10个季度内变化不大。这是因为这段时间内,在2011—2013年内,数据中西结构内仅有三大运营商和移动互联网等电力用户经营,而在之后的时间数据中心的用电量有一段爆发式增长,这是因为互联网服务业、云计算和大数据等行业的兴起,导致其用电量呈爆炸式增长,之后其用电量呈平稳上升趋势。对于传统行业的用电量预测,由变化趋势可知,其增长趋势一直较为稳定,这也符合经济社会发展的趋势,因此上述关于数据中心和传统行业的用电量变化趋势和预测结果符合实际。

接下来,将“新经济”形势下的用电需求ARMA预测结果与实际值相比较,其对比结果见表3。由表3能够看出,电能替代和数据中心这2个用电结构主体的用电量预测在2018年的第3、4季度预测值与真实值的偏差均在5%以内,也即预测值落在ARMA模型的置信区间内,但在2019年的前2个季度内,模型的预测值与实际值偏差较大,超出了95%的预测置信区间,这是因为ARMA预测模型是按照历史数据进行预测的,而在这2个季度内,用户的实际用电量出现非常规增长,而ARMA模型无法这种短时间内的非常规增减趋势,因此出现差值较大的情况。随后,在2019年的第3、4季度,电能替代和数据中心回归正常的增长趋势,从而ARMA预测模型的预测值与真实值的偏差又在5%以内,也即预测值落在ARMA模型的置信区间内。而对于传统行业,其受客观因素的影响使得增长趋势始终较为平稳,符合经济社会的发展情况,因此ARMA模型的预测值和真实值的偏差几乎都在5%以内。

表3 基于ARMA模型预测值和真实值比较Tab.3 Comparison of predicted value and real value based on ARMA model

综上所述,“新经济”态势下基于数据挖掘的用电需求结构分析与预测模型具有一定的使用价值。

4 结论

本文首先对“新经济”态势下的主要电力用户进行归纳,然后构建出用电相似度评价指标,再利用因子分析模型找出“新经济”态势下的主要电力的共性,并将它们进行归类,从而得到简化后的“新经济”相关用电结构主体,实现了“新经济”态势下的用电需求结构分析;然后本文将ARMA预测模型用于对不同用电结构的用电量预测,能够得到基于数据挖掘的“新经济”相关用电结构主体的用电需求预测。最后,本文运用算例验证ARMA预测模型的有效性。研究结果表明,本文中的模型具有一定的实用价值。

猜你喜欢
新经济用电量预测值
02 国家能源局:1~7月全社会用电量同比增长3.4%
01 国家能源局:3月份全社会用电量同比增长3.5%
加拿大农业部下调2021/22年度油菜籽和小麦产量预测值
AI讲座:ML的分类方法
国家能源局:3月份全社会用电量同比下降4.2%
自体荧光内镜对消化道肿瘤诊断临床应用分析
中国GDP或增加“新经济”成分
论新经济时代下泡沫经济形成的原因