空间负荷预测中确定元胞负荷合理最大值的主成分分析法*

2017-12-21 05:32肖白李科田春筝王璟何茜张凯
电测与仪表 2017年14期
关键词:元胞反演分量

肖白,李科,田春筝,王璟,何茜,张凯

(1.东北电力大学电气工程学院,吉林 吉林132012;2.国网河南省电力公司经济技术研究院,450000;3.国网郑州供电公司,郑州450000)

0 引 言

空间负荷预测(Spatial Load Forecasting,SLF)是对待测区域内负荷时空特性的预测,是城市电网规划设计的基础,也是一个涉及面广、不确定性因素多的复杂问题[1-5〛。

SLF结果的准确性将直接影响到城市电网的电源布点、供电路径选择、设备投运等是否技术可行且经济合理[6-8]。

SLF与负荷预测的区别在于,SLF不仅要预测负荷的值,而且还要预测负荷增长的地理情况[9]。由于SLF在预测负荷的值时,所需负荷数据一般是元胞负荷每年的最大值,即只使用各元胞每年众多历史负荷数据中的一个值。可见,若选用的元胞历史负荷数据不考虑由于负荷数据在测量、通信等误差造成的随机波动而建立负荷预测模型,就难以有效地模拟负荷发展变化规律,模型的预测精度也同样不能得到保证[10-14]。因此,为确保在建模和预测过程中所使用的元胞历史负荷数据能合理地反映元胞发展的趋势和规律,从而提高SLF质量,需进行数据预处理方法的研究。

本文针对此问题,提出运用主成分分析技术来求取适用于SLF的元胞负荷合理最大值的方法。该方法以元胞历史负荷数据分析为基础,通过主成分分析技术将得到的各元胞负荷分解出表征各元胞负荷数据总体信息的主成分分量和刻画随机波动的非主成分分量。综合归纳两种分量,通过剔除非主成分分量来抑制随机波动对预测结果精度带来的不利影响,尽量避免随机波动影响到负荷发展的总体趋势,提取表征元胞负荷的总体信息的主成分分量的最大幅值作为元胞负荷合理最大值,实例分析表明,该方法能够提高SLF结果的精确度。

1 确定元胞负荷合理最大值的基本思想

首先根据城市电网中每条10 kV馈线的供电范围生成元胞;其次利用(Principal Component Analysis,PCA)技术,通过设定适合的累计贡献率将各元胞负荷分解为表征总体信息的主成分分量和刻画随机波动性的非主成分分量,通过“主成分分析反演”的方法来剔除具有随机波动性的非主成分分量,从而抑制其给SLF带来的不利影响;最后将经过“主成分分析反演”所得到的主成分分量中的最大值作为元胞负荷合理最大值。确定元胞负荷合理最大值方法的原理示意图如图1所示。

图1 确定元胞负荷合理最大值方法的原理图Fig.1 Schematic diagram of ascertaining reasonable maximal value of cellular load

2 主成分分析法及其反演

2.1 主成分分析原理及计算步骤

主成分分析方法是研究多个数值变量间相关性的一种多元统计方法。在基本保持原变量信息不变的前提下,能通过原变量的少数几个线性组合来代替原变量并揭示原变量之间的关系,从而达到利用较少的互不相关的变量反映原变量的绝大部分信息的目的[15-16]。主成分求解步骤如下:

以样本X=数据为例,其式中n是样本个数;p是样本的维数;xij为第i个样本中第j维数据。

(1)将X简化为X=(x1,x2,…,xp),依式(1)对X标准化处理;

式中x*j为标准化的数据;E(xj)和Var(xj)分别为xj的平均值和方差。

(2)按照式(2)求取样本数据的相关矩阵R=(rij)p×p。

式中Cov(xi,xj)为样本数据矩阵第i列与第j列间的协方差。

(3)依式(3)和式(4)计算相关矩阵R的特征值和特征向量,并将特征值从大到小排列,即λ1≥λ2≥…≥λp,与之对应的特征向量为p1,p2,…,pp。

式中λi为特征值;pi为特征向量。

(4)依式(5)求取主成分矩阵。

将主成分矩阵简化为Y=(y1,y2,…,yp),其中y1,y2,…,yp分别为第1,2,…,p主成分,各个成分间互不相关且所含信息量依次减少。

(5)计算各个主成分的贡献率,其中第k个主成分的贡献率的计算公式如下。

(6)按照各成分的贡献率由大到小的顺序排列,并按照式(3)~式(7)求取累计贡献率M。

PCA的目的是在保证基本信息不变的前提下,减少数据量,从而简化数据分析问题。通过累计贡献率M的合理选取,进而得出主成分数量m的取值,通常M取90%以上。在主成分矩阵中取出前m个成分,便完成了主成分提取。

2.2 主成分分析反演剔除随机波动

PCA在几何意义上就是对原空间的数据用新的坐标系表示[17]。尽管经过PCA计算得到的主成分可以保证信息基本不变,但得到的主成分数据在幅值上和原始数据相比发生很大的变化,故经PCA处理后得到的负荷数据不能直接替代原负荷数据进行预测。为了使经PCA计算得到的主成分数据能够应用在SLF中,而不是单单对影响元胞负荷变化的影响因素变量进行降维,本文提出了主成分分析反演的方法。

所谓主成分分析反演就是与PCA的计算过程的相反计算。PCA的计算过程实质就是通过矩阵的相乘使得矩阵发生旋转,从而完成降维,故将其进行逆旋转到原来位置即可完成反演,从而解决由于经PCA处理后导致得到的主成分分量不能直接用于SLF的问题。

在PCA的主成分提取步骤中对样本数据进行标准化处理,是为了解决样本中各个数据量纲不同的问题。而对于负荷数据而言,任何一个负荷值的量纲都相同,因此在对负荷数据做主成分分析时,不需要标准化这一环节,减少了PCA的计算量。

以样本X为例,得到主成分y1,y2,…,ym以及非主成分ym+1,ym+2,…,yp将非主成分分量设为 0,依式(8)完成反演。

式中为剔除非主成分分量后的数据;为非主成分分量设为0的主成分矩阵;inv(P)为特征向量矩阵的逆矩阵。

经此变换,不仅解决了数据经PCA处理后不能直接用于SLF,而且在反演过程中剔除了视为刻画随机波动性的非主成分分量,从而抑制随机波动性带来的不利影响。

3 确定元胞负荷合理最大值

本文通过分析元胞历史负荷数据提出了基于PCA确定元胞负荷最大值的方法。其具体计算步骤如下:

(1)按照城市电网中每条10 kV馈线的供电区域来生成元胞;

(2)经大量尝试得出累计贡献率设定为99.8%时是合适的。此时运用PCA技术将各元胞负荷分解出的主成分分量能够表征元胞负荷总体信息,同时非主成分分量也可以较好地刻画随机波动性;

(3)利用提出的主成分分析反演方法对主成分分量和非主成分分量进行处理。处理后的结果不仅剔除了随机波动带来的不利影响,同时解决了经PCA计算得到的主成分分量不能直接应用于SLF的问题;

(4)将主成分分量经主成分分析反演后所得数据中的最大值作为元胞负荷最大值,从而完成元胞负荷最大值的确定。

4 实例分析

以东北某城市中的一个供电分局为例,该局所辖26条10 kV馈线的各自供电范围如图2所示[18-19]。

图2 待预测区域中的元胞Fig.2 Cellular in the forecast regional

按照28条馈线供电区域生成28个元胞。已知2004年至2008年一年的负荷历史数据。若以一年为一个时点,则每个元胞有5个最大负荷值。为叙述方便,将直接使用每年中的最大负荷作为元胞负荷最大值的方法称为“传统方法”;将本文确定元胞负荷最大值的方法称为“PCA方法”。

各实测的元胞负荷最大值与基于“PCA方法”得到的元胞负荷合理最大值详见附录中的表2。

在“传统方法”和“PCA方法”两种条件下,分别单独使用“灰色理论法”、“指数平滑法”、“线性回归法”预测2009年各元胞负荷的最大值,预测结果见表1。由于“北大线”和“西安线”在2009年的负荷实测值为0,故未在表1中给出。

表1 各元胞的负荷预测结果Tab.1 Results of load forecasting for each cellular

表2中各方法预测结果的总体预测误差见表3。

表3 元胞负荷的总体预测误差Tab.3 Overall forecasting errors of cellular load

由表3可以看出,“PCA方法”的SLF误差均小于“传统方法”的SLF误差。

5 结束语

文章提出了一种基于PCA技术确定元胞负荷最大值的方法,该方法用于SLF时,能够处理元胞负荷数据的测量、采集、传输会受到某些不确定性因素的影响导致预测精度降低问题。该方法利用PCA将元胞负荷进行分解,得到主成分分量与非主成分分量,通过提出主成分分析反演方法不仅剔除了非主成分分量,避免了随机波动性给SLF带来的不利影响,同时解决了元胞负荷经PCA分解得到的主成分分量不能直接用于SLF的问题。*

猜你喜欢
元胞反演分量
反演对称变换在解决平面几何问题中的应用
帽子的分量
一物千斤
论《哈姆雷特》中良心的分量
基于元胞自动机下的交通事故路段仿真
基于元胞自动机下的交通事故路段仿真
基于低频软约束的叠前AVA稀疏层反演
基于自适应遗传算法的CSAMT一维反演
基于元胞数据的多维数据传递机制
基于AIS的航道移动瓶颈元胞自动机模型