基于变分模态分解和复合变量选取的短期负荷预测

2024-02-21 09:40周纲黄瑞刘谋海李文博胡军华高云鹏
电测与仪表 2024年2期
关键词:变分模态负荷

周纲,黄瑞,3,刘谋海,李文博,胡军华,高云鹏

(1.国网湖南省电力有限公司,长沙 410004; 2.智能电气量测与应用技术湖南省重点实验室,长沙 410004; 3.湖南大学,长沙 410082)

0 引 言

负荷预测,通常指基于现有负荷、气象、经济等数据通过数学、人工智能等方法研究和分析历史数据,探究并挖掘负荷数据及其相关影响因素间的内在联系与发展规律,并对未来某一时刻或某个时段负荷多少做出合理的预估[1]。准确负荷预测不仅能为电力公司制定发电计划提供可靠依据,有利于电力系统安全平稳的运行,同时能有效降低运维成本,对电力系统经济调度控制具有重要指导意义[2]。

近年来,国内外学者一直致力于研究更精准的负荷预测方法,其中短期负荷预测因其随机性与波动性强、预测难度大,成为负荷预测研究重难点[3]。目前,短期负荷预测方法主要分为两类,一类是传统基于统计学的时间序列法,另一类是以机器学习为核心的人工智能算法[4]。时间序列法主要包括高斯过程回归(Gaussian Process Regression, GPR)、差分整合移动平均自回归模型(Autoregressive Integrated Moving Average Model, ARIMA)、卡尔曼滤波模型等,这些方法计算简单、响应速度快,在负荷预测方面取得一些成果,但均以线性模型为主,更适用于规律性强的负荷预测,且在建模过程中无法综合考虑温度、湿度、气压等因素对负荷变化的影响,导致时间序列法难以满足非线性与随机性较强的短期负荷预测精度要求。人工智能技术的不断发展为负荷预测提供新的思路和方法,据此国内外学者使用聚类[5]、径向基函数(Radial Basis Function Network, RBF)神经网络[6]、最小二乘支持向量机(Least Squares Support Vector Machine, LSSVM)[7]、长短时记忆神经网络(Long Short-Term Memory, LSTM)[8]、深度置信网络(Deep Belief Network, DBN)[9]等机器学习算法在短期负荷预测方面取得了较好的成果,这些方法将多种负荷变化影响因素作为预测输入量,具有良好的泛化能力,有效提高负荷预测精度。其中,LSTM网络因其可实现信息的长期保存、解决信息长期依赖问题,被广泛应用于时间序列预测等方面,并取得较好的效果。

为进一步提高短期负荷预测精度,国内外学者将信号分解算法与机器学习相结合,进一步分析和挖掘负荷数据变化的潜在规律。文献[10]使用小波函数将负荷信号分为季节性基础负荷和需求响应主导负荷两部分,并结合支持向量机,降低预测误差的同时提升拟合优度,但分解效果严重依赖主观经验的小波基函数选取,难以广泛使用。文献[11-13]使用经验模态分解(Empirical Mode Decomposition, EMD)或集合经验模态分解(Ensemble Empirical Mode Decomposition, EEMD)将负荷信号分解成多个本征模态函数(Intrinsic Mode Function, IMF),分别建立预测模型,较好预测负荷信号的变化波动,但经验模态分解及其改进无法控制信号分解后IMF的数量,需针对每个IMF建立预测模型,易造成预测模型数量多导致模型训练时间长、耗费资源多等情况。变分模态分解(Variational Mode Decomposition, VMD)是一种自适应、完全非递归的信号处理方法,相比于EMD或EEMD算法,该方法具有更严谨的数学理论支撑和更好的模态抗混叠能力,且能根据实际需要,设置分解后IMF数量,更有利于与机器学习结合,建立短期负荷预测模型[14]。

国内外学者针对负荷预测关键影响因素的选取也开展了较多研究。文献[15]依据信息论中熵理论,通过计算并排序不同环境因素与负荷的互信息值选取最佳影响因素;文献[16]使用相空间重构算法重构负荷影响因素数据,分析重构后的各影响因素与负荷变化的相关性,选取关键影响数据集。上述算法可较好衡量两个变量随时间变化的关联性,但两种算法对变化数据的敏感性也带来一些缺陷,如不同月份负荷数据会有相应差异,因此“月份”也是负荷预测的关键信息之一,但使用关联分析计算所得“月份”与负荷变化的关联度较低,与每小时发生变化的负荷数据相比,“月份”的信息变更速度较慢。

针对短期负荷预测随机性强、影响因素选取困难等问题,使用VMD分解算法将原始电力负荷数据分解为多个特征互异的IMF,挖掘负荷数据潜在波动规律,构建复合变量选取算法(Complex Variable Selection, CVS),针对不同类型负荷影响数据,筛选负荷预测关键影响因素,降低预测模型输入数据维度,结合对时序信号预测具有良好效果的LSTM网络,据此构建VMD+CVS+LSTM短期负荷预测模型,并以长沙市2019年实测数据验证对所提出的方法进行验证与分析。

1 VMD分解

变分模态分解设定信号是由多个具有不同中心频率和有限带宽的本征模态函数组成,其利用交替方向乘子法不断更新各本征模态函数及中心频率,确保各本征模态函数估计窗宽之和最小,并将本征模态函数解调到相应的基频带,最终提取各个本征模态函数及相应的中心频率。

变分模态分解主要涉及到经典维尔纳滤波、希尔伯特变换和频率混合三个重要概念,算法求解过程可分为变分问题的构建与求解两个步骤。

(1)变分问题构建

对每个模态函数uk(t)求Hilbert变换,得到其解析信号以及单边频谱,给解析信号加入一个指数项e-jwkt调整得到对应的预估中心频率,将其频谱调制到相应的基频带,最后计算解调信号梯度的L2范数,据此计算各模态信号的预估带宽,对应约束变分模型表达式为:

(1)

式中k=1,2,3…K,K为原始信号分解得到的本征模态函数个数;wk为本征模态函数;uk所对应的中心频率;δ(t)为Dirac分布;*为卷积运算。

(2)变分问题求解

为求取式约束变分模型的最优解,VMD算法引入二次惩罚因子和拉格朗日乘法算子将约束变分模型转化为非约束性变分模型,拓展拉格朗日表达式为:

(2)

式中α为二次惩罚因子,可保证信号在受到高斯噪声干扰时的重构精度;λ(t)为拉格朗日惩罚算子,用于确保重构模型的约束条件保持严格性。

(3)

(4)

为更直观展示VMD算法的良好性能,构造谐波信号,通过与EMD算法对比,展示VMD算法的抗模态混叠能力及构建短期负荷预测模型的适用性。谐波信号表达式为:

x=sin(50πt)+2sin(100πt)+1.5sin(150πt)

(5)

式中 谐波信号采样频率为1 500 Hz,采样点数为1 024。使用EMD对谐波信号进行分解,共得到10个本征模态分量和一个残差。其中,IMF1~IMF4时域波形图及其对应的频谱图如图1所示。

图1 EMD分解IMF1~IMF4时域及频域信号

由图1可见,IMF1为原始信号,包含25 Hz、50 Hz和75 Hz共3种频率信号,IMF2同时包含频率为50 Hz和75 Hz的信号,而IMF3与IMF4均只包含一种频率的信号,信号频率分别为50 Hz和25 Hz。由此可见,使用EMD算法分解谐波信号得到的IMF包含不止一种频率成分,出现较为明显的模态混叠现象。

使用VMD算法对构造的谐波信号进行分解,VMD算法参数中设置分量个数K为3,惩罚系数α为2 000,判别精度为1×10-7,分解后IMF1~IMF3的时域信号及其对应频谱如图2所示。

图2 VMD分解 IMF1~IMF4时域及频域信号

由图2可见,使用VMD算法分解得到3个IMF,由分解得到的时域信号及其对应频率信号可知,每个IMF频率成分单一,表明VMD算法分离不同频率的信号效果更好,具有良好的抗模态混叠能力。此外,与EMD算法无法控制分解得到的IMF个数不同,VMD算法能根据实际需要设置分解后信号分量个数,易于神经网络方法相结合,针对不同频段的信号选取合适的方法,降低预测模型的复杂度,据此构建快速准确的短期负荷预测方法。

2 基于灰色关联分析与CART回归树变量选择

在复杂环境下有效选取负荷影响关键因素是实现短期负荷精准预测的关键,也是降低输入数据维度、提高模型训练速度的重要保障。针对不同输入数据,基于灰色关联分析和CART回归树提出一种复合变量选取方法,分析不同因素对负荷预测的重要程度,选取负荷预测关键因素,实现输入数据有效降维同时提高预测精度。

2.1 灰色关联分析算法

灰色关联分析是对一个系统发展变化态势的定量描述和比较,常用于分析相关因素对结果的影响程度。灰色关联分析由原始序列集确定参考序列和比较序列,并对所有序列进行无量纲化处理。

比较序列Xi对于参考序列X0在k点的关联系数计算式为:

(6)

式中ρ为分辨系数,取值越小,分辨能力越高。ρ取值范围一般为(0,1),更一般取值为0.5。

为将比较序列所有时刻的关联系数集中体现在一个数值上,采用平均值获得计算结果为:

(7)

式中γi为关联度系数;n为序列长度。

2.2 基于决策树的输入变量选择

针对天气情况、日期信息等随时间变化较为缓慢的输入变量,选择基于CART回归树的XGBoost算法,计算各变量对于预测的贡献度,据此选择输入变量用于负荷预测。

XGBoost算法通过不断添加新CART回归树,用于学习新的函数以拟合上次预测残差。XGBoost的目标函数定义为:

(8)

(9)

式中T为叶子节点个数;w为叶子节点分数;γ可调节叶子节点个数,调整λ可避免叶子节点分数过大,从而避免过拟合。

为最小化损失目标函数,利用目标函数在ft=0处的泰勒二阶展开近似函数,找到合适ft使目标函数最小化,并通过“剪枝”得到目标函数为:

(10)

式中gi与hi分别为生成第t棵树后上一次预测残差的一阶与二阶导数。由式(10)可得,目标函数可看作叶子节点分数w的一元二次函数,求得最优目标函数和最优w值。

由于基于空间切分的优化问题是一种NP难问题,XGBoost利用贪婪算法确定最佳决策树结构并寻找输入变量最佳特征和最佳分裂点。依据输入变量在所有树中作为划分属性的次数、带来的平均增益和影响的平均样本数三个指标,计算各输入变量的重要性,据此选择输入变量用于负荷预测。

3 VMD-CVS-LSTM预测方法的构建

长短时记忆神经网络是基于传统循环神经网络(Recurrent Neural Network,RNN)的改进,在克服RNN网络梯度消失问题的同时,对存在短期或长期依赖的数据进行建模时具有良好的表现,已成为实际应用中最有效的序列预测模型之一。LSTM网络单元通过门结构控制信息的流动,可实现对信息的存储和更新。LSTM网络单元如图3所示。

图3 LSTM网络单元结构

图3中,LSTM单元中有输入门、遗忘门和输出门,分别使用i、f和o表示。

采用变分模态分解算法,对用电信息采集系统提供的电力负荷数据进行分解。针对分解得到的各子序列,利用复合变量选取算法筛选负荷变化关键影响因素,作为负荷预测的输入。使用LSTM神经网络,对负荷子序列分别建立预测模型,并将各预测分量进行叠加,得到最终的短期负荷预测结果。短期负荷预测模型整体框架如图4所示。

图4 短期负荷预测模型整体框架

4 实验与分析

借助国网用电信息采集系统,获得长沙某地区2019年1月1日-12月31日共8 760条负荷数据,采样间隔为1 h,并结合对应时间的温度、湿度、气压等气象数据,构成短期负荷预测的数据集验证所提出方法。选用均方根误差RMSE和绝对平均误差MAE作为短期负荷预测效果的评价指标,用于衡量预测数据与真实数据的偏差与离散程度,均方根误差与绝对平均误差计算式分别为:

(11)

(12)

4.1 负荷数据VMD分解

为更加直观展现负荷数据的部分变化特征,选取2019年1月7日-13日共计一周的每小时负荷数据进行展示,负荷曲线如图5所示。

图5 1月7日-13日负荷曲线

由图5可知,每日负荷曲线的最低点在6时左右,每日12时-14时、18时-22时是该地区的两个用电高峰期。对比一周七天的负荷曲线可得,周一至周五的负荷曲线变化较为一致,在用电高峰时间段周末的用电量明显低于工作日。负荷数据变化呈现一定的规律性,使用VMD算法可进一步挖掘并提取负荷变化的规律,提高短时负荷预测的可靠性。

电力负荷信号可分为趋势分量、细节分量和随机分量。因此,设置VMD分量个数K=3,惩罚系数α=2 000,判别精度为1×10-7。负荷数据的VMD分解如图6所示。

图6 负荷数据VMD分解

由图6可见,对原始负荷数据进VMD分解得到的IMF1和IMF2都呈现出较好的周期性,变化规律明显。其中,IMF1中波形变化的周期接近24 h,变化比较平缓且平均幅值最大,反映该地区每天用电量变化的趋势。IMF2中波形变化周期约为12 h,反映一天之中不同时间段用电的波动规律。IMF3中波形变化规律性弱,波动具有较强的随机性,且平均幅值相对较低,反映该地区由于天气等因素发生变化导致短时间内负荷发生相应改变。

4.2 基于CVS输入变量选择

使用灰色关联算法计算多个变量间的关联度,分析不同变量之间的相互影响程度。使用灰色关联算法,设置参数ρ=0.5,计算原始负荷数据及各影响因素之间的关联度,并绘制灰色关联度热力图,负荷影响因素灰色关联度热力图如图7所示,其横轴为参考序列名称,纵轴为比较序列名称。

图7 负荷影响因素灰色关联热力图

由图7可知,灰色关联度热力图可展示每个数据序列与其他数据序列的关联度,该图第一列为以负荷数据为参考序列所计算得到灰色关联度。灰色关联度越接近1,表明比较序列对参考序列的影响度越大。降水与电力负荷之间的关联度为0.81,是负荷数据作为参考序列的最大关联度,表明该地区相比其他因素,降水对负荷变化的影响程度最大。其他影响因素与负荷数据的关联度分布在0.74~0.79之间,表明各影响因素对负荷变化影响程度接近。此外,本地气压与海平面气压、2 min风向与10 min风向、2 min风速与10 min风速的关联系数分别为0.99、0.96和0.95,表明参考序列和比较序列之间关联密切,变化趋势几乎一致。

使用VMD算法将负荷数据分解为3个IMF,为更准确地针对每个IMF选择合适影响因素作为预测模型的输入,分别计算每个IMF与影响因素间的灰色关联度。关联度计算结果如表1所示。

表1 IMF分量灰色关联度

针对天气情况、小时、日、星期以及月份等信息,使用XGBoost算法计算对各IMF预测的重要性,重要性计算值如图8所示。

图8 部分输入变量的预测重要性

由图8可见,“时刻”与“月份”两个输入变量对于IMF~IMF3的预测重要性明显高于其他输入变量,且其余输入变量的重要性计算值均低于11%,表明除“时刻”和“月份”两个变量外,其余变量对各IMF预测的帮助十分有限。据此,针对不同IMF选择的全部预测输入数据如表2所示。

表2 各IMF对应预测输入数据

由表2可知,通过CVS算法筛选后,不同IMF分量构建负荷预测模型时所需输入数据不同,再进一步提升短时负荷预测精度的同时,也能有效剔除对负荷预测贡献较低的数据,减小负荷预测模型的复杂度。

4.3 LSTM网络参数的选取

使用Python语言,构建三层LSTM网络,包含输入层、隐藏层和输出层。其中,隐藏层神经元个数为500。设置参数epouch=50,batchsize=70,并选择在非稳态问题具有优良性能、计算效率高、所需内存小的Adam算法作为神经网络优化器。

4.4 预测与比较分析

将数据样本的70%作为训练集,30%作为测试集,在同等条件下,分别运用RNN预测、LSTM预测、CVS+LSTM预测、EMD+CVS+LSTM预测以及VMD+CVS+LSTM预测共5种方法进行短期负荷预测。通过对比5种方法的预测效果,验证所提出的基于变分模态分解和灰色关联的短期负荷预测方法有效性。5种预测方法的总体预测效果如表3所示,并选取某日的数据绘制预测效果对比图与预测相对误差对比图,如图9和图10所示。

表3 预测方法评价指标

图9 预测效果对比

图10 预测相对误差对比

由表3可知,直接使用神经网络进行短期负荷预测,均方根误差和绝对平均误差较大,表明预测效果欠佳。其中,LSTM网络的预测精度相对于RNN有较大的提升,但预测结果仍具有较大误差。使用信息分析或CVS算法对输入变量进行筛选后,预测精度有进一步的提升。相比于互信息分析算法,基于提出的CVS算法选取负荷预测关键变量并结合使用LSTM进行预测,更能有效提高负荷预测精度,RMSE和MAE分别减少32.6%和15.5%,表明CVS算法能有效去除干扰信息,筛选出负荷预测所需的关键影响因素,同时提高预测精度。预测模型训练输入变量越少,训练参数越少,需要的训练时间越短,有利于未来在面对大数据的训练过程中实现快速训练,减少模型更新和维护所需时长。使用VMD算法后能够使短期负荷预测的RMSE和MAE进一步降低,分别减少13.3%和9.9%,预测精度得到更多的提升,表明VMD算法能够有效的挖掘并提取负荷数据的变化特征,提高负荷预测精度。

由图9与图10可知,直接使用RNN或LSTM神经网络得到的负荷预测曲线对原始负荷曲线的拟合效果不佳,易出现较大偏差。使用CVS算法与神经网络结合后有较好的改进效果,使用EMD或VMD信号分解算法可进一步提高负荷预测的精度。其中,使用VMD+CVS+LSTM算法的负荷预测曲线与原始负荷曲线变化的一致性最好,累计预测偏差最小。

根据EMD+CVS+LSTM与VMD+CVS+ LSTM两种预测模型在某日连续24 h的预测对比结果如表4所示。

表4 24 h负荷预测对比

由表4可知,EMD+CVS+LSTM预测模型在这一天的平均绝对误差为239.4 MW,VMD+CVS+ LSTM预测模型的平均绝对误差为198.8 MW,表明使用所提出的负荷预测方法获得的预测结果累计误差更少,预测精度更高,且VMD+CVS+ LSTM模型的平均相对误差为3.96%,能够较好地满足供电部门对负荷预测的精度需求,为电力系统长期稳定的运行提供帮助和指导。

5 结束语

针对复杂环境下短期负荷波动性、随机性以及负荷预测影响因素选取困难等问题,建立基于变分模态分解和复合变量选取算法的短期负荷预测模型,实测分析结果表明:使用VMD分解将原始负荷数据分解成为多个本征模态函数,可有效避免EMD或EEMD方法的模态混叠,充分挖掘负荷数据潜在的变化规律;提出复合变量选取算法,充分考虑不同影响因素的特征,筛选关键影响因素,可减少模型训练数据的复杂度,提高预测精度;使用LSTM网络,能有效学习负荷数据时序序列特征,同时避免负荷预测模型构建过程中梯度消失等问题。比较传统预测模型,提出方法具有更高的预测精度,可为电力系统制定发电计划提供准确、可靠的依据。

猜你喜欢
变分模态负荷
逆拟变分不等式问题的相关研究
求解变分不等式的一种双投影算法
关于一个约束变分问题的注记
一个扰动变分不等式的可解性
防止过负荷时距离保护误动新判据
主动降负荷才是正经事
国内多模态教学研究回顾与展望
负荷跟踪运行下反应堆一回路控制系统仿真与验证
基于HHT和Prony算法的电力系统低频振荡模态识别
Savitzky-Golay在含冲击负荷短期负荷预测中的应用