基于融合长短时记忆网络的风电场超短期风速预测研究

2020-02-25 11:44王红刚
可再生能源 2020年1期
关键词:短时记忆网络层风电场

王红刚,李 彬

(武汉理工大学,湖北 武汉 430070)

0 引言

风电凭借分布广、技术成熟度高的特点,在我国的电力装机中的占比逐年提升。然而,风电出力具有不确定性,大规模的风电并网对电力系统的安全、稳定经济运行带来了严峻的挑战[1]。风速或者风电功率预测是应对上述挑战的重要技术手段。准确的风速、风电功率预测能够优化机组组合与经济负荷调度,减少系统旋转备用容量,减少风电场弃风限电,对于电力系统的优化运行有着十分重要的意义[2]。

风速预测方法主要可以分为物理方法和统计方法。在现有的技术条件下,统计方法在超短期(4 h 以内)和短期(4~72 h)的风速预测结果均优于物理方法,计算时间与计算规模也更有优势,因此,统计方法是目前风速预测的主流[3]。在统计方法中,超短期风速预测主要从时间序列建模的角度出发,核心的思想是从历史时间序列中发掘风速的时序变化特征并依此对未来的风速做出预测。常用的算法包括:自回归滑动平均模型、支持向量机、卡尔曼滤波、神经网络等[4]~[6]。

近年来,为提升风速的预测精度,深度神经网络方法被引入到风速的时间序列预测中,并且获得了比浅层模型更加良好的预测效果。文献[7]提出了基于深度玻尔兹曼机的超短期和短期的风速预测模型,研究结果表明,深度玻尔兹曼机模型能够学习深层数据特征,获得比浅层模型更加准确的结果。文献[8]建立了堆叠自动编码机的超短期风速预测方法,研究结果表明,模型在没有遇到过度拟合问题时,增加隐藏层数能够提高风速的预测精度。以上的研究成果也进一步表明,深度学习能够提取数据中的深层抽象特征,从而提升预测模型的精度。

长短时记忆网络是深度学习中的经典序列建模算法,本文在使用长短时记忆网络的基础上,通过考虑多个风电场之间存在的时空相依关系,构建了一种融合长短时记忆网络(Merged LSTM)的超短期风速预测方法。该方法通过融合层将多个堆叠的Merged LSTM 输出张量进行拼接,再通过全连接层统一输出多个风电场的预测风速。该模型充分利用了Merged LSTM 的时间序列特征提取能力以及全连接网络的特征融合能力,能够直观地考虑到多个风电场风速的时空相关性。此外,模型时间序列特征提取模块的设计充分考虑了预测风电场群的规模,较大规模的风电场群落可以适当增加时间序列特征提取模块的输入数据长度,进一步提升了模型的适应性。总之,Merged LSTM 模型不仅实现了多个风电场的超短期风速预测,而且能够融合临近风电场的风速信息,从而获得比单个风电场预测建模更好的预测效果。

1 全连接神经网络层与长短时记忆网络层

神经网络核心是通过优化神经网络内计算节点的连接方式来逼近复杂的非线性目标函数。由于算法结构灵活,函数近似能力强,神经网络算法被用于各种有监督与无监督任务当中。在风电领域中,风电功率预测、风电机组故障诊断、风电机组优化控制等技术均广泛采用了神经网络算法[9]。一个完整的神经网络可以由许多网络层模块搭建,常用的网络层有全连接层(Dense Layer)、卷积层 (Convolution Layer)、 循环层(Recurrent Layer)、标准化层(Normalization Layer)等多种类型,通过对不同类型网络层的组合可以为不同类型的任务提供一个合理的结构。本文构建的Merged LSTM 超短期风速预测模型主要涉及了循环层中的长短时记忆网络层、Dense Layer 和融合层(Merge Layer)。

1.1 长短时记忆网络层

循环神经网络通过门机制对循环神经网络的输入、遗忘和输出信息进行控制,能够有选择地记忆和遗忘过去的信息,极大地拓展了循环神经网络在时间序列上的学习能力及其应用范围[10]。

长短时记忆网络(LSTM)是一种经过特殊设计的循环神经网络。通常LSTM 元胞在单个时间步内的前向过程可由输入、遗忘和输出过程表述。

首先,上一时刻输出(ht-1)和当前时刻输入(xt)进入遗忘门,确定遗忘何种过去的状态信息(ft)。

然后,ht-1和xt进入输入门,确定输入何种当前信息(it),同时产生备选状态信息

式中:xt为 t 时刻输入;Wf,Wi,Wo,Uf,Ui,Uo,Vo为权重矩阵;bf,bi,bo为偏置向量;σ 为 sigma 激活函数;tanh 为激活函数;ot为输出门信息;ht为最终的输出结果。

1.2 全连接网络层与融合层

全连接层的每一个节点都与上一层的所有节点相连,是最为简单的神经网络层,主要用于将之前的特征进行融合以及输出模型的结果,能够对上层特征实现不同的线性或者非线性转换,全连接层表达式为

式中:Wfc为连接权重;bfc为连接偏置向量;hl-1为上一层输出为全连接层输出;g 为激活函数,目前常用的激活函数有ReLU,sigmoid,tanh 以及linear 等类型,linear 激活函数常用于网络的回归输出。

对于构建风速预测模型,中间的全连接层均采用ReLU 激活函数,输出层采用linear 激活函数。

网络融合层主要实现多种形式的张量操作,例如张量相乘、加和、相减以及拼接等。本文主要是将多个LSTM 网络的输出张量进行拼接。

2 基于Merged LSTM的风电场风速预测模型

2.1 模型结构

为融合多个风电场的预测序列信息,使用临近风电场的历史风速信息帮助预测效果的提升,提出了基于Merged LSTM 的多风电场超短期风速预测模型。模型结构如图1 所示,主要由3 个模块构成,即逐个风电场的序列特征抽取模块、多个风电场的序列特征融合模块以及多个风电场预测风速的输出模块。

序列特征抽取模块由一个两层的堆叠长短时记忆网络构成,采用多个时刻的风电场风速风向序列作为输入,输入的风速风向序列的长度由经验取得,也可通过自动调参算法获得,不同的风电场输入风速风向序列长度可以不同。

序列特征模块通过张量拼接层(Concatenate Layer)以及两个堆叠的全连接网络层构成。张量拼接层将LSTM 的输出序列特征拼接并输入两个全连接层。最后线性激活函数的全连接层作为多个风电场的预测风速的输出模块。

图1 融合长短时记忆网络的超短期多风电场风速预测模型Fig.1 Structure of Merged LSTM network for short-term wind speed forecasting

2.2 模型参数以及对比模型设置

Merged LSTM 参数设置主要包括输入序列长度、各层的节点数、学习率、优化器、初始化方式等。其中:输入的序列长度为24;LSTM 层节点数为64;全连接层采用ReLU 激活函数,节点数为128;输出层的激活函数为线性激活函数,节点数为3。本文使用了Adam 优化器,优化器学习率为0.001,初始化方式为随机正交初始化。

对比模型有持续法模型(Persistence)、支持向量机回归模型 (SVR)、 多层全连接网络模型(FNN) 以及堆叠的长短时记忆网络模型(Stacked LSTM)。对比模型的参数见表1。

表1 各对比模型的参数Table 1 Model parameters of each comparative model

3 算例分析

3.1 数据集与评价指标

算例分析数据集来自于江苏省3 个相邻的近海风电场,图2 为3 个风电场的相对位置关系及每个风电场的风玫瑰图。数据包含了从2016-01-01T00:00-2017-12-31T24:00 两年的完整数据,时间分辨率为1 h,超短期的预测时长也为1 h。为了合理验证提出的模型效果,数据集被划分为训练数据集与测试数据集,比例为4∶1,每个季节的前80%数据为训练数据集 (80%的数据集再去10%的数据作为验证集),后20%为测试数据集。在划分数据集后,分季节对模型预测效果进行评估。

图2 3 个风电场位置关系及风电场风玫瑰图Fig.2 Relative location of three wind farms and wind rose map of each wind farms

模型评估指标为均方根误差(RMSE)与平均绝对误差(MAE)。

3.2 多风电场时空相关性分析及网络输入设计

图3 为3 个风电场的相关系数矩阵。

图3 3 个风电场的相关系数矩阵Fig.3 Correlation metric for three wind farms

分析3 个风电场的互相关系数可知: 风电场1 与风电场2 的相关系数为0.82,呈高度相关关系;风电场1 与风电场3 的相关系数为0.73,具有一定的相关性;风电场2 和风电场3 的相关系数为0.8,呈现出高度相关关系。

Merged LSTM 的结构设计应考虑3 个风电场之间的时空关联关系。在设计Merged LSTM 时应注意到两点:(1)由于3 个风电场近海,受到以日为周期性的海陆风影响,可以通过输入不短于24 h 的风速风向时间序列来捕捉周期性的风速序列变化;(2)3 个风电场之间相隔距离较近,风电场间的风速延迟时间也较短,例如5 m/s 风速的气流运动1 h 的距离大致为18 km,已经远超本算例中3 个风电场的相隔距离。因此,按照(1)中所述的超过24 h 的序列输入Merged LSTM 模型,也能同时考虑到3 个风电场间的时间延迟特性;对于不存在海陆风影响且相隔距离较远的多个风电场,可根据风电场间的相对位置设置输入序列的长度。

3.3 预测结果分析

计算本文提出的Merged LSTM 以及4 种对比方法在不同季节的RMSE 以及MAE。

图4 为风电场1 在四个季节的预测误差,Merged LSTM 的RMSE 在春夏秋冬四个季节下的提升比例分别为6.4%~36.7%,5.6%~33.4%,9.6%~32.1%和6.6%~39.3%。MAE 在春夏秋冬四个季节下的提升比例分别为7.9%~43.0%,6.0%~44.8%,5.2%~41.8%和6.4%~44.9%。

图4 1# 风电场均方根误差与平均绝对误差Fig.4 The RMSE and MAE of wind farm 1

图5 为风电场2 在四个季节的预测误差,Merged LSTM 的RMSE 在春夏秋冬四个季节下的提升比例分别为4.8%~15.7%,5.1%~13.3%,3.3%~12.6%和3.6%~11.4%。MAE 在春夏秋冬四个季节下的提升比例分别为3.7%~22.6%,5.4%~21.1%,7.0%~13.4%和3.7%~17.6%。

图5 2# 风电场均方根误差与平均绝对误差Fig.5 The RMSE and MAE of wind farm 2

图6 为风电场3 在四个季节的预测误差,Merged LSTM 的RMSE 在春夏秋冬四个季节下的提升比例分别为5.9%~7.2%,8.4%~15.1%,6.6%~13.2%和10.7%~15.9%。MAE 在春夏秋冬四个季节下的提升比例分别为8.1%~22.6%,7.9%~15.3%,2.7%~18.6%和1.7%~17.6%。

由图4~6 可知,本文提出方法在3 个风电场的不同季节均能改善预测效果,获得比其他4 种常规建模方法更好的预测效果。

图7 为本文提出的方法与对比方法的预测走势图。

图6 风电场3 均方根误差与平均绝对误差Fig.6 The RMSE and MAE of wind farm 3

图7 风电场超短期风速预测曲线与实际风速曲线对比图Fig.7 Comparison of predicted wind speed values and measured wind speed values

由图7 可知,本文提出的方法预测序列更接近实际序列,这进一步证明了同时融合临近多个风电场的时序信息可以改善超短期风速的预测效果。

4 结论

相邻风电场之间存在时空相关性,对于时空相关关系的挖掘能够提升相邻多个风电场的风速预测精度。本文提出了一种基于Merged LSTM 的超短期风速预测模型,并对多个风电场的超短期风速同时进行预测。在使用长短时记忆网络提取单个风电场序列特征的基础之上,将多个风电场的序列特征进行融合学习,最终同时输出多个风电场的超短期预测风速。采用沿海3 个相邻风电场两年的数据进行验证分析,结果表明,3 个风电场的风速序列之间存在较强的相关性。本文提出的Merged LSTM 模型能够考虑到临近风电场之间的风速时空相关性,使3 个风电场的超短期风速预测效果在不同季节均能得到提升。

猜你喜欢
短时记忆网络层风电场
基于长短时记忆神经网络的动力电池剩余容量预测方法
数字化风电场后评估指标体系研究
《海上风电场设施施工检验指南》(GD01—2020)发布
基于PSS/E的风电场建模与动态分析
论物联网安全威胁及其应对策略
吉林大学考古与艺术博物馆观众短时记忆调查报告
英语听力理解与短时记忆
我国离岸最远的海上风电场并网发电
短时记忆理论的影响
物联网技术在信息机房制冷系统中的应用