基于BiLSTM-LightGBM混合模型的风速预测方法

2023-11-10 07:01国电电力广西风电开发有限公司杨旺春莫浩鸣
电力设备管理 2023年20期
关键词:深层梯度风速

国电电力广西风电开发有限公司 杨旺春 莫浩鸣

风电作为一种清洁、可再生的能源,在全球范围内受到广泛关注和应用。然而,风速和风向的不确定性是风电场运行稳定和发电效率提高的重要挑战。一方面风的随机性和波动性限制了机组的发电稳定性,这对电力上网调频和调度产生了较大的影响;另一方面,对风速的准确感知和把握是风电机组最大化利用风能的关键。准确预测风速对于提高风力发电行业的可靠性、安全性和经济性具有至关重要的意义。

随着气象学、统计学和机器学习等领域的快速发展,风速预测技术得到了显著提高。目前,在风速预测领域已经有较多成熟技术,从预测的时间尺寸来看,可以分为超短期、短期预测、中期预测以及长期预测等,主要使用包括物理方法、统计方法、神经网络方法以及混合方法[1]。其中,物理方法主要通过建立准确的数值气候预报模型(Numerical Weather Prediction,NWP),需要考虑到风电场风机的位置分布、气象等物理因素,对计算性能要求较高,且难以短时间输出结果,不利于预测短期风能变化。而基于统计方法的预测则,需要大量的时序数据来保障模型拟合的准确性,对短期序列预测效果较好,但风数据的非线性、非平稳性常导致建立的统计模型准确性不高。

近年来,基于深度学习的预测方法成为风速预测的研究热点,通过构建多层神经网络来自动学习输入数据之间的复杂非线性关系,能够更好地处理非线性和非平稳的时空信号,也被广泛地运用到风速序列的各个时间尺寸和区间上的预测[2],取得了较好的效果。考虑到风速数据的在时间上具有长期依赖关系,为进一步提高预测精度,本文建立一种BiLSTM-LightGBM混合预测模型,应用BiLSTM神经网络深入挖掘两个指标间的关联,提取时间序列特征,再使用LightGBM进行预测输出,并结合风场实测数据验证模型的有效性。

1 研究方法

1.1 BiLSTM网络

LSTM(Long short memory)作为RNN网络的一种变体,通过增加遗忘门、记忆门等结构,使模型能有效避免因序列过长导致的梯度消失或梯度爆炸,自主学习长序列在时间上的依赖。LSTM层前向传播的过程如下[3]。

首先通过输入门控制输入信息的添加:it=σ(WxiXt+Whiht-1+bi),其中:it表示当前时刻的输入门值,Wxi、Whi和bi分别表示输入层到输入门、隐藏层到输入门的权重和偏置,Xt表示当前时刻的输入特征,ht-1表示上一个时刻的隐藏状态。再由遗忘门决定哪些信息需要从细胞状态中保留或遗忘:ft=σ(WxfXt+Whfht-1+bf),经由更新门的输入来更新细胞状态:得到最终细胞状态(Cell State)更新:,其中,表示元素级别的乘法操作,Ct表示当前时刻的细胞状态。输出门(Output Gate)输出:ot=σ(Wx0Xt+Wh0ht-1+b0),隐藏状态(Hidden State)更新:根据细胞状态和输出门进行更新,得到新的隐藏状态用于下一时刻的计算:其中,ht表示当前时刻的隐藏状态。

通过这些门控单元的组合和更新,LSTM模型可以更好地处理长期依赖关系,并具有较强的记忆能力。但单向的LSTM往往只能考虑到前文序列数据对现有数据的影响,对后文的学习却无法反馈到前文进行判断,即无法做到联系上下文进行综合学习。为此,研究者基于LSTM进行改进,在前向LSTM层的基础上,增加一层后向传播LSTM层,构建双向长短期记忆神经网络(Bi-direction Long short memory,BiLSTM),使模型可以同时考虑上下文信息。如图1所示,网络能实现对序列x1,x2,…,xn通过同时考虑数据的前向和反向信息来进行序列建模,在xi处将返回对该节点处两层LSTM隐藏层更新状态进行拼接[hi,h`n-1],用于后续预测结果的输出。

图1 BiLSTM网络训练图

图2 BiLSTM-LightGBM模型流程

1.2 LightGBM

LightGBM是一种为优化模型训练时效性和扩展性而开发的梯度提升决策树算法(Gradient Boosting Decision Tree,GBDT)。其与XGBoost模型类似,都具有高效的并行运算性能,且因面对大量样本数据具有更快的训练速度、更低的内存使用等特点,频繁出现在各类赛事与科研活动中。而其优异的表现主要来自两种策略.

基于梯度的单边采样(GOSS)。LightGBM采用对小梯度样本的单边采样策略(Gradient-based One-Side Sampling,GOSS),能通过计算梯度对样本筛选。通过节点分裂保留具有更大增益效果的大梯度样本,并筛选掉容易犯错误的小梯度样本,降低低质量样本的比重,提高模型训练速度与训练质量;互斥特征捆绑(EFB)。LightGBM利用稀疏性对特征进行无损合并,通过贪婪算法不断迭代组合特征,选出最佳特征组合。使用互斥特征捆绑(Exclusive Feature Bundling,EFB)策略,将高度相关的特征进行合并,有效地降低了原始特征的维度,保留最具有区分度的特征组合,帮助模型提高泛化能力与可解释性。

2 风速预测模型

2.1 BiLSTM-LightGBM混合风速预测模型

风速数据通常具有非线性、非平稳性和随机性。对于小型风场而言,顾及复杂的气象系统、地形和地理条件,各种气象数据的采集和精准物理模型的建立不仅困难,计算成本也高昂。本文通过挖掘风速数据在时间跨度上的相互联系,基于数据驱动的深度学习方法建立一种BiLSTM-LightGBM风速混合预测模型。

模型主要由一个三层BiLSTM神经网络特征提取模块和LightGBM预测模块组成,模型训练的步骤如下。数据预处理。受风场环境恶劣、系统故障等因素影响,系统采集到的数据中可能出现部分缺失。针对这部分缺失数据,选择对间隔不超过10min的数据进行前后均值填充,以在一定程度上保持数据的趋势和变化;对超过10min间隔的数据进行分割处理,划分为不同时间段,以保证数据的完整性和连续性。对处理后的数据归一化后,用于下一步模型的构建和研究。

BiLSTM模型训练。将处理好的数据带入BiLSTM模型中。数据首先经过一个带有8个隐藏单元的双向LSTM层,再通过堆叠的两个带有16个隐藏单元的双向LSTM层,用于捕捉输入序列中的正向和反向信息。然后将前述层中正向和反向信息沿特征轴使用Concatenate层进行连接组合,输入一个具有64个隐藏单元的双向LSTM层,进一步捕获前后序列信息。此时得到的输出即可作为提取风速数据前后序列的深层特征,再依次通过Flatten层,全连接层、Dropout层输出该模型的预测结果。通过迭代训练得到拟合效果最优模型。

特征提取。对BiLSTM的预测结果进行分析,发现模型的拟合表现较好,但仍有部分时间预测值与实际值相比波动较大,可能是受数据中噪声或者风速本身波动过大的影响。为解决该问题,考虑将BiLSTM模型提取的风速序列深层特征,送入噪声鲁棒性高的LightGBM模型进行最终预测。通过评价表现最优的BiLSTM模型提取深层特征,用于下一步Light-GBM模型训练。

LightGBM模型训练与预测。将BiLSTM模型提取的深层特征输入LightGBM模型进行训练,通过调整学习率、树的深度等参数配置,选择效果最优的模型进行预测。在整个模型中,BiLSTM层能够有效地捕捉长距离依赖关系以对序列数据进行建模,使用两层LSTM网络进行双向连接,可以访问过去和未来的信息。而LightGBM能够很好地降低噪声数据或者数据波动过大的影响。通过这种组合策略,极大地改善了模型的预测准确性和稳定性。

2.2 评估指标

使用均方误差(MSE),平均绝对误差(MAE),平均绝对百分比误差(MAPE)三个指标对模型预测效果进行评价,公式如下:其中:n表示样本数量,yi表示真实值,表示预测值。

3 案例分析

本文试验使用从山东某风场SCADA系统中提取的w001号风机的装载测风仪实测数据集。该数据集包含了风机所在位置从2022年6月到2023年7月期间的风速分钟级采样数据。本文使用Windows 11操作系统,CPU采用Intel Core i7-12700H处理器,显卡为NVIDIA RTX 3060,显卡驱动版本为NVIDIA-SMI 528.33,内存大小为DDR3 64 GB,开发环境使用TensorFlow 2.10.0,并使用PyCharm作为开发工具。

3.1 BiLSTM模型预测

将预处理好的数据带入BiLSTM网络模型进行训练。初步设置模型学习率为0.0001,选择MSE(Mean Squre Error)作为损失函数,采用Adam优化器对模型训练参数优化。并结合模型检查点(ModelCheckpoint),提前停止(Early Stopping),学习率衰减(ReduceLROnPlateau)等回调函数,对验证集得分最高的模型权重进行保存,设置训练在验证集上连续15次损失没有改善,或者连续5个epoch的损失未降低,则学习率减半,以控制模型的自主优化,减少模型训练时长。初步设置总时间滑动窗口大小为1000,滑动步长可选择为50,10,进行单步预测。最终保存最优的模型权重,预测效果如图3所示。

图3 BiLSTM 50,10步长预测效果

从预测效果来看,受到数据缺失和风速数据本身非平稳性、随机性的影响,BiLSTM模型对部分数据的拟合仍存在较大的波动,模型拟合精度有待进一步提升。但从总体效果来看,滑动步长为50的预测结果波动相对较小,效果更优,所以选择50步长的模型来提取风速的深层特征。

3.2 BiLSTM-LightGBM预测

将BiLSTM模型提取得到的特征数据带入LightGBM模型中进行训练,训练结果如图4所示,可以直观地观察到,利用BiLSTM提取的深层特征进行训练后,LightGBM模型可以精准地预测风速变化趋势,说明LightGBM充分地学习了深层特征中包含的风速序列信息。

图4 BiLSTM-LightGBM混合预测效果

同时对比原模型在MAE、MAPE、MSE这些指标上的结果,由表1发现,LightGBM作为单模型训练时误差要高于BiLSTM,而且通过绘制BiLSTM预测效果图,也发现预测数据值离风速实际值差异较大。但结合BiLSTM进行混合预测后,三项指标均有大幅度的优化,MSE指标降低了约81.9%,MAE下降了约59.8%,MAPE下降了约52.4%,说明通过BiLSTM模型能有效提取出风速数据中深层特征所包含的丰富信息,而LightGBM模型则能够克服风速本身的非平稳性、随机性,表现出了对噪声和随机性的高鲁棒性能,最终呈现出对风速数据的精准预测,验证了混合模型的有效性。

表1 训练模型效果对比

综上所述,针对风速数据具有非线性、随机性强、时间长期依赖性复杂等特征,本文提出一种基于BiLSTM-LightGBM的混合预测模型,使用BiLSTM模型进行深层特征提取,挖掘高维的风速序列信息,再利用具有强鲁棒性的LightGBM进行预测,建立稳健性更强、预测速度更快的预测模型。且经过试验验证有效性,组合预测模型具有更好的鲁棒性和实用性,为实际风速预测任务提供了可靠的解决方案。

猜你喜欢
深层梯度风速
一个改进的WYL型三项共轭梯度法
基于Kmeans-VMD-LSTM的短期风速预测
基于最优TS评分和频率匹配的江苏近海风速订正
一种自适应Dai-Liao共轭梯度法
考虑各向异性渗流的重力坝深层抗滑稳定分析
一类扭积形式的梯度近Ricci孤立子
SAM系统对TDCS数据的优化处理与深层应用
基于GARCH的短时风速预测方法
对“医患失去信任”的深层忧虑
考虑风速分布与日非平稳性的风速数据预处理方法研究