基于PSO 优化BiLSTM 的联合循环电厂输出功率预测

2022-03-04 02:19邵科嘉山浩强
电力科学与工程 2022年2期
关键词:输出功率粒子电厂

邵科嘉,周 玉,宋 豪,山浩强

(华北水利水电大学 电力学院,河南 郑州 450045)

0 引言

随着我国经济持续稳定发展,国家相关部门相应提高了环保制度的要求标准,环保达标成为生产企业的一项重要任务。在发电行业,由于火电厂排放的污染物影响空气质量,所以由燃气轮机和蒸汽轮机组成的联合循环机组逐渐兴起。循环电厂因为能够提供更加高效环保的电能,所以得到越来越广泛的应用。与常规的燃煤发电相比,联合循环发电的主要优点有:投入资金较少、污染小、效率高、调峰性能好、启停快等。因此,燃气轮机成为了世界上大多数热电厂的原动机,并且从电厂优化设计到经济运行的各个方面都得到学者广泛关注[1]。

热电联产可使机组热耗率降低,从而提高能源使用效率,具有良好的经济性。在大多数电力市场中,每个发电厂都必须向调度中心提交其电力生产预测以确保发电厂能够产生最佳输出输入比。通过对其高精度预测,可实现每兆瓦时电能的效益最优;同时有利于电力系统相关部门合理安排输电网络扩展规划、生产调度、机组使用计划,从而提高电力系统的经济和社会效益。

联合循环机组的输出功率受温度、压力、相对湿度、燃料条件和电力需求等因素的影响而变化[2],在一定程度上不利于并网机组稳定运行。使用热力学方法进行精确的系统分析需要大量的假设[3-4]。为了消除这一障碍,通常使用机器学习方法进行分析。

国内外已经提出了多种基于统计学和机器学习的人工智能预测方法,包括前馈神经网络、模糊神经模型、支持向量机以及多种组合模型等[5]。文献[6]利用多种机器学习方法,通过实验结果分析出不同参数与模型组合对循环电厂输出功率预测产生的影响:首先,针对不同参数组合所得结果进行比较分析寻找最优子集;其次,针对各个机器学习方法的预测精度进行了较为全面的分析,并获得预测精度最高的方法。文献[7]中使用了自适应神经模糊推理系统预测核电站汽轮发电机的功率输出。文献[8]分析了影响燃气轮机发电量的因素,为机组的优化运行与改造指出了实际性的解决方案。文献[9]中提出了一种基于神经网络的双层递阶预测方法并进行了评价。目的是尽可能减少任何预测应用偏差产生的误差。文献[10]采用循环神经网络组合模型在风电功率预测方向取得了较高的精度;但该网络方法存在梯度下降和消失的问题。文献[11]把LSTM 运用到了负荷预测并极大提高了预测精度。文献[12]采用了PSO-LSTM 用于非时序电价信号的短期预测,利用粒子群算法优化LSTM 网络输入权重;然而未考虑粒子群自身的权重对全局最优解的影响。

与其他神经网络模型类似,在BiLSTM 神经网络模型中,部分参数如隐含层神经元个数、周期次数、学习率、批大小等依赖于经验值验证结果,具有较低的泛化性能。基于此,本文通过粒子群算法优化BiLSTM 获得最优超参数,构建基于PSO-BiLSTM 的联合循环电厂输出功率预测模型。利用UCI 标准数据集对本方法和多种方法进行可行性对比实验分析。结果表明,该方法多个预测指标表现优秀,能有效提高循环电厂输出功率预测精度。

1 相关理论和方法

1.1 LSTM 神经网络

为了解决循环神经网络在梯度消失方面的问题,通过改进其隐含层,提出LSTM 人工神经网络。LSTM 是一种特殊改进的递归神经网络,其特点是增加了长短记忆功能,用长短期记忆神经网络单元替代(recurrent neural network,RNN)单元。LSTM 应用在时间序列数据方向具有优异表现,适用于电厂输出功率预测等场景[13]。

LSTM 改进RNN 隐含层的主要步骤如下。

Step 1:隐含层内增加遗忘门、输入门和输出门。

Step 2:在隐含层的内部增加长短期记忆神经网络单元。

以上2 个步骤使LSTM 具有更好的长短期记忆功能。其中LSTM 的隐含层内部构造如图1所示。

图1 LSTM 网络单元结构Fig.1 LSTM network unit structure

LSTM 的训练过程如下。

(1)遗忘门层完成选择性的遗忘部分。

式中:σ为sigmoid 函数;ht–1为上一个时间点的输出;xt为直接输入;Wf为遗忘门的权重;bf为遗忘门的偏置项。

(2)输入门与长短期记忆神经网络单元记忆过程。

式中:Wi和bi分别为函数sigmoid 在完全连接层的权重和偏移参数;WC和bC分别为全连接层tanh函数的权重和偏移参数。

(3)输出门确定细胞状态并将其输出到当前时刻隐含层状态中。

式中:ot为输出门;Ct为当前时刻细胞状态。LSTM网络结构模型如图2 所示。

图2 LSTM 网络结构模型Fig.2 LSTM network structure model

1.2 BiLSTM 神经网络

电厂输出功率数据为时序型数据。对于LSTM此类传统单向神经网络的预测,通常是按照时间序列从前往后进行训练;但这种训练形式对数据利用率较低,不能进一步挖掘数据潜在的特征[14]。

BiLSTM 神经网络通过构造一对方向相向的LSTM 层,即在原来的基础上增加一个反向的LSTM 层使其拥有了双向特性[15]。双向网络使序列起点和终点隐含层的状态均可进行递归响应训练,能进一步挖掘当前数据与之前时刻的数据,以及和未来时刻数据之间的某种联系,进而更深入地处理反向信息,优化长期依赖问题,提升模型的预测精度[16]。BiLSTM 网络模型如图3所示。

图3 BiLSTM 网络结构模型Fig.3 BiLSTM network structure model

BiLSTM 模型通过两个独立的隐藏层分析正向和反向序列,BiLSTM 预测模型中最终输出的预测值yt由正向和反向隐含层共同决定[17]。正反向隐含层的输出以及预测值输出yt的计算公式如下。

正向隐含层输出为:

1.3 粒子群算法

在实验过程中发现,BiLSTM 关键超参数的选取会对预测精度产生影响,所以需对部分超参数的取值进行合理选择。

粒子群优化算法(PSO)由模拟鸟类觅食的随机搜索算法进行改进。相较之其他随机搜索算法的盲目性搜索,该算法在搜索过程具有内在指导性作用[18]。粒子群优化算法因其结构简单、便于实现、输出结果精度高、收敛速度快等优点,被应用于约束优化、动态多目标优化等问题,并取得了很好的效果[19]。鉴于粒子群算法在处理非线性问题的突出效果,故在BiLSTM 超参数的选取上使用PSO 优化算法[20]。

该算法的核心是根据个体历史最优解与全局历史最优解来更新粒子的速度和位置,更新公式为:

式中:vid为速度;c1,c2为粒子的加速学习因子;t为迭代次数;xid为当前位置;w为惯性权重;r1,r2为随机数;pid,pgd分别为粒子自身最优值和全局最优值。

通过迭代更新各个粒子的位置与速度。搜索过程中得出最佳方程解即全局最优解。当群体搜索到满足最小适应值的最优位置结束计算。

本文将PSO 应用于BiLSTM 网络的隐含层神经元个数、周期次数、学习率、批大小等相关参数进行寻优,进一步提升BiLSTM 网络的预测精度。

2 PSO-BiLSTM 预测模型

PSO-BiLSTM 预测模型构建步骤如下。

(1)了解分析联合循环发电厂,再通过主成分分析,获得联合循环机组性能表现的主要影响因素。将这些因素选取并作为主要特征输入到BiLSTM 模型。

(2)初始化PSO-BiLSTM 模型的网络参数,确定输入层。xi表示联合循环发电厂的输出功率影响因素。将这些主要参数输入到网络中进行学习,而输出为未来某一时间段的输出功率预测值。

(3)BiLSTM 模型设置3 层隐藏层。每层有30 个神经元,4 个输入量,激活函数为tanh 函数和sigmoid 函数,周期次数为9,初始学习率为0.001。

(4)根据损失函数RMSE 获得输出误差。结合PSO 算法调节样本权重并不断更新Bi-LSTM 中的参数,直到迭代收敛或达到最大迭代值时结束。

(5)得到PSO-BiLSTM 预测模型并对模型输出值反归一化,得到并输出最终预测结果,完成预测。

基于PSO-BiLSTM 模型的预测流程图如图4所示。

图4 PSO-BiLSTM 模型流程图Fig.4 PSO-BiLSTM model flow chart

3 实验与结果分析

3.1 数据采集分析

采集6年的历史数据,由9 568个数据点组成,使用的数据集是UCI 数据库中Combined Cycle Power Plant Data Set 的数据。该电厂被设置为满负荷运行。为实现对发电量高精度地预测,必须选择接近最大负荷系数的运行数据,故该数据集符合模型测试的数据对象。原始数据如图5 所示,表示各时间点对应的输出功率值。

图5 各时间点输出功率数据分布Fig.5 Data distribution of output power at each time point

选取原始数据集前90%数据用作训练集,选取其中96 个点用作测试集,对不同算法及优化组合模型进行实验。数据描述如表1 所示。

表1 数据集的基本统计数据Tab.1 Basic statistics of dataset

由表可以看出,当联合循环电厂机组满负荷工作时,电能输出功率PE的最小值和最大值相差75.5 MW;这主要受环境因素的波动影响。环境因素对CCPP 机组的输出功率影响至关重要,并且两者间关系比较复杂。为建立精确的数学模型以得到复杂的环境因素与功率之间的关系,本文使用PSO-BiLSTM 模型预测联合循环机组的输出功率。

联合循环电厂满负荷工作条件下,燃气轮机负荷输出对环境因素反应较为敏感,汽轮机负荷输出对排气真空度敏感、特征变量间的关系由相关性分析得出,如图6 所示。环境变量温度和排气真空度与发电输出功率呈强负线性关系,环境压力和湿度与发电输出功率呈弱正线性关系。由图6 可知,温度和排气真空度是发电输出功率的主要控制变量,而剩余的环境压力和湿度等变量经多次实验得出仍对预测的输出结果有影响。最终考虑4 个主要特征作为输入变量。因此,本文是在同时使用4 个特征的前提下进行训练的。

图6 特征相关矩阵Fig.6 Characteristic correlation matrix

3.2 实验环境

使用MATLAB2020a 搭建模型并训练。实验运算条件:主机时钟频率3.20 GHz,Inter Core i7-8700处理器,内存为16 GB,硬盘为512GBPCIe3.0固态。

3.3 归一化

联合循环电厂数据集中的环境变量(温度、环境压力、相对湿度)和排气真空变量等主要特征数据与用于预测电厂的每小时净电能输出数据相比波动幅度较大,且数据之间的量纲不同,必须进行归一化处理。

式中:x为原始输出功率数据;xmin为原始数据的最小值;xmax为原始数据的最大值;xnorm为归一化后的结果。

3.4 模型的评价标准

对于常见的预测算法,预测精度评价指标有平均绝对误差和均方根误差。本文选取的评价指标及表达式为:

3.5 实验过程及结果分析

在BiLSTM 模型中,关键超参数对模型整体性能的影响较大,分别为:3 层隐含层神经元个数、周期次数、学习率和批大小值。

PSO 优化BiLSTM 模型参数的具体步骤如下。

步骤1:对联合循环电厂的环境温度、环境压力、相对湿度、排气真空等主要特征数据,以及用于预测电厂的每小时净电能输出数据进行预处理。

步骤2:初始化粒子群参数。超参数初始设置:自我学习因子为0.5,群体学习因子为0.5,惯性权重为0.8,种群规模为20。

步骤3:构建BiLSTM 预测模型,确定参数寻优范围。BiLSTM 中原始隐含层个数分别为34,50,24;学习率为0.001,周期次数为9,批大小值为24。待优化参数:3 个隐含层个数取值范围L1,L2,L3∊[1,100],周期次数取值范围为e∊[1,30],学习率取值范围为Lr∊[0.001,0.3],批大小取值范围为b∊[1,150]。生成一个种群粒子,将这6 个关键超参数作为粒子寻优参数变量,确定参数的寻优范围。

步骤4:设置的适应度函数为均方根误差。将这6 个关键超参数作为粒子寻优的特征,并作为待优化参数输入到PSO 算法中并进行初始化;将初始化后的值作为历史最优值赋值给双向长短期记忆神经网络,计算粒子的适应度值;根据粒子适应度值的不同进行评估,确定粒子的全局最优位置与局部最优位置,并作为其历史最佳位置记录。

步骤5:根据公式(6)(7)对普通粒子和局部最优粒子位置及速度更新。

步骤6:判断粒子能否终止迭代。原始BiLSTM预测模型的均方根误差值为4.54,将均方根误差值定为寻优目标且小于4.0 设为系统要求。若经过粒子群优化后的模型最终得到的均方根误差值小于4.0 或达到最大迭代次数即得到最优参数,则停止训练,输出此时的优化参数数值,同时输出最终的模型;否则重复步骤5。

寻优过程适应度变化曲线如图7 所示。基于PSO 算法的各个参数寻优过程见图8。参数最终的寻优结果:前3 层隐层神经元个数分别为27、30 和30,周期次数为9,学习率为0.023 7,批大小值为12。

图7 适应度变化曲线Fig.7 Fitness change curve

图8 最优粒子的寻优过程Fig.8 Optimization process of optimal particle

为了验证PSO-BiLSTM 预测模型的性能,使用相同实验数据集,将本文模型与LSTM 模型、PSO-LSTM 模型、BiLSTM 模型进行对比实验。

采取多次实验取平均值分析结果,表2 为随机10 次模型平均误差对比实验结果。传统的LSTM 模型、BiLSTM 模型、PSO 优化LSTM 的模型和PSO-BiLSTM 模型4 种方法的预测结果如图9 所示。

表2 随机10 次模型平均误差对比结果Tab.2 Comparison of model average error of random 10 times

图9 LSTM、BiLSTM、PSO-LSTM 与PSO-BiLSTM 预测对比结果Fig.9 Comparison of prediction of LSTM、BiLSTM、PSO-LSTM and PSO-BiLSTM

实验结果表明,LSTM 和BiLSTM 模型预测的均方根误差分别为4.560 1、4.343 4,而PSO-LSTM模型与本文提出的PSO 优化BiLSTM 模型的均方根误差分别为4.296 8、4.047 0。在基础模型上,双向特性的BiLSTM 模型能够训练学习更多的信息,所以各个评判误差均小于单向LSTM 模型;且经PSO 优化超参数后的模型,其预测值更接近真实值。与基础模型的预测效果对比可知,优化后的模型预测精度进一步提升,说明利用PSO 算法优化BiLSTM 模型参数能够明显提高电厂输出功率预测的精确性。

将该模型与GM,BP,GRNN 和Elman 等网络模型进行了比较,结果如图10 所示。

图10 不同模型预测结果对比Fig.10 Comparison of prediction results of different models

图10 为不同模型预测结果对比图。由图10可以看出,长短时记忆网络预测结果相较其他模型能更好地贴合真实数值;且相对数据集而言的某些离群点,PSO-BiLSTM 模型比LSTM、BiLSTM、PSO-LSTM 预测精度更高。

表3 为各模型预测误差结果。结果显示,以LSTM 算法为基础的模型精度更高。LSTM、BiLSTM、PSO-LSTM 和PSO-BiLSTM 的平均预测误差分别为0.841 2%、0.811 0%、0.818 5%、0.761 6%;采用PSO-BiLSTM 模型的预测精度相比LSTM、BiLSTM、PSO-LSTM 分别提高了9.462 7%,6.091 2%,6.951 7%。

表3 各模型预测误差结果Tab.3 Prediction error results of each model

在PSO 优化方面,不论是针对LSTM 还是BiLSTM,本文模型上都体现了超参数优化对模型预测精度的提升效果。采用PSO 优化的模型的误差相比原模型LSTM 和BiLSTM 分别减少了5.774 0%,6.824 1%。经PSO 优化后模型预测精度比原模型更高,且PSO-BiLSTM 模型预测精度最优,充分体现了Bi-LSTM 对数据的利用率更高。所以,PSO-BiLSTM 模型可有效提高联合循环电厂输出功率预测精度。

图11 为BiLSTM 与PSO-BiLSTM 模型的部分误差对比。从图11 中可看出,优化后的BiLSTM模型数据真实误差相对更小。

图11 BiLSTM、PSO-BiLSTM 模型误差对比Fig.11 Comparison of errors between BiLSTM and PSO-BiLSTM models

4 结论

针对联合循环电厂发电能力随环境温度、压力、相对湿度和电力需求等条件变化影响造成预测精度较差的问题,提出使用粒子群算法与具有较强泛化能力和双向特性的BiLSTM 模型相结合的PSO-BiLSTM 预测模型。并利用UCI 数据库中数据集进行性能验证。

针对BiLSTM 训练过程中遇到的调参问题,引入PSO 算法对BiLSTM 网络模型的相关超参数进行优化,使优化后的PSO-BiLSTM 模型不仅能实现自动调参,而且其预测精度得到提高。

实验分析表明,本文所提PSO-BiLSTM 模型在联合循环电厂输出功率的预测方面精度最优,验证了本文所提方法的有效性和可行性。

猜你喜欢
输出功率粒子电厂
某660MW电厂主蒸汽及再热蒸汽管道管径选择分析
碘-125粒子调控微小RNA-193b-5p抑制胃癌的增殖和侵袭
BIM技术应用与问题分析——以南通某垃圾焚烧电厂为例
基于Matlab GUI的云粒子图像回放及特征值提取
电厂热工控制系统中抗干扰技术运用分析
电厂电气调试方法的改进及新方法的探析
一种用于抗体快速分离的嗜硫纳米粒子的制备及表征
感应加热电源的调频调功研究
问:超对称是什么?
磁耦合谐振串串式无线电能传输研究