湖北山区复杂地形条件下风电功率预报算法研究

2021-08-04 07:06许沛华陈正洪孙延维王必强简仕略
干旱气象 2021年3期
关键词:天数风电场合格率

许沛华,陈正洪,孙延维,王必强,简仕略

(1.华中师范大学人工智能教育学部教育信息技术学院,湖北 武汉 430079;2.湖北省气象服务中心,湖北 武汉 430074;3.湖北第二师范学院计算机学院,湖北 武汉 430205)

引 言

湖北省内风能资源丰富区域主要分布在鄂北部的随州至麻城桐柏山大别山一线、中部的襄阳及荆门一带、鄂西南的利川齐岳山区、鄂东低山丘陵湖区,全省90%以上风电场建设在复杂地形的山区。对于复杂地形的山区来说,数值模式预报由于网格及陆面物理过程的局限性,模拟山区复杂地形及地貌条件较困难[1-4],尤其是近地层风速易受复杂下垫面和复杂湍流过程影响[5-6],使模式模拟的风速、风向与实测值之间存在一定偏差[7-8],需要在大量的观测数据基础上进行模式后处理,使数值预报结果更接近电站观测值[9-13]。

目前国内外风电功率预报算法主要分为物理法与统计方法,物理法也被称为数值天气预测模型[14],它严重依赖于风电场条件的完整描述。统计方法侧重于挖掘时间序列中的时变关系,这些时变关系由三类组成,分别是时间序列分析方法、卡尔曼滤波和机器学习方法。自回归模型、移动平均模型、自回归移动平均模型是典型的时间序列分析模型[15],往往需要较高的模型阶数来描述时间序列数据的线性关系。卡尔曼滤波考虑了模型误差的动态传播,可以有效提高预测精度[16]。除此之外,神经网络和支持向量机是具有代表性的机器学习方法[17],可以通过各种学习规则在输入和输出之间建立非线性映射。然而在风电场大规模的服务实践过程中发现,针对统计模型所需的高质量时间序列数据,往往会受测风塔观测数据质量、风机老化、停机检修、限电、覆冰等诸多因素影响,数据的内在统计规律被破坏,给统计模型的建立带来了困难。同时,随着并网风电规模越来越大,国家能源局华中监管局2019年7月发布了对每日功率预报准确率进行考核的文件,对预报的合格率和准确率提出了更高要求。因此,如何建立一个可以适应不同数据场景又能提供持续高准确率的风电功率预测算法体系,并在大规模的工程应用中以经济高效的方式运行是一个急需破解的难题。

本文使用物理法[18]、偏最小二乘法[19]、神经网络算法[20-24],建立基于风速订正方法的物理法、偏最小二乘法、神经网络方法进行功率预测,通过实际对比检验,每一种单一方法均无法满足风电场对持续高准确率预报的要求,受深度学习方法的启发,在这些方法的基础上提出了softmax集成预报方法[25],该方法较单一预报方法和传统均值法集成预报都具有更高的合格率和准确率,可以有效减少电站考核天数,提升电站经济效益。

1 资料与方法

1.1 资 料

为检验softmax集成预报方法在不同典型条件下的预报能力,对具有典型代表地区的3个风电场进行6种风电短期功率预报,并对预报结果进行详细分析。这3个电站情况分别为:电站1位于鄂北部山区,风机较多,装机容量大,投产时间长,观测数据受风机老化、检修、限电等各种不确定因素影响较大,数值预报较为准确;电站2位于鄂西南高海拔山区,投产时间短,观测数据质量高,数值预报在该地区存在系统偏差;电站3位于鄂东低山丘陵地区,装机规模小,投产时间短,观测数据质量高,数值预报经订正后大部分月份能满足要求。

利用湖北省3个风电场2018年5月至2019年12月的数据进行试验,经过分析和筛选,每个风电场挑选数据质量较好的7个月数据(其中第1个月数据用于训练,剩余6个月数据用于检验准确率),包括风电场的功率实况数据、测风塔数据及数值预报数据,时间分辨率均为15 min,数值预报使用同期欧洲中期天气预报中心(European Center for Medium-Range Weather Forecasts,ECMWF)产品,区域水平分辨率为3 km×3 km。

1.2 方 法

为适应不同风电场的数据条件和场景,利用物理法[18],即利用数值预报的风速、风向、温度、湿度、气压等预报要素,根据风机的功率曲线预报发电功率的方法;偏最小二乘法[19],基于线性回归和最小二乘法基础上的一种高度非线性体系的统计预报方法;神经网络法[20-24],是一种高度非线性预报方法,能够以任意精度逼近任何非线性映射,以及考虑数值预报周期性和季节性波动特点的滚动风速订正方法。首先使用数值模式预报输出结果输入到上述3种功率预报模型中,然后结合风电场实际测风数据对风速和功率曲线进行滚动订正和建模,再输入到3种功率预报模型中。在长期风电场服务过程中发现,由于每个风场观测数据的稳定性、数值预报误差的不确定性等因素导致无法使用任何一种单一的预报方法进行高合格率和高准确率的预报服务。

均值法集成预报方法,即对所有预报方法求平均值的方法,存在一些固有缺陷,容易高估小风,导致小风天气因为平滑而被夸大,低估大风,导致大风天气的预报能力因为平滑而被降低,给功率预报造成了困扰,降低预报的合格率[26-28]。越来越多实践表明[29],预报准确率较高的方法应赋予“更高”的权重,预报准确率不高的方法也能得到一定的权重,准确率不同的预报方法之间的权重需要具有一定的“距离”,softmax函数恰好能够满足这个要求,该函数是机器学习领域比较重要的函数,尤其在多分类的任务中应用广泛,softmax函数可形式化表示[25]如下:

(1)

假设P1、P2、P3分别为某一时刻最优预报方法一、方法二、方法三的风电预报功率,则集成预报风电功率P公式如下:

P=δ1(z)×P1+δ2(z)×P2+δ3(z)×P3

(2)

式中:P(MW)为集成预报的风电功率;δ1(z)、δ2(z)和δ3(z)分别为优选的3种算法权重值;P1、P2、P3(MW)分别为优选的3种算法预报的功率值。由公式(2)可以看出,softmax集合方法可以“凸显”最近30 d预报准确率较高的方法并“抑制”最近30 d预报准确率相对一般的方法,如3种方法都具有相同的合格天数,则该方法变为均值法。每天选择参与集成预报的方法时,根据这些预报方法最近30 d的预报准确率进行动态调整,而不是固定的3种方法。

风电功率预报预测合格率(Q)计算公式如下(1)国家能源局华中监管局文件. 关于印发华中区域“两个细则”的通知,(2019)192号.:

(3)

式中:i代表某一天,Bi代表第i天是否合格,rRMSE为第i天功率预报的相对均方根误差,当预报准确率大于等于80%为1,表示该日预报合格,当预报准确率小于80%为0,表示该日预报不合格。

1.3 流程图

设计两大类预报算法:(1)基于原始数值预报结果进行预报的物理法、偏最小二乘法和神经网络法;(2)原始数值预报结合现场观测数据进行风速订正的基础上,再将订正风速进行物理法、偏最小二乘法和神经网络法进行预报。对以上6种算法再进行最近30 d的预报合格率计算并优选合格率最高的3种预报算法,再对这3种预报算法进行softmax集成预报,图1为softmax集成预报流程图。

图1 softmax集成预报流程图Fig.1 The softmax ensemble prediction flow chart

2 结果分析

2.1 电站1

随州天河口风电场地处随州市桐柏山脉,风场由一条东西走向长约10 km的主导山脊组成,风场占地面积大,地形地貌复杂,装机容量220 MW,为湖北省境内最大装机容量风电场,共135台风机,选取2019年4—10月的数据进行各种算法的合格率和准确率统计。表1列出2019年5—10月天河口风电场各算法风电功率预报合格率及天数,可以看出,前6种算法每个月合格的天数不稳定,而后2种集成预报算法表现出较好的稳定性,其中7月、8月、10月softmax集成预报算法较均值法集成预报合格天数提高2 d,其他月份提高1 d,平均提高1.5 d。softmax集成预报算法较均均值法集成预报月平均合格率提高4.91%。

表1 2019年5—10月天河口风电场各算法风电功率预报合格率及天数Tab.1 The qualification rate and days of wind power forecasted by each algorithm in Tianhekou wind farm from May to October 2019

表2列出2019年5—10月天河口风场各算法风电功率预报准确率。可以看出,数值模式的原始预报较准确,即使在没有订正的基础上,预报准确率也均大于80%。6—8月将该风场数值预报输出风速代入3种方法后,物理法较神经网络法和偏最小二乘法的预报准确率更高,以6月为例分析发现,5月整场的风速和实况功率的散点图(图2)虽成“S”型分布,但对于4~10 m·s-1风速来说,对应的实况功率取值范围较大,其中4~5 m·s-1风速对应实况功率值范围为0~150 MW,由于神经网络法和偏最小二乘法采用最近前30 d的数据滚动建模,所以5月的数据不利于机器学习,影响6月神经网络法和偏最小二乘法预报准确率,分析原因可能是由于该风电场装机容量较大,风机较多,整场出力受到风机检修、老化等各种不确定因素的影响。另外,softmax集成预报的准确率较均值法集成预报更高,其中月平均预报准确率较均值法提升0.79%,其中10月预报准确率较均值法提升0.92%。

表2 2019年5—10月天河口风电场各算法风电功率预报准确率Tab.2 The forecast accuracy of wind power of each algorithm in Tianhekou wind farm from May to October 2019

图2 2019年5月天河口风电场实况风速与实况发电功率散点图Fig.2 The scatter diagram of actual wind speed and actual generation power of Tianhekou wind farm in May 2019

2019年5—7月天河口风电场采用直接将数值预报输出的风速代入物理法的预报准确率更高,以6月为例分析发现,6月订正前的风速均方根误差为2.23 m·s-1,订正后均方根误差为2.24 m·s-1,误差不仅没有下降,相反略有增大(图3)。说明通过风速订正后的预报算法反而比没有订正的算法预报效果略差。

图3 2019年6月天河口风场实况风速及订正前后预报风速的日变化Fig.3 The daily variation of observed wind speed and forecasted wind speed before and after revision in Tianhekou wind farm in June 2019

2.2 电站2

利川齐岳山风电场位于鄂西北高海拔山区,总装机容量99 MW,共66台风机,选取该风电场2018年6—11月的风电功率预报合格率、合格天数、准确率(表3、表4)进行分析。由表3可以看出,softmax集成预报较均值集成预报合格天数提高1~3 d,其中8月和11月均值法和softmax集成预报法的合格率一样。以11月例,优选的3种预报算法合格天数均为25 d,由公式(2)可知,softmax集成预报法变成了均值法集成预报,故两种集成预报合格天数一样,也均为25 d。总体上,softmax集成预报法月平均合格天数比均值法集成预报高1.3 d。

表3 2018年5—11月齐岳山风电场各算法风电功率预报合格率及天数Tab.3 The qualification rate and days of wind power forecasted by each algorithm in Qiyueshan wind farm from June to November 2018

表4 2018年6—11月齐岳山风电场各算法风电功率预报准确率Tab.4 The forecast accuracy of wind power of each algorithm in Qiyueshan wind farm from June to November 2018

图4为2018年6—11月齐岳山风电场预报风速订正前后的均方根误差。可以看出,7月、8月和11月订正后风速均方根误差(RMSE)均略有增大,其中7月增大0.05 m·s-1,但6月、9月、10月预报风速经订正后均方根误差均有下降,其中10月下降0.26 m·s-1。由表4可以看出,将数值预报输出风速直接代入的物理法没有其他预报方法效果好,其中6月、9月、10月经风速订正后的各预报算法准确率都得到明显改进,6月、9月风速订正后的神经网络法较直接将数值预报输出风速代入的物理法分别提升3.89%、6.25%,10月风速订正后的物理法较直接将数值预报输出风速代入的物理法提升6.67%,与图4风速订正误差较为吻合,尤其是10月,风速订正后改进最为明显。从各月预报准确率来看,softmax集成预报法接近单一预报方法的最大值,6—11月均优于均值法集成预报。

图4 2018年6—11月齐岳山风电场订正前后预报风速的均方根误差Fig.4 The root-mean-square error of forecasted wind speed before and after revision in Qiyueshan wind farm from June to November 2018

2.3 电站3

武穴大金中部风电场位于鄂东低山丘陵地区,装机容量26 MW,共13台风机,选取该风电场2019年7—12月的功率预报合格率、合格天数、准确率(表5、表6)进行分析。由表5可以看出,7—12月softmax集成预报法较均值法集成预报合格天数提高1~3 d,其中10月、12月合格天数提高较明显,均提高3 d,与天河口风电场类似,月平均合格天数提高1.8 d。

表5 2019年7—12月大金风电场各算法风电功率预报合格率及天数Fig.5 The qualification rate and days of wind power forecasted by each algorithm in Dajin wind farm from July to December 2019

由表6可见经过风速订正后的预报模型比直接使用数值预报输出风速的预报模型月平均预报准确率更高,对预报风速订正后的算法除9月和11月外,其他月份预报准确率均为最高,其中9月订正风速后偏最小二乘法较数值预报输出风速代入物理法提高2.89%。7月softmax集成预报法比单一预报算法准确率最高的偏最小二乘法(订正风速)提高1.31%,其他月份softmax集成预报法均接近单一预报算法准确率最高的算法。除12月外,其他月softmax集成预报均高于均值法集成预报。

表6 2019年7—12月大金风电场各算法风电功率预报准确率Tab.6 The forecast accuracy of wind power of each algorithm in Dajin wind farm from July to December 2019

图5为2019年9月大金风电场实况风速与实况发电功率散点图。对比图2发现,该风电场散点图数据聚集度高,经过数据“清洗”后,噪声数据少,适合机器学习模型的建立,所以统计方法较物理法准确率更高。

图5 2019年9月大金风电场实况风速与实况发电功率散点图Fig.5 The scatter diagram of actual wind speed and actual generation power of Dajin wind farm in September 2019

图6为2019年12月大金风电场实况风速及订正前后预报风速的日变化。可以看出,12月预报风速与实况风速存在明显的系统偏差,预报风速偏小,订正前预报风速均方根误差为2.06 m·s-1,订正后预报风速均方根误差为1.77 m·s-1,误差减小0.29 m·s-1,经风速订正后的神经网络法准确率较数值预报输出风速代入物理法提高7.05%(表6),预报准确率得到明显提升。

图6 2019年12月大金风电场实况风速及订正前后预报风速的日变化Fig.6 The daily variation of observed wind speed and forecasted wind speed before and after revision in Dajin wind farm in December 2019

通过3个典型电站分析发现,6个单一的预报算法在每个电站每个月都会有不同的表现,预报合格率和准确率受数值预报的不确定性、训练数据(历史数据)的质量问题、风机老化程度、检修等各种复杂的主客观因素影响。如在天河口风电场,装机容量较大,原始的数值预报在没有订正的情况下准确率能达到80%以上,而在齐岳山风电场观测数据质量较高,数值预报风速存在一定系统偏差,使用订正后的预报算法效果更好,但没有任何一个单一预报算法所有月份的预报准确率大于80%,在大金风电场虽然观测数据质量较好,但极少数月份通过订正后预报准确率仍然达不到80%,有赖于数值预报的能力的进一步提高。通过应用实践表明,softmax集成预报法相比传统均值法集成预报,月平均合格天数提高约1~2 d,预报准确率提高0.40%~0.79%,具有更高的合格天数和准确率。

3 结论与讨论

(1)在数值模式后处理的订正方面,统计订正方法的确可以修正数值预报对风速预报的系统偏差,但同一数值模式在不同地区表现出不同的预报能力,甚至同一地区的不同月份和季节都表现出不同的预报能力,订正算法有时候也会使预报误差增大,最终影响功率预报的合格率和准确率。

(2)在采用实际功率曲线方面,偏最小二乘法与神经网络算法在部分电站表现出较好的预报能力,分析发现功率预报的合格率和准确率与风机出力、测风质量、模型训练有关。

(3)在数据质量方面,观测数据的质量会严重影响订正模型的表现能力,对训练样本集噪声数据的清洗比较困难,需结合电站实际情况和专家经验进行具体斟别,需投入大量的人力物力,不利于大规模的推广应用。

综合分析,任何单一算法受数值模式的预报能力、风电场规模、风机老化程度(投产时长)、观测数据质量、检修限电等各种因素的影响,即使对每个场站进行深入分析后再精细化建模,要使单一预报算法的合格率和准确率每个月都达到最好效果比较困难,受深度学习启发,本文提出一种softmax的集成预报算法,较均值法集成预报算法具有更好的预报效果,使得每个月预报准确率和合格率都能有较稳定的表现,大多数情况下都能逼近每个月预报准确率最高的算法,甚至极个别月份还会超过所有单一预报算法,尤其是每个月的预报合格天数可以提升约1~3 d,能有效减少电站被考核的电量,提高电站经济效益。

猜你喜欢
天数风电场合格率
质量管理工具在减少CT停机天数中的应用
提高肉鸡出栏合格率的综合措施
抑郁筛查小测试
最多几天?最少几天?
基于PSS/E的风电场建模与动态分析
生日谜题
含风电场电力系统的潮流计算
提高重症医学科床头抬高合格率
含大型风电场的弱同步电网协调控制策略
我国生鲜乳连续7年三聚氰胺抽检合格率100%