基于PSO/DE-ELM模型的云贵高原干旱预测

2023-06-09 00:56赵建华王华曹双
水利水电快报 2023年3期
关键词:学习机时间尺度权值

赵建华 王华 曹双

摘要:

气候变化导致西南地区面临愈加严重的干旱问题,为准确预测该区域干旱情势,分别构建了粒子群算法(PSO)和差分进化算法(DE)优化的极限学习机(ELM)模型,并将其应用于云贵高原干旱预测,从预测精度和特征值模拟能力等方面比较了PSO-ELM模型和DE-ELM模型在云贵高原干旱预测中的适用性。结果表明:①PSO-ELM模型和DE-ELM模型均能够有效预测云贵高原不同时间尺度下的干旱状况,模拟值与实测值的相关系数均在0.75以上,均方根误差均小于0.65;②两种模型对最大值、最小值、不同百分位数等特征统计值、干旱历时和干旱强度的拟合效果较好,能够有效反映研究区干旱特征;③相较而言,DE-ELM模型的预测性能略优于PSO-ELM模型,在云贵高原干旱预测中具有更强的适用性。

关键词:

干旱预测; PSO; DE; ELM; SPEI; 云贵高原

中图法分类号:P426.616

文献标志码:A

DOI:10.15974/j.cnki.slsdkb.2023.03.002

文章编号:1006-0081(2023)03-0015-07

0 引 言

干旱灾害是全球范围内影响面最广、灾害损失最大的气象灾害之一[1-2],对农业生产、人类生活和社会经济发展均造成了严重的影响[3]。由于干旱影响机制复杂、发展相对缓慢,往往难以对干旱灾害进行系统的评估和预测[4],如何科学地预防和控制干旱灾害成为全球各个国家和地区面临的重要挑战。随着计算机技术的发展,机器学习技术为准确高效的干旱预测提供了技术支撑[5-6]。其中,极限学习机(Extreme Learning Machine,ELM)作為一种学习速度快、泛化能力强的单隐层前馈神经网络,在许多领域得到了广泛的应用[7-9]。但由于ELM自身算法存在缺陷,容易陷入局部最优或产生过拟合现象,因此需采用优化算法对ELM进行优化。粒子群算法(Particle Swarm Optimization,PSO)和差分进化算法(Differential Evolution Algorithm,DE)作为典型的基于群体进化机制的优化算法,在机器学习模型优化方面表现较为出色[10-11],但仍鲜有研究将其应用于干旱预测。本文以中国西南地区云贵高原为研究区,分别构建了粒子群算法优化的极限学习机模型(PSO-ELM)和差分进化算法优化的极限学习机模型(DE-ELM),并将其应用于气象干旱预测,揭示了不同智能算法优化的极限学习机模型在云贵高原干旱预测中的适用性。研究成果可为云贵高原防旱减灾提供技术支撑。

1 研究区概况及数据来源

1.1 研究区概况

云贵高原地处中国西南部,位于北纬22°~30°、东经100°~111°,包括云南省东部和贵州省全境(图1)。云贵高原属于亚热带湿润区,为亚热带季风气候,水量充沛,多年平均降水量约为1 219.7 mm,但受海拔高度和大气环流条件的影响,年际年内气候差异显著,易发生旱涝。年内降水多集中于5~10月,约占全年降水量的85%~95%;最大年降水量与最小年降水量的比值约为1.66。受气候变化的影响,近半个世纪以来云贵高原的干旱频次和强度均呈现增加趋势[12-13]。2010年,中国西南五省区发生历史罕见特大干旱,云贵两省农作物受灾面积达287万hm2(4 300万亩),2 000多万人出现饮水困难,直接经济损失达200亿元。连续严重的干旱威胁区域粮食和生态安全,并影响地区社会经济的可持续发展。

1.2 数据来源

本文采用的气象资料为中国气象数据网(http:∥data.cma.cn)提供的1971~2016年云贵高原区域内25个气象站点的月降水和气温数据。气候系统数据为中国气象局国家气候中心网站(http:∥cmdp.ncc-cma.net/cn/index.htm)提供的1970~2016年的130项气候系统指数逐月资料,包括26项海温指数、88项大气环流指数以及16项其他指数。本文所采用的数据均通过了一致性与可靠性检验。

2 研究方法

2.1 标准化降水蒸散指数

标准化降水蒸散指数(Standardized Precipitation Evapotranspiration Index,SPEI)[14]基于水量平衡原理,能够同时考虑降水和气温的影响,并表征不同时间尺度的干旱状况,被广泛应用于干旱评价与预测[6]。本文采用Thornthwaite方法计算潜在蒸散发量,并逐月计算降水与蒸散发的差值;采用3参数log-logistic概率分布对差值序列进行正态化处理,计算得到3个月、6个月和12个月尺度的SPEI(SPEI-3、SPEI-6和SPEI-12),以此表征不同时间尺度下云贵高原干旱状况,并将其作为干旱预测模型的输出变量。SPEI的具体计算原理见参考文献[14]。

2.2 极限学习机模型优化

2.2.1 ELM

极限学习机[15]为典型的基于广义逆矩阵理论的单隐含层前馈神经网络,输入层与隐含层的权值和隐含层的阈值可随机生成,只需确定隐含层神经元个数即可获得唯一解。与传统神经网络算法相比,具有学习速度快、泛化能力好的优点[16]。

若存在N个样本(xi,yi),其中xi=(xi1,xi2,…,xin)T∈Rn,yi=(yi1,yi2,…,yin)T∈Rm,ELM随机生成输入权值w和隐含层偏置b。对于有L个隐含层节点,激活函数为f(x)的ELM输出式为

yt=∑Li=1βifi(wi,bi,xi)=h(xt)β(1)

式中:t=1,2,…,N;fi为激活函数;i为节点;β=(β1,β2,…,βL)T为ELM网络中隐含层与输出层之间的输出权值矩阵;h(xt)表示输出层的输入数据在隐含层对应的输出;bi为第i层隐含节点的阈值;wi为第i个输入层与隐含层的连接权值。Y=Hβ为ELM目标期望的输出矩阵,H为隐含层输出矩阵。

2.2.2 PSO/DE-ELM

由于标准ELM的输入权值和隐含层阈值是随机给定的,参数的不确定性可能导致模型预测精度降低或产生过拟合现象[11]。为了提高模型的稳定性和预测精度,本文分别利用粒子群算法(PSO)和差分进化算法(DE)对ELM模型的输入权值和隐含层阈值进行优化,将迭代得到的最优输入权值和隐含层阈值作为ELM模型的参数进行预测。

粒子群算法(PSO)是一种通过模拟鸟群捕食行为设计的群智能全局搜索算法[10],该方法将问题的解看做空间中的一个“粒子”的位置,每个粒子都有专属的位置和速度,通过计算各粒子适应度值的大小确定个体和全局极值,并以此更新粒子的位置和速度,在反复迭代过程中各粒子逐渐趋于全局最优解[17]。差分进化算法(DE)[18]是一种基于群体的启发式全局寻优算法。该方法随机初始化种群,并随机两个个体相减求差进行加权处理,随机选取一个新的个体对其进行交叉变异操作,生成新的个体;若新个体优于变异前个体,则保留此个体,若新个体适应度并未优于变异前个体,则淘汰此变异个体。

PSO和DE优化ELM的具体步骤:① 构建ELM模型的样本数据集,采用试错法确定最优隐含层神经元个数,随机生成输入权值和隐含层神经元阈值;② 随机设定种群规模,将随机生成的输入权值和隐含层阈值作为种群个体,利用ELM计算输出值,以预测值与实测值的均方误差作为适应度函数,计算每个个体的适应度数值;③ 基于适应度计算结果更新种群,重复上述步骤,直至达到迭代结束条件。将最终得到的最优网络输入权值和神经元阈值代入ELM模型进行学习和训练。PSO-ELM和DE-ELM的具体流程见图2。

2.3 云贵高原干旱预测

将构建的PSO-ELM和DE-ELM应用于云贵高原干旱预测。模型输入参考文献[19],选取影响云贵高原SPEI-3,SPEI-6和SPEI-12的关键致旱气候系统指数,详见表1。模型输出为基于云贵高原25个气象站点1971~2017年实测月降水、气温数据计算得到的SPEI-3,SPEI-6和SPEI-12,用于表征研究区实际干旱状况。模型的训练期为1972~2012年,共41a,测试期为2013~2017年,共5 a。PSO-ELM和DE-ELM模型的参数设置见表2,其中两种模型在ELM模块的参数设置一致。

2.4 模型性能评价

为定量评价模型的预测精度,本文选取均方根误差RMSE和相关系数CORR为模型精度评价指标,具体计算公式如下:

RMSE=∑ni=1(xi-yi)2n

(2)

CORR=∑ni=1(xi-x)(yi-y)∑ni=1(xi-x)2∑ni=1(yi-y)2

(3)

式中:xi為模型预测值,yi为SPEI计算值;x为预测平均值,y为SPEI计算实测值;n为数据个数,i=1,2,3,…,n。RMSE和CORR的值均在[0,1]之间,RMSE越接近0且CORR越接近1,则预测精度越高,反之则预测精度越低。

本文的干旱预测模型运行次数为50次,选取50次中各指标的平均值评价模型预测精度,提高性能评价的可靠性。

3 结果与讨论

基于PSO-ELM和DE-EL模拟预测云贵高原干旱状况,图3~5为不同时间尺度不同模型最佳预测结果时间过程线和预测值与实际计算值散点关系图,反映了不同模型预测结果与实际计算结果的拟合情况。散点图中实线为1∶1参考线,虚线为线性拟合趋势线,趋势线斜率越接近1且越接近参考线,表明模拟结果越好。由图3~5可知,两种模型对3种时间尺度SPEI的预测效果均较好,能够较为准确地反映研究区SPEI的时间变化过程,预测值与计算值相关性较强,线性拟合斜率在0.85~1.10之间。

采用CORR和RMSE评估模型预测性能,评价结果如图6所示。为进一步评估不同模型在干旱预测中的适用性,参考相似条件下,文献[20]基于遗传算法优化极限学习机(GA-ELM)的云贵高原干旱预测结果,将GA-ELM模拟得到的CORR和RMSE结果同样绘制在图6中。

通过对比不同模型的CORR和RMSE可知,PSO-ELM和DE-ELM模型在训练期和测试期的模拟精度均能够满足精度要求,未出现过拟合或欠拟合现象,表明所构建的模型结构合理,且具有较强的泛化能力。对于两种优化模型,训练期CORR均在0.85以上,RMSE均在0.5以下;测试期CORR均在0.75以上,RMSE均小于0.65。根据参考文献[20],相较于标准ELM,GA-ELM在云贵高原干旱预测中表现出更强的预测性能,因此本文将PSO-ELM和DE-ELM的计算结果与GA-ELM进行对比,进一步探究PSO和DE对ELM模型的优化能力。由图6可知,不同时间尺度下,PSO-ELM和DE-ELM在训练期和预测期的表现均优于GA-ELM,测试期CORR分别较GA-ELM提升了5.2%~15.8%和9.6%~17.8%,RMSE分别减小了2.7%~16.7%和7.1%~17.9%,表明相较于GA-ELM,PSO-ELM和DE-ELM模型的预测性能得到了明显提升。对比PSO-ELM和DE-ELM的预测结果,PSO-ELM在训练期和测试期的CORR在0.767~0.871之间,RMSE在0.423~0.604之间;DE-ELM的CORR在0.799~0.897之间,RMSE在0.411~0.577之间。总体而言,DE-ELM在云贵高原干旱预测中的表现更优于PSO-ELM。

绘制不同时间尺度SPEI计算值和不同模型模拟值在测试期的箱型图,如图7所示。由图7可知,对于SPEI-3,PSO-ELM和DE-ELM对最大值的模拟偏小,对最小值的模拟偏大,但对中位数、上四分位数(75%)和下四分位数(25%)的模拟效果相对较好,且DE-ELM的模拟效果相对优于PSO-ELM;对于SPEI-6,PSO-ELM对各统计值的模拟效果均存在一定偏差,DE-ELM模拟结果的数据分布与计算值的相似程度更高;对于SPEI-12,DE-ELM对数据分布的模拟效果同样优于PSO-ELM。综上,DE-ELM在云贵高原干旱预测中表现更优。

为进一步评价模型预测结果的可靠性,本文统计了不同模型预测结果对应干旱事件的干旱历时和干旱强度。参考基于SPEI的干旱评价方法,当SPEI不大于-0.5时,认为当月发生干旱,发生干旱的月数求和为干旱总历时,干旱月份SPEI之和的绝对值为干旱强度。计算测试期不同模型预测干旱总历时和总强度的相对误差,统计结果如图8所示。

对于SPEI-3,SPEI-6和SPEI-12,测试期实测数据计算值统计得到的干旱总历时分别为19,23,26个月;PSO-ELM模擬得到干旱总历时分别为20,26,25个月,相对误差分别为5.26%,13.04%,-3.85%;DE-ELM模拟得到干旱总历时分别为19,24,28个月,相对误差分别为0,4.35%,7.69%。对于干旱总强度,3种时间尺度下PSO-ELM模拟的相对误差分别为-9.8%,4.5%,-3.21%,DE-ELM模拟的相对误差分别为-8.43%,-5.55%,-5.21%,相对误差均在±10%以内。两种模型在干旱历时和干旱强度的模拟方面各有优劣,但总体误差均在可接受范围内,能够有效揭示云贵高原干旱特性。

4 结 论

本文分别构建了基于PSO-ELM和DE-ELM的云贵高原干旱预测模型,并从模型泛化能力、预测精度、干旱特征模拟等方面对模型进行了综合评估,验证了模型在云贵高原干旱预测中的适用性。研究结果表明:

(1) PSO-ELM和DE-ELM均能够有效预测云贵高原干旱状况;两种模型对云贵高原不同时间尺度干旱预测结果CORR均大于0.75,RMSE均小于0.65,能够相对准确预测SPEI最大值、最小值、中位数等各项特征统计值,预测干旱总历时和总强度相对误差均在±15%以内;

(2) 相较于PSO-ELM,DE-ELM模拟结果与计算值的CORR更高,RMSE更小,对SPEI各项特征统计值的预测效果更好,在云贵高原干旱预测中表现更优。

参考文献:

[1] 王鹏涛.西北地区干旱灾害时空统计规律与风险管理研究[D].西安:陕西师范大学,2018.

[2] 朱妮娜.基于GLDAS和GRACE数据的塔里木河流域干旱综合评估[D].上海:华东师范大学,2020.

[3] 符淙斌,温刚.中国北方干旱化的几个问题[J].气候与环境研究,2002(1):22-29.

[4] ZHANG Q,YAO Y,WANG Y,et al.Characteristics of drought in southern China under climatic warming,the risk,and countermeasures for prevention and control[J].Theoretical and Applied Climatology,2019,136(3-4):1157-1173.

[5] 赵美言,胡涛,张玉虎,等.基于机器学习模型的海河北系干旱预测研究[J].干旱区地理,2020,43(4):880-888.

[6] 米前川,高西宁,李玥,等.深度学习方法在干旱预测中的应用[J].应用气象学报,2022,33(1):104-114.

[7] 王婷婷,冯起,温小虎,等.基于极限学习机的干旱区潜在蒸发量模拟[J].中国沙漠,2017,37(6):1219-1226.

[8] 叶家豪,魏霞,黄德启,等.基于灰色关联分析的BSO-ELM-AdaBoost风电功率短期预测[J].太阳能学报,2022,43(3):426-432.

[9] 张宇,刘珊.蚁群算法优化极限学习机的通信网络流量建模分析[J].甘肃科学学报,2021,33(6):29-33.

[10] 黄日胜,黄锡波.基于加速参数自调整粒子群算法的物流配送优化模型[J].计算机应用与软件,2015,32(10):328-333.

[11] 张仙,戴家佳,余奇迪.基于SARIMA-PSO-ELM组合模型的我国铁路货运量预测[J].数理统计与管理,2022,41(3):394-401.

[12] 张强,邹旭恺,陈鲜艳,等.考虑多尺度和蒸散影响的新干旱指数研究——以云南为例[J].高原气象,2022,41(4):909-920.

[13] 徐海亮.六十年来全国与西南地区气象干旱及气候环境变化——以云南为例[J].昆明学院学报,2020,42(2):24-35.

[14] VICENTE-SERRANO S M,BEGUERA S,LPEZ-MORENO J .A Multiscalar drought index sensitive to global warming:the standardized precipitation evapotranspiration index[J].Journal of Climate,2010,23(7):1696-1718.

[15] HUANG G B,ZHU Q Y,SIEW C K.Extreme learning machine:Theory and applications[J].Neurocomputing,2006,70(1/3):489-501.

[16] 黄远红,黄清宝.DE-ELM在水煤气组分浓度软测量建模中的应用[J].自动化仪表,2017,38(2):77-81.

[17] 宋剑.基于神经网络的智能电能表故障预测研究[D].南京:河海大学,2021.

[18] STORN R,PRICE K.Differential evolution:a simple and efficient adaptive scheme for global optimization over continuous spaces[J].Clobal Optimization,1997,11(4):341-359.

[19] 刘振男.中长期干旱预测研究:以云贵高原为例[D].南京:河海大学,2019.

[20] 刘振男,杜尧,韩幸烨,等.基于遗传算法优化极限学习机模型的干旱预测——以云贵高原为例[J].人民长江,2020,51(8):13-18.

(编辑:江 文)

Drought prediction of Yunnan-Guizhou Plateau based on PSO/DE-ELM model

ZHAO Jianhua1, WANG Hua2, CAO Shuang2

(1.Suqian Branch of Jiangsu Province Hydrology and Water Resources Investigation Bureau,Suqian 223800,China; 2.Lower Changjiang River Bureau of Hydrological and Water Resources Survey,Bureau of Hydrology,Changjiang Water Resources Commission,Nanjing 210011,China)Abstract:

Climate change has led to a gradual intensification of drought of southwest China.In order to accurately predict the drought regime in this region,the extreme Learning Machine (ELM) models optimized by Particle Swarm Optimization (PSO) and Differential Evolution (DE) were established respectively.In this paper,it used the optimized models(PSO-ELM model,DE-ELM model) to predict drought of Yunnan-Guizhou Plateau.The drought prediction applicability were compared in terms of prediction accuracyand eigenvalue prediction ability.The results showed that ① both PSO-ELM model and DE-ELM model could effectively predict drought conditions in the Yunnan-Guizhou Plateau at different time scales,and correlation coefficient between the simulated values and the measured values were above 0.75,and the root mean square errors were less than 0.65.②The two models fit the maximum,minimum,different percentile and drought duration and drought intensity well,which could effectively reflect the drought characteristics of the study area.③The prediction performance of DE-ELM model was slightly better than that of PSO-ELM model,which had stronger applicability in drought prediction of Yunnan-Guizhou Plateau.

Key words:

drought prediction; PSO; DE; ELM; SPEI; Yunnan-Guizhou Plateau

收稿日期:

2022-04-20

作者簡介:

赵建华,男,高级工程师,主要从事水文水资源分析与论证、防汛防旱等方面的工作。E-mail:zhaojjhh@126.com

通信作者:

曹 双,男,高级工程师,硕士,主要从事河道治理、防洪研究、水文水资源分析与论证等方面的工作。E-mail:xycaos@qq.com

猜你喜欢
学习机时间尺度权值
一种融合时间权值和用户行为序列的电影推荐模型
时间尺度上Lagrange 系统的Hojman 守恒量1)
交直流混合微电网多时间尺度协同控制
CONTENTS
时间尺度上完整非保守力学系统的Noether定理
极限学习机综述
基于极限学习机参数迁移的域适应算法
分层极限学习机在滚动轴承故障诊断中的应用
基于权值动量的RBM加速学习算法研究
大连市暴雨多时间尺度研究分析