基于海表异常温度与MPGA-BP模型的干旱预测

2018-06-13 07:43刘振男周靖楠
贵州农机化 2018年1期
关键词:权值算子遗传算法

刘振男,周靖楠

(贵州理工学院,贵州 贵阳 550001)

0 引言

作为对农业生产影响最大的一类自然灾害,干旱由于发生几率大、持续时间久、随机性强等特征,增加了对其预测与防治的难度,从而导致了许多环境与经济问题,如何提高预测干旱的精度问题成为当今研究的一个热点。随着计算机技术的飞速发展,干旱预测的技术也经历了跨域式的革命,由最初的应用历史资料和天气学统计相关、相似等方法迅速的发展到了应用数理统计及计算机软件等方法进行预测的阶段[1],其中,灰色系统理论[2]、森林随机模型[3]、ARIMA模型[4]、PSO-LSSVM[5]等方法都已成功的应用于干旱预测,而在大量现代研究技术手段中,人工神经网络模型(Artificial Neural Network,ANN)无疑是应用最为广泛、最适用于解决非线性问题的方法。刘代兰等[6]成功的利用ANN模型对于河西走廊伏旱进行了预测。虽然ANN的预报精度高并且本身具备较强的非线性拟合能力,但其也固有很多缺点。比如ANN的权值和阈值一般是通过随机初始化为[-0.5,0.5]区间的随机数,这个初始化的参数对神经网络训练的影响很大,但是又无法准确获得,鉴于此,赵廷红等[7]与王笑宇等[8]引入多种群遗传算法对BP神经网络的初始的权值和阈值进行了优化,分别成功的应用到了重力坝变形预测与降雨预报中,以得到更好的预测效果,但至今还没有文献描述过利用文中的改进模型对干旱进行预测的效果,因此,本文将MPGA-BP模型应用到干旱预测当中,并选取SSTA作为模型的输入因子对越南盖河流域的干旱进行了预测。

1 MPGA-BP模型

BP神经网络是多层前馈神经神经网络算法,这种算法主要是在神经网络训练的过程中,采用误差反向传播的学习算法来不断调整神经网络的权值。由于其结构简单,可调整的参数多,训练算法灵活,可操作性高而被广泛应用。BP神经网络结构主要由输入层、隐含层及输出层构成,同层的各个节点之间没有连接,不同层之间的节点相连接,如图1所示。

图1 BP神经网络拓扑结构

针对BP神经网络的初始权值和阈值对预测结果的影响较大,并且该值的选取随机性大的缺点,本文应用多种群遗传算法对BP神经网络进行优化,主要优化初始权值、阈值、适应度函数以及遗传算子。

多种群遗传算法(MPGA)较标准的遗传算法(SGA)的不同在于:一是采用多个种群进行寻优并行计算,对不同种群设置不同的控制参数值;二是增加了移民算子和人工选择算子,移民算子作为一个媒介将互异的不同种群联系起来,它的作用是增加了各种群间的信息交互,而人工选择算子则负责挑选各种群中最佳个体至精华种群并储存,详细原理请参见文献[7,8],MPGABP的流程图如图2所示。

MPGA-BP神经网络主要步骤如下:

Step1:构造BP神经网络的拓扑结构(确定待优化的权值和阈值的数量);

Step2:对多个初始种群进行遗传操作(确定误差计算公式以及适应度函数);

Step3:选择运算(根据适应度值确定各个基因的选择概率参数);

图2 MPGA-BP神经网络算法流程图

Step4:遗传算子操作(根据选择算子得到的概率,对新种群进行交叉、变异等基本操作);

Step5:移民算子操作(在新种群之间淘汰最差基因,保留最佳基因);

Step6:人工选择算子操作(选择存储每个种群中最优基因);

Step7:判断终止条件(将优化后的权值和阈值应用到BP神经神经网络);

Step8:优化后的BP神经网络对训练样本进行训练、对测试样本进行测试得到最终结果。

2 MPGA-BP模型在干旱中的应用

2.1 研究区域概况

盖河流域图 3所示(12°02’49” – 12°36’13”N,108°40’03” – 109°11’38”E)位于越南庆和省,流域面积约 1,889 km2、流域长 62 km2、平均宽度31 km、流域平均坡度为25.5%。流域具有热带季风气候与海洋性气候特征。流域多年平均降雨量为1,656 mm,每年5月底至12月初为雨季,9月至11月为主要降雨期,雨量占全年总降雨量的55%左右;多年的平均气温为26.7℃;多年蒸发量为1 200-1 800 mm/a。

2.2 数据资料

降雨和温度数据:为研究越南盖河流域的干旱情况,收集了越南庆和省庆永气象站1983年1月至2012年12月的逐日降雨及温度数据。

图3 研究区域图

SSTA 数据:NinoW 区域(15°N-0°S;130°E-150°E)的 SSTA数据搜集自 http://apdrc.soest.hawaii.edu。该数据在收集之前已经经过标准化处理。数据时间为1982年至2012年。

2.3 预报因子

预报因子对于预测模型的成功应用起着至关重要的作用,因此,本文选用了SSTA作为改进模型MPGA-BP的输入因子,因为研究区域的干旱与海气耦合现象厄尔尼诺和南方涛动(El Nino and the Southern Oscillation,ENSO)有很强的相关关系,特别是与太平洋海域的NinoW区域的关系最为强烈[9]。

McKee等[10]提出的标准降水指数(Standardized Precipitation Index,SPI)能进行不同时间尺度的计算,是一种有效干旱监测和评估的工具。因此,本文将使用时间尺度为3个月的SPI指数作为模型输出因子来预测干旱,因为时间尺度为3个月的SPI值能够比较准确的反映季节性干旱,与农业干旱关系密切[11]。

2.4 模型训练与结果分析

2.4.1 模型训练

本文将整理的数据集分为训练集与测试集两部分,训练集为1983年至2008年,测试集为2009年至2012年。根据MPGA-BP神经网络算法流程图,应用MATLAB软件编程,模型相关参数设置如表1所示,为了客观评价,选用统计回归模型、BP神经网络与MPGA-BP神经网络进行比较,其中,BP神经网络与MPGA-BP神经网络相同的参数设置一致,统计回归模型预测利用SPSS软件完成。预测模型结构如表2所示。

表1 模型参数表

表2 模型结构表

其中,SSTA在NinoW区域的值用SSTA-NW表示,SSTA-NW(1)表示与SPI相同时间段的值;SSTA-NW(2)表示的是SPI前1个月的值;SSTA-NW(3)表示SPI前2个月的值,依此类推。例如,在M2中,预测时间尺度为3个月的3月的SPI的值,采用3月的 SSTA-NW(1)、2月的 SSTA-NW(2)及1月的SSTA-NW(3)的值作为输入因子进行预测。鉴于篇幅原因,本文只针对模型M5的进行详细的评价分析,因为模型M5的输入变量数量大于其他模型,实际证明该模型的预测效果最佳。

2.4.2 结果分析

为了简单直观的比较各个模型性能优劣,使用均方根误差(Root-mean-square error,RMSE)与相关系数(Correlation coefficient,CORR)来衡量三个模型预测的精度。

通过对数据的训练和拟合,MPGA-BP神经网络、BP神经网络与统计回归模型预测过程线如图4所示,三种模型预测结果如表3所示,预测性能比较如表4所示.

图4 模型预测结果对比图

表3 预测结果表

时间 实测值 统计回归 BP MPGA-BP预测值 绝对误差 预测值 绝对误差 预测值 绝对误差2011月4月 0.41 0.80 0.39 0.37 0.04 0.49 0.08 2011月5月 0.87 0.64 0.23 0.70 0.17 0.77 0.10 2011月6月 0.55 0.58 0.03 0.52 0.03 0.57 0.02 2011月7月 1.05 0.61 0.44 1.02 0.03 1.07 0.02 2011月8月 0.95 0.82 0.13 0.70 0.25 1.08 0.13 2011月9月 0.43 0.80 0.37 0.38 0.05 0.50 0.07 2011月10月 0.63 0.16 0.47 0.34 0.29 0.47 0.16 2011月11月 -0.02 0.42 0.44 0.69 0.71 0.31 0.33 2011月12月 0.20 0.13 0.07 0.32 0.12 0.28 0.08 2012月1月 -0.09 0.08 0.17 -0.40 0.31 0.23 0.32 2012月2月 0.48 0.21 0.27 0.23 0.25 0.27 0.21 2012月3月 1.63 0.48 1.15 0.86 0.77 1.53 0.10 2012月4月 2.07 1.56 0.51 1.61 0.46 1.98 0.09 2012月5月 1.84 1.73 0.11 1.50 0.34 1.95 0.11 2012月6月 1.47 1.21 0.26 1.15 0.32 1.31 0.16 2012月7月 0.82 1.10 0.28 2.32 1.50 1.36 0.54 2012月8月 -0.19 0.72 0.91 0.77 0.96 0.30 0.49 2012月9月 0.50 -0.23 0.73 -0.16 0.66 0.34 0.16 2012月10月 0.08 0.52 0.44 -0.24 0.32 -0.28 0.36 2012月11月 -0.18 0.33 0.51 -0.77 0.59 -0.82 0.64 2012月12月 -0.74 -0.39 0.35 -0.75 0.01 -0.34 0.40

表4 预测性能对比表

通过对比图4、表3、表4可以发现,统计回归模型预测的效果最差,其次是BP模型,最佳的则是MPGA-BP模型,导致这样的原因是该干旱预测模型的输入因子与输出因子是复杂的非线性关系,而回归模型主要适用于线性关系。图5给出了三种模型预测误差曲线。从图5可知,MPGA-BP神经网络的预测误差较BP神经网络与统计回归模型的预测误差更小,说明MPGA-BP神经网络比BP神经网络不仅精度有了提升,而且拟合度也有了一定的提高,更适用于研究区域的干旱预测,结果更可靠、性能更稳定。

图5 模型预测误差对比图

3 结语

(1)MPGA-BP神经网络较BP神经网络具有明显的性能优势,提高了研究区域的干旱预测的精度。

(2)MPGA-BP神经网络适用于研究区域的短期干旱预测。

(3)MPGA-BP神经网络的运行时间偏慢的问题未得到解决,主要是由于遗传算法的交叉和变异概率为一常量,导致子代个体产生随机性大,父代优良基因易被破坏,如何解决上述问题,加快遗传算法的全局寻优能力是今后重点研究的一个问题。

参考文献:

[1]迟道才,张兰芬,李雪,等.基于遗传算法优化的支持向量机干旱预测模型[J].沈阳农业大学学报,2013,44(2):190-194.

[2]刘代勇,梁忠民,赵卫民,等.灰色系统理论在干旱预测应用中的应用研究[J].水力发电,2012,38(2):10-12.

[3]吴晶,陈元芳,余胜男.基于随机森林模型的干旱预测研究模型[J].中国农村水利水电,2016,11:17-22.

[4]白致威,张雷,王杰,等.基于ARIMA模型的云南气象干旱预测研究[J].人民长江,2015,46(15):6-9.

[5]孟锦根.基于PSO-LSSVM的干旱区中长期降水预测模型研究[J].长江科学院院报,2016:20160010-20160010.

[6]刘洪兰,张强,张俊国,等.BP神经网络模型在伏旱预测中的应用-以河西走廊为例[J].中国沙漠,2015,35(2):474-478.

[7]赵廷红,张赛.基于MPGA-BP的重力坝变形预测研究[J].兰州理工大学学报,2016,42(5):122-127.

[8]王笑宇,刘畅,王国玖,等.基于 MPGA-BP模型的降雨预报研究[J].水电能源科学,2017,35(4):6-9

[9]Nguyen L.B.,Li Q.F.,Nguyen V.T.Effects of ENSO on SPEI/SPI drought indices in the Vietnam Songcai basin[J].Advanced Civil,Urban and Environmental Engineering,2014,157:453-464.

[10]McKee,T.B.,Doesken,N.J. ,Kleist,J.The relationship of drought frequency and duration to time scales[C].In:8th Conf.on Applied Climatology,Anaheim,California,1993,179-184.

[11]车少静,李春强,申双和.基于SPI的近41年(1965-2005)河北省旱涝时空特征分析[J].中国农业气象,2010,31(1):137-143.

猜你喜欢
权值算子遗传算法
与由分数阶Laplace算子生成的热半群相关的微分变换算子的有界性
一种融合时间权值和用户行为序列的电影推荐模型
斜对角算子矩阵的Weyl谱
基于遗传算法的高精度事故重建与损伤分析
Domestication or Foreignization:A Cultural Choice
基于遗传算法的智能交通灯控制研究
强规划的最小期望权值求解算法∗
程序属性的检测与程序属性的分类
QK空间上的叠加算子
一种基于遗传算法的聚类分析方法在DNA序列比较中的应用