基于遗传算法优化小波神经网络预测GPS可降水量

2019-09-05 01:10熊红伟郑进

城市勘测 2019年4期

熊红伟，郑进

(1.中冶智诚(武汉)工程技术有限公司，湖北武汉 430080； 2.湖北省国土测绘院，湖北武汉 430010)

1 引言

水汽是地球大气中的重要组成部分，GPS测站天顶方向上大气中水汽全部凝结成水降落所产生的降雨量又被称为可降水量(PWV)。地基GPS遥感大气可降水量，有着探测精度高、全天候和高时空分辨率，能够有效地弥补常规气象探测水汽的不足。在获取GPS可降水量的基础上对不同气候和不同地区的数据进行分析，可以作为气象预报的有力补充。因此可降水量的短期预测，对天气预报有着重要的意义。

天气系统是一个随时间和空间剧烈变化的非线性系统，数学和物理方法难以描述，要准确地预测GPS可降水量有一定的难度。由于神经网络对非线性函数有着很好的逼近能力，自Robret利用人工神经网络预测降雨量以来[1]，国内外研究主要集中在预测的模型[2～12]和GPS数据处理的精度[13～15]。由于大气可降水量受到时空环境影响以及现有预测模型自身的局限性，无法高精度实时地对其进行预测。本文正是针对可降水量的这一特点以及现有模型的局限性，利用小波神经网络对非线性函数超强的逼近能力和遗传算法较强的全局搜索能力，建立遗传小波神经网络预测GPS可降水量。

2 可降水量预测模型

2.1 预测模型

预测就是利用数学理论和方法，通过历史数据建立数学模型，利用近期数据作为测试数据并推理验证，用于解决未来趋势问题。假定未来的观测值和过去的观测值之间存在一定的函数关系[6]，即

x(t)=f(x(t-1)，x(t-2)，…，x(t-n))

(1)

通过构造这一函数，来预测后续的观测值，可见预测问题可以转换成函数逼近问题。如果一个函数的自变量的个数为n，问题进一步可转化为在n+1维空间构造一个超曲面函数。通过对历史的观测数据反复拟合，构造一个函数f使得观测值与期望值之间按照一定的准则达到最优，进而求解f的参数。

2.2 小波神经网络算法

BP神经网络由于其强大的自学习能力以及不需知道输入与输出之间的具体关系，就可以以较高的精度逼近非线性函数，所以在时间序列的应用上十分广泛。但是，BP神经网络的激励函数并不正交，神经网络在进行学习时收敛的速度相当慢，同时BP神经网络在部分参数的选取上没有理论的指导，在局部极值的地方将导致迭代不收敛和过拟合。基于以上缺点，相关学者在神经网络算法的基础上，为了对其改进，将小波分析的时频局部化和多尺度分析能力引进到神经网络算法中，即将小波分析与神经网络进行结合，得到的小波神经网络具备了小波分析的时频局域化特点和人工神经网络的自学习能力，有效地改善了传统的BP神经网络算法的局限性。目前使用最为广泛的小波神经网络算法是紧致型的小波神经网络算法，将小波函数代替人工神经网络的隐含层函数，同时用小波基函数的尺度参数与平移参数，将神经网络输入层到隐含层的权值及阈值进行替换。该算法在参数和激励函数的选取上更具备理论的指导意义，以更快的收敛速度和逼近能力进行高精度的预测。

图1 小波神经网络模型

2.3 遗传小波神经网络模型(GWNN)

虽然小波神经网络(WNN)相比较于BP神经网络在参数的选取上有很大的改善，但是在网络的初始权值参数选取方面，多数基于经验模型没有理论指导；在学习算法上，WNN是直接根据误差能量函数采用梯度下降算法来调整网络连接权值和伸缩平移尺度，所以在迭代过程中受局部极值的影响导致训练结束后预测的结果出现不同程度的差异[7]。如果直接使用该算法预测GPS可降水量，得到的结果在实际GPS可降水量预测中的应用往往不理想。

遗传算法是一种模拟遗传机制和生物进化理论的并行随机搜索最优方法，按照选择的适应度函数并通过遗传中的选择、交叉和变异对个体进行筛选，使得适应度好的个体被保留，在多点随机并行的搜索下寻找适合群体的最优解，以此来抵抗震荡效应和参数收敛到局部最优解上。

神经网络的学习算法可以表示为，在一个样本集S=(xi，yi)，i=1，2，…P，其中P为样本数，从中寻找一个参数集，使得能量函数E最小

(2)

最陡梯度下降算法调整权值参数公式为：

(3)

(4)

(5)

(6)

其中η和α分别为学习速率与动量因子。

顾及遗传算法的全局搜索能力，利用该能力来确定伸缩和平移尺度参数以及权值和阈值。训练过程分为初次训练和二次训练。

初次训练为：

(1)对初始种群进行编码，主要包括wij，wlj，aj，bj参数进行编码，编码的方法采用实数编码，使得每一个个体均为一个实数串；并在此过程中初始化进化的次数、种群规模、交叉概率Pc和变异概率Pm等参数；

(2)适应度函数，根据个体得到WNN的初始权值和阈值，由训练后得到的预测输出yl和期望输出dl之间的误差绝对值和计算误差函数E：

(7)

(3)遗传操作，选择若干适应度最大的个体直接继承给下一代，采用“轮盘赌”选择方法进行种群的选择操作，每个个体的选择概率pi为

(8)

其中N为种群个体数目。同时以概率Pc和Pm完成交叉和变异操作，最后产生新的下一代个体。

(4)将新的个体插入到种群P中得到新种群，并计算新个体的适应度值，如果达到了指定的条件，则结束，否则转到操作(3)。

(5)反复迭代到满足收敛条件以后，将最终种群里面的最优个体解码作为网络连接权、伸缩和平移参数。

二次训练为：在初次训练得到参数的基础之上使用WNN的最陡梯度下降算法进行二次优化训练，将两次训练得到参数作为遗传小波神经网络模型的最终参数对GPS可降水量进行预测。

3 算例与分析

为了验证GWNN预测GPS可降水量的能力，利用高精度GPS解算软件GAMIT，对香港地区的卫星定位参考网站(SatRef)2017年第157天的观测数据进行解算，通过在解算时引入WUHN、BJFS、URUM、三个长于 500 km的站点获得绝对的天顶对流层延迟量。另外为了保证获得的GPS可降水量值与实时的温度、气压和湿度等大气参数保持一致，在解算GPS可降水量时引入各自站点的气象数据文件(met)。选用最终星历，采用松弛解(RELAX)模式，卫星截止高度角为10°，降低由于外部参数和卫星轨道误差的选取对GPS可降水量解算结果造成的影响，另外在数据处理过程中还对天线相位中心偏差、海潮负荷改正、大气潮和非潮汐的大气负荷改正。

每分钟提取一个GPS可降水量值可以更加精细地反映GPS反演可降水量的细节信息。得到的结果发现，在0：00～10：00由于大气参数因素的影响，GPS可降水量值变化相当剧烈，最大时相邻两个历元的差值有 12.64 mm，平均偏差为 4.26 mm；10：00以后抖动量相对平缓，最大时相邻两个历元的差值为 1.92 mm，平均偏差为 0.52 mm。针对GPS可降水量的这一特点，实现天气变化短期的预报，对不同时间段的GPS可降水量分别进行预测，选取以下两种不同的方案进行试验：

方案一：选取该天11：00～14：00每分钟的GPS可降水量值共240个，选用前 180 min的数据为建模数据，预测后续 60 min的GPS可降水量值。

方案二：选取该天凌晨4：00～8：00每分钟的GPS可降水量值共240个，选用前 180 min的数据为建模数据，预测后续 60 min的GPS可降水量值。

为了对建立的GWNN模型进行对比分析，分别选用WNN和BP神经网络模型同时进行预测。选用均方根误差(RMS)、残差的最大值和最小值等指标进行外符合精度的评定，RMS计算公式为

(9)

(10)

3.1 方案一

考虑文章篇幅，现选取HKON站点的数据，使用BP神经网络和WNN模型预测的数据与本文提出的GWNN模型预测的数据进行比较。

由表1，就BP神经网络与WNN模型比较可知，WNN在RMS上有 0.27 mm的改善，平均误差降低了 0.30 mm，可见在预测的精度和拟合程度上WNN要优于BP神经网络；但是这种优势并不明显，WNN最大绝对误差为 1.89 mm，最大相对误差为3.96%，均高于BP神经网络，因此WNN虽然在模型的整体精度上有一定的提高，但是预测的稳定性却不如BP神经网络。理论上，训练好的WNN可预测复杂的时间序列问题，但是WNN模型是结合了小波分析通过调节尺度参数放大局部信号，如果在参数的选择上不够合理，训练好的WNN仍然不能很好地对非线性系统的GPS可降水量进行预报。而本文提出的GWNN模型在GPS可降水量预测的精度与稳定性均优于其他两种模型，最大绝对误差为 0.82 mm，RMS为 0.29 mm。

方案一残差结果统计表表1

图2给出了三种模型预测结果的残差情况，图2(a)在总体上呈现一定的偏离，说明了BP神经网络对实时GPS可降水量的预测并不敏感，该模型不能很好地拟合水汽的短时期变化。从图2(a)和图2(b)可知，WNN残差基本上以零为中心跳动，说明了WNN能够在一定程度上拟合GPS可降水量；且前两种模型在前 20 min预测的效果好。从图2整体上来看，GWNN模型在前 20 min预测的效果与另外两种模型预测的效果相当，在后续的 40 min预测上虽然残差逐渐变大，但是仍能与原始GPS可降水量序列很好地保持一致。

图2 方案一预测结果残差图

3.2 方案二

方案一对GPS可降水量变化程度不明显的时刻进行了预测，得出GWNN相对于WNN在预测精度、稳定性以及预测的时长都有很大的提高，但是该预测仍然停留在GPS可降水量较为稳定的情况，不能代表短时期强对流天气带来GPS可降水量剧烈的变化，然而GPS可降水量剧烈的变化对于短时数值预测又是非常重要的，因此方案二在方案一的基础上，就GWNN预测PWV在气压、温度和湿度等大气参数造成的GPS可降水量抖动明显的情况继续进行分析。

由表2可知，对GPS可降水量抖动明显的情况下进行预测，WNN模型相对于BP神经网络模型在预测的精度上有一定的改进，但是在 60 min的预测上RMS仍然为 3.11 mm；无法很好地满足实时的水汽预测要求，且在预测的稳定性方面依然无法得到很好的改善，WNN模型预测的最大绝对误差为 7.85 mm，最大相对误差为15.92%，均高于BP神经网络模型。可见由于WNN模型自身的小波分析功能的影响，使得这一特点在GPS可降水量变化剧烈的情况下表现得更为明显。而本文建立的GWNN模型，网络参数预测得到的RMS为 2.19 mm，在WNN模型的基础上有 0.92 mm提高。在预测的稳定性上，相比较于另外两种模型也均有不同程度的改善。

方案二残差结果统计表表2

图3 方案二预测结果残差图

图3给出了在方案二下，3种模型预测结果的残差图。从图3可以看出GWNN模型预测的效果明显得优于其他两种方法。图中存在部分由3种方法预测结果的残差都偏大的点，这一方面与气压、温度和湿度等大气参数有关，若以理论推导 2.5 HPa的气压变化能导致实时解算GPS可降水量值有 1 mm的变化，因此外部参数的变化是影响预测精度的一个重要误差源；另一方面是由于3种模型均是基于神经网络的模型进行预测，因此在趋势上保持着一致性。同时图3(a)、图3(b)中前 30 min部分的效果均要优于后半部分，可见随着预测步长的增加模型预测的误差逐渐增大。而图3(c)中虽然在后半部分的预测上有一定的偏大，但是总体上仍然优于前面两种模型，可以保持良好的稳定性。说明了GWNN模型可以在一定时间内抵抗由于随着预测步长增加而带来预测偏差。

4 结语

本文针对水汽变化剧烈这一特点以及BP神经网络和小波神经网络对GPS可降水量预测的局限性，采用遗传算法优化小波神经网络预测GPS可降水量。分别从预测的精度、稳定性以及预测的步长等方面对三种模型进行比较，对得到的结果进行了合理的评价。通过实验发现，建立的GWNN模型在现有模型的基础上有很大的改进，能适用于PWV变化剧烈的情况。同时本文对三种不同的模型在GPS可降水量预测的结果上亦进行了分析，发现采用GWNN模型预测GPS可降水量的一些特点，这些结论对今后的短时天气预测将有着一定的指导作用，而提出的GWNN模型也是一种数值天气预报新方法。在后续的研究中将对该模型在暴雨、台风等短时期的强对流天气情况下进行分析。