雾霾的RBF网络与遗传算法优化预测

2017-05-18 08:39王鑫
科技视界 2016年19期
关键词:RBF神经网络雾霾遗传算法

王鑫

[摘要]雾霾是对大气中各种悬浮颗粒物含量超标的笼统表述。随着空气质量的恶化。阴霾天气现象出现增多,危害加重。为了更加准确的预测雾霾天气的形成,本文基于自然界遗传机制和生物进化论,提出了一种基于遗传算法优化的RBF神经网络雾霾形成的预测模型,并使用MATLAB进行仿真研究。研究表明RBF神经网络预测精度与网络权值和RBF参数初始值有很大关系,因此本文采用遗传算法优化RBF网络权值和其他参数。形成GA-RBF预测模型。该模型通过计算群体中个体适应度,确定全局最优值。寻找网络参数的最优值。实验结果表明GA-RBF优于传统的RBF预测模型,训练速度和预测精度显著提高。

[关键词]RBF神经网络:遗传算法:雾霾:预测

0引言

雾霾是雾和霾的混合物,二氧化硫、氮氧化物以及可吸入颗粒物这三项是雾霾的主要组成部分,颗粒物的英文缩写为PM,北京市目前监测的是PM2.5,也就是空气动力学当量直径小于等于2.5微米的污染物颗粒。这种颗粒本身既是一种污染物,又是重金属、多环芳烃等有毒物质的载体。

雾霾能直接进入并粘附在人体下呼吸道和肺叶中,对人体健康有伤害,因此重污染天气的预警预测工作显得尤为重要,不仅可以让公众提前合理安排生产生活,也可以让政府相关部门及时采取应急措施,缓解重污染天气带来的危害。雾霾天气的形成与组成的主要可吸入颗粒物呈现的是非线性的关系,并且雾霾天气时变且受多种因素影响,而且决定雾霾形成的各因素间的关系很难精确描述,具有明显的模糊性、随机性和信息不完全性,采用一般的方法很难准确预测。

神经网络具有良好的非线性函数逼近能力,可将信息并行分布式处理与存储,多输入、多输出。神经网络还可进行自学习以适应环境变化,即使在数学模型未知的情况下也能通过训练输出期望的结果。径向基函数神经网络(RBF)是具有单隐层的3层前馈网络,它模拟了人脑中局部调整、相互覆盖接受域的神经网络结构,能以任意精度逼近任意连续函数。采用RBF网络可有效提高预测模型精度、鲁棒性和自适应性。

本文采用RBF神经网络对雾霾的形成进行预测研究,但是在实验中发现每次预测结果具有不一致性,研究表明主要是网络初始值是以随机函数形式给出,因此本文采用遗传算法优化RBF网络权值和其他参数,形成GA-RBF预测模型,并和未经优化的RBF模型预测结果进行对比研究。

1遗传算法

遗传算法简称GA,是1962年由美国Michigan大学Holland教授提出的模拟自然界遗传机制和生物进化论而成的一种并行随机搜索最优化方法。遗传算法是对参数的编码进行操作,而非对参数本身,它可同时使用多个搜索点的搜索信息,在解空间进行高效启发式搜索,而非盲目地穷举或完全随机搜索。遗传算法具有并行计算的特点,因而可通过大规模并行计算来提高计算速度,适合大规模复杂问题的优化。雾霾天气时变且受多种因素影响,传统的优化算法不仅需要利用目标函数值,而且需要目标函数的导数值等辅助信息才能确定搜索方向,不适用于对雾霾形成的预测。而遗传算法在搜索过程中不需要问题的内在性质,对于任意形式的目标函数和约束,无论是线性的还是非线性的,离散的还是连续的都可处理,较适用于处理雾霾形成预测此类模糊性、随机性和不完全性强的问题。

1.1算法原理

遗传算法将“优胜劣汰,适者生存”的生物进化原理引入优化参数形成的编码串联群体中,按所选择的适配值函数并通过遗传中的复制、交叉及变异对个体进行筛选,使适配值高的个体被保留下来,组成新的群体,新的群体既继承了上一代的信息,又优于上一代。这样不断循环,群体中个体适应度不断提高,直到满足一定的条件。一般的遗传算法是由4部分组成:编码机制、适应度函数、遗传算子、控制参数。

基本遗传算法使用固定长度的二进制符号来表示群体中的个体,其等位基因是由二值符号集{0,1}所组成的。初始个体的基因值可用均匀分布的随机值来生成。基本遗传算法与个体适应度成正比的概率来决定当前群体中每个个体遗传到一代群体中的概率多少。为正确计算这个概率,须先确定由目标函数值到个体适应度之间的转换规则,从而做到所有个体的适应度为整数或零。遗传算法最重要的遗传算子有三种:选择、交叉和变异,且操作期间确定一些可用的参数,以提高选择结果的优化性。

1.2遗传算法基本参数

(1)M:群体大小,即群体中所含个体的数量,一般取20-100;

(2)G:遗传算法的终止进化代数。一般取100-500;

(3)Pc:交叉概率,一般取0.4-0.99;

(4)Pm:變异概率,一般取0.0001-0.1。

1.3算法流程

遗传算法优化步骤如下:

(1)确定决策变量及各种约束条件,即确定出个体的表现型X和问题的解空间:

(2)建立优化模型,即确定出目标函数的类型及数学描述形式或量化方法:

(3)确定表示可行解的染色体编码方法,即确定出个体的基因型x及遗传算法的搜索空间:

(4)确定个体适应度的量化评价方法,即确定出由目标函数J(x)到个体适应度函数F(x)的转换规则;

(5)设计遗传算子,即确定选择运算、交叉运算、变异运算等遗传算子的具体操作方法:

(6)确定遗传算法的有关运行参数,即M,G,Pc,Pm等参数;

(7)确定解码方法,即确定出由个体表现型X到个体基因型x的对应关系或转换方法,

2RBF神经网络

2.1网络结构

RBF神经网络是一种3层前向网络,由输入到输出的映射是非线性的,而隐层空间到输出空间的映射是线性的,而且RBF网络是局部逼近的神经网络,因而采用RBF网络可大大加快学习速度并避免局部极小问题,适合于雾霾天气预测实时控制的要求。

采用RBF网络构成神经网络控制方案,可有效提高系统的精度、鲁棒性和自适应性。RBF神经网络结构如图1所示:

(1)

(2)

(3)

2.2网络迭代算法

根据梯度下降法,输出权、节点基宽参数及节点中心矢量的迭代算法如下:

(4)

(5)

(6)

(7)

c(k),b(k)的调节与w(k)调节方法类似。式中,η为学习速率,α为动量因子。η,α∈[0,1]。取RBF网络的第一个输入为u(k),即x1=u(k),则由于高斯基函数的有效性与中心向量G和基宽bj取值有关,因此RBF初始参数与模型的预测准确性有较大关系。

3预测模型的建立及应用

3.1参数选择

预测模型的建立依赖于要解决的实际问题,根据实际问题中输入量和输出量的个数,可以确定RBF神经网络的结构。本文采用2015年12月北京空气质量的数据作为实验数据,如表1所示。

3.2仿真预测模型建立及预测结果

在MATLAB R2009a环境中编写程序进行测试。

(1)未经优化的RBF网络预测

RBF神经网络的输入层节点,可以取影响空气质量状况的可吸入颗粒SO2,CO,NO2,O3等4项指标,输出层节点取PM2.5指数。RBF网络结构确定为4-5-1。RBF神经网络的学习参数取学习速率η=0.05,惯性系数α=0.01。预测结果如图2所示。

(2)经优化的GA-RBF预测模型预测

RBF网络结构确定为4-5-1。RBF神经网络的学习参数取学习速率η=0.05,惯性系数α=0.01。由此确定需要优化的参数共计有4×5+5+5=30。

遗传算法中,取样本个数为Size=30,进化代数G=250,交叉概率为Pc=0.6,采用自适应变异概率,适应度越小。变异概率越大。取变异概率为:

Pc=0.001-[11:1:Size]×0.001/Size (8)

RBF神经网络的学习参数取学习速率η=0,05,惯性系数α=0.01。GA-RBF模型实现程序包括3个模块:①GA算法;②最佳适应度计算;③RBF神经网络训练及预测。

神经网络的最佳适应度函数变化过程如图3所示,其中适应度函数采用下式

(*)

式中y,ym分别为实际输出与RBF网络输出。

将GA算法优化的网络权值和RBF参数作为神经网络预测模型的初始参数,对RBF网络进行训练,达到规定的训练精度或次数后再进行预测。基于GA-RBF模型预测结果如图4所示。

对比图4和图2可知,GA-RBF模型预测曲线几乎与期望输出曲线重合,而传统RBF网络预测结果存在较大误差。

经过对比发现,无论从迭代次数、网络训练时间、预测误差及预测精度来看,GA-RBF的性能均优于傳统RBF模型。实际上。由于传统RBF的迭代次数已经达到规定最大值2000,这说明其在训练过程中没有达到要求的精度。

上述预测属于多因素预测方法,采用了其中的20组样本进行训练,各类参数的选取和确定主要依据是实验效果。神经网络预测只有采用大量的训练样本才能保证网络知识学习的完备性,图4中GA-RBF模型预测精度很理想,表明20组样本数据质量好。

4结论

本文对遗传算法优化的RBF雾霾预测模型进行了研究,由于RBF神经网络预测结果受网络初始参数影响较大,因此本文利用GA优化算法对RBF神经网络初始参数进行了优化。实验结果表明,虽然GA优化的RBF神经网络算法比传统RBF网络算法复杂,但从预测结果和性能看,前者要远优于后者,达到要求精度所需迭代次数和时间明显减少,预测精度有较大的提高,证明了这种方法在雾霾预测中的有效性。

[责任编辑:王伟平]

猜你喜欢
RBF神经网络雾霾遗传算法
基于自适应遗传算法的CSAMT一维反演
一种基于遗传算法的聚类分析方法在DNA序列比较中的应用
可以消除雾霾的新型无人机
基于遗传算法和LS-SVM的财务危机预测
基于改进的遗传算法的模糊聚类算法
从雾霾中突围
雾霾的中医认识及其防治
雾霾下的清晰