基于粒子群优化小波神经网络的行程时间预测

2020-04-29 07:09泉,孙
交通运输研究 2020年2期
关键词:小波粒子神经网络

于 泉,孙 瑶

(1.北京工业大学 北京市交通工程重点实验室,北京 100124;2.北京工业大学 北京市城市交通运行保障工程技术研究中心,北京 100124)

0 引言

近年来,随着出行需求的不断增加,公路交通供需矛盾愈发突出,导致了严重的交通拥堵问题。合理地预测高速公路行程时间可为交通管理者和出行者提供高实时性的、可靠的出行信息,提升各类交通管理决策的合理性,以缓解交通拥堵、提高高速公路服务水平。

小波神经网络(Wavelet Neural Network,WNN)由小波变换与人工神经网络组合而成[1],可以自由选择非线性小波基函数,因此小波神经网络具备良好的小波变换特性及较强的非线性数据处理能力,尤其在面对多源海量数据处理的当今时代,其常被用来作为预测工具。但是,小波神经网络也存在易陷入局部最优解、易产生振荡效应及收敛缓慢等不足,因此国内外学者做了大量相关研究力求改善缺陷。Xu 等人[1]通过思维进化算法的全局搜索方式优化小波神经网络权重和小波参数,进而提高全局预测精度。Gao等人[2]将主成分分析法与小波神经网络相结合,预测结果的平均相对误差明显优于传统BP神经网络。Tian等人[3]提出了基于灰色关联分析的小波神经网络铁路货运量预测方法,利用灰色关联分析对原始序列进行去噪,以提高输入变量的平滑度。Qiu等人[4]将自回归积分滑动平均模型与小波神经网络结合以提升异常检测能力。李会超等人[5]在进行交通量预测时,采用遗传算法对小波神经网络进行优化,预测精度显著提升。刘亚东[6]借助遗传算法对小波神经网络进行改进,并通过仿真实验比较了优化前后的拥挤交通短时预测结果,结果表明优化后预测精度更高。蒋婷婷[7]采用鸡群算法对小波神经网络进行改进,预测结果表明,鸡群算法改进的小波神经网络预测精度和预测速度均有所提升。郑俊褒等人[8]利用改进的蛙跳算法来优化小波神经网络从而实现交通短时预测,实验结果表明均方误差比传统小波神经网络有所降低。

综上所述,采用优化算法对传统小波神经网络进行改善可显著提升预测效果,但是目前采用优化小波神经网络的方式来预测具有非线性、高实时性特征的行程时间的预测模型研究尚为空白。粒子群优化(Particle Swarm Optimization,PSO)算法是一种模仿鸟类觅食的进化算法,具有原理简单、学习速度快、能迅速寻找种群中的全局最优解的优势,可有效弥补小波神经网络的局限性。基于此,本文将粒子群优化算法与小波神经网络相结合,利用粒子群算法优化小波神经网络行程时间预测模型(Particle Swarm Optimization Wavelet Neural Network,PSO-WNN)来预测具有非线性、高实时性特征的行程时间信息,并基于Matlab 数值仿真对比分析PSO-WNN 和WNN行程时间预测模型的效果。

1 高速公路收费数据简介及数据预处理

我国高速公路收费采用全面覆盖收费过程的信息化系统[9],因而可以采集大量收费数据。本文研究所需的数据字段如表1所示。

表1 收费数据字段说明表

但是收费数据产生过程中,系统故障、人工操作失误、异常驾驶行为等情况不可避免[10],从而导致原始收费数据中可能包含噪声数据,如果直接使用会造成分析结果偏移,因此需对原始收费数据进行数据处理[11]。本文收费数据处理分两步进行:第一步,剔除异常数据[12],包括缺失数据、错误数据等;第二步,根据四分位法筛选有效数据。

(1)剔除异常数据

车辆驶出收费路段与驶入收费路段的时间差即为车辆在该路段的行程时间[13]。本文以京沪高速马驹桥—大羊坊段2019年1月17日的收费数据为例,以小客车为研究对象,对行程时间进行统计,行程时间分布结果如图1 所示。从图中可知,小客车的行程时间主要分布在5~20min 之间,但数据中存在奇异点。清洗掉的部分异常数据示例见表2。

图1 行程时间分布图

表2 异常数据表

表2中,第1、第2条数据分别缺失入口时间和出口时间,导致无法计算行程时间;第3 条数据入口时间和出口时间一致,导致行程时间计算结果为0,显然不正常;第4条数据计算的行程时间约为正常行程时间的3倍,显然为异常数据。

(2)筛选有效数据

四分位法可有效反映整体数值情况,进而筛选有效数据,所有大于tmin且小于tmax的均为有效数据,tmin及tmax为数据的上下截断点。因而在去除错误数据的基础上,基于四分位法筛选有效数据[14],行程时间阈值计算公式如下:

式(1)~式(2)中:t25%为25%分位数(min);t75%为75%分位数(min);tmin为行程时间阈值的最小值(min);tmax为行程时间阈值的最大值(min)。

根据上述过程对数据处理后,得到行程时间有效范围为[5.429min,18.459min],数据处理后的行程时间分布结果如图2所示。

图2 数据处理后的行程时间分布图

2 高速公路行程时间预测模型的构建

2.1 基本思想

模型构建第一步首先要确定神经网络拓扑结构,本文采用紧致型小波神经网络,其包括三层:输入层、隐含层和输出层,构造原理是用小波函数代替BP 神经网络的传递函数,然后优化神经网络参数。本文采用粒子群优化算法不断迭代调整从而寻求最优小波神经网络参数,以满足高精度的识别预测。PSO-WNN 模型网络结构如图3 所示,其中m,n分别表示输入和输出神经元个数,ωij,ωjk分别表示输入层和隐含层及隐含层和输出层间的连接权重。

图3 PSO-WNN模型网络结构图

2.2 基本理论

2.2.1 粒子群优化算法

粒子群算法是利用种群间信息共享机制进行协同搜索的寻优算法[15]。个体通过交换信息和共享信息找到个体最优解,然后寻找全局最优解。

粒子群优化算法可描述为:在一个D维的搜索空间内,某种群包含S个粒子,粒子具有两个属性:速度v和位置x,粒子s的速度记作vs=(vs,1,vs,2,…,vs,D),位置记作xs=(xs,1,xs,2,…,xs,D)。每个粒子在搜索空间中通过交换信息和共享信息搜索个体最优解,当寻找到个体最优解时,记作Ps=(ps,1,ps,2,…,ps,D),然后比较个体最优解与其他粒子的信息,从而找到全局最优解,记作G=(pg,1,pg,2,…,pg,D)。

2.2.2 小波神经网络

小波神经网络用小波函数代替BP 神经网络的传递函数。小波函数种类很多,包括Haar 小波、Daubechies 小波、Mexican 小 波、Meyer 小波等[16]。然而在实践中,Morlet小波函数[17]被广泛使用,效果良好。其表达式为:

式(3)中:x为行程时间输入值;h(x)为小波函数。

2.3 PSO-WNN模型预测步骤

PSO-WNN行程时间预测模型计算步骤如下。

第一步:网络构建。本文采用研究路段连续29d的行程时间数据预测第30d的行程时间,因此构建输入层为29、输出层为1、隐含层为J的网络,表示为29-J-1PSO-WNN。

第二步:参数初始化处理。系统随机生成S个粒子,将初始化的小波函数伸缩因子aj、平移因子bj、第i个输入与第j个隐含层之间的连接权重ωij和隐含层第j个小波基与输出层之间的连接权重ωj采用实数编码表示成粒子的位置向量,如式(4)所示。同时设定粒子的最大最小速度、学习速率及最大迭代次数。

其中,D=29×J+J×1+28×J=58J。

第三步:网络训练。将研究路段连续29d 的行程时间值作为网络输入,经过不断学习,得到行程时间预测值。基于实际输出值与理想输出值间的误差,计算每次迭代过程中粒子适应度E(k)。

式(5)中:Q为训练样本总数;n为网络输出神经元个数;p为样本编号;k为神经元输出编号;yp,k(k)为实际输出值;tp,k为理想输出值。

第四步:将粒子适应度作为判定是否达到设定的误差要求的指标,如果能达到设定的误差要求,则完成训练,转至第六步;如果依旧达不到误差要求,则进行下一步。

第五步:判断训练的次数是否达到了设定的最大迭代次数,如果达到了,则跳出循环,转至第六步,停止训练;否则按照式(6)、式(7)更新粒子的速度和位置,返回第三步继续训练。

式(6)~式(7)中:s=1,2,…,S;d=1,2,…,D;c1,c2为加速因子;i为当前迭代次数;ω为惯性因子;r1,r2为0和1之间均匀分布的随机数。

第六步:网络调试。选择训练样本的特定时段样本值作为输入值,训练样本中的另一特定时段的实际值作为理想输出值,根据第三步适应度公式计算误差,若满足误差精度设定,则结束运行;若不能满足设定的误差精度,则转至第二步。

PSO-WNN行程时间预测模型流程如图4所示。

图4 PSO-WNN行程时间预测模型流程图

3 高速公路行程时间预测模型性能验证指标

选用平均绝对误差(Mean Absolute Error,MAE)、平均相对误差(Mean Relative Error,MRE)、均方误差(Mean Square Error,MSE)3 项评价指标[18]对预测模型精度进行对比分析。

结合式(5),tp,k为行程时间实际值,yp,k(k)为行程时间预测值,l为预测时间段个数,各项指标计算方法如式(8)~式(10)所示。

式(8)中:MAE 为平均绝对误差,是用于评定实际值与预测值间差异的指标。

式(9)中:MRE 为平均相对误差,是用于评定行程时间预测结果精确度的指标[19]。

式(10)中:MSE为均方误差,用于综合评价数据的变化程度。

4 实例分析

本文研究对象为京沪高速北京段马驹桥—大羊坊段,马驹桥收费站位于通州区,大羊坊收费站位于大兴区,路段里程为8.1km,属于城市内部高速公路,设置的出入口较城市间高速公路多,主要服务于通勤人员,交通量在不同时间段分布不均衡,会产生比较明显的早晚高峰现象。选取该路段2019 年1 月2 日—1 月31 日的行程时间数据,统计全天6:00—22:00 的数据,以10min为分析时间间隔,计算该时间段内的平均行程时间,将前29d共2 784组行程时间数据作为训练样本,预测第30d的行程时间。利用Matlab按照图4所示流程进行实验。

设置网络参数是行程时间预测实验的第一步。在粒子群算法寻优过程中,需事先设定粒子数量,粒子数量也称为种群规模。粒子数量的设定与算法运行精度、平稳性及优化速度显著相关[16]。因此,在其他参数保持不变的情况下,首先确定粒子群规模。由于有研究指出[20],当种群规模设置为50~100时,模型具有高精度和高稳定性,所以本文计算了种群规模从50到100时模型预测结果各误差指标值,如表3、图5所示。从图表中可看出,当种群规模为80时,各误差值均达到最小。

表3 不同种群规模下各误差计算表

图5 不同种群规模下各误差对比图

PSO-WNN 模型参数设置如下:加速因子c1=c2=2,种群进化迭代次数N=300,种群规模M=80,惯性权重设定为动态权重,计算公式为ω=0.4+0.5r,其中r是[0,1]之间的随机数。

在实验过程中,适应度变化如图6 所示。从图可知,随着迭代次数的不断增加,适应度函数值在逐步减小,当迭代到296 次时,适应度函数值最低且趋于稳定。

本实验预测结果如图7 所示。由图可看出,PSO-WNN 模型预测的准确性很高,无论是实际行程时间的走向还是波动水平,PSO-WNN 模型都预测得非常准确。为了更清晰地表征出PSOWNN行程时间预测模型的误差水平,用图8表示实验运行过程的绝对误差。由图可知,最大预测绝对误差为12.115s。图9 是PSO-WNN 行程时间预测模型预测结果相对误差图。由图可知,误差区间为[-2.461%,2.850%]。综上,PSO-WNN 行程时间预测模型能高精度地预测行程时间,可以指导公众以高效率和最优路线完成出行,保证出行的机动性、方便性和效率,可推动精细化交通管理和定制化信息服务目标的实现。

图6 PSO-WNN模型适应度变化曲线图

图7 PSO-WNN行程时间预测值与实际值曲线对比图

图8 PSO-WNN行程时间预测模型的绝对误差

图9 PSO-WNN行程时间预测模型的相对误差

本文采用对比分析的方法验证模型的有效性,利用Matlab 进行WNN 行程时间预测实验,并与PSO-WNN 模型的预测结果进行对比分析。图10 为WNN 模型在实验运行过程中的均方误差。由图可知,在实验进行到771 次时,网络产生了局部最优解且出现振荡效应。

图10 WNN行程时间预测模型的均方误差

WNN 模型预测结果如图11 所示。由图可知,WNN预测结果虽与实际行程时间的变化趋势一致,但无法准确预测出实际行程时间的波动情况。图12 为WNN 行程时间预测模型实验运行过程中的绝对误差,由图可知,绝对误差在300s以内,大多数落在130s 以内,最大预测误差为252.797s。图13为WNN行程时间预测模型实验运行过程中的相对误差,由图可知,误差区间为[-24.802%,28.173%]。综上,WNN模型无法满足高精度预测行程时间的要求,在推动交通管理精细化和出行者出行高效率的目标上尚有欠缺。

图11 WNN行程时间预测值与实际值曲线对比图

图12 WNN行程时间预测模型的绝对误差

图13 WNN行程时间预测模型的相对误差

采用平均绝对误差、平均相对误差和均方误差3 个评价指标对WNN 行程时间预测模型和PSO-WNN 行程时间预测模型进行比较,结果如表4 所示。从表中可看出,两种预测模型的平均绝对误差值、平均相对误差和均方误差值差异显著,PSO-WNN 预测结果的平均绝对误差、平均相对误差和均方误差相较于WNN 分别降低了83.36%,82.20%和98.15%。由此可知,PSO-WNN行程时间预测模型不仅能更高精度地预测行程时间,而且能较准确地预测出行程时间的走向和波动情况。

表4 PSO-WNN模型和WNN模型预测效果对比

5 结论

本文针对传统神经网络行程时间预测模型精度不足的缺陷进行改进,提出了PSO-WNN 行程时间预测模型。研究结果表明:(1)PSO 通过不断迭代优化WNN 的参数,解决了WNN 模型的缺陷问题,包括收敛速度缓慢、易陷入局部最小值和易产生振荡效应;(2)通过对比实验分析可知,PSO-WNN 模型能准确预测行程时间的变化趋势和波动情况;(3)基于PSO-WNN 模型的高速公路行程时间预测实验证明了PSO-WNN 网络收敛速度快、预测精度高、适应性强的优点。

但本文在基于PSO-WNN 的实验中仅考虑了种群规模对实验结果的影响,尚未考虑加速因子等参数对行程时间预测结果的影响,有待进一步深入研究。

猜你喜欢
小波粒子神经网络
基于多小波变换和奇异值分解的声发射信号降噪方法
碘-125粒子调控微小RNA-193b-5p抑制胃癌的增殖和侵袭
构造Daubechies小波的一些注记
基于膜计算粒子群优化的FastSLAM算法改进
基于MATLAB的小波降噪研究
神经网络抑制无线通信干扰探究
Conduit necrosis following esophagectomy:An up-to-date literature review
基于神经网络的中小学生情感分析
基于粒子群优化极点配置的空燃比输出反馈控制
基于改进的G-SVS LMS 与冗余提升小波的滚动轴承故障诊断