基于混沌-小波神经网络的公交客流量预测模型研究

2017-11-22 01:11范黎林符天阳孙兰宾张广振
城市公共交通 2017年9期
关键词:相空间客流量刷卡

范黎林 符天阳 孙兰宾 张广振 徐 铭

(1.河南师范大学 计算机与信息工程学院,新乡 453007;2.河南省高校计算智能与数据挖掘工程技术研究中心,新乡 453007;3.新乡市公共交通总公司,新乡 453000)

基于混沌-小波神经网络的公交客流量预测模型研究

范黎林1,2符天阳1孙兰宾3张广振3徐 铭3

(1.河南师范大学 计算机与信息工程学院,新乡 453007;2.河南省高校计算智能与数据挖掘工程技术研究中心,新乡 453007;3.新乡市公共交通总公司,新乡 453000)

为提高公交客流量预测的精确度,将混沌理论和小波神经网络方法相结合应用于公交客流量预测。分别采用自相关法、伪最近邻域法计算公交客流量时间序列的时间延迟、嵌入维数,采用小数据量法计算其最大李雅普诺夫指数,证实该时间序列具有混沌特性。据此建立混沌-小波神经网络预测模型,进而对H省某市实际公交客流量进行预测。实验结果表明,相比于传统的BP神经网络预测法、LIBSVM预测法,该方法在均方误差(MSE)、平均绝对误差(MAE)、平均相对误差(MRE)上均具有更小的预测误差,因而可以有效地预测公交客流量。

混沌;小波神经网络;公交客流量预测

U491.1+4

A

1 引言

随着我国城市交通拥堵、汽车尾气污染日益加重,城市公共交通优先发展战略[1]的实施迫在眉睫。对各条公交线路客流量的精确预测有利于公交公司高效地进行车辆调度,既不浪费公交资源,又能更好地满足人们日常的乘车需求。公交客流量作为日常公交运营的关键因素,它与上下班时间、节假日、天气状况等因素有关,其中既有确定性因素的作用,又受随机性因素的影响,这导致其时间序列呈现出非线性、非平稳性和复杂性的特征,因而对公交客流量进行预测的难度很大。目前,在公交公司实际的运营调度工作中,大多依靠调度人员凭借经验判断公交客流量的变化情况,由于缺乏定量的分析预测手段,导致预测效果往往与实际的公交客流量有不小出入,因而需要运用科学有效的方法进行公交客流量预测,以提高预测精度。

近年来,受国家城市公共交通优先发展战略的政策导向以及实际需要,研究者们在公交客流量预测领域的研究日趋增多。例如:顾杨等[2]从公交线网枢纽站客流变化规律出发,设计出ARMA短期客流预测模型。这种基于ARMA模型的线性方法建模简单,但无法保证对具有非线性、非平稳性和复杂性特征的公交客流量进行预测的精度。米根锁等[3]提出用灰色变异粒子群组合预测模型来预测公交客流量。陆百川等[4]建立了基于IC卡和RBF神经网络的短时公交客流量预测模型并介绍了具体的预测过程。王庆荣等[5]提出了一种基于随机灰色蚁群神经网络的近期公交客流量预测方法。刘翠等[6]建立了基于改进的BP神经网络的公交线路站点时段上下车人数预测模型。但BP神经网络容易陷入局部最优且样本依赖性太强。薛向红等[7]提出了一种基于相空间重构与支持向量机的预测公交客流量的新方法。但支持向量机更适合小样本问题。因此,需要采用更先进的预测方法,以提高公交客流量预测的精确度。

目前的研究结果表明,混沌是一种非线性现象,混沌的动态系统具有确定性的法则。由于公交客流量时间序列的混沌特性[8]是由公交系统的内在特性引起的,故该时间序列的短期变化行为是完全可以确定的,这便为对公交客流量时间序列进行预测提供了新的理论基础。同时,由于小波分析[9]对非平稳序列具有多尺度的分解能力,而且它能够通过小波基函数的变换分析信号的局部特征,因此我们可以通过小波分析来降低公交客流量时间序列的非平稳性,进而实现对该时间序列的预测。由于基于小波分析理论的小波神经网络方法[10]在其隐含层引入了伸缩因子、平移因子这两个新的参数,从而具有更加灵活有效的函数逼近能力,这便为对公交客流量时间序列进行预测提供了新的方法途径。因此,本文采用混沌理论的相空间重构方法[11]将公交客流量时间序列映射到m维特征空间,形成相点并构造样本对,解决了样本对确定的问题,再应用小波神经网络方法对训练样本对进行训练以得到最佳模型,进而通过该模型实现公交客流量预测。

2 公交客流量时间序列的混沌特性判定及相空间重构

2.1 混沌特性判定

混沌是一种广泛存在于自然界的科学现象,它在宏观上表现为一种混乱的、随机的状态且对初始条件敏感依赖,但在微观上又有一定的规律性。通常认为混沌系统介于完全确定和完全随机之间,因此可用于分析具有非线性、非平稳性和复杂性特征的公交客流量时间序列。

判定公交客流量时间序列是否具有混沌特性的最常用方法是计算其最大李雅普诺夫指数。如果该时间序列的最大李雅普诺夫指数为正,那么意味着其为混沌时间序列[12]。计算公交客流量时间序列最大李雅普诺夫指数的方法主要有Wolf法、Jacobian法、小数据量法等。由于Rosenstein等提出的小数据量法[13]计算量较小、相对易操作,故本文亦采用此法。采用小数据量法计算公交客流量时间序列最大李雅普诺夫指数的前提是计算该时间序列的时间延迟、嵌入维数。计算时间延迟的方法有自相关法、平均位移法等,计算嵌入维数的方法有伪最近邻域法、Cao方法等。本文分别采用自相关法[14]、伪最近邻域法[14]计算公交客流量时间序列的时间延迟、嵌入维数。

综上,我们首先计算出公交客流量时间序列的时间延迟、嵌入维数,然后计算其最大李雅普诺夫指数,进而判定该时间序列是否具有混沌特性。

2.2 相空间重构

研究表明,具有混沌特性的公交客流量时间序列看似是一维时间序列,但实际上它包含了高维信息。Packard等[15]认为高维相空间中系统任一分量的变化都不是孤立的,它与其他分量之间存在着相关性。为了让看似一维的时间序列再现高维的信息,Packard等还发展了一套相空间重构技术。对于一维时间序列,重构的相空间状态矢量为[16]:

3 小波神经网络

小波神经网络是以BP神经网络拓扑结构为基础、小波基函数作为隐含层节点的传递函数、输入信号前向传播的同时误差信号反向传播的神经网络。

小波神经网络权值参数修正算法类似于BP神经网络权值修正算法,采用梯度修正法修正网络的权值和小波基函数的参数,从而使小波神经网络预测输出不断逼近期望输出。

隐含层节点数对小波神经网络的预测性能有很大影响。一般情况下,较多的隐含层节点数可以带来更好的预测性能,但可能导致训练时间过长。目前没有一个理想的解析式可以用来确定合理的隐含层节点数,通常的做法是凭借经验分析并根据实验的预测性能对比给出该值。

4 混沌-小波神经网络预测模型

基于公交客流量时间序列的混沌特性以及小波神经网络方法的优越性,本文将二者结合,建立了混沌-小波神经网络预测模型,进而对H省某市实际公交客流量进行预测。

本文采用的混沌-小波神经网络预测模型的流程如图1所示。

具体步骤如下:

图1 本文模型流程

Step3 根据计算出的最大李雅普诺夫指数,判定该时间序列是否具有混沌特性。

5 公交客流量预测

5.1 数据来源

本文采用的数据来自H省某市6路公交车2015年11月2日(星期一)起连续8个星期工作日的全部公交IC卡刷卡记录。部分公交IC卡刷卡记录见表1。

表中列名“kbh”即“卡编号”,表示乘客乘车刷卡的卡号;列名“xfrq”即“消费日期”,表示乘客乘车刷卡的年、月、日;列名“xfsj”即“消费时间”,表示乘客乘车刷卡的时、分、秒;列名“xlbh”即“线路编号”,表示乘客乘车的线路号。

经调研,该市乘坐6路公交车的人群中,公交IC卡刷卡人次约占总乘车人次的50%,出于研究考虑,本文把公交客流量等同于公交IC卡刷卡量。编程统计该公交线路每日各时段的公交IC卡刷卡量。部分统计出的刷卡量见表2。

表中从第3列开始的列名均表示从该时刻起连续15分钟的时段,如列名“6:00:00”表示06:00时段(06:00:00-06:14:59)。

对统计出的刷卡量进行分析,选取每日最具代表性的时段,最终整合成用于研究的公交客流量时间序列。考虑到实际需要、预测精度等因素,本文选取的数据统计周期为15分钟;由于早高峰、晚高峰对公交客流量有较大影响,本文分别选取每日06:00时段(06:00:00-06:14:59)至11:45时段(11:45:00-11:59:59)、每日13:00时段(13:00:00-13:14:59)至18:45时段(18:45:00-18:59:59)的公交IC卡刷卡量进行实验,06:00时段至11:45时段简记为“上午时段”、13:00时段至18:45时段简记为“下午时段”。综上所述,共获得上午时段公交客流量时间序列(简记为“序列1”)、下午时段公交客流量时间序列(简记为“序列2”)均为960个数据,如图2(a)、图2(b)所示。

表1 部分公交IC卡刷卡记录

表2 部分统计出的刷卡量

5.2 预测过程

图2 公交客流量时间序列

5.2.1 数据预处理

首先,采用自相关法分别求得序列1、序列2的时间延迟,该值均为1;采用伪最近邻域法分别求得序列1、序列2的嵌入维数,该值均为5。据此,采用小数据量法分别求得序列1、序列2的最大李雅普诺夫指数,该值分别为0.2307、0.2117。求得的最大李雅普诺夫指数均为正,表明序列1、序列2均具有混沌特性。分别对序列1、序列2进行相空间重构,均得到具有956个相点、维数为5的相空间。进而构造样本对,均能构造出955个形如的样本对。根据经验,均取前727个样本对用于训练、后228个样本对用于预测。

5.2.2 小波神经网络训练

本文构建的小波神经网络的结构为“5-8-1”:由于序列1、序列2的嵌入维数均为5,故输入层设置5个节点;根据经验分析及H省该市6路公交车客流量的特点,隐含层设置8个节点;无论是序列1还是序列2,由于每次预测的公交客流量的个数均为1,故输出层设置1个节点。小波神经网络的初始权值凭借经验设置为(-2.4/F, 2.4/F)间均匀分布的随机数,其中F为权值输入端连接的神经元的个数。小波基函数的伸缩因子、平移因子在参数初始化时随机得到。对训练样本对进行归一化处理,以便提高收敛速度、缩短训练时间。然后用归一化后的数据训练小波神经网络,网络反复训练100次。

5.2.3 小波神经网络预测

接下来,用训练好的模型预测公交客流量。序列1、序列2的预测效果如图3、图4所示。

5.3 预测效果分析

为验证本文方法的有效性,建立当前研究最多且发展最快的BP神经网络预测模型、LIBSVM预测模型进行对比实验。本文研究中,使用均方误差(Mean Square Error,MSE)、平均绝对误差(Mean Absolute Error,MAE)、平均相对误差(Mean Relative Error,MRE)这三个评价指标来评估不同模型的预测性能。MSE、MAE、MRE的值越小就越说明相应模型的结构合理且预测精度高。以上三个评价指标的计算公式为:

由表3可知,与BP神经网络预测模型、LIBSVM预测模型相比,无论是序列1还是序列2,本文采用的混沌-小波神经网络预测模型在MSE、MAE、MRE这三个评价指标上均具有更小的预测误差,即说明预测效果更好,因此更适合于公交客流量预测。

图3 序列1的预测效果

图4 序列2的预测效果

表3 不同模型的预测性能对比

6 结束语

本文研究利用了公交客流量时间序列的混沌特性和小波神经网络方法相结合进行公交客流量预测的方法。根据混沌理论,通过相空间重构将公交客流量时间序列映射到m维特征空间形成相点并构造样本对,解决了样本对确定的问题,进而建立混沌-小波神经网络预测模型,最终实现对H省某市实际公交客流量的预测。研究结果表明,与传统的BP神经网络预测模型、LIBSVM预测模型相比,本文模型具有更好的预测性能,更适合于公交客流量预测。

[ 1 ] 中华人民共和国中央人民政府.国务院关于城市优先发展公共交通的指导意见[EB/OL].2013-01-05[2017-01- 06].

[ 2 ] 顾杨,韩印,方雪丽.基于ARMA模型的公交枢纽站客流量预测方法研究[J].交通信息与安全,2011,29(2):5-9.

[ 3 ] 米根锁,梁利,杨润霞.灰色变异粒子群算法在公交客流量预测中的应用[J].计算机工程与科学,2015,37(1):104-110.

[ 4 ] 陆百川,邓捷,马庆禄,等.基于IC卡和RBF神经网络的短时公交客流量预测[J].重庆交通大学学报(自然科学版),2015,34(6):106-110.

[ 5 ] 米根锁,梁利,杨润霞.灰色变异粒子群算法在公交客流量预测中的应用[J].计算机工程与科学,2015,37(1):104-110.

[ 6 ] 刘翠,张艳青,陈洪仁.基于BP神经网络的公交线路站点时段上下车人数预测模型[J].交通标准化,2008(5):186-189.

[ 7 ] 薛向红,薛小锋.基于相空间重构-SVM的公交客流量预测研究[J].江苏理工学院学报,2010,16(9):24-28.

[ 8 ] 田中大,李树江,王艳红,等.短期风速时间序列混沌特性分析及预测[J].物理学报,2015,64(3):236-247.

[ 9 ] Yu H.Network traffic prediction based on wavelet analysis and hopfield neural network[J].Computer Applications amp; Software,2013,30(6):246-249.

[ 10 ] 秦剑,王建平,张崇巍.基于相空间重构小波神经网络的短期风速预测[J].电子测量与仪器学报,2012,26(3):236-241.

[ 11 ] 陈帝伊,柳烨,马孝义.基于径向基函数神经网络的混沌时间序列相空间重构双参数联合估计[J].物理学报,2012,61(10):22-31.

[ 12 ] 朱顺应,王红,向红艳,等.交通流参数及交通事件动态预测方法[M].南京:东南大学出版社,2008.

[ 13 ] Rosenstein M,Collins J,De Luca C.A practical method for calculating largest Lyapunov exponents from small data sets[J].Physica D-nonlinear Phenomena,1993,65(1-2):117-134.

[ 14 ] 韩敏.混沌时间序列预测理论与方法[M].北京:中国水利水电出版社,2007.

[ 15 ] Packard N,Crutchfield J,Farmer J,et al.Geometry from a time series[J].Physical Review Letters,1980,45(9):712.

[ 16 ] 姜爱萍.混沌时间序列的小波神经网络预测方法及其优化研究[M].上海:上海大学出版社,2013.

[ 17 ] 罗赟骞,夏靖波,王焕彬.混沌-支持向量机回归在流量预测中的应用研究[J].计算机科学,2009,36(7):244-246.

[ 18 ] 王小川,史峰,郁磊,等.MATLAB神经网络43个案例分析[M].北京:北京航空航天大学出版社,2013.

Research of Public Transportation Passenger Volume Prediction Model Based on Chaos-wavelet Neural Network

Fan Lilin1,2Fu Tianyang1Sun Lanbin3Zhang Guangzhen3Xu Ming3
(1.College of Computer and Information Engineering, Henan Normal University, Xinxiang 453007;2.Computational Intelligence and Data Mining Engineering Technology Research Center of Colleges and Universities in Henan Province, Xinxiang 453007;3.Xinxiang City Public Transportation Corporation, Xinxiang 453000)

In order to improve the accuracy of public transportation passenger volume prediction, this article integrates chaos theory and wavelet neural network method into the prediction. We deploy autocorrelation method and false nearest neighbor domain method to calculate the delay time and embedding dimension of the public transportation passenger volume time series. After that, by utilizing small data sets method, we obtain its largest Lyapunov exponent and then the chaotic characteristic of the time series is proved. According to this, we establish the chaos-wavelet neural network prediction model to predict the actual public transportation passenger volume. Finally, by applying our method on the real data set from some city of H Province, the experimental results demonstrate that our approach achieves the smaller prediction error on Mean Square Error (MSE), Mean Absolute Error (MAE) and Mean Relative Error (MRE) compared with the traditional prediction methods, such as BP neural network and LIBSVM. So it is able to predict public transportation passenger volume effectively.

chaos; wavelet neural network; public transportation passenger volume prediction

猜你喜欢
相空间客流量刷卡
基于嵌入式系统的商场客流量统计算法
刷卡
非对易空间中的三维谐振子Wigner函数
基于AFC数据的城轨站间客流量分布预测
基于相空间重构的电磁继电器电性能参数预测研究
刷脸就可以购物
相空间重构和支持向量机结合的电力负荷预测模型研究
从客流量推算公交出行PA矩阵的方法
新建旅游项目客流量分析方法初探
宅急送开始推行终端POS机刷卡结算