城市轨道交通自动售检票系统回收类票卡的时序数据挖掘

2015-06-29 02:35江春安邵家玉
城市轨道交通研究 2015年9期
关键词:分中心轨道交通乘客

江春安 张 宁 邵家玉

(东南大学教育部ITS工程研究中心,210018,南京∥第一作者,硕士研究生)

城市轨道交通可以很好地解决由于城市人口急剧增长、地面空间剩余资源有限所带来的交通拥堵问题,因此得到迅速发展[1]。我国城市轨道交通的布局亦日趋复杂,由单线路变为多线路,再由多线路连接成为复杂的网络结构。其管理也从起初的按单线路的垂直管理,到目前的多线路、区域管理。城市轨道交通票务管理,包含售检票、结算、数据统计分析等,已成为各轨道运营公司的一项比较繁复的任务,而自动售票检票(Automatic Fare Collection,简为AFC)系统的投入运行,极大地减少了管理人员的重复性劳动,提高了轨道交通信息化、自动化水平,也提高了其服务水平[2]。

票卡是AFC 系统的核心,作为记录乘客信息的媒介和载体,与车站现场设备共同完成自动售票、检票的功能。票卡可分为回收类和非回收类票卡。目前,国内城市轨道交通运营管理中回收类票卡所占比例仍较大,关于回收类票卡的管理,主要包括票卡采购、制作、调配、库存管理等方面。由于回收类票卡需要在自动售票机、闸机中反复存取,在使用过程中会有损坏、遗失,使用的数量会随着乘客数量的增加而增加,加重了配送人员的负担,增加了企业的运营成本。如何基于现有回收类票卡的使用状况,合理高效地进行回收类票卡管理已经引起越来越多的关注[3-4]。

目前这方面的研究主要集中于票卡的票务管理流程方面,而对回收类票卡的物流,以及对AFC 系统所收集的数据的分析研究比较少[5],对于相关票卡使用情况大量信息的利用还很不充分,对于具体的票卡库存管理及调配的优化稍显不足。由于随时间而变的票卡使用情况信息是典型的时间序列数据,本文主要根据现有运营模式,将整个线网在系统层面分为清分中心、线路中心、车站三个层次,以清分中心为例分析回收类票卡出入库数量的流动性所带来的非平衡性问题;利用“ARIMA+RBF”(“自回归积分滑动平均+径向基函数”)组合模型,对回收类与非回收类票卡使用比例趋势、未来回收类票卡使用数量和流失数量进行预测,为票卡的调配管理奠定基础。

1 时序数据预测的基本理论

1.1 时间序列ARIMA模型

时间序列预测是根据时间序列的变化特征,提取与时间属性有关的信息,利用历史时序数据,预测未来状态。时间序列中最常见的非平稳模型为ARIMA(p,d,q)模型(其中,p为自回归阶数,d为差分阶数,q为滑动平均阶数)[6]。ARIMA 模型可以比较准确地确定时间序列的线性规律。

1.2 RBF神经网络模型

RBF神经网络是一种三层结构的前馈网络,分别为输入层、隐含层、输出层。利用聚类方法学习RBF神经网络,先用无监督学习方法确定RBF 神经网络中隐节点的数据中心,并根据各数据中心之间的距离确定隐节点的扩展常数,其径向基函数采用高斯函数[7],然后用有监督学习训练各隐节点的输出权值。RBF 神经网络模型可以用于挖掘时间序列的非线性特征。

2 “ARIMA+RBF”组合模型

由于ARIMA 模型只是提取时间序列的线性规律,然而现实中绝大多数时间序列均含有非线性特征,单纯应用ARIMA 模型进行预测会因忽略掉非线性特征而产生较大的误差,故利用RBF对误差中的非线性特征进行挖掘提取。本文首先利用ARIMA 模型对回收类与非回收类票卡的使用比例趋势、回收类票卡的使用数量和遗失数量进行多步预测,并与实际数据进行比较,然后再利用RBF 对ARIMA所预测的误差进行挖掘,整合得出比较准确的预测值。“ARIMA+RBF”组合模型预测原理如图1所示。

图1 “ARIMA+RBF”组合模型预测原理图

3 实例分析

3.1 回收类票卡使用的历史统计

笔者从某城市轨道交通清分中心获取了近3年的自动售票机、半自动售票机、闸机所记录的票卡数据,归纳整理得到每日回收类与非回收类票卡的比例、回收类票卡的使用数量、回收类票卡的流失数量,以及每日每车站回收类票卡进、出库数量。将3年中的节假日(中国法定假日,以及西方的情人节、圣诞节,不含平常周六、周日)数据剔除,得到日常回收类票卡数据;再将这些数据以7天为1个周期进行整合,共得到120个样本,每个样本包括1周的数据量。由于本文所作的预测主要为清分中心服务,故选择7天为一周期进行建模分析,至于特殊节假日票卡的预测,则需另外建模分析。

回收类与非回收类票卡的比例,回收类票卡的使用量,以及回收类票卡的流失量统计如图2所示。其中,出于部分数据的敏感性及建模要求,将票卡使用数量和流失数量的数据进行了归一化处理,即票卡使用(流失)量=(每周票卡使用或流失数量-最小样本值)/(最大样本值-最小样本值)。

图2 票卡原始数据统计图(已作归一化处理)

如图2 a)所示,随着城市轨道交通的发展,其乘客群日益稳定,回收类与非回收类票卡的使用比例由开通时的1.2∶1,下降到0.7∶1,并一直降到0.5∶1左右,整体呈下降趋势。在城市轨道交通运行之初,回收类票卡与非回收类票卡的使用比例较大有多方面原因,比如:乘客的固有出行习惯;不熟悉地铁的运营方式;亦或该AFC 系统尚不能完全兼容该城市的公交一卡通,导致部分乘客因需办理新卡而放弃使用非回收类票卡等。但随着时间的推移,非回收类票卡的便捷性和经济性会使回收类票卡所占比例总体呈逐渐下降趋势,并在整个运营系统稳定后,保持平稳。

如图2 b)所示,虽然回收类票卡的使用比例总体呈下降趋势,但随着城市轨道交通线路的扩张,对城市交通的覆盖面增大,将使乘客数量增加,回收类票卡的使用量总体呈现增长趋势。准确预测每周回收类票卡的使用数量,并进行调配,能够确保整个运营线路不会出现票卡短缺的情况,有助于提高运营公司的服务水平。

因乘客保管不当,或乘客在自动售票机购买了票卡后并未使用(如由于票卡图案新颖,被收藏纪念等)或乘客超程后非正常出站,或极少部分乘客恶意地带走票卡,以及利用检票设备漏洞而尾随出站等,都会造成回收类票卡的流失,导致运营成本的增加。回收类票卡的流失是城市轨道交通运营过程中不可避免的现象,票卡的流失不仅浪费乘客的时间、金钱,亦为运营公司带来经济负担。由统计分析还可知,虽然城市轨道交通的票卡管理日趋成熟,流失数量应该有所下降,但随着回收类票卡使用数量的增长,总体上仍然呈增长趋势。

3.2 回收类票卡预测

回收类票卡使用数量在线路开通初期处于不稳定状况,经过一段时间后趋于稳定,故本文将此部分数据剔除;由于清分中心增加优惠等措施,会减少回收类票卡的使用量,但该过程比较缓慢,此类样本数据不剔除,最终得到建模所需的120 个数据样本。利用前90个数据样本建立ARIMA 模型,得出30个预测值;利用RBF 模型对预测出的30个值中的前25个预测数据的误差进行训练,预测出最后5个预测值的误差并与相应ARIMA 原始预测值组合,最后利用120个样本的最后5个数据进行验证。

上述回收类与非回收类票卡使用比例、每周回收类票卡使用数量、每周回收类票卡流失数量等3个时间序列都为不稳定时间序列,需进行差分,利用AIC(最小信息)准则,分别建立模型为ARIMA(1,1,6)、ARIMA(1,1,2)、ARIMA(2,1,2)。利用“ARIMA+RBF”组合模型进行5 步预测(即每步预测1个值,共预测5个值),得到结果如图3所示。实际值与ARIMA 模型预测值、“ARIMA+RBF”模型预测值的比较见表1。

图3 利用“ARIMA+RBF”组合模型对回收类票卡使用的5步预测

表1 5步预测误差比较

从表1 可以看出,“ARIMA+RBF”模型与单独使用ARIMA 模型相比,在相对误差这一项上,精度有了比较大的提高,使回收类票卡的预测更加符合实际应用。

通过以上分析可以得出:“ARIMA+RBF”模型预测精度要比单纯ARIMA 模型高,可应用于清分中心的票卡库存管理。本文建模所需的样本数据应随着时间段的不同而进行更新,使模型的参数也相应地更新,使其能够比较精确地对各个时段进行预测。

4 票卡预测的实际应用

利用上述回收类票卡使用量预测、流失票卡数量预测、损坏量预测并结合现有库存量就可以得出每段时间回收票卡的计划采购数量。假设以季为单位时间段,可得清分中心每季票卡的采购量 = 由乘客数量增长所需新增回收类票卡数量+流失回收类票卡数量 + 回收类票卡损坏数量。其中,由乘客数量增长所需新增回收类票卡数量、流失回收类票卡数量可分别通过回收类票卡每周使用数量、流失数量预测得到,回收类票卡损坏数量为实际统计值。由此可以比较准确地得知每季所需采购数量。

由上述分析可知,回收类票卡的使用数量是呈增长趋势,并且有部分票卡会不断流失或出现损坏,造成整个轨道线网的票卡数量不平衡,需要不断地购买、制作票卡。

利用本文介绍的方法,只需选择适当的取样周期,就可以依次预测出每条线路中心、每个车站的出入库流动量,为清分中心、线路中心、车站之间的回收类票卡调配提供必要的依据。

5 结语

本文主要利用回收类票卡的时序数据,对回收类与非回收类票卡使用比例趋势、每周回收类票卡的使用量和流失量进行分析,并用“ARIMA+RBF”组合模型进行预测,为今后的回收类票卡的库存、调配管理提供了理论依据。实例验证的结果表明,本文建议的方法预测的相对误差在3%左右,所建模型有比较好的精度和适用性,具有实际应用价值。

[1]邓先平,陈凤敏.我国城市轨道交通AFC 系统的现状及发展[J].都市快轨交通,2005(3):18.

[2]张宁,高朝晖,王健.轨道交通AFC系统票卡管理分析[J].都市快轨交通,2008(1):24.

[3]Zhang Ning,Yang Liqiang,He Tiejun,et al.The application of distributed computing technique in rail transit automatic fare collection system[C]∥Proceedings of Distributed Computing and Applications to Business,Engineering and Science.Wuhan:Hubei Science and Technology Press,2007:121.

[4]蔡靓.成都地铁单程票使用比例的线性回归分析[J].现代城市轨道交通,2012(1):57.

[5]王雨.北京市轨道交通单程票物流方案研究[D].北京:北京交通大学交通运输学院,2012.

[6]Ahmed M S,Cook A R.Analysis of freeway traffic timeseries data by using Box-Jenkins techniques[J].Transportation Research Record,1979(722):1

[7]吴杰,徐骏善.地铁自动售检票系统中票务处理模块的设计[J].城市轨道交通研究,2013(11):95.

猜你喜欢
分中心轨道交通乘客
轨道交通产品CE认证论述
嫦娥五号带回的“乘客”
高速轨道交通发展趋势
汽车顶层上的乘客
最牛乘客
国家测绘地理信息局卫星测绘应用中心河南分中心
高速公路监控分中心网络配置探析
基于CAN的冗余控制及其在轨道交通门禁环网中的应用
全国首个民族出版产品质检分中心成立
各地分中心 海选现场