考虑客流时序特征的短期客流预测模型

2023-04-04 09:40姚祯龙
大科技 2023年13期
关键词:工作日客流轨道交通

姚祯龙,高 芮,王 恒

(中国中铁二院工程集团有限责任公司,四川 成都 610031)

0 引言

根据我国城市轨道交通协会统计数据显示[1],我国城市轨道交通运营里程从2012 年的2286km,增加到2020 年底的7969.7km;年平均增长约16%。截至2020年底,中国大陆地区已有45 个城市开通了244 条轨道交通线。从变化趋势来看,随着运营里程的增加以及城市化率的提高,乘客运量也在不断上升[1]。2012 年,我国城市轨道交通累计运送约87 亿人次,2019 年、2020 年分别达237、175.9 亿人次,2019 年较2012 年增长约175%[1]。

准确预测城市轨道交通客流对合理的城市轨道交通规划具有重要意义。国内学者对客流预测模型与方法做了较多的研究。研究目标包括具体车站客流预测[2]、城市轨道交通环线客流预测[3]、新开城市轨道交通预测方法[4,5]、月度客流数据预测方法[6]等,提出了受影响客流的界定算法,建立了突发事件下网络受影响客流重分布预测算法。

本文基于重庆市轨道交通客流数据,考虑客流的周期性以及客流的时间依赖性,对不同时段(工作日/周末/节假日)的客流分别进行分析,并建立基于支持向量机、长短记忆循环神经网络模型,提高了客流预测精度。基于实证分析证明了所用方法在客流预测中的有效性。

1 预测模型

1.1 支持向量回归模型(SVR)

引入拉格朗日函数L 和拉格朗日乘子(α-α^),分别对ω,b,ξ,ξ^求偏导并令其为0 后,再次代入拉格朗日函数,可以得到其对偶问题,如式(1)所示。

其中,k(Xn,Xm)是支持向量机的核函数,它是利用内积运算实现将输入映射到高维特征空间的一种简化计算方式,一般有线性(Linear)核函数、多项式(Polynomial)核函数、径向基(Radial Basis)核函数等。显然,对偶问题有解的充要条件是满足库恩塔克条件(Kuhn-Tucker conditions,KKT 条件),如式(2)所示。

1.2 长短记忆神经网络预测(LSTM)

本网络是一种门控循环神经网络(recurrent neural network, RNN)[7]。在LSTM 神经网络中,一共存在3 种门。分别介绍如下。

式中:i——细胞;t——当前时刻;X(t)——当前的输入向量;ht——当前隐藏层向量,其同时含有所有LSTM“细胞”输出,b、U、W 分别是LSTM“细胞”得偏置、输入权重和循环权重。

针对城市轨道交通客流量预测,将每日的历史数据客流量视为一个时间序列,设为P={p1,p2,…,pn}。由于城市轨道交通客流基本保持平稳状态,对LSTM 预测精度影响有限。但同时,和其他神经网络模型一样,LSTM 的输入数据范围最好能保持在其激活函数(为双曲正切,取值-1~1 之间)的范围以内。因此,还是要对原始的客流数据输入需要进行进一步加工,本文采用归一化方法(MinMaxScaler class)进行处理,计算原理如式(7)所示。

2 模型效果评估

2.1 数据描述及分析

本文数据来源于重庆轨道交通集团有限公司。本文数据采用的是重庆市轨道交通3 号线,2018 年1 月1 日—6 月29 日运营数据,其中工作日125d;节假日包括周末、元旦、春节(春节客流数据偏差较大,7 个数据点被剔除)清明节、劳动节,共计48d。分别将工作日和节假日数据的70%与30%作为训练数据与测试数据,即对工作日,共计87 个训练数据及38 个测试数据;对节假日,共计34 个训练数据及14 个测试数据。本文所有建模、测试均基于Python 3.6。

2.2 评估指标

为了精确度量各类预测方法的精度,本文选择采用两个常用指标,分别是平均绝对百分比误差(mean absolute percentage error, MAPE),用以计算相对误差;均方根误差(root mean square error, RMSE),用以计算绝对误差。

2.3 客流时间序列预测结果

2.3.1 SVR 回归

使用上述训练数据及测试数据进行支持向量回归分析,由于数据明显呈现非线性,建模采用径向基作为支持向量机核函数,图1a 和图1b 分别展示了SVR 针对工作日和节假日的不同回归结果,图中灰色竖线两侧分别为训练集与测试集,蓝线部分表示训练及预测的绝对误差。

图1 SVR 模型预测值及误差情况

2.3.2 LSTM 预测

LSTM 模型相关参数标定如下:①定值参数,时间步长为7,预测步长为1,迭代次数300 次,损失函数为Mean_Squared_Error;②网格搜索参数,批量大小为1/2/4/6/8/10/12/14/16(最终取值为1),隐藏层细胞元为5/10/20/50/75/100(最终取值为10)。图2 可以看到,对工作日客流,迭代100 次后误差趋于稳定;节假日客流迭代150 次后误差趋于稳定。图3 显示了LSTM 预测模型的计算结果,结果可见,当客流呈现规律性波动时,预测效果较好;对于节假日等客流波动较大且数据量不足的情况时,LSTM 模型效果显得较为不足。

图2 LSTM 预测模型误差随迭代次数下降曲线

图3 LSTM 预测模型预测结果

2.4 误差量化分析及模型比选

为了说明两种机器学习方法在工作日、节假日客流预测上的有效性,使用平均绝对百分比误差MAPE及均方根误差RMSE 对它们进行误差量化计算,结果如表1 所示。从中可以看到,在数据量较大(工作日)时,长短记忆神经网络预测模型具有较好的预测效果,MAPE 仅为6.58%,但其在处理节假日数据时,表现欠佳;支持向量回归预测模型,通过参数比选,最终对工作日、节假日的预测均表现出不错的效果。

表1 不同预测模型预测误差计算

3 结语

本文根据重庆市轨道交通3 号线半年客流数据,分工作日、节假日两种情况,分别利用支持向量回归预测和长短记忆神经网络预测两种机器学习模型进行了预测分析。根据预测结果,基于均方根误差(RMSE)和平均百分误差(MAPE)对比分析结果表明:

(1)在数据量较大(工作日)时,长短记忆神经网络预测模型具有较好的预测效果,MAPE 仅为6.58%,但其在处理节假日数据时,表现欠佳。

(2)支持向量回归预测模型,通过参数比选,最终对工作日、节假日的预测均表现出不错的效果。

猜你喜欢
工作日客流轨道交通
客流增多
轨道交通产品CE认证论述
高速轨道交通发展趋势
关于休闲的量的问题的考察
基于自学习补偿的室内定位及在客流分析中的应用
基于CAN的冗余控制及其在轨道交通门禁环网中的应用
人工免疫算法在电梯客流时段划分的应用
城市轨道交通联调探讨
城市轨道交通运营客流数据分析缺陷及应对
对《资本论》中工作日问题的哲学思考