高速公路收费站出入口交通流量分析及预测

2023-03-31 11:05陈建雄徐延军
关键词:交通流量周期性收费站

陈建雄, 徐延军,2

(1.上海船舶运输科学研究所有限公司, 上海 200135;2.中远海运科技股份有限公司, 上海 200135)

0 引 言

近年来,收费系统在我国高速公路运营管理系统中的应用不断增多,电子不停车收费(Electronic Toll Collection,ETC)技术在汽车上的普及率不断提高。高速公路收费站出入口作为交通路网的敏感点,经常出现拥堵现象,特别是在节假日期间,承受着巨大的车流压力。与此同时,收费站出入口会产生大量交易数据,其中包含详细的车辆信息,相比通过传感器得到的数据,这些数据更加准确可靠,且获取的成本较低,如何高效合理地利用这些数据已成为研究的热点。目前国内外学者已针对收费站交通流量、通行能力等内容开展诸多研究。KOMADA等[1]证明了ETC和人工半自动收费(Manual Toll Collection,MTC)2类收费车道的基本图与对应车辆的密度和比例有很强的相关性;孙德强[2]基于收费数据,从不同的时间维度(周、日、时)分析了高速公路的交通流特征,对收费人员排班模型进行了优化。本文主要对收费站出入口交通流量进行研究,通过现有的数据挖掘和分析方法挖掘这些数据中隐藏的可靠信息,如相关性、周期性等;同时,对收费站出入口交通流量进行预测,帮助出行者规划出行时间和路线,分散出入口的交通压力,为交通管理者的管理决策提供参考。

1 研究数据说明

本文以宁夏自治区银川南收费站2021年的收费数据为研究对象进行分析。收费系统一般以1个工班日为单位统计收费站入口和出口全年的车流量,共有365条记录,每条记录中都包含时间、入口车流量和出口车流量等信息。

2 出入口交通流量相关性分析

2.1 图像观测法

图像观测法的原理是直接绘制散点图,其优点是形象直观,不足是缺少对相关参数的数据化度量。本文将收费站入口交通流量x作为自变量,将收费站出口交通流量y作为因变量,得到出入口交通流量散点图见图1。从图1中可看出,收费站出入口交通流量之间存在明显的正相关性,但对二者之间的相关度和相关可信度没有数据化的度量。

图1 出入口交通流量散点图

2.2 科学计算法

科学计算法的原理是通过具体的数学计算方式揭示各变量之间的相关性[3],通过该方法可得到以下2个重要指标:

1) 皮尔森(Pearson)相关系数r,可准确地反映变量之间的相关程度,其值为[-1,1];

2) 显著性水平p,用来衡量变量之间的关系,具体指不相关的概率,若相关系数为1,则p=0。

图2 出入口交通流量皮尔森相关系数

在统计学中,一般当p>0.05时,数据之间的差异无显著意义,这种结果可能是某种偶然因素导致的,不具有统计学意义[4]。

r的计算公式为

(1)

通过计算得到出入口交通流量皮尔森相关系数见图2。从图2中可看出,出入口交通流量之间的皮尔森相关系数为0.84。

通过T检验得到p=5.66×10-97,远小于0.05,说明收费站出入口交通流量之间确实存在关系。一般用r的取值范围判断变量间的相关程度[5],收费站出入口交通流量之间的关系见表1。

表1 收费站出入口交通流量之间的关系

综上所述,通过采用图像观测法和科学计算法进行验证,可知银川南收费站出入口交通流量之间存在着明显的正相关关系。

3 出入口交通流量的周期性特征

3.1 时间-频域图

根据全年365 d的收费站出入口交通流量数据得到出入口交通流量变化图见图3。选择具有明显规律性的部分作放大处理,观察其变化是否存在规律。由图3可知,出入口交通流量的变化存在周期性,周期为3~7 d。

a) 出口交通流量变化及部分放大图

b) 入口交通流量变化及部分放大图

3.2 通过傅里叶变换确定可能的周期

将时序数据转换为三角函数的线性组合,得到的各展开项的系数就是傅里叶系数。傅里叶系数越大,表明其对应的正弦波的周期越有可能是这份数据的周期。通过傅里叶变换得到傅里叶系数中最大的前10个值和对应的周期,分别对应出口交通流量数据和入口交通流量数据,见表2和表3。

表2 出口交通流量对应的傅里叶系数和可能的周期

表3 入口交通流量对应的傅里叶系数和可能的周期

3.3 通过自相关系数检验周期性

为保证得到的周期性结果可靠、准确,需对上文得到的可能的周期进行自相关系数计算。自相关系数的计算公式为

(2)

通过计算得到出入口交通流量可能的周期对应的自相关系数,见表4和表5。由表4和表5可知:出口交通流量的周期为7 d、3 d和14 d时自相关程度较高,入口交通流量的周期为7 d、3 d和11 d时自相关程度较高。结合自相关系数的绝对值越大,相关程度越高,越有可能是交通流量周期的性质,得出银川南收费站出入口交通流量周期均为7 d(1周),以周为单位呈现出重复性,这主要是受1周内的工作日和休息日的影响,特别是在周五和周日易出现出行高峰。

4 出入口交通流量预测

4.1 长短期记忆网络模型

采用随机森林方式对原始数据进行预处理之后,得到收费站出入口交通流量的完整数据,基于此对未来出入口7 d内的交通流量进行预测,采用长短期记忆(Long Short-Term Memory,LSTM)网络模型[6]。在模型中加入一个判断信息是否有用的“处理器”,称为记忆单元(Memory Cell),其结构见图4。

由于工作时间比较统一,相同收费站的出入口交通流量表现出周期性的通畅、拥挤等现象,周期为1周。

表5 入口交通流量的自相关系数和可能的周期

图4 LSTM网络模型记忆单元结构

例如,本周五的交通模式一般与上周五的交通模式相似,而与周末的交通模式差别较大,需将该现象添加到LSTM网络模型中[7],以提升模型的预测精度。LSTM网络模型在处理时间序列数据时,随着数据长度的增加,周期性的影响会逐渐减弱,因此需对预测目标的相同时间进行建模(即周一对周一);同时,收费站出入口交通流量数据并非呈现严格的周期性,易受交通突发事件、交通拥堵和疫情防控等因素的影响,即出入口交通流量并非严格以7 d为周期变化,因此需通过注意力机制[7]解决该问题。

4.2 模型训练过程

采用Z-score标准化方法对填补好的完整数据进行归一化处理,使其符合标准正态分布,计算公式为

(3)

对数据集进行划分:将数据集中80%的数据作为训练集;将另外20%的数据作为测试集。创建LSTM网络模型,采用前28 d的交通流量预测未来7 d的交通流量,训练过程见图5。

在训练阶段,使收费站出入口的实际交通流量与预测交通流量的偏差最小[8],模型的损失函数为

(4)

4.3 预测结果分析

图6 LSTM网络模型预测值与实际值对比(出口)

1) 平均绝对误差EMA,其表达式为

(5)

2) 均方根误差ERMS,其表达式为

(6)

3) 对称平均绝对百分比误差ESMAP,其表达式为

(7)

4) 决定系数R2,其表达式为

(8)

式(5)~式(8)中:EMA的取值范围为[0,+∞),其值越大,说明模型的预测误差越大;ERMS的取值范围为[0,+∞),其值越小,说明模型的预测精度越高;ESMAP的取值范围为[0,+∞),其值为0表示模型为完美模型,其值大于100%表示模型为劣质模型[10];一般而言,当R2>0.4时,可认定模型的拟合效果较好。

出口交通流量评估结果见表6。由表6可知:R2在训练集和测试集中均大于0.4,说明模型的拟合效果较好;EMA和ERMS相对较低,预测结果与真实值比较吻合[10];ESMAP在训练集和测试集中均小于0.400 0,表明模型在收费站出口交通流量预测中效果良好。

表6 出口交通流量评估结果

按以上处理和训练步骤对入口交通流量进行预测分析,同时利用以上指标对模型进行评估分析。通过LSTM网络模型对入口交通流量进行预测,入口交通流量评估结果见表7,预测值与实际值对比见图7。由表7和图7可知:在训练集和测试集中,R2均大于0.4,说明模型的拟合效果较好;EMA、ERMS和ESMAP等3个指标的值均处于理想状态,表明模型在收费站入口交通流量预测中效果良好,误差在可接受范围内。

表7 入口交通流量评估结果

为进一步验证预测模型的可靠性,增加跨年度数据进行交通流量预测。仍以银川南收费站的收费数据为研究对象,按以上研究思路和方法对2020年3月1日至2021年6月1日的收费站出入口交通流进行预测,得到损失函数值变化曲线见图8。由图8可知,损失函数值在训练次数约为8次时达到低点,并一直保持收敛状态,误差较小且稳定。同样采用上述4个指标对模型的预测效果进行评价,结果见表8。通过对比可知,4个评价指标的值均在合理范围内,未出现异常值,基于跨年度数据的模型依然表现出良好的预测性能。综上,将周期性现象融入LSTM网络模型中,对未来7 d内的收费站出入口交通流量进行预测,不论是针对全年数据还是跨年度数据,模型的预测效果都良好,可准确预测未来7 d的交通流量。

图7 LSTM网络模型预测值与实际值对比(入口)

图8 损失函数值变化曲线

表8 基于整年数据与跨年度数据的LSTM网络模型出入口交通流量预测效果对比

5 结 语

本文以宁夏回族自治区银川南收费站的收费数据为研究对象,对收费站出入口交通流量进行相关性分析、周期性分析和预测,主要得到以下结论:

1) 收费站出入口交通流量的Pearson相关系数为0.84,具有极强的相关性,出入口交通流量相互影响;

2) 收费站出口交通流量的变化周期为7 d,入口交通流量的变化周期为7 d,主要受上下班高峰时段的影响;

3) 融合交通流量的周期性特征建立LSTM网络模型预测出入口交通流量,基于整年数据和跨年度数据,通过EMA、ESMAP、ERMS和R2等4个指标评价该模型的有效性,结果表明其能取得良好的预测效果。

猜你喜欢
交通流量周期性收费站
江苏20个高速收费站实施“准自由流”改造
浙江首个“云收费站”投用
数列中的周期性和模周期性
基于XGBOOST算法的拥堵路段短时交通流量预测
基于Spark的高速收费站大数据系统的设计与实现
基于GA-BP神经网络的衡大高速公路日交通流量预测
一类整数递推数列的周期性
一种收费站排队模型的模拟实现
基于扩频码周期性的单通道直扩通信半盲分离抗干扰算法
基于复合卡和ETC的交通流量采集研究