基于收费数据的高速公路旅行时间预测*

2020-12-07 08:51樊博马筱栎
公路与汽运 2020年6期
关键词:站间收费站旅行

樊博, 马筱栎

(1.重庆交通大学 交通运输学院, 重庆 400074;2.重庆市交通运输工程重点实验室, 重庆 400074)

高速公路旅行时间是诱导公众出行的重要依据,是评价道路实时运行状态的重要指标,也是辅助道路管理人员进行管控资源配置的决策参考。旅行时间预测对于交通使用者和管理者都具有重要意义和应用价值,可以说,旅行时间预测是高速公路交通管理系统、出行者信息系统中不可或缺的部分。

由于国外检测器铺设密度相对较高,旅行时间预测研究可以在高精度交通流数据下开展,如Moonam H.等基于历史真实数据,使用卡尔曼滤波器,针对不同类型道路预测旅行时间。对于利用收费数据进行旅行时间预测的研究,王翔等根据交通事故持续时间和不同时段交通状态的特征,构建基于改进最近邻非参数回归的方法预测旅行时间,算法中各类别历史真实数据集中K值采用交叉验证的方法标定;赵建东等采用决策级融合策略,对收费数据和微波车检数据进行融合,通过建立模型分配权重,使用BP神经网络进行旅行时间预测,同时引入遗传算法对BP神经网络进行优化,模型预测结果的相对误差在10%以内。该文以高速公路中主线收费站路段为基础进行分析,构建影响旅行时间的解释变量,采用支持向量回归算法,提出一种基于收费数据的高速公路站间旅行时间预测模型。

1 数据准备

1.1 数据来源与数据结构

数据来自重庆高速公路网2017—2019年联网收费数据,删除其中异常数据(包括但不限于字段缺失、字段取值无效和车辆进出收费站的时间不合逻辑等)后提取每条信息中的车辆OD信息。经过数据预处理后一条完整的收费数据所包含的主要字段及含义见表1。

表1 收费数据中包含的主要字段

1.2 研究对象

选取重庆G65包茂(包头—茂名)高速公路渝湘段为研究对象。该项目全长84.5 km,由巴南主线收费站起,出城单向途经南彭、接龙、石龙、大观、南川、金佛山8个收费站后到水江收费站为止。

以2018年为例,路网上总流量分布受客车流量分布影响最大,货车流量则基本上维持在相对稳定状态(见图1)。客车中的一型客车,其交通量占客车流量的绝大部分,具有一定的代表性。同时已有研究表明,高速公路交通系统中可用一型客车的旅行时间来推算其他车型的旅行时间。因此,以一型客车作为主要研究车型。

随机统计工作日、周末和节假日路网流量小时分布,结果见图2。由图2可知:路网夜晚和凌晨时段流量相对稀少,该时段车辆以自由流速度行驶,无预测必要。因此,以7:00—20:00作为预测时段。

图1 重庆高速公路网2018年全年流量月份分布

图2 重庆高速公路网流量小时分布

2 旅行时间提取及处理

2.1 旅行时间提取

如图3所示,高速公路A、B收费站之间的路段称为k站间,站间旅行时间是指在某时间周期内由A入口驶入、B出口驶出高速公路的所有车辆的平均行驶时间,也可称为旅行时间。

图3 高速公路收费站间示意图

可根据收费数据中车辆经收费站进出高速公路的时间计算k站间在周期T内的旅行时间:

(1)

(2)

由于部分时间相邻收费站间OD记录较少,甚至某些相邻站间在某些时段内无OD记录,无法提取站间真实交通运行状态的旅行时间。另外,由于某些特殊驾驶行为(如车辆长时间以低于最低限速或超速行驶、车辆进入服务区休息等)产生的异常旅行时间对提取OD间准确的旅行时间有所影响,有必要对该类数据进行控制。

2.2 数据质量控制

对旅行时间数据的控制主要分为数据清洗和数据修补。数据清洗流程如下:1) 删除旅行时间大于一个自然日的数据;2) 删除平均速度超过道路最大限速20%的数据;3) 计算各周期内车辆旅行时间的均值μ和标准差δ,按照2δ原理删除旅行时间不在[μ-2δ,μ+2δ]范围内的数据;4) 重复步骤3直至剔除所有不在有效范围内的数据。

(3)

(4)

(5)

3 解释变量构建

在构建影响旅行时间的解释变量时,将变量分为前期旅行时间,月份、周天、时段,大小车旅行时间差值,道路环境、天气条件。

3.1 前期旅行时间

选取该预测站间k的前期旅行时间为备选变量,为确定变量中前期旅行时间的周期数量,随机选取该项目某2个月、某2个不相邻站间p和q的前5个周期旅行时间进行相关性分析,相关系数计算结果见表2。

表2 当前周期旅行时间与前期旅行时间的相关系数

由表2可知:当前时间下的旅行时间与其前3 个周期旅行时间的相关性较高。因此,选择前3 个周期旅行时间作为备选变量。

3.2 月份、周天、时段

以月份、周天和时段为变量对主线收费站交通量分布规律进行分析,确定各变量分类。

对于时段,根据图2路网流量分布可将预测时段分为两类:一类为出行高峰时段7:00—11:00和13:00—18:00;另一类为平峰时段11:00—13:00和18:00—20:00。

对于月份,统计2018年各月进入主线收费站的日均流量,结果见图4。按照各月日均流量分布可将全年12个月分为两类:第一类为1、3、4、5、10、11和12月;第二类为2、6、7、8和9月。

图4 通道主线收费站日均流量月份分布

再统计各周天进入主线收费站的日均流量,并进行系统聚类,结果见图5。根据图5,将周天变量分为三类:周一到周四为一类;周日为一类;周五、周六为一类。

图5 周天聚类谱系图

3.3 大小车旅行时间差值

相比城市交通系统,高速公路系统各周期内货车平均数量较多,交通流量中货运车辆所占比例对交通运行状态有一定影响,而交通运行状态又与车辆旅行时间密切相关。小车(一型客车)旅行时间与大车(所有货车)旅行时间的差值一定程度上能反映站间交通状态,在运行畅通的路段上,大、小车旅行时间基本维持在相对固定的差值;较为拥堵时,大、小车旅行时间差值会降低,意味着交通状态已经或正在发生某些改变,这些改变又会对下一时刻的旅行时间产生影响。因此,引入周期内大小车旅行时间差值作为变量之一。

3.4 道路环境、天气条件

就道路环境而言,根据重庆山区高速公路多桥梁、隧道的特点,选取站间内桥梁、隧道长度作为备选变量。对于天气条件,按晴天、阴雨天和雾天雪天对其进行划分。

综上,影响高速公路旅行时间的解释变量及含义见表3。

表3 解释变量

4 基于支持向量回归的旅行时间预测模型

4.1 支持向量回归

(6)

κ(xu,xv)=exp(-δ‖xu-xv‖)2

(7)

式中:δ为超参数,设置为1。

对式(6)进行求解,得:

(8)

式中:b为偏置误差项,可借助KKT条件求解。

4.2 实验验证

4.2.1 性能评价指标

选取均方根误差(RMSE)、平均相对误差(MAPE)作为模型的评价指标,计算公式如下:

(9)

(10)

4.2.2 预测结果分析

以某站间某天的旅行时间为例,通过修正,旅行时间相比未经处理的原数据波动范围有所减小,缺少有效数据的周期也得到修补(见图6)。

图6 修正旅行时间

将真实旅行时间按7∶3划分训练集和测试集,选取m站间(路段长度为6 km,其中桥梁、隧道长度为零)和n站间(路段长度为16 km,其中桥梁、隧道长度为4.85 km)。图7为m站间在一般情况场景下某周一和某事故场景下的模型预测结果,图8为n站间在暑期场景下某周日和端午节假日下的模型预测结果。

图7 m站间分场景预测结果

由图7可知:模型在一般情况场景下表现较好;由于构建的解释变量中缺少能准确描述偶然事件下旅行时间的影响因素,模型对偶然事件场景下的预测能力表现不足,但在非事故影响周期内,模型仍有一定的预测能力。

由图8可知:模型在暑期场景下的预测精度总体较高;在节假日场景下也具有一定的预测能力。

综上,模型总体表现能力较优,尤其是在一般场景和暑期场景下,平均相对误差分别为5.17%、8.30%;相较于一般场景和暑期场景,节假日场景下短时间内或某些周期内的车流量更多,模型预测误差较高。不同场景下模型预测结果的误差见表4。

图8 n站间分场景预测结果

表4 模型预测结果评价

5 结论

(1) 构造SVR模型预测高速公路旅行时间可行、有效,模型在一般情况场景和暑期场景下的预测精度较高,对节假日也有一定的预测能力。

(2) 要实现模型对偶然事件下的准确预测,仅考虑大小车旅行时间差值还不够,需引进更能描述偶然事件的参数变量。

(3) 下一步可考虑道路线形等相关变量,进一步提高模型的可靠性和适用性;同时使用特征选择方法,去掉解释变量中可能存在的冗余变量,进一步提高模型的计算能力。

猜你喜欢
站间收费站旅行
江苏20个高速收费站实施“准自由流”改造
浙江首个“云收费站”投用
基于Spark的高速收费站大数据系统的设计与实现
站间未设通过信号机的区间红灯转移问题探讨
一种收费站排队模型的模拟实现
小黑的旅行
单线自动站间联系电路的改进
ZPW-2000A站间联系电路的改进
夏日旅行
基于AFC数据的城轨站间客流量分布预测