基于ConvLSTM的高速公路交通流预测仿真研究

2022-03-22 08:04吴剑云于安双
实验室研究与探索 2022年12期
关键词:交通流收费站滑动

吴剑云, 于安双,2

(1.青岛大学商学院,山东 青岛 266071;2.上海大学悉尼工商学院,上海 201800)

0 引 言

随着经济的发展,居民的交通出行需求不断增加,由于交通基础设施建设的滞后性,交通拥堵问题随之出现[1]。高速公路网关键节点的拥堵如果没有尽快解决,就会引发由点到线最终至面的趋势,使整个路网运行效率降低[2]。收费站是高速公路网中的瓶颈,拥堵造成的二氧化碳增加、生产力下降、经济损失等负面影响成为阻碍经济可持续发展的顽疾[3]。准确的交通流预测,不仅有助于交通管理部门掌握交通状态演变的趋势,采取交通管制、进行资源调配,帮助出行者进行路线规划,提高出行效率[4]。科学、准确地预测高速公路收费站交通流量,探索交通流量变化规律,对提高高速公路网运行效率具有重要现实意义。

为探究交通流的变化规律,国内外学者提出了许多关于交通流预测的方法。传统预测方法主要基于数理统计的模型,针对路网中某一观测点的时间序列数据进行建模,如季节性ARIMA 模型[5]、指数平滑模型[6]等。基于数理统计模型对参数十分敏感且对不稳定、复杂的非线性高维数据处理较为困难,机器学习模型逐步被用于交通流预测的相关研究中,如支持向量机(Support Vector Machine,SVM)[7]、随机森林算法[8]等。随着交通大数据的到来,深度学习模型可以处理大规模、高维度数据,学习各类交通数据之间的深层关系,被广泛用于各类交通流预测任务中[9]。深度置信网络[10]、堆叠自编码神经网络[11]、卷积神经网络(Convolutional Neural Network,CNN)[12]以及卷积神经网络与循环神经网络(Recurrent Neural Network,RNN)的混合模型[13]等被用来进行交通流预测。上述模型为交通流预测奠定了良好的基础,其本质是交通流时间序列的分析,忽略了交通流的时空关联性。

高速公路交通流通常具有动态变化、时空关联和周期性等复杂特性,交通流的预测会受到交通速度、天气和事故等外部因素的影响[14]。各类时空序列数据之间往往存在复杂的非线性相关关系,如何在提取交通流时空特性的同时,刻画外部因素对高速公路交通流的影响仍有较大研究空间。为实现多个关键节点交通流的高精度多步预测,本文除了描述交通流的时空相关性,还考虑了外部因素的影响,包括交通速度和天气。在此基础上,构建了基于卷积长短时记忆网络(ConvLSTM)的交通流短时预测模型。利用卷积神经网络中的卷积层实现交通流的多变量多步预测。本文利用随机搜索算法来优化模型参数组合。

1 STE-ConvLSTM模型预测原理

高速公路交通流预测模型STE-ConvLSTM的主体部分为ConvLSTM网络。交通流会受到外部因素的影响,出行者相对固定的出行习惯使得高速公路交通流在时间维度上呈现出一定的周期性和规律性,上下游收费站间存在一定的空间相关性。基于ConvLSTM网络对交通流数据的时间、空间相关性特征及外部因素的特征进行提取,构造前t 个时段的历史交通流和外部因素数据的时空矩阵。STE-ConvLSTM 模型的结构如图1 所示。

图1 STE-ConvLSTM模型

将交通流和外部因素的历史时空序列数据转换为类图像的时间序列数据之后,输入ConvLSTM模型,由多个ConvLSTM 层、批标准化层(Batch Normalization,BN)和ReLU层(Rectified Linear Unit,ReLU)提取交通流的时空特性,并学习外部因素时空矩阵数据与交通流数据的关系。利用卷积神经网络的Conv2D层输出未来交通流量矩阵。

1.1 构建模型输入数据

ConvLSTM网络的输入为带有时间特征的图像数据,即具有图像的三维特征(高度、宽度和深度)且这些图像构成时间序列。

(1)各类时空数据。各收费站实时交通流图像获取难度较大,基于收费站间相对地理位置和历史交通流时序数据,将收费站交通流的时空分布设计成二维特征矩阵,该矩阵包含交通流的时间和空间特征:

式中:t为样本时间长度;m为收费站的数量;vij为过去第i =1,2,…,t时第j =1,2,…,m方向的交通流信息。

交通速度可分为时间和空间平均速度。空间平均速度的计算数据易获取,且能处理成时间序列,故选其为研究对象。考虑到一个收费站可与多条道路相连接,本文采用主成分分析法来降低交通速度数据的维度,并选取贡献率最大的第1 个主成分来构造新的样本集合

式中:矩阵的横轴为空间维度,按照与高速收费站对应位置排列交通速度值;矩阵的纵轴为时间维度;sij为过去第i =1,2,…,t时第j =1,2,…,m 方向的交通速度信息。

天气数据通常包含降雨量、温度、湿度等多种特征。为消除样本特征的冗余,本文对天气数据进行主成分分析,并选取贡献率最大的第1 个主成分构造天气时空矩阵。

式中:矩阵的横轴为空间维度,按照与高速收费站对应位置排列相应天气数据;矩阵的纵轴为时间维度,wij为过去第i =1,2,…,t时第j =1,2,…,m 方向的天气信息。

(2)输入数据。为构建能输入ConvLSTM模型的类图像时间序列数据,基于各收费站的地理位置及相应的历史交通流、交通速度、天气数据设计了时空矩阵。如图2 所示,在此基础上将交通流时空矩阵与外部因素时空矩阵延深度方向堆叠,使用一次滑动窗口模型形成类似于图像的数据,其中时间和空间维度对应图像的宽度和高度,交通流量值、交通速度值以及天气数据值对应了彩色图像数据的色彩通道。再次使用滑动窗口模型形成带时间轴的类图像数据作为模型的输入。

图2 类图像时间序列数据的构建

在图2 中,第1 次使用滑动窗口模型产生的类图像数据中vt,m、st,m、wt,m分别为第m 个收费站在t 时间的交通流量、交通速度和天气数据,Δt 为第1 次滑动窗口的大小;第2 次使用滑动窗口模型后产生的单个样本的形状为ΔT×Δt×m ×3,ΔT为第2 次滑动窗口的大小。模型输入数据集记为D,其形状为n ×ΔT×Δt×m×3,n为样本数量。

1.2 模型的主要结构

交通流预测问题基于历史交通流量、交通速度及天气数据,通过让研究模型不断学习样本中0-t 时刻的数据,让模型来推断未来交通流量的变化趋势,对下一段时间t +Δt的交通流量进行预测。

(1)ConvLSTM网络。长短时记忆网络主要用于时间序列数据处理,很难提取具有空间信息的数据。在LSTM网络的基础上,ConvLSTM网络被提出来研究雷达回波图的时间序列预测问题[15]。ConvLSTM网络将前馈方法从哈达玛乘积改为卷积,把input-to-gate与gate-to-gate均改为做卷积运算,以提取除时间关联性之外的空间关联性,被广泛用于客流预测、天气预测、流量预测等领域的研究中[16]。ConvLSTM网络的卷积结构可对交通流以及外部因素数据的空间特征进行提取,且网络中的信息也会持续积累和更新,能有效处理具有时间相关性的交通流信息

式中:Dt为输入;w、b 为可学习参数;σ 为非线性激活函数;‘*’表示卷积;‘◦’为哈达玛积。ConvLSTM 的每个神经元都有一个记忆单元Ct来存储状态信息,Ct能通过输入门It、遗忘门Ft和输出门Ot进行访问和修改,当Dt输入ConvLSTM时,若遗忘门Ft被激活,则遗忘之前的神经元状态;若输入门It被激活,则它的信息会更新Ct。输出门Ot控制最终输出Ht,Ht决定Ct是否会传递到最终的状态。

(2)卷积层。卷积层是卷积神经网络中有较强特征学习能力的单元,卷积层输出的缺点。Bergstra等[17]提出超参数优化的随机搜索算法。研究表明,在多个学习算法对多个数据集的情况下,随机搜索算法比网格搜索算法更有效地进行超参数优化,并且所需的计算时间更少。考虑到时间成本和结果的有效性,本文采用随机搜索算法来进行超参数组合优化。

2 实验验证与结果分析

2.1 数据集与数据预处理

(1)数据集。实验数据集是KDD CUP 2017 提供的某高速公路收费站口交通流数据、汽车轨迹数据、天气数据和道路及网络连接属性数据,数据的采样周期为20 min,每天产生72 条数据。汽车轨迹数据为交叉路口a ~c到收费站的行驶信息。交通流数据是收费站口的车辆通行记录,其中2 号收费站口只允许车辆驶入高速公路,“0”代表驶出,“1”代表驶入。天气数据包含湿度、降雨量等特征。数据采样周期为2016-09-19 ~2016-10-24,由于国庆假期期间的交通流量与平时有较大差异,为保证预测准确性不考虑假期数据。采用线性插值法处理缺失数据,并选用Min-Max 方法对数据进行标准化。

(2)相关性分析。采用皮尔逊相关系数验证外部因素与交通流的相关性以及交通流的时空相关性,为交通流预测模型输入数据集的确定奠定理论基础。图3 所示为交通流和交通速度进行相关性分析的结果,图中数据表明,交通流与其连接道路交通速度不仅呈现一定的相关性,相邻收费站的交通流也存在高度时空相关性。

图3 皮尔逊相关系数

图4(a)所示为1_0 方向一周内每天同一时段的交通流对比图,图中曲线说明,某收费站口每日交通流表现出很强的时间上的相似性,都呈现出明显的早晚高峰,白天流量比较大,夜间流量整体比较小;从周一到星期天的数据分布来看,其仍然表现出一定差异。交通网络是一个复杂的系统,交通流不仅在时间上表现出高的相关性,在空间上同样也表现出强的相关性。图4(b)所示为相邻收费站某日同一时段的交通流对比图,从图中可以看出,5 个不同方向的交通流表现出了高度的相似性,整体的变化趋势是一致的,只因受随机因素的影响而在细节上存在差异。

图4 时空特性分析

(3)主成分分析。对与收费站连接道路的交通速度数据和天气数据进行主成分分析,以减少数据的维数,加快模型的迭代速度。收费站口1 和收费站口2汇入道路交通速度第1 个主成分的方差贡献率分别为73.708%和63.425%,天气数据第1 个主成分的方差贡献率为99.999%。

(4)滑动窗口设置。输入数据包含的特征数量及样本数量受滑动窗口设置大小的影响,设置窗口小,样本数量增加,每个样本包含的时间序列特征会减少。交通流预测的准确性与滑动窗口的设置密切相关。本文使用2 次滑动窗口的方法对时间序列数据进行处理,第1 次是将时间序列数据处理为类似于图像数据的形式,为尽可能保证样本数量并符合轨迹变化的特征故将滑动窗口的宽度设为6,滑动步长1。第2 次是获取带时间维度的类图像数据,为确保样本包含足够特征数量,设置滑动窗口的宽度为10,滑动步长为1。通过滑动窗口设置最终得到训练数据991 条,验证数据487 条,测试数据487 条。

(5)参数设置及参数优化。根据具体的实验效果进行调优设置,选择学习率为0.1%的Adam迭代优化器和设定为均方误差的损失函数,训练迭代次数预设为1 000,使用早期停止策略,设置patience参数为10,批大小为64。ConvLSTM层采用ReLu激活函数,且在2 个ConvLSTM层之间使用批标准化层。卷积层作为输出层,filters设置为1,kernels设置为(3,3),并采用sigmoid激活函数。ConvLSTM 层层数和filters 参数是影响模型预测准确度和训练时长的关键参数,为选择最佳的参数设置,设置了多种参数组合,ConvLSTM 层层数的搜索范围是2 ~4,filters 参数在[64,128]中取值。采用随机搜索算法确定上述参数值,最终确定ConvLSTM层为3 层,filters参数值为64。

2.2 仿真结果分析

为对预测性能进行对比分析,选取以下几种基于数理统计的模型、传统机器学习模型以及只能提取交通流时间相关性的深度学习模型与STE-ConvLSTM模型比较:ARIMA、SVR、CNN1D、LSTM、CNN-GRU 和CNN-LSTM。

(1)拟合曲线。利用STE-ConvLSTM 模型、只考虑时空特性的ST-ConvLSTM 模型和6 种传统交通流预测模型ARIMA、SVR、LSTM、CNN、CNN-LSTM 和CNN-GRU,对数据样本进行预测。图5 所示为2016-10-24 高速公路收费站1_0 和2_0 方向4 种深度学习模型预测值与交通流量真实值的拟合曲线,其中,纵坐标为20 min 采样周期的交通流量值。从2 个方向拟合曲线可见,本文的ST-ConvLSTM 模型和STEConvLSTM模型在交通流波峰和波谷时间范围内的拟合效果均要优于其他深度学习模型。

图5 不同模型拟合效果

(2)模型评价指标对比。交通流预测属于回归预测任务,采用平均绝对误差(Mean Absolute Error,MAE)和均方根误差(Root Mean Squared Error,RMSE)作为模型预测效果的评估指标,用于分析不同模型的交通流预测仿真结果。结果见表1,表中列出了本文所提出的STE-ConvLSTM模型与ARIMA、SVR、LSTM、CNN、CNN-LSTM、CNN-GRU 和ST-ConvLSTM 模型的误差指标MAE和RMSE 的对比。由于数据集中速度只有驶入高速公路的数据,所以STE-ConvLSTM 模型只有3 个预测值。由表1 可见,传统的数理统计模型ARIMA,难以学习时空数据的复杂关联性,预测误差较大;传统机器学习模型SVM和深度学习模型可自主学习数据的复杂特征,使预测误差大幅降低,表现出更好的预测效果;关注交通流时空相关性的STConvLSTM模型预测准确性高于其他只考虑时间相关性的传统预测模型,预测效果整体提升,且可利用Conv2D层实现多变量多步输出;考虑天气、交通速度等外部因素STE-ConvLSTM模型,相较于ST-ConvLSTM模型,各收费站的预测误差整体下降,表现出更好的性能。

表1 模型评价指标对比

为进一步验证高速公路交通流受天气、速度等外界因素的影响以及STE-ConvLSTM模型和数据建模方式的优越性,将交通流、天气、速度数据延空间维度排列处理成时空矩阵输入基准模型进行预测,计算误差,并与将各类时空序列数据处理为类图像时间序列数据输入STE-ConvLSTM 模型的误差结果对比,结果见表2。根据表1、2 的结果对比可见,融合外部因素的模型预测效果优于只考虑交通流数据的模型;STEConvLSTM模型以及数据建模方式相较于将交通流与外部因素融合为时空矩阵输入基线深度学习模型,能更好地提取、融合各类时空数据的特征和非线性关系,所以交通流的预测精度有所提高。

表2 加入外界因素后模型评价指标对比

3 结 语

针对交通流具有随机性、时空关联性等复杂特性且易受到外部因素影响的特点,将时空序列数据通过滑动窗口的方法转化成类图像数据构成的时间序列,采用深度学习方法,构建基于ConvLSTM 网络的模型框架。仿真结果表明,考虑外部因素可提高交通流预测的准确性,且与基准模型相比,本文提出的STEConvLSTM模型使交通流的预测准确度明显提高。本文的仿真结论如下:

(1)就交通流预测效果而言,深度学习模型由于能学习大规模数据的复杂特征,其性能优于传统机器学习模型和数理统计模型。

(2)ConvLSTM网络可以更好地学习高速公路交通流的时空关联性,提高预测的准确性。

(3)通过将其他与交通流相关的时空序列数据与交通流数据延深度方向堆叠,构建类图像时间序列数据的方式,可更好地提取、融合不同数据的特征,提升预测效果。

基于深度学习模型,融合其他影响因素进行交通流预测,预测准确度较高,可为交通管理部门科学决策提供新的技术依据。在后续研究中,将开展高速公路路网级别的流量预测,构建能处理海量、高维数据的可扩展模型。

猜你喜欢
交通流收费站滑动
江苏20个高速收费站实施“准自由流”改造
浙江首个“云收费站”投用
基于Spark的高速收费站大数据系统的设计与实现
基于加权组合模型的短时交通流预测研究
一种平稳化短时交通流预测方法
一种新型滑动叉拉花键夹具
Big Little lies: No One Is Perfect
一种收费站排队模型的模拟实现
交通流随机行为的研究进展
路内停车对交通流延误影响的定量分析