基于时空特征信息的交通流状态辨别研究

2020-07-14 10:53翁小雄张腾月
公路工程 2020年3期
关键词:交通流收费站密度

王 莉,翁小雄,张腾月

(华南理工大学 土木与交通学院,广东 广州 510640)

高速公路的收费业务数据中潜藏着有关车辆的周转状态和行驶特性等丰富的数据内容,从这些数据信息中还原车辆的驾驶路线,提取相关参数,这给予后续的状态判别研究以扎实的数据基础。

纵观国外方面,GREENSHIELDS[1]研究速度与密度联系,得到了线性相关的结论,并绘制出其关联图。EDIE[2]在密度稀疏区和稠密区分别采用Underwood的速度-密度模型和Greenberg模型[3]。KERNER[4]通过车流变现出来的相表征对交通流状况进行识别。LV[5]在交通流预测中融入了自编码算法。KUREMOTO[6]构建了RBM与DBN相结合的预测模型。国内方面,对交通流状态识别模型和算法的研究也已经相对完善,用于研究的算法大致有这几类:①基于神经网络技术:刘聪聪[7]在对过往的数据进行分析时,把小波神经网络与遗传算法相结合,研究得出交通状态参数与交通状态的联系。②基于模糊理论技术:黄艳国[8]等将各状态数据的离散变化为参考基准,增加了历史先验数据和交通流数据,采用FCM算法的空间位阻概率,把传统的欧几里得距离替换为对多维度数据与空间分布更加敏锐的马哈拉诺比斯距离,实例证明该方法的识别结果更加准确。杨庆芳[9]等在交通状态判别中应用模糊C均值,并使用Vissim工具进行模拟。③基于参数融合技术:丁恒[10]等采用聚类算法修正了路网的状态参数,在此基础上,考虑干线交通流、匝道组合形式及邻近地面路网条件对高速公路的影响,建立了基于流量与速度关系的状态识别模型。韩坤林[11]等将融合了多源数据提出了一种融合异常状态识别方法。

当下已有的大多数研究文献中在对交通流的参数预测和状态识别方面具有一定的局限性,就是其内部运行机理无法从表象探知,而本文采用的基于出行车辆时空信息特征推断交通状态参数的方法是建立在数学模型的基础上融入外部交通流的时空特征信息,由外而内的揭示交通流从现象到本质的原理。

1 交通流原理

交通流理论是研究流量、速度和密度等重要参数之间联系的理论知识[12]。交通参数可以照见路面交通的变化状况。其中,流量是指一定时域范围途经某断面或车道的机动车数量[13]。在实际应用中流量总是伴随着其他交通流参数一起出现,主要是因为道路服务水平不仅受到流量大小的影响,还受到其他因素的控制。速度在交通流状态判别方面,较常用的是时间平均速度这一概念,是衡量路段拥堵状况的物理量,它可以更直观地映现交通流量周转状态的问题。在城市道路管理中,由于密度参数难以测量,时间占有率常常被用来替代密度这一参数对交通状态进行评估。

除了上述描述的要素,其实还受到诸多或外在、或内在等因素的影响,在时间维度和空间维度方面不断地处于一种动态的过程。这种动态变化会打破原有的平衡状态,不断产生新的交通流状态,一旦路面车流量过饱和将会产生拥堵等异常状况,这就产生了本次论文的研究动机。

2 数据处理

从电子收费系统获取的数据,聚集了海量的数据信息,其数据结构主要由IC卡编号、入口站编号、入口日期及时间、入口车牌号码、入口客货标识、出口站编号、出口日期及时间、行驶里程、轴数、总轴重、总轴限、各轴轴重、超限重量等属性组成。由于采集数据的集成、存储、传输等过程的不稳定性导致数据存在缺失、异常等问题,所以需要对数据进行预处理。

针对数据缺失这一问题需要进行如下还原修复处理:①计算公式中单一字段属性值缺失。例如总轴重等于总轴限与超限重量之和,或者是轴数与各轴轴重之积。对于公式中缺少3个字段属性之一的情况,可以通过上述公式进行信息补全操作。②当车辆的出入口信息出现不一致的问题时,以出口信息为准,主要是因为入口信息由机器设备判断,存在误差,出口信息由人工检验,可对其进行纠正。③针对数据明显异常这一问题需要进行剔除处理。剔除原则是在计算车辆行驶时间和速度时,通过离群值处理方法对出、入口日期及时间严重偏离正常值的数据进行剔除操作,但是在计算路段车流量和密度时需要保留该异常数据。在通过上述方法处理数据后,再从中随机选取部分数据进行检验,如果核验数据依旧存在问题,则返回初始步骤重新处理。研究过程如图1所示。

图1 研究过程

3 基于时空特征信息的模型

3.1 模型思想

基于高速公路上运行车辆出行时间和空间位置等特征信息的模型,其主要思想是分时间分空间的对交通流参量进行求解。首先,对有用数据实行量化处理,并将公路按收费站划分小段,然后,根据具体时间将处于该时间范围内不同空间位置上的车辆分配到具体的各个空间位置上,即当待分配车辆符合一定时间要求的情况下,该空间位置的交通参数属性值增加一个单位量,构造出车辆在不同时间不同空间位置散布的二维矩阵图。最后,根据皮尔逊系数和变异系数的差异,划分出交通流相图。

3.2 模型求解

a.流量。首先,以收费站为分界点对各收费站点从0开始进行编号,将该高速公路分为0~1、1~2、……、k~k+1等不同路段,其示意图2所示。

图2 收费站示意图

当车辆从空间位置0站点驶入,由1点驶离,并在时间上满足条件[t1,t2]的条件时,0~1路段时段的[t1,t2]流量属性值增加一个单位量。同理,当从0处进入,由k+1处离开时,在路段0~k+1的各个空间位置上分别对应的时间范围内流量属性值分别加一个单位量。即起始路段区域0~1上的车流量包含所有从收费站点0进入该高速,出口可以是任何收费站点的车辆;中间路段区域i~i+1上的车流量可以表示为途经路段i-1~i期间的车流量总和Qi-1,i加上从收费站i-1进入的流量,再减去从收费站i-1离开的流量。其表达式见式(1)和式(2):

Q0,1=OD0,1+OD0,2+…+OD0,N=

(1)

(2)

具体情况分析:假设车辆在t时刻进入收费站,在各空间区域的驾驶时间分别为t01、t12、t23,在编号为0的收费站处在匝道上的驾驶时间为tr0。当车辆从0进入1离开,并满足t1

表1 流量分布一Table1 Flowdistributionone0-11-22-3[t1,t2]1[t2,t3][t3,t4]

当某车辆从编号为0的收费站点进入高速,从编号为2的收费站点离开,并满足条件:t1

表2 流量分布二Table2 Flowdistributiontwo0-11-22-3[t1,t2]11[t2,t3][t3,t4]

当上述车辆满足条件:t1

表3 流量分布三Table3 Flowdistributionthree0-11-22-3[t1,t2]1[t2,t3]1[t3,t4]

同理,当该车辆从0点进入3点离开,则需要对条件t+tr0、t+tr0+t01、t+tr0+t01+t12以及所归属得某个时间范围作出判断,并进行不同空间位置不同时间范围的分配,把线路上的车流量全部分配到相对应的空间位置和时间范围。

综上可以得到各个空间区域在不同时间范围内的流量分布矩阵Q,Qi,j表示ti到ti+1这一时间区间内,第j个空间位置的单位时域内所有车子的数量总值。即:

0~1 1~2 … k~k+1

(3)

b.速度。

速度属性值可以由特定的行程长度和对应时域范围的比值来表示[14]`,即:

(4)

不同时域范围相对不同空间位置的平均速度,即:

(5)

0~1 1~2 …k~k+1

(6)

c.密度。

关于密度的求解与上述获取流量的方法步骤同理,主要是基于车辆的时空特征信息在不同空间位置对应不同时间范围属性值的累加,即在某一系列时间范围内于各不同空间位置上的分布情况,使得车子所属空间位置在相应时间范围的密度属性值增加一个单位量,以便求取在统计时间范围内于某一空间区域的全部车辆的散布状况。首先,判断进入收费站的时刻tn距离参考时刻ti+1所需要的时间域ti+1-tn,所归属的高速线路起始和终止时刻对应的时间范围;然后,确定出所有待分配车辆在ti+1时所属空间位置详情;最后,将待求解的空间位置处车辆均值与该空间位置的长度之比定义为统计时段的密度属性值,即:

(7)

其中,ti表示一个周期范围的起始时间;Δt表示测量密度的时间间隔;n的取值范围(1,ti+1/Δt)。

综上,通过对统计周期内所有时间范围的密度进行计算,以统计周期内n个密度属性值求滑动均值作为该统计周期内区间密度的估计值[15]。然后将不同时间范围各空间位置断面密度分布的二维矩阵表示为:

0~1 1~2 …k~k+1

(8)

其中,ki,j表示ti到ti+1时间区间,路段j的平均密度。

d.时间。

入口匝道时间:可以通过测量多个入口匝道获取其里程长xr和等效加速度ar,然后拟合出其函数关系ar=f(lr),则入口匝道所用时间tr如下式所示:

(9)

同理,出匝道所耗时间需要额外的排队时间tp,即:

(10)

则机车在各个空间区域(即由收费站i到j)的行驶时间tij,等于总的行驶时间Tij,去除进入i站点的匝道时间tri和离开j的匝道时间tcj,即:

tij=Tij-tri-tcj

(11)

假设统计周期为[tk,tk+1],进入i站点的时刻是ti,在i处的匝道时间域为tri,则该车辆在统计周期内的行驶时间需要满足tk

0~1 1~2 …k~k+1

(12)

3.3 交通流状态划分步骤

交通流状态参数的阈值主要是对SPSS软件统计出的相关系数进行划分,没有特殊说明的情况下相关系数是指卡尔·皮尔逊系数,其表达式如式(13)所示。变异系数的表达式如式(14),主要用来度量一组变量的离散关系。

(13)

(14)

基于上述理论知识,构建如下交通流相图,具体操作步骤如下:

图3 交通流相图构造程序图

4 实例分析

现以广州市某条高速公路为例,首先将其划分出9个收费站点,示意图如图4所示。

图4 收费站点示意图

各站点空间域距离如表4所示。

表4 各空间域距离Table4 Distanceineachspatialdomain空间域0-11-22-33-4距离50034709035704-55-65-75-818461162456745674

然后,统计连续7 d内各空间域的车流量,以第1 d为例,如表5所示。

表5 各空间域车流量Table5 Trafficflowineachspacedomain0123008616413015380982021633919430030000438741189054575000061167133011527544780109781474206624567826220123169411676601069638000005185015821779664000000074238820909340334789604493452022103128771820

统计可知该天内的收费数据样本共5 185个,统计信息如表6所示。

表6 统计信息Table6 Datasamplestatistics样本总量均值标准差偏度峰度51851093.75291.0388.53679.26

四分位法对上述数据处理后的统计信息见表7。

表7 数据处理后的统计信息Table7 Statisticsafterdataprocessing样本总量均值标准差偏度峰度4914326.4788.7010.606-0.007

基于该高速公路出行车辆的出行特征信息通过分时间分空间模型对该高速公路的交通状态参数进行求解,二维矩阵中一列为一个空间域,一行为一个时域,以15 min为一个统计时域的参考标准,则流密和速密关联图见图5、图6。

图5 流量-密度时序图

图6 速度-密度时序图

从图5可以看出,该特定时空区域下的流量和密度联系呈现出正相关的趋势。在非高峰时域范围对应交通流相图的自由流部分。各个时间域的对应速度通过图6直观地展示出来。

通过对该条高速公路2018年9月2日-8日为期一周的收费数据经过数据处理分析后,基于收费内容中隐藏的车辆时空特征信息利用分时间分空间的方法对其状态参数求解,得出如图7、图8所示的流密散点关联图和速密散点关联图。

图7 流量-密度散点图

图8 速度-密度散点图

通过时空特征信息方式推导出的流量-密度和速度-密度两个散点关联图,两幅图片中展现的点对点关系均非一一对应的关系,从流量-密度的散点图中的自由流状态下,流量和密度呈现强正相关联系,速度和密度之间的相关性不够明显,不过当密度超过某个阈值,速度会产生突变。通过上述理论基础和交通流状态划分步骤对为期一周时间范围内的高速公路收费数据进行处理,得到了图9所示的交通流相图。

图9 交通流相图

图9所示L1和L2区间的深色区域表明该区间的交通流状态属于自由流状态,L2和L3区间的浅色区域表明该区间属于拥挤流状况。从图9可得知,该高速数据的堵塞密度为42 veh/(km·ln)。根据技术标准JTGB 01-2014相关参考规范[16],交通流的堵塞密度近似为41.67 veh/(km·ln)。相对误差0.79%,换言之,该识别方法是有效可行的。

5 结论

文章主要是对某一高速公路进出口数据记录进行研究,通过对原始数据进行处理分析,挖掘出高速公路上运行车辆在时间和空间上的轨迹信息,建立了交通流状态参数的二维矩阵模型,从该模型中可以获取任一车辆在某一空间位置任一时刻的详细信息,即任一空间位置在任意时间范围的交通参数值,并由此推断出当下时刻其他所有车辆的断面分布状况。通过分析获取的交通流量和密度的散点关联图以及速度和密度的散点关联图,最终获得识别交通流状态的相图。鉴于选取的高速公路和样本数据的局限问题,该方法最终只识别出自由流和拥挤流两部分。最后通过实例与标准对比结果表明相对误差0.79%,说明该模型效果良好。

猜你喜欢
交通流收费站密度
基于LSTM的沪渝高速公路短时交通流预测研究
江苏20个高速收费站实施“准自由流”改造
浙江首个“云收费站”投用
京德高速交通流时空特性数字孪生系统
『密度』知识巩固
密度在身边 应用随处见
“玩转”密度
密度应用知多少
基于Spark的高速收费站大数据系统的设计与实现
一种收费站排队模型的模拟实现