基于算法确定交叉路口交通特征参数

2019-07-21 06:15詹启亮
建材发展导向 2019年17期
关键词:交叉路口交通量数据源

詹启亮 王 亮

(中机中联工程有限公司,重庆 400039)

关键字:交通预测;交通流;交通量;数学模型

近年来,应用数学算法研究不断地创新发展,可解决因车辆大幅度增长带来的交通问题,为道路的使用者和交通管理部门提供重要信息,以便更好的做出决策,还有助于改善交通网络规划[2]。

1 数据来源

为实现对交叉路口交通预测的准确性,必须使用多个数据源协同完成。从交通量数据源提取时间、日期、交通量、白天或黑夜、高峰与非高峰等,从交通事故数据源提取事故编码,位置坐标、道路编码、时间、事故类型、路面状况、天气情况等,从道路施工维护数据源提取位置坐标、工作类型等[4]。

2 确定特征

列出以下主控参数:

日期:交通流在不同日期表现不同

时间:不同时间段有不同的表征

是否工作日:周末周内交通模式不同

是否交通峰值:决定交通流变化

昼夜:交通流量显著变化点

事件距离:事件距离交叉路口的影响

3 算法介绍

包括三种算法:梯度提升回归、随机森林、极值梯度树算法,以下为三种算法介绍:

3.1 梯度提升回归算法

F(x) 用来估计等式计算的平均误差,对于每一个回归树,将输入空间划分为M个区域m1,m2,…mm,并对每一个区域,预测一个恒定值pm。

其中I=1,如果x∉mi,则I=0,pikI是区域m1,m2,…mm,的预测值,通过应用更新数据,回归迭代每一次得到的数据,以下等式描述了更新后的似然函数和回归步长:

修改模型参数,将mi,pik忽略,使得到的yik为每一个区域内的最佳值:

该算法用分阶段来构建模型,在数据每次更改时,通过最小化损失函数来更新模型,使用回归手段来避免过度的拟合,使每一个模型使用0-1 的值控制结果输出。

当ν 值很小时,获得最佳收缩,可以减少每次迭代时的函数损失。

数学算法模型 日期 时间 是否工作日 是否峰值 是否昼夜 事件距离梯度提升回归 0.3636 0.1340 0.1130 0.0137 0.0903 0.2854随机森林 0.1310 0.0263 0.0412 0.0004 0.6272 0.1743极值梯度树 0.3592 0.2078 0.1690 0.0227 0.0276 0.2137

3.2 随机森林算法

该方法的程序为输入n维向量(x),通过计算输出n预测(y) 重新采样以后,选择随机的数据点替换原有的数据信息,并标记未选择的备用,利用所选择的数据集构建成完全成长的树系统而不进行修剪,在每一个节点拆分时,选择随机特征值中的最佳特征值进行拆分,直到不再有拆分为止。不断进行重复,直到得到每个树的输出值,通过取平均值得到最终的输出(y),

其中x是输出样本集,hj(x)是第j个树的输出值。

3.3 极值梯度树算法

此算法是种可扩展的机器学习系统,算法的运行速度比普通机器学习算法的速度快很多,可有效的并行处理数十亿个数据。实际问题中常常出现数据的丢失,此算法对于丢失的数据,算法将默认方向并添加到树的每一个节点中,计算所处理数据集的最佳值。第二个功能是使用列快进行并行学习计算,以称为块的内存单元进行压缩列格式存储数据。每列都根据特征值进行排序计算[3]。

4 研究结果

从表中可以看出,事件距离占模型一总特征的28.54%,模型二占17.43%。模型三占21.37%,因模型二随机性较大,所以参考价值较低。从表格中也可以发现模型中最不重要的特征参数是时间是否在高峰时段,模型一,模型二和模型三的结果分别为1.37%,0.004%和2.27%。与以往数据模型相比较,添加事件距离此特征参数可以提高在交叉路口附近交通量预测的准确性。

5 结语

本文基于交通事故和道路工程在交叉路口影响交通模式的事实,提出了增加不同特征参数来预测交叉口交通量的新方法。结果表明提出增加事故发生地点距交叉路口的距离,能有效减少预测误差。

猜你喜欢
交叉路口交通量数据源
基于ETC门架数据的高速公路交通量转换探究
高PG等级沥青及其混合料在交叉路口中的应用研究
基于动态差法的交通量监测技术应用
Web 大数据系统数据源选择*
高速公路补偿交通量模型研究
基于不同网络数据源的期刊评价研究
基于四阶段法的公路交通量预测研究
无人驾驶汽车在交叉路口的避障规划
基于农村主路交叉路口优先右转汽车的碰撞预警系统初步设计
基于真值发现的冲突数据源质量评价算法