基于多源浮动车数据融合的道路交通运行评估

2018-02-08 05:21张红军陈小鸿
关键词:样本量浮动车速

孙 超, 张红军, 陈小鸿

(1.同济大学 道路与交通工程教育部重点实验室,上海 201804;2.深圳市城市交通规划设计研究中心有限公司,深圳市交通信息与交通工程重点实验室 广东 深圳 518021;3.美国加州大学戴维斯分校,土木与环境工程学院,戴维斯 95616,美国)

浮动车(floating car)是伴随着智能交通应用而发展起来的新型交通信息采集手段,它是指安装有全球定位系统(GPS)定位模块和无线通信模块的普通车辆,能实现较高精度的卫星定位并实时将位置信息传送到服务器数据中心.由于具备运营时间长、道路覆盖面广、便于集中管理等显著优点,出租车浮动车数据(floating car data,FCD)已经在北京、上海、广州等城市道路交通运行状况评价中得到了广泛应用[1-2].但是,完全依托出租车GPS数据存在数据源单一、样本量偏少、空间分布不均衡、覆盖度不足等问题,一定程度上影响了道路交通运行评估的精度和可靠性,不利于全面掌握交通运行状况和变化态势.为此,部分学者探索了面向道路交通运行状况评价的多源数据融合方法.Chris Bachmann等[3]采用线圈检测数据和视频监控数据等多源数据融合技术来推算高速公路运行车速,提高了车速估计的精度;Nour-Eddin El Faouzi等[4]提出采用GPS和车牌识别等多源数据融合方法推算旅行时间;李慧兵等[5]融合了线圈数据和浮动车数据,获得了更高精度的路段平均行程时间估计值;李嘉等[6]构建了基于浮动车GPS数据、微波检测数据的行程时间预测融合模型;赵莹[7]基于北京浮动车和微波检测数据,采用优化反向传输(back propagation,BP)神经网络融合模型对城市快速路区间车速进行推算;魏敏燕[8]基于出租车和公交车两种浮动车数据融合方法进行城市道路交通状态判别;张旭[9]以北京浮动车数据、微波检测器数据以及车牌识别数据这三种异质交通流数据,基于BP神经网络数据融合模型进行交通运行状态评价;张昕等[10]基于深圳定点数据和浮动车数据等多源数据融合,提出一种基于推理和支持向量机的数据融合算法.

随着移动互联网和大数据时代的到来,基于百度高德地图、浮动车GPS的大数据融合挖掘将解决目前出租车GPS覆盖范围和数据质量不足的问题,大大提高了交通运行评估的精度和可靠性,同时将减少线圈、视频、微波等外场设备的投资建设和依赖.以深圳为例,深圳全天拥有1.5万辆稳定出租车浮动车,但空间分布不均,尤其原特区外覆盖不足,同时由于数据传输等原因,可能存在数据量剧减或数据中断的情形;百度高德地图导航定位数据在全市范围内分布均匀,白天至少拥有1.5万台设备,定位频率能达到秒级响应,但存在时间分布不均的问题;公交车在全市范围内分布均匀,白天拥有1.2万辆浮动车,但存在时间分布不均及由于公交进出站特性需要进行速度修正的问题,见表1.通常情况下,可直接利用车牌识别数据计算得到实际车速,深圳设有304个车牌识别点,由于总体数量有限和空间分布不均,只能直接获取少数主要道路真实车速.出租车、百度、公交车等数据源同属于浮动车数据,数据存在互补且获取容易,为新时期道路交通运行状况评估提供了可行办法.本文面向道路运行评估和拥堵管理,提出一种基于出租车、百度、公交车多源FCD数据融合的道路交通运行评估方法,将为政府规划决策、市民出行选择和技术人员分析等提供重要支持.

表1可用于道路运行评估的深圳多源交通数据优缺点比较

Tab.1Comparisonoftheadvantagesanddisadvantagesofmulti-sourcedatausedinroadoperationassessmentinShenzhen

数据源优点缺点出租车24h运营,全天稳定1.5万辆,频率15s,原特区内覆盖充足,涵盖各种出行目的空间分布不均,原特区外覆盖不足,由于数据传输等原因,可能存在数据量剧减或数据中断的情形百度百度手机导航数据在全市范围内分布均匀,白天1.5万台设备,频率1~1.5s时间分布不均,夜间数据覆盖不足(凌晨仅有2000台设备上传数据)高德同百度,但在线设备量较少同百度公交车全市范围内分布均匀,白天1.2万辆,频率15s时间分布不均,夜间数据覆盖不足,速度需修正车牌识别全市范围内分布304个车牌识别点,可用于主要道路实际车速计算总体数量有限,只能直接获取少数主要道路实际车速,且空间分布不均,原特区外覆盖不足手机信令时空分布均匀,百万级别设备量基站覆盖范围大,较少用于城市道路状态判别

1 交通运行指数算法

1.1 评估指标及指数定义

近年来,发达国家交通管理部门和研究机构开展了大量的交通拥堵评价相关研究.美国、欧洲、日本等建立了比较完善的拥堵评价指标体系,如美国的畅通性研究报告(mobility report)[11]和交通拥堵评价系统(congestion management system,CMS)[12],日本道路公团从交通拥堵在时间和空间的分布状态出发,提出了道路交通拥堵评价指标[13],包括行程车速、排队长度和拥堵持续时间.国内公安部和建设部制订了城市道路交通管理评价体系,近年来积累了有关交通拥堵评价的经验.美国等西方国家,以及上海、北京等国内大城市先后提出了不同的交通指数定义和算法,其中美国道路拥堵指数(roadway congestion index,RCI)[14]基于道路交通密度定义,上海道路交通指数(road traffic index,RTI)[1]以行驶速度及道路交通负荷度为基础基于综合评价方法定义,北京交通拥堵指数(traffic congestion index,TCI)[15]基于拥堵里程比例定义,广州与北京的指标类似.

深圳交通运行指数(traffic performance index,TPI)[16]是一种基于出行时间比的交通运行指数,取值范围为0~5,分为畅通(0~1)、基本畅通(1~2)、缓行(2~3)、轻度拥堵(3~4)和拥堵(4~5)等五个等级(颜色逐渐加深),见表2.

表2 深圳市道路交通运行指数分级

其中,出行时间比是路段或路网实际行程时间与期望行程时间的比值,表征当前路况下相比期望车速情形下多花费的时间.在此基础上通过实际调查和专家打分,建立行程时间比与交通运行指数的换算关系.国内外主要地区和城市的交通运行指数定义方法、关键参数和特点见表3.

表3 交通运行指数定义方法比较

1.2 基于出行时间的指数算法

根据深圳交通运行指数的定义范围和等级划分,基于大量历史计算结果和实地调查,建立行程时间比与交通运行指数(TPI,以TPI表示)的换算关系.

TPI=F(RT)

(1)

设路网中共有n个路段,路段k的长度为lk、流量为qk,实际行程时间和期望行程时间分别为tk、tdk;实际速度与期望速度分别为vk、vdk,则行程时间比为

(2)

通过在深圳的大量实地调查评分,研究行程时间比与交通运行指数之间的换算关系.在路段层面,两者线性回归关系如图1所示,与《美国道路通行能力手册》(2000 年版)[17]的对应关系相似.图1中,v,vd与式(2)中vk,vdk含义相同,只是不特定指某个路段. 在路网层面,两者线性回归关系如图2所示.

图1 路段行程时间比与交通指数关系

Fig.1Relationsbetweenthetravellingtimeratioandtrafficindexforroadsection

图2 路网行程时间比与交通指数关系

Fig.2Relationsbetweenthetravellingtimeratioandtrafficindexforroadnetwork

其中路段交通运行指数:

TPI,link=Fl(RTlink)=

(3)

式中:TPI,link为路段交通运行指数;RTlink为特定时段内路段行程时间比.

路网交通运行指数:

TPI,net=Fn(Rnet)=

(4)

式中:TPI,net为路网交通运行指数;Rnet为特定时段内路网行程时间比.

2 多源浮动车数据融合算法

2.1 数据融合规则

基于融合因子采用决策级融合机制,对不同区域(片区)不同道路等级每个精细化路段细分出每种数据源的计算结果和融合结果,用于支持横向对比.对每种数据源的融合引入融合参数实现决策级融合,参数维度大类分为时间和空间维度,取一定时间段(如一个月)的数据进行训练标定,得到6 300个融合因子.多源数据融合因子见表4.多源FCD数据融合框架如图3所示.

表4 多源数据融合因子

图3 基于多源FCD的数据融合框架

Fig.3Datafusionframeworkbasedonmulti-sourceFCDdata

将出租车、百度导航及公交车三种FCD数据源纳入数据融合,建立融合规则如下.

首先是数据重要度排序规则.根据不同数据源计算结果比较,出租车车速>车牌识别车速(作为实际车速,下同)>百度导航车速>公交车速,其中出租车速度平均比车牌识别速度高3%~5%,百度导航车路平均比车牌识别速度低5%~10%,公交车速度平均比车牌识别车速低30%~35%.因此在单种数据源样本量足够的条件下,数据重要度排序方面,出租车优先于百度优先于公交车.

其次是数据样本量确定规则.根据与车牌识别

车速的测试精度要求,确定不同情况下融合的样本量参数:当路段出租车浮动车样本量不小于3,只考虑出租车浮动车数据源,根据与车牌识别车速测试比较分析,平均误差可控制在3%以内;当路段出租车浮动车样本量小于3,且出租车+百度浮动车样本量不小于4时,只考虑与百度浮动车数据的融合,根据与车牌识别车速测试比较分析,平均误差可控制在5%以内;其他情况纳入三者融合.

最后是时间规则.00:00~07:00时段,大部分公交车停止运营或处于非正常运营状态,此时公交车浮动车数据不纳入融合.

2.2 数据融合算法

道路交通运行指数以固定时间长度为周期进行计算,且时间周期长度远大于出租车、百度和公交车三类浮动车GPS的采样周期,因此在一个时间周期内一辆浮动车可能存在多条采样数据,为避免不同车辆的采样数据长度不同引起的指数计算偏差,采用平均法进行取值.以出租车浮动车为例,假设一个时间周期Δt内出租车i在某一个路段有j条采样记录,那么在该时间周期内该浮动车平均车速为

(5)

假设在时间周期Δt内出租车浮动车的数量为N,在该时间周期内出租车浮动车的行驶速度为

(6)

同时,假设出租车浮动车在一个时间周期Δt内的行驶长度为l,根据N辆车在时间周期Δt内的GPS数据可以计算出租车的行驶长度ltaxi.同理,可以求解一个时间周期Δt内百度和公交车浮动车的行驶速度分别为vbaidu,vbus,行驶长度分别为lbaidu,lbus.

基于上述融合规则,建立如下动态加权融合算法:

(7)

ifNtaxi≥3, thenktaxi=1,kbaidu=0,kbus=0

ifNtaxi<3,Ntaxi+Nbaidu≥4, thenktaxi=1,

kbaidu=1,kbus=0

elsektaxi=1,kbaidu=1,kbus=1

if time∈(0:00-7:00),kbus=0

式中:vfusion为多源浮动车数据融合后的行程车速;v为某一种浮动车数据计算得到的行程车速;F为融合因子;l为某一类车辆在当前路段行驶的长度之和;k为控制参数,ktaxi,kbaidu,kbus分别是指出租车、百度浮动车和公交车浮动车数据源是否加入融合(1或0);Ntaxi,Nbaidu,Nbus为当前路段行驶过的出租车、百度浮动车和公交车浮动车的车辆数.

3 融合效果分析及应用方向

以深圳2016年3月浮动车数据为例,根据融合结果,全市范围内使用纯出租车浮动车数据的占6%,使用出租车+百度浮动车数据融合的占10%,使用出租车+百度+公交车三种浮动车数据融合的占84%;中心城区范围内使用纯出租车浮动车数据的占14%,使用出租车+百度浮动车数据融合的占12%,使用三种浮动车数据融合的占73%.

3.1 融合效果分析

3.1.1结果精度分析

数据融合后,结果精度有所提高,融合后车速相比其他单一数据源与实际车速误差最小.以深圳北环大道(东西向城市快速路)某工作日(2016年3月24日)为例,多源浮动车数据融合后车速更接近实际车速,平均误差在3%以内,如图4所示.

图4 城市快速路车速对比(以北环大道为例)

Fig.4Speedcomparisonofurbanexpressway(takenorthcentralavenueasanexample)

3.1.2数据覆盖率分析

这里定义覆盖率为数据匹配到的路段数占所有

路段数的比例.根据融合结果,全市整体浮动车覆盖率从32%提升至77%,原特区内福田、罗湖、南山三区平均覆盖率从75%提升至81%;原特区外提升更为显著,其中宝安区(从17%提升至73%)、龙华新区(从41%提升至88%)、龙岗区(从24%提升至75%)、光明新区(从2%提升至67%)、坪山新区(从3%提升至62%)和大鹏新区(从1%提升至43%).三种浮动车数据分布如图5所示,出租车浮动车数据分布如图6所示,融合后覆盖道路情况如图7所示.图7表示了白天时段(17:00~20:00)每5 min对次干道及以上级别道路的平均覆盖率.

图5 出租车、百度导航、公交浮动车分布

图6 出租车、浮动车分布

图7 多源FCD数据融合后道路覆盖情况

3.1.3数据可靠性分析

三种FCD数据互补,数据可靠性得到提高.在高时间分辨率下,融合后的速度、指数时间序列趋于平稳.融合后,白天时段匹配成功的路段Link数量为出租车的2.5倍,解决了因出租车数据传输不稳定、数据量不足导致的异常大幅度波动情况.以某工作日(2016年3月24日)为例,多源FCD数据融合后匹配道路变化情况(每5 min)如图8所示.

图8 FCD数据融合后匹配道路情况

3.1.4样本量分析

增加多源浮动车数据后,尤其引入百度手机导航数据后,样本量大幅提升,准确率大幅提高.根据统计,百度市场份额约70%,依赖庞大的数据量,在市场主流的手机应用程序(Application,简称APP)中,百度路况覆盖度最高、准确率最高.与出租车同期匹配的路段情况对比,融合后样本量有提升的路段比例为76%,原先低样本(仅有1~3辆车经过)情况下有显著提升的比率超过65%.数据融合后不同浮动车样本量的提升比例分布如图9所示.

图9 数据融合后不同浮动车样本量的提升比例分布

3.2 主要应用方向

本文提出的道路运行评估方法可为拥堵路段排查治理及拥堵机理分析、交通需求管理、重大交通政策、重大交通事件评估等提供重要决策支持.

3.2.1拥堵路段排查治理及拥堵机理分析

以深圳为例,通过拥堵等级的时长和频率,排查得出2016年深圳全市常发拥堵路段249段,总拥堵里程345.4 km,为针对性开展交通拥堵治理起到重要支撑作用.再者,利用交通运行指数的实时变化情况,统计评估一定范围内各拥堵等级的持续时间,分析拥堵形成及消散机理.对于特定道路路段,可通过拥堵时空图综合全面地反映评估路段上交通拥堵在时空的分布及衍变情况,为研究拥堵产生和扩散机理提供了很好的技术手段.

3.2.2停车收费等需求管理政策评估

以深圳为例,在已实施的路内停车收费的基础上建立路内停车收费费率与交通运行的动态调节机制,实现动态评估路内停车收费等需求管理政策实施效果并根据实施效果对停车收费方案进行动态调整,保障道路运行维持在合理水平.根据评估,深圳2014年中心城区实施路内停车收费政策后,四个试点片区工作日晚高峰平均车速增幅3.2 km·h-1,上升约13%.

3.2.3重大事件评估

利用本文提出的道路运行评估方法评估重大事件(如交通基建开通、特殊天气、大型活动等)对道路交通运行状况的影响,辅助政府重大政策和管理措施制定.以深圳轨道三期7、9号线为例,开通前后全市平均车速增幅约7.3%,7、9号线沿线片区平均车速增幅约8.9%.

4 结语

针对当前出租车FCD覆盖范围和数据质量不足的问题,本文引入百度手机导航和公交车GPS数据,面向道路运行评估和拥堵管理提出了基于出行时间的交通运行指数算法和一种基于出租车、百度、公交车多源FCD数据融合的道路交通运行评估方法,构建了多源数据融合规则和融合算法.在融合规则方面,充分考虑了三种数据源的特点,从数据重要度排序、数据样本量确定及时间方面制定了融合规则及相关参数确定的原则,能够满足测试精度要求.在融合算法设计方面,在融合规则指导下,建立了动态加权融合算法.以深圳为例进行了融合效果分析,结果表明本文提出的多源数据融合方法效果显著,很大程度上提高了融合结果精度、数据覆盖率、数据可靠性和数据样本量,最后在拥堵路段排查治理及拥堵机理分析、交通需求管理、重大交通政策、重大交通事件评估等方面给出了初步应用及效果分析.

相比传统基于出租车的交通运行指数算法及其他异质交通数据融合方法,本文构建的多源浮动车数据融合方法大大提高了交通运行评估的精度和可靠性,具有数据获取容易、算法可移植性强、不依赖外场硬件设备的突出优点.后续研究和应用中可考虑进一步拓展数据来源(如滴滴网约车浮动车数据),优化数据融合算法进一步提高道路运行车速、运行指数计算的准确性,为城市道路交通运行评估和交通管理工作奠定基础.

[1] 魏正明.上海推出交通指数评价运行质量[J].上海环境科学, 2002,21(9):556.

WEI Zhengming. Shanghai launched traffic index evaluation operation quality[J]. Shanghai Environmental Sciences, 2002,21(9):556.

[2] 章威,徐建闽,王海峰.基于浮动车技术的城市路况计算方法[J].交通运输系统工程与信息, 2007,7(1):43.

ZHANG Wei, XU Jianmin, WANG Haifeng. Urban traffic situation evaluation methods based on probe vehicle data[J]. Journal of Transportation Systems Engineering and Information Technology, 2007,7(1):43.

[3] BACHMANN C, ADBULHAI B, ROORDA M J,etal. A comparative assessment of multi-sensor data fusion techniques for freeway traffic speed estimation using microsimulation modeling[J]. Transportation Research Part C, 2013,26(1):33.

[4] FAOUZI N E E, KLEIN L A. Data fusion for ITS: techniques and research needs[J]. Transportation Research Procedia, 2016(15):495.

[5] 李慧兵,杨晓光.面向浮动车取样偏差修正的数据融合方法[J].同济大学学报(自然科学版),2012,40(10):1498.

LI Huibing, YANG Xiaoguang. Data fusion method on modifying sampling bias of floating cars[J]. Journal of Tongji University (Natural Science), 2012,40(10):1498.

[6] 李嘉,刘春华,胡赛阳,等. 基于交通数据融合技术的行程时间预测模型[J]. 湖南大学学报(自然科学版),2014,41(1):33.

LI Jia, LIU Chunhua, HU Saiyang,etal. A travel time prediction model based on traffic data fusion technology[J].Journal of Hunan University (Natural Science),2014,41(1):33.

[7] 赵莹.基于多源检测器的城市快速路区间车速融合算法研究[D].北京:北京交通大学,2016.

ZHAO Ying. Study on interval speed fusion algorithm of urban expressway based on multi-source detectors[D]. Beijing: Beijing Jiaotong University,2016.

[8] 魏敏燕.异种浮动车数据融合的城市道路交通状态判别及时空分析[D].重庆:重庆大学,2016.

WEI Haiyan. Study on urban road traffic state identification and spatio-temporal characteristics based on different types of floating car data fusion[D]. Chongqing: Chongqing University,2016.

[9] 张旭.面向交通运行状态评价的多源异质交通流数据融合技术方法研究[D].北京:北京交通大学,2008.

ZHANG Xu. Fusion of multi-source heterogeneous traffic flow data for the assessment of traffic operational conditions[D].Beijing: Beijing Jiaotong University,2008.

[10] 张昕,关志超,胡斌.实时动态交通信息服务的数据融合技术研究[C]//2008第四届中国智能交通年会论文集.青岛:中国智能交通协会,2008(9):902-908.

ZHANG Xin, GUAN Zhichao, HU Bin. Research on data fusion technology for real-time traffic information service[C]//2008 Fourth China Intelligent Transportation Symposium. Qingdao: China Intelligent Transportation Association,2008(9):902-908.

[11] Texas Transportation Institute 3135 TAMU, Cambridge Systematics. Current conditions and trends from archived operation data[R]. Columbus: Monitoring Urban Freeways,2004.

[12] Texas Transportation Institute 3135 TAMU, Cambridge Systematics. Congestion and reliability using archived traffic detector data[R]. Columbus: Lessons Learned,2004.

[13] Schrank D, Lomax T. 2011 Urban mobility report[R]. Texas: Texas Transportation Institute, The Texas A & M University System, 2011.

[14] Turner S, Margiotta R, Lomax T. Lessons Learned: monitoring highway congestion and reliability using archived traffic detector data[R].Texas: Texas Transportation Institute, The Texas A & M University System, 2004.

[15] 北京市质量监督局.城市道路交通拥堵评价指标体系(征求意见稿)[S].北京:北京市质量监督局,2010.

Beijing Municipal Bureau of Quality Supervision. Urban road traffic congestion evaluation system[S]. Beijing: Beijing Municipal Bureau of Quality Supervision,2010.

[16] 陈蔚,段仲渊,周子益,等.基于出行时间的道路交通运行指数算法与应用研究[C]//中国城市交通规划2012年年会论文集.福州:中国城市交通规划学术委员会, 2012:1703-1711.

CHEN Wei, DUAN Zhongyuan, ZHOU Ziyi,etal. Traffic Performance Index Algorithms and Applications Study based on road traffic travel time[C]//Chinese Urban Transportation Planning 2012 Annual Conference Proceedings. Fuzhou: Chinese Urban Transportation Planning Academic committee, 2012:1703-1711.

[17] Transportation Research Board, Highway Capacity Manual[M]. Washington D C: Transportation Research Board, 2000.

猜你喜欢
样本量浮动车速
一种基于进化算法的概化理论最佳样本量估计新方法:兼与三种传统方法比较*
电连接器柔性浮动工装在机械寿命中的运用
医学研究中样本量的选择
论资本账户有限开放与人民币汇率浮动管理
样本量估计及其在nQuery和SAS软件上的实现*——均数比较(十一)
样本量估计及其在nQuery和SAS软件上的实现*——均数比较(十)
2012款奔驰R300车修改最高车速限制
带有浮动机构的曲轴孔镗刀应用研究
CSS层叠样式表浮动与清除浮动技术研究
跑跑卡丁车