基于GPS数据的出租车路径选择行为研究

2015-04-19 08:40姚恩建
交通运输系统工程与信息 2015年1期
关键词:浮动出租车驾驶员

杨 扬,姚恩建*,潘 龙,赵 楠

(1.北京交通大学城市交通复杂理论与技术教育部重点实验室,北京100044;2.北京城市交通协同创新中心,北京100044;3.惠州市住房和城乡规划建设局城市交通规划所,广东,惠州516000)

基于GPS数据的出租车路径选择行为研究

杨 扬1,2,姚恩建*1,2,潘 龙1,赵 楠3

(1.北京交通大学城市交通复杂理论与技术教育部重点实验室,北京100044;2.北京城市交通协同创新中心,北京100044;3.惠州市住房和城乡规划建设局城市交通规划所,广东,惠州516000)

出租车路径选择行为研究对于剖析城市交通流时空分布规律及交通流分配具有重要意义.基于北京市出租车调度系统采集的GPS(Global Positioning System)数据,本文首先通过旅程数据提取、地图匹配及双向扫除算法,构建车辆路径选择行为分析所需的RP(Revealed Preference)数据.其次,在综合考虑道路网络条件和交通条件对驾驶员路径选择行为影响的基础上,构建基于PSL(Path-Size Logit)模型的出租车多路径概率选择模型.案例分析结果表明,出租车驾驶员更倾向于选择旅行时间短、转向次数少、主干路和次干路比例较高的路径.同时,文中所提出的路径选择行为建模方法,对于提高GPS数据的使用价值具有积极的意义.

交通工程;路径选择行为;PSL模型;出租车;GPS数据

1 引 言

车辆路径选择行为建模是分析驾驶员路径选择行为及路网交通流分配的基础.出租车作为城市交通流中重要的组成部分,其路径选择行为会对交通网络的运行产生较大的影响,分析其路径选择行为将有助于分析城市交通流时空分布规律,为交通流分配奠定基础,进而为交通网络的合理设计和管理提供依据.近年来,Yang等[1]和Wong等[2]在分析基于道路网络出租车出行特征的基础上,分别构建了固定需求和弹性需求下的出租车网络均衡模型.马俊来等[3]和边扬等[4]在上述研究的基础上,考虑了出行需求对出租车路径选择行为的影响,构建了城市出租车运营网络平衡模型.四兵锋[5]分析了多方式网络下出租车的路径选择行为.虽然上述研究均对出租车路径选择行为进行了分析,但是并没有实际数据的支持,研究结论难以准确描述实际路网中的出租车路径选择行为.周元锋等[6]通过SP(Stated preference)调查数据分析了VMS(Variable Message Signs)对出租车驾驶员路径选择行为的影响.但是,SP调查结果难以准确反映出租车在真实道路条件下的路径选择结果.因此,基于RP调查数据分析出租车真实环境下的路径选择行为,是对上述研究的有效补充.

随着信息通讯手段的进步和车载导航仪、智能手机等设备的普及,GPS数据的精度日益提高且获取更加容易.通过对GPS数据进行提取和加工能够获得人们真实的出行路径选择数据,其效果等效于对出行者进行了RP调查.因此,许多学者开展了基于GPS数据分析真实条件下车辆路径选择行为的研究.Li[7]基于GPS数据分析了早晨通勤客流的路径选择行为.Mandir等[8]在研究慕尼黑都市圈中驾驶员路径选择行为中,运用C-logit模型构建了基于GPS数据的车辆路径选择模型,以证明交通信息有助于节约出行总时间和总能耗.Hood等[9]和Broach等[10]在研究自行车出行者的路径选择行为中,运用PSL模型构建了基于GPS数据的自行车出行者的路径选择模型,以避免重复路段的影响.

本文基于北京市出租车GPS数据,通过旅程数据提取、地图匹配、K-最短路算法中的双向扫除算法构建路径选择行为分析所需的RP数据.在综合考虑道路条件和交通状态对驾驶员路径选择行为影响的基础上,利用非集计理论构建多路径概率选择模型,分析真实条件下的出租车路径选择行为,探讨各影响因素的影响程度及其相互关系,为小汽车出行路径诱导方案的制定,以及考虑多重因素作用下的交通流分配模型提供重要参考,所提出的建模方法也为完善城市智能交通系统提供帮助.

2 建模方法

2.1 数据采集及预处理

本文所采用的数据主要包括车辆GPS数据、电子地图数据和交通状态数据等三个方面.车辆GPS数据来源于北京浮动车历史数据库中的原始浮动车数据,该数据库采集自北京市出租汽车,原始浮动车数据记录时间为当天0:00–24:00.数据库中一条记录包含了车辆编号、数据采集时间点、浮动车GPS点(Pi)位置、浮动车的行驶速度、行驶方位角、乘客乘车状态和事件信息等.电子地图数据包含了北京市道路的基本属性、道路网的交叉路口点、道路连接点等信息.交通状态数据包含了北京市各条链路全天的平均速度,以5 min为间隔,全天共288条数据.

由于城市中建筑物对信号传输过程的影响,以及GPS测量精度等,造成浮动车在定位时存在较大误差,使得原始浮动车数据中存在一些异常数据,包括定位信息在一段时间内保持不变的无效数据,速度远高于正常行驶速度的异常数据等.上述数据都会对地图匹配精度产生较大影响.因此,在对浮动车数据进行地图匹配前,首先依据以下判断逻辑对异常数据进行排除:

(1)根据道路等级设定浮动车速度的最高阈值(快速路100 km/h;主干道80 km/h;次干道和支路60 km/h).

(2)当前浮动车点到上一个有效浮动车点之间的距离小于30 m时,为了避免GPS数据本身的误差对地图匹配产生干扰,将其视为无效浮动车数据点进行剔除,再计算下一个浮动车点到有效浮动车点之间的距离.

2.2 数据处理

2.2.1 旅程数据提取

浮动车数据中交错记录了出租汽车空驶和载客的全部信息.通常,出租汽车驾驶员采取巡游揽客,空驶时是一种无目的的驾驶行为,不存在强烈的目的性和时间性,并不能反映真实的路径选择结果.相反,驾驶员在载客时目的明确,所选路径是驾驶员和乘客共同意愿的体现.因此在利用原始浮动车数据进行路径选择建模时,需要提取载客运行过程的信息作为分析数据,以避免空驶状态信息对出行路径选择行为研究的影响.在此,将出租车从开始载客直至目的地乘客下车的全过程中所行驶的路径定义为旅程数据.如图1所示,出租汽车按1-2-3-4-5-6-7的顺序行驶,图中圆点表示浮动车位置,空心和实心分别表示出租汽车空驶和载客状态.通过旅程识别,可提取得到出租车的旅程数据,即图中所对应3-4-5-6-7顺序.

2.2.2 地图匹配

由于受到采集频率的限制,相邻浮动车数据点间相距较远且可由多条路径进行串联,单纯依靠浮动车的GPS信息并不能准确反映车辆真实的走行路径.因此,本文采用文献[11]中提出的地图匹配算法对浮动车数据点进行地图匹配,获得旅程的驾驶员所选路径及各组成路段.结果如图2中实线所示.

图1 旅程识别Fig.1 Trip identification

图2 地图匹配结果Fig.2 The travel trajectory based on map matching

2.3 备选路径集生成

作为路径选择行为建模过程中必不可少的环节,备选路径集生成是指针对任一起讫点,确定哪些路径是出行者考虑的备选路径.备选路径集合的大小和组成将严重影响标定路径选择行为模型的准确性[12].典型的备选路径生成算法包括K-最短路算法、链路标记法、链路惩罚法、链路消除法、分支定界法和基于仿真模拟的算法等.但是从算法效率和准确性等方面考虑,只有基于最短路径算法的备选路径生成算法适用于大型的交通网络[9].因此,采用K-最短路算法中执行效率相对较高的双向扫除算法[13](含回路处理)筛选得到每个OD(Origin Destination)对间的K条最短路径,构造得到备选路径集合.考虑到出行者对于出行时间最为敏感,若某条路径的时间超过其最大忍耐值,出行者将不会再考虑该出行路径[14].因此,按照乘客可以忍受的路径时间与最短路径时间的差值(绝对值和相对值)设定可接受的临界阈值,运用非补偿原则确定最终的备选路径集合,并与匹配得到的车辆真实走行路径共同组成路径选择行为分析所需的RP数据.其中绝对差值和相对差值的临界阈值分别取10 min和1.5倍,且只删去均不满足两种阈值的路径.

2.4 模型的构建

传统的MNL(Multinomial Logit)模型因具有IIA(independence of irrelevant alternatives)特性,难以适用于真实的交通路网中.因此,相关学者提出了诸多改进的路径选择模型.按照模型结构可将改进的路径选择模型分为MNL修正模型、基于广义极值理论的离散选择模型和混合Logit模型等三类.由于后两类模型依然存在计算效率低等问题,难以运用于大型的交通网络.相反地,MNL修正模型通过在效用函数中添加表征相似性度量的修正项,克服了由于IIA特性引起的统计误差的同时,继承了MNL模型易于计算的特点,在实践中拥有良好的适用性.因此,本文选择MNL修正模型中的PSL模型(Ben-Akiva&Bierlaire,1999)[15]作为车辆路径选择行为模型的基本框架.

其中PSL模型修正项为

Γk——路径k中路段的集合;

Krs——OD对rs上的路径集合;

RS——所有OD对的集合;

la——路段a的长度;

修正后的效用函数为

β——值为正的参数;

选择概率的计算公式为

3 实例分析

3.1 数据

选取北京市内面积约为10 km×10 km的区域作为研究范围,如图3所示.提取该范围内出租汽车的GPS数据(即原始浮动车数据),经过数据预处理、旅程提取及地图匹配等处理后,获得406个OD对及相应的路径行驶轨迹数据.

由于出租车司机对北京市道路网络和交通条件拥有较高的熟悉度,因此在探索备选路径集合时,可结合北京市道路网5 min间隔的历史旅行时间数据库,以总的旅行时间为搜索标准,运用K-最短路算法中的双向扫除算法搜索任一OD对间的可行路径,取前K条路径作为备选路径集合,并且备选路径集中必须包括实际走行路径.考虑可行路径的数量应受限于人的感知能力,因此设定备选路径集的最大元素数量为6.通过提取路径的道路条件和交通状态指标形成描述各路径的特征向量,为后续路径选择行为分析和建模提供数据基础.其中,道路条件指标包括旅行距离、左转次数、右转次数、快速路比例、主干路比例、次干路比例和支路比例等,交通状态指标包括旅行时间和旅行速度等.最后,根据已确定的临界阈值和删除逻辑,筛选得到最终的备选路径集合.

图3 研究范围Fig.3 Study areas in Beijing city

3.2 模型标定结果

综合考虑影响因素相关性,并比较不同影响因素组合带入模型的t检验结果,最终选择的模型特征变量及其说明如表1所示.

表1 模型特征变量及其说明Table 1 Illustration of route choice model’s variables

在确定模型特征变量之后,运用最大似然估计法对PSL模型进行标定,并与MNL模型的标定结果进行对比分析,具体结果如表2所示.

表2 模型标定结果Table 2 Model estimation results

从表2中可以看出,两个模型中各参数的t值均满足要求,表明上述参数的标定结果具有良好的统计有效性.PSL模型中修正项所对应的系数为正,符合模型的基本原理.上述两个模型的调整优度比均较高,但与MNL模型相比,PSL模型的调整优度比更好.由此可见,尽管上述模型均能较好地描述车辆的路径选择行为,但相对于MNL模型而言,PSL模型能更好地表现实际路径选择行为.

3.3 结果分析

(1)系数分析.

旅行时间变量对应系数为负,即路径所需的旅行时间越长,其效用越小,被选择的概率越低,表明驾驶员更倾向于选择旅行时间短的路径,与实际相符.左转次数和右转次数变量的对应系数均为负,表明驾驶员倾向于选择转向较少、线路较为顺直的路径.路径中主干路和次干路所占比例项对应的系数为正,表明驾驶员在路径选择时会倾向于选择主干路和次干路比例较高的路径.可能原因在于:由于北京机动车保有量较高,使得快速路在很长一段时间内处于拥堵的状态,出租汽车驾驶员凭借对交通路网的熟悉程度会选择其它等级的道路以避免交通拥堵.因此,相对于较为拥堵的快速路和道路通行能力较低的支路而言,主干路和次干路更加受到出租车驾驶员的偏爱.

(2)边际替代率.

边际替代率(Marginal Rates of Substitution, MRS)是指在效用保持不变的前提下,增加因素αi的一个单位值时所需要减少的另一因素αj的值.计算公式为

因此,其他影响因素与路径所需旅行时间项之间的边际替代率如表3所示.

表3 边际替代率计算结果Table 3 Calculation results of MRS

分析可知,若增加一次左转,为保持其效用不变,旅行时间需要减少近1 min;若增加一次右转,为保持其效用不变,旅行时间需要减少近20 s.据此不难发现,相对于右转而言,驾驶员优先选择左转次数少的路径,并且每一次左转相当于三次右转对于驾驶员路径选择的影响,这与现实生活中车辆左转比右转更为复杂的事实相符,进一步说明了模型的有效性.

4 研究结论

本文基于北京市出租车GPS数据,通过旅程识别处理、地图匹配和K-最短路计算等过程构建了包含实际走行路径的备选路径集合,并通过路径特征值提取获得出租汽车路径选择行为分析的RP数据.然后,结合路径影响因素分析,构建了基于PSL模型出租汽车多路径概率选择模型,形成了基于GPS数据的路径选择行为建模及分析方法,提高了GPS数据的使用价值,为智能交通系统的完善提供帮助.通过与MNL模型结果的对比,表明PSL模型能更好的描述城市路网中的路径选择行为.分析结果表明,出租汽车驾驶员更倾向于选择旅行时间短、转向次数少、主干路和次干路比例较高的路径.同时对于出租汽车驾驶员而言,路径中进行一次左转相当于增加了1 m in的旅行时间,而进行一次右转仅相当于增加了20 s的旅行时间.

[1]Yang H,Wong S C.A network model of urban taxi services[J].Transportation Research Part B: Methodological,1998,32(4):235-246.

[2]Wong K I,Wong S C,Yang H.Modeling urban taxi services in congested road networks with elastic demand[J].Transportation Research Part B: Methodological,2001,35(9):819-842.

[3]马俊来,边扬,王炜.基于驾驶行为分析的城市出租车运营网络平衡模型[C].中国城市交通规划2006年年会暨第22次学术研讨会,2006.[MA J L, BIAN Y,WANG W.A equilibrium model of urban taxi service network based on analyzing taxi-driving behaviors[C].The 22th Conference on Chinese Urban Transportation Planning,2006.]

[4]边扬,王炜,陆建.城市出租车运营网络平衡模型[J].交通运输工程学报,2007,7(1):93-98.[YANG B, WANG W,LU J.Equilibrium model of urban taxi service network[J].Journal of Traffic and Transportation Engineering,2007,7(1):93-98.]

[5]四兵锋,孙壮志,赵小梅.基于随机用户平衡的混合交通网络流量分离模型[J].中国公路学报,2006,19 (1):93-96.[SI B F,SUN Z Z,ZHAO X M.Mixed traffic network flow-split model based on stochastic user equilibrium[J].China Journal of Highway and Transport, 2006,19(1):93-96.]

[6]周元峰.基于信息的驾驶员路径选择行为及动态诱导模型研究[D].北京:北京交通大学,2007. [ZHOU Y F.Research on driver route choice behavior in the presence of information and dynamic guidance model[D].Beijing:Beijing Jiaotong University, 2007.]

[7]Li H.Investigating morning commute route choice behavior using global positioning systems and multi-day travel data[D].Atlanta:Georgia Institute of Technology, 2004.

[8]Mandir E,Pillat J,Friedrich M,et al.Choice set generation and model identification for route choice using GPS data from smart phones[C]//Proceedings of the Conference on Innovations in Travel Modeling of the Transportation Research Board,Tempe,Arizona.2010.

[9]Hood J,Sall E,Charlton B.A GPS-based bicycle route choice model for san francisco,california[J]. Transportation Letters:The International Journal of Transportation Research,2011,3(1):63-75.

[10]Broach J,Dill J,Gliebe J.Where do cyclists ride?A route choice model developed with revealed preference GPS data[J].Transportation Research Part A:Policy and Practice,2012,46(10):1730-1740.

[11]姚恩建,左婷.基于低频浮动车数据的实时地图匹配算法[J].北京工业大学学报,2013,39(006):909-913. [YAO E J,ZUO T.Real-time map matching algorithm based on low-sampling-rate probe vehicle data[J]. Journal of Beijing University of Technology,2013,39 (006):909-913.]

[12]Prato C G,Bekhor S.Modeling route choice behavior: How relevant is the composition of choice set?[J]. Transportation Research Record:Journal of the Transportation Research Board,2007,2003(1):64-73.

[13]Rink K A,Rodin E Y,Sundarapandian V.A simplification of the double-sweep algorithm to solve the k-shortest path problem[J].Applied Mathematics Letters,2000,13(8):77-85.

[14]Swait J.A non-compensatory choice model incorporating attribute cutoffs[J]. Transportation Research Part B:Methodological,2001,35(10):903-928.

[15]Ben-Akiva M,Bierlaire M.Discrete choice methods and their applications to short term travel decisions[M]. Handbook of Transportation Science,Springer US,1999.

Taxi Route Choice Behavior Modeling Based on GPS Data

YANG Yang1,2,YAO En-jian1,2,PAN Long1,ZHAO Nan3
(1.MOE Key Laboratory for Urban Transportation Complex Systems Theory and Technology,Beijing Jiaotong University, Beijing 100044,China;2.Center of Cooperative Innovation for Beijing Metropolitan Transportation,Beijing 100044,China; 3.Department of Traffic Planning,Housing and Urban-Rural Development of Huizhou,Huizhou 516000,Guangdong,China)

Taxi route choice behavior analysis is of great significance to study urban traffic flow’s spatiotemporal distribution and assignment.First,based on the GPS data collected from taxi dispatch system,RP data for taxi route choice behavior analysis are obtained by using trip-identification method,map matching and double-sweep algorithm.Second,by considering the comprehensive impacts of road network condition and traffic status on taxi drivers’route choice behavior,a PSL model based vehicle route choice model is developed.Finally,the results of case study show that taxi drivers incline to choose the route with less travel time,lower frequency of the left turns and right turns,and higher total ratio of arterial road and sub-arterial road.Meanwhile,the modeling approach of route choice behavior is of positive significance to improve the use value of GPS data.

traffic engineering;route choice behavior;path-size Logit model;taxi;global positioning system data

1009-6744(2015)01-0081-06

:U491.1

:A

2014-08-15

:2014-10-16录用日期:2014-10-22

国家“973”计划资助项目(2012CB725403);中央高校基本科研业务费专项资金(2013YJS051).

杨扬(1989-),男,江西宜春人,博士生. *

:enjyao@bjtu.edu.cn

猜你喜欢
浮动出租车驾驶员
电连接器柔性浮动工装在机械寿命中的运用
基于高速公路的驾驶员换道意图识别
驾驶员安全带识别方法综述
乘坐出租车
论资本账户有限开放与人民币汇率浮动管理
一种用于剪板机送料的液压浮动夹钳
凭什么
带有浮动机构的曲轴孔镗刀应用研究
起步前环顾四周是车辆驾驶员的义务
开往春天的深夜出租车