基于公交IC卡信息的公交客流推算

2019-01-07 03:27范桂莲马兴慧
交通工程 2018年6期
关键词:IC卡刷卡公交

游 婷,范桂莲,马兴慧

(1.武汉市交通科学研究所, 武汉 430014; 2.北京通途永久科技有限责任公司, 北京 100080)

0 引言

公交客流OD信息是进行公交线网规划、公交运行调度管理和公交系统辅助的基础信息. 公交OD信息包含公交乘客的上、下车,换乘,出行距离和出行时间等信息[1].

目前武汉市常规公交高峰期满载率过高、部分线路区间方向不均衡系数大,公交客流水平呈逐年下降趋势,2015年客运量约为14.31亿人次,较2014年减少0.52亿人次,2016年由于换乘优惠政策实施,换乘系数有了一定程度的提升,由1.07提升至1.30,客流量较之前有所回升,客流量增加为404万人次,但仍比2014年少0.09亿人次[2-3].

通过获取公交客流OD信息,全面、准确把握公交的运行现状和客流的变化趋势,对公交线网和公交调度方案进行优化,可以使上述问题得到缓解. 目前武汉市公交IC卡采用单一票制收费模式,刷卡字段中缺少下车的相关信息,无法直接得到公交乘客的下车站点、时间等信息,继而无法直接得到出行路径. 通过对公交乘客的刷卡数据和公交GPS数据的挖掘利用,可以得到公交客流OD信息.

目前国内外关于公交刷卡乘客上车站点识别的研究中较为常用,相对较准确的方法是将公交IC卡刷卡数据和GPS数据相结合进行判断[4-6];下车站点识别方法主要是在公交IC卡刷卡数据和GPS数据相融合的基础上,基于出行连续性、乘客出行链或站点吸引权等方法进行识别[7-8].

本文重点基于公交GPS数据和IC卡刷卡数据,建立公交刷卡乘客上、下车站点识别模型. 上车站点识别包含2个模型分别是基于GPS时间推算和基于IC卡刷卡时间推算,首先对比分析其优缺点,并根据实际数据试算得到的识别率最终确定上车站点识别模型. 下车站点识别模型包含基于出行连续性和出行链识别2个模型,对比分析其优劣并以识别率为判别基准,选取较高者为下车站点识别模型. 最终根据武汉市的的进行实例验证研究.

1 公交客流推算模型

1.1 数据准备

识别模型需要的数据有公交IC卡数据、GPS数据和公交站点位置数据. 武汉市目前共有7 000余辆公交车,每隔15 s会上传一次点位信息;每日的刷卡数据成千上万次(2016年刷卡率达到84.2%);还具有5 000多个公交汽车站和370条公交线路的基础信息.

表1 武汉公交IC卡数据

表2 武汉公交GPS卡数据

表3 武汉公交线路站点基础信息数据

1.2 公交刷卡乘客上车站点识别

1.2.1 基于GPS时间识别上车站点

城市公交车辆GPS设备能够实时采集车辆号、时间、速度、位置(经纬度)等信息. 基于GPS时间识别上车站点,首先根据公交站点信息及公交GPS数据推算出公交车辆的停靠站点及站点停靠时段,然后基于停靠时段对大量乘客IC卡刷卡数据进行分类分组,得到乘客的相关到站信息.

图1 上车站点识别

具体判断条件:

1) 计算GPS点与站点距离,保留GPS点位与站点距离小于100 m的点位;

2) 在保留点中按照时间进行排序,选择站前距离最近数据点的时间作为到站时间,且该时间应早于第一位上车乘客的刷卡时间;

3) 在保留点位中如果GPS连续多点集中于一点,则认为该点为停站点;

4) 每辆车每天始发时,可能会存在车辆未启动就有乘客刷卡上车现象,因没有GPS点位信息,建议根据当天车辆第1位乘客刷卡时间向前推5~10 min作为到站时间. 若始发站没有乘客刷卡上车,则结合车辆GPS数据分析.

1.2.2 基于IC卡时间识别上车站点

公交乘客乘坐相同车次,在相同站点上、下车,其时间相近,因此可以对刷卡记录进行聚类处理.

采用该模型推算乘客上车信息,因为乘客同车次同站点的性质,其刷卡时间相近,因此可以对数据进行聚类,得到公交站点停靠时间段,然后与公交GPS数据的时间字段进行对比分析,配对后得到公交上车站点.

图2 基于IC卡刷卡时间推算上车站点

具体判断条件:

1)根据公交IC卡刷卡时间作为判定公交车到站的时间依据;

2)考虑到GPS数据系统和IC卡数据系统存在一定的时刻偏差,在此假设时间偏差为4 min,以同一天的公交IC卡刷卡数据为基础,匹配线路号、车辆号字段后进行刷卡时间聚类分组,筛选保留刷卡集中段时间前后4 min内的GPS点位信息,其他数据剔除;

3)保留的GPS点与站点经纬度进行匹配,确定公交停靠站点.

1.2.3 模型比较分析

基于GPS时间识别刷卡乘客上车站点(模型1)存在的问题是:武汉市GPS点位信息是每隔15 s上传1次,部分站点车辆到站时不是上传数据的时间,则没有GPS点位信息. 解决该问题的方法是寻找与该点位时间最接近的点位信息进行推算得到.

基于IC卡刷卡时间识别公交刷卡乘客上车站点(模型2)存在以下问题:部分站点没有乘客刷卡上车;乘客早晚高峰时段出行,车厢内人数较多,部分乘客为寻求方便会选择从后门上车,这种情况的刷卡数据一般是距离站点一段距离. 此类问题会导致站点无法识别或识别错误. 模型2相较于模型1存在明显的缺陷.

1.3 公交刷卡乘客下车站点识别

1.3.1 基于出行连续性识别

基于出行连续性识别公交刷卡乘客下车站点模型是建立在日刷卡次数在2次及以上的基础上,根据公交乘客出行具有连续性规律,即公交乘客往往会在上次出行的目的地乘车返回上次出行的出发地. 采用该模型对IC卡乘客的出行OD进行识别,仅有一次IC卡刷卡记录和所有IC卡1 d内的最后1次刷卡记录不在本算法考虑范围内. 具体步骤为:

1)以日期和卡号为筛选字段,提取相同日期相同卡号的刷卡数据,根据时间先后排序.

2)基于上车站点的识别,关联获取所有IC卡刷卡数据的上车站点及位置信息.

3)依次识别每一次刷卡记录的下车站点. 如果乘客相近两次出行乘坐同一线路,则第2次出行的起始地站点为第1次出行刷卡对应的目的地站点;如果乘客相邻2次出行乘坐线路不一致时,则计算第1次出行刷卡上车站点的后续站点与第2次出行刷卡上车站点之间的距离,距离最短时对应的站点为第1次次刷卡对应的下车站点位置.

1.3.2 基于出行链识别

所谓出行链,即以居住地作为1 d公交出行的起终点,将公交乘客1 d内出行的起终点连接,形成一个环. 出行链闭合即1 d内相邻2次出行的起始地和目的地重合,形成一个闭合的环,例如本次出行从A站点出发到达B站点下车,下次出行从B站点或者B邻近站点出发到达A站点或者A邻近站点下车.

该模型的推算需要一个月的公交乘客刷卡数据. 根据刷卡数据,将所需识别的刷卡乘客类型分为A、B、C 3种类型. 其中,A类型乘客特点是出行是连续的,即第1次出行的目的地是第2次出行的起始地,即出行链闭合;B类型乘客特点是当天公交出行是不连续的,即出行链断裂,但历史出行记录中存在多日相似的起始地目的地重合的出行记录;C类型乘客特点是当次公交出行不连续,且没有相似的可供参考的出行记录.

图3 乘客类别判断流程

对于A类型乘客,可直接用出行连续分析法进行识别:提取同一卡号的刷卡数据,判断前后2次刷卡是否为同一线路,如果乘客相近2次出行乘坐同一线路,则第2次出行的起始地站点为第1次出行刷卡对应的目的地站点;如果乘客相近两次出行乘坐线路不一致时,则计算第1次出行刷卡上车站点的后续站点与第2次出行刷卡上车站点之间的距离,距离最短时对应的站点为第1次次刷卡对应的下车站点位置.

图4 A类乘客下车站点识别方法流程

1.3.3 模型比较分析

1.4 公交客流OD推算

根据上文模型的推算得到公交刷卡乘客的上、下车信息,在此基础上统计得到任意2站点之间的客流量,继而得到公交线路OD、公交线网OD和交通小区OD. 需要注意的是,一方面在公交乘客上、下车站点识别过程中所采用的的刷卡数据存在部分无效数据,推算的结果需要根据数据率(有效刷卡记录/所有刷卡记录)进行初步扩样;另一方面,公交刷卡乘客上、下车站点识别只包含刷卡乘客不包含投币乘客,所以采用数据率进行初步扩样后还需要采用刷卡率进一步扩样得到最终结果.

公交线路OD指一条公交线路上从i站点上车而在j站点下车的乘客OD量为Tα(i,j),即由站点i上车至站点j下车的客流量.

公交线网OD是城市所有公交线路在任意两站点之间的OD量汇总. 用T为公交线网OD矩阵,i为上车站点,j为下车站点,α为公交线路,则公交线网OD为T(i,j)=∑Tα(i,j).

交通小区的公交出行OD是指隶属于任意2交通小区间的站点对间的OD量汇总. G为交通小区OD矩阵,Zi为小区i内的公交站点集合. 因此交通小区OD为式(1).

G(i,j)=∑T(Zi,Zj)

(1)

3类公交OD之间存在递进的关系,首先由公交IC卡数据统计得到公交线路OD,由线路OD统计得到公交线网OD,最后得到交通小区OD.

2 实例分析

根据武汉市2016-12-29早高峰时段的公交乘客IC卡刷卡数据和GPS数据,对模型进行试算. 其中上车站点识别模型试算发现采用模型2(基于IC卡刷卡时间识别)识别,站点序号基本对应不上,识别失败. 而模型1(基于GPS时间识别)识别情况是:总的有效刷卡记录为23 206条,占所有刷卡记录85.67%(27 088条),识别成功的记录数为22 814条,识别率为98.31%. 所以最终选取模型1为识别模型.

利用公交刷卡乘客下车站点识别模型(模型1:基于出行连续性识别;模型2:基于出行链识别)对543路公交车上、下行公交乘客刷卡记录进行识别,具体识别结果为表4.

表4 543路公交刷卡乘客下车站点识别结果

由表4可得模型2比模型1的识别率更高,模型2的识别率为70%左右,模型1为50%左右,所以选取模型2为最终的公交刷卡乘客下车站点识别模型. 出行链识别模型可以识别的刷卡类型相对更全面,对于模型1不能识别的单一刷卡记录和不连续刷卡记录均能够识别,因此其识别率相对较高. 该模型主要针对单个刷卡乘客记录,可以得到单个乘客的公交出行起终点、出行时间、频率等信息,有助于分析得到城市公交出行者特征,辅助政府、管理部门决策. 但是利用模型2推算下车站点需要多天数据,并且需要对每张公交IC卡数据逐一分析,工作量繁重,速度慢,效率低下.

根据公交刷卡乘客上、下车站点识别结果,统计得到543路公交车在12月29日早高峰时段上行方向在各站点的上、下车人数,如图5所示.

图5 543路公交各站点上、下车人数

3 结束语

1)公交刷卡乘客上车站点识别包含2个模型,基于IC卡刷卡时间识别(模型2)相较于基于GPS时间识别(模型1)存在明显缺陷,部分站点缺乏刷卡数据或部分乘客刷卡时公交车辆已经驶离站点,这些缺陷会导致下车站点无法识别或识别错误. 并且利用实际数据试算时发现采用模型2识别,站点序号基本对应不上,而模型1站点识别率高达98.31%,所以最终选取模型1为识别模型.

2)利用武汉市543路公交车GPS数据、IC卡数据以及543线路的各站点信息试算得到2个公交乘客下车站点识别模型的识别率分别是:基于出行链识别为70%左右,基于乘客出行连续性识别为50%左右,所以选取前者为下车站点识别模型. 该模型不仅可以识别出行连续的刷卡记录还可以识别出行不连续(出行链断裂)的刷卡记录. 针对出行链断裂的刷卡记录,通过将这类乘客细分为2类,采用不同的概率计算方法得到下车站点概率继而确定下车站点.

猜你喜欢
IC卡刷卡公交
工商业IC卡控制器改造为物联网控制器实践
一元公交开进太行深处
在用电梯加装外接式IC卡运行控制系统设计改进
等公交
刷卡
长春开通公交IC卡充值平
刷脸就可以购物
湖北省高速公路IC卡管理系统浅谈
宅急送开始推行终端POS机刷卡结算
第一次刷卡