大数据在交通规划和管理中实践探索
——以广州为例

2019-01-07 03:11苏跃江龙小强吴德馨
交通工程 2018年6期
关键词:广佛公交站点IC卡

苏跃江,龙小强,吴德馨

(广州市交通运输研究所 广州市公共交通研究中心, 广州 510635)

0 引言

近年来,大数据发展非常迅猛,其定义和内涵在各行业也有不同的解释,最为常用的局势大数据具有4V特征:即Volume(体量大)、Variety(多样性)、Value(价值高)、Velocity(更新速度快). 在大数据快速发展的新形势下,传统交通规划研究面临技术革新的重大机遇与挑战. 很多学者尝试通过大数据研究城市(含交通)规划和管理,主要经历以下几个发展阶段:“大数据如何获取以及带来规划新方法→大数据支持下的城乡治理方法与实践、大数据的获取与分析技术研究→以大数据为主的新技术作支撑促进规划方案自下而上与自上而下的互动”. 文献[1-6]主要探索通过大数据分析与规划业务逻辑之间的深刻关联,促进大数据与规划业务的结合与深化;文献[7-12]主要探索通过数理方法和评价实例,如何将大数据与规划业务相结合,实现数据分析作为决策的进一步落地.

交通大数据主要分为3大类:①以人为对象的数据,包含IC卡数据、轨道交通闸机数据、手机信令数据、公路联网售票数据、铁路和民航客流数据以及社交网络(媒体)数据等;②以车为对象的数据,包含道路高清卡口数据、车载GPS数据、FRID电子牌数据、视频监控数据、高速公路收费流水数据、国省道流量观测数据等;③以路为对象的数据,包含线圈、微波、红外线等流量检测数据、停车诱导屏数据等. 本文主要介绍手机信令数据、GPS数据、道路卡口数据以及公共交通IC卡数据在交通规划和管理中的应用,并与广州市为例进行实证研究. 其目的是通过对大数据的分析,洞察和厘清车流、人流的出行规律,实现交通规划和运营管理从“局部数据、经验驱动”向“多种数据、数据驱动”转变.

1 移动手机数据在交通规划中应用

1.1 基本原理

手机通信数据包括手机信息、信令信息和基站信息3部分,由于手机信令数据包含短信、通话、基站切换、开关机、通信维护情况下与基站通讯的信令数据,手机信令数据可获得频率较高的采样点,常用手机信令数据进行分析,基本原理就是通过移动通信网络信号覆盖与用户进行交互,然后利用数据预处理、数据清洗、数据质量分析以及出行链技术等方法还原用户的出行模糊轨迹. 一般手机数据主要用于4个方面:即交通调查的补充和校核分析、典型吸引点客流密度分析、轨道交通换乘分析、交通设施路径分析、交通状态识别分析,其中交通状态识别分析由于基站模糊地址原因映射到道路网络的精度相对较低.

图1 手机信令数据在道路交通网络中的位置电子脚印原理

表1 手机信令数据的基本格式

图2 手机信令数据的应用领域

1.2 案例分析

广佛地域有约200 km的接壤边界,现有跨界交通设施为两市开展同城化合作奠定了基础,为广佛两地居民居住和就业提供方便. 分析以2016年6月以来22 d移动手机信令数据为基础,限于篇幅,本次仅对广佛同城化的职住特征和时空分布特征进行分析.

图3 广佛“候鸟”居住地分布(左)和就业分布(右)特征

1.2.1 广佛同城化“候鸟”职住特征

广佛“候鸟”是指在佛山居住、广州就业;广州居住、佛山就业. 根据对广佛两市连续22 d的数据监测,广佛“候鸟”居住地、工作地沿广佛边界分布,呈现“一心多点”等级集聚,同城化特征显著. 在广州工作、佛山居住的广佛“候鸟”人数较多,约是佛山工作、广州居住“候鸟”的1.5倍. 其中广佛“候鸟”居住地主要集中在南海区的大沥镇(占比53.3%),工作地则相对较为分散;佛广“候鸟”工作地集中在大沥镇、桂城街道,分别占比26.3%、20.9%,居住地较为分散,其中居住在南沙区的大岗镇的“候鸟”最多,占比11.8%.

1.2.2 广佛同城化居民出行时空分布特征

目前广佛间城际出行主要通过广佛地铁、城际公路客运(普通客运、城巴、快巴)、广佛公交、出租车、私人小汽车等方式. 从空间分布来讲,客流呈现出“两点放射、毗邻区域密集”的特征,“两点放射”以佛山南海、顺德两区向广州毗邻区县连接,其中南海与荔湾、白云的出行需求最高,日均交换量均超过25万人次,毗邻区域呈现一体化、网络化特征. 从时间分布来讲,工作日广佛间出行交换量时变曲线基本符合双峰分布,出行早高峰为07:00—08:00时段,相比于广州出行早高峰提前约0.5 h,晚高峰出现在17:00—18:00时段. 非工作日无明显的早高峰,晚高峰时段为18:00—19:00.

图4 广佛同城化居民出行空间分布特征

2 IC卡数据在公交客流分析中应用

2.1 基本原理

2.1.1 站点OD推断

图5 广佛同城化居民出行时间分布特征

图6 上下车客流推断流程(左)和IC卡数据、报站数据字段(右)

公交OD推断是以乘客长时间的出行和换乘行为假设为基础,即假设乘客的起终点首次出行、回程、换乘均具有规律性,比如在同一天中连续2次乘车的上车时间间隔小于一定阈值时,则判定该乘客的2次乘车为换乘出行,第2次乘车的起点为换乘站点. IC卡交易数据是由乘客上车刷卡产生的交易流水数据,该数据主要记录IC卡进行交易时的相关信息,主要包括卡片信息、交易时间、车辆属性、公交线路以及乘坐地铁等信息;公交车报站数据是车辆进出站时,公交车载终端在进出公交站点周边设置的电子栅栏时会自动报站,由此记录了公交车在运行过程中的时空信息,主要包含车辆属性、公交站点名称、报站时间、线路行车方向等信息. 利用IC卡数据和公交GPS报站数据推断上、下车客流,主要利用IC卡获取的车辆编码(交易终端公交车编码)、交易时间(记录IC卡当次刷卡时间)、线路编码(当次刷卡车辆对应的公交线路编码)等信息与公交GPS报站数获取的车辆编码、报站时间、公交站点名称、公交线路方向等信息进行匹配(图6中深色字体),并结合多次IC卡刷卡时间的连续性数据、出行时间阈值、公交站点空间属性、居民出行规律性以及换乘行为识别等特征推断上、下车客流和换乘客流,从而得到公交站点OD.

2.1.2 站点OD推算小区OD

构建公交站点OD映射到交通小区客流OD,主要有2点:①梳理公交站点应对交通小区的关系,引入距离系数统计公交站点周边满足条件的交通小区做选择集,公交站点和交通小区是一对多的关系(见图3);②统计分析小区内人口和就业岗位数量,或交通小区内用地性质和土地面积(建筑面积),引入分配权重系数将公交站点客流分配到交通小区;包含2种算法,即基于交通小区内人口和就业岗位模型算法和基于交通小区内用地性质和土地面积或建筑面积的模型算法[13].

图7 公交站点与交通小区关系(左)站点OD推算小区OD流程(右)

2.2 案例分析

公交IC卡数据的应用价值还体现在对公交系统的调度、运营和管理以及服务水平的评价. 通过对广州市中心6区705条公交线路(涉及线路站点31 996个、物理站点6 214个)梳理,分析以2015年12月IC卡的数据为基础,从“点”“线”“面”3个层次刻画广州市常规公交客流情况,限于篇幅,本次仅以公交站点和用地关系进行详细分析. 根据公交站点周边用地性质和客流特点,公交站点可分为居住主导型、商业主导型、混合型3种类型. 同时,有611个公交站点集散量大于0.5万人次,主要集中分布环城高速公路区域内的主要干道;公交站点集散量大于4万人次的站点主要分布于地铁线路未端覆盖的大型居住片区和主要干道与地铁线路交汇点,如BRT棠下村站、同德乡站、横滘站、同和站、芳村站、和平新村站等. 大部分集散点客流与公交复线条数的资源配置基本适应,但部分站点资源配置不匹配,例如动物园站、动物园南门站,站点的停靠线路与和平新村站、新市墟站为1∶1的关系,但线路条数客流仅为这2个站的1/3.

表2 不同类型公交站点的客流特征

图8 公交站点集散客流(左)与停靠线路(右)关系

3 GPS数据在出租车规划中应用

3.1 基本原理

出租汽车GPS数据主要通过车辆终端和无线通信装置以约每15~60 s不等的时间间隔上传至后台控制中心存储,其属性数据包含车牌号、入库时间、GPS时间、经度、纬度、速度、行驶方向、车辆状态以及数据有效性等,其中经纬度位置数据详细记录出租车运营轨迹信息,包含了车辆或乘客的上、下车位置信息;出租车计价器是用于测量出租车运营持续时间以及依据里程传感器传送的信号测量里程测算乘客的支付费用,数据包括载客的行程时间(含开始时间、结束时间、慢速时间)、行程里程、费用以及支付方式等信息. 通过对出租车GPS数据的挖掘,分析出租车出行空间分布、出行次数、出行距离、出行时长、时间分布、到达时间分布等特征,结合城市土地利用关系分析居民出行行为特征.

表3 出租车GPS数据表结构

图9 出租车GPS数据的应用领域

3.2 案例分析

在广佛同城化趋势下,为使出租车回程时不空载,两市交通主管部门协调确定设置出租车回程候客点,即广佛两市的出租车搭客到佛山、广州后,可前往出租车回程候客点配客回程. 但由于出租车回程配客点设置数量少、两市收费标准不统一(如佛山出租车超过12 km后加50%回程费,而广州这个距离为35 km),难以满足广佛出租车客运需求.

分析以广佛两市2015年11月以来1万的出租车GPS数据和计价器数据为基础,限于篇幅,本次仅结合需求和用地等规划广佛两市出租车返程点. 通过分析,目前出租车行程起讫点呈现出3个特点:①出行需求集中在两市毗邻地区,并且广州市境内出行需求总量高于佛山市;②局部出行需求呈点状(如广州南站)、带状分布(广佛路、花地大道、龙溪大道)分布;③除毗邻区域外,广佛两市出租车需求集中在客运枢纽和地铁站,如白云国际机场、广州南站、广州站、广州东站、芳村客运站以及浔峰岗地铁站、黄沙地铁站、西朗地铁站等.

图10 广佛两市出租车需求空间分布(左)和OD期望线路(右)

图11 广佛两市出租车热点区域分布(左)和返程点规划(右)

4 道路卡口数据在交通执法管理中应用

4.1 基本原理

利用道路卡口数据进行车牌识别,使得对单个车辆轨迹的出行链进行识别,对个体规律进行跟踪和预测分析. 道路卡口车牌识别获取的数据字段包括抓拍时间、车牌号码、车牌颜色、抓拍路段和方向等信息. 主要利用卡口捕获和记录过往车辆的号牌,通过对车牌号、时间、路段等信息继进行空间、时间以及车辆的三维匹配,精确定位车辆的车身属性、时间分布、空间分布、出行轨迹等信息,为交通运营管理提供精细化的数据支持.

4.2 案例分析

本次分析以2016年6月广州市卡口(412个)数据为基础,对广州市大客车可疑对象进行分析. 主要分为3步:①类别特征分类. 通过对途经广州境内道路卡口大客车车辆流水数据统计分析,结合运政管理系统车牌库等数据库,将大客车进行类别分类,筛选出疑似非法大客车7 359辆、占全部大客车比例的15%;②运行特征分类. 针对疑似非法营运大客车运行特征(包括出行频率、规律性、运营速度和注册时间),并考虑车辆的危险程度进一步分析运行特征,得出可疑车辆主要分为频繁且轨迹相对固定(被连续4个及以上卡口监测到)、频繁但轨迹不固定、不频繁3大类(并细分为11小类),车辆数分别为1 159辆、219辆、5 981辆;③综合分析. 统筹考虑类别特征和运行特征,重点对“频繁规律+上高速+超过8a”“频繁不规律+上高快速+超过8a”的车辆进行重点监测管理,并详细分析这部分车辆的时空分布、出行轨迹等信息,做到执法管理的精细化和有的放矢.

5 结束语

本文通过梳理大数据的特征、发展阶段以及交通领域大数据类别,分析手机、IC卡、GPS和道路卡口等大数据分析的基本原理和应用领域,以广州市为例进行实证研究,为下一步交通大数据的应用提供参考. 但交通数据不是数据和工程案例的简单整合,而是数据的充分融合共享和应用强逻辑关联. 因此,在后续研究中应关注几个方面:①如何减少手机数据定位的漂移、加密采样时间、获取完整的出行链信息,进一步挖掘交通方式、出行目的以及活动类型判断、扩样技术等方面具有重要的意义;如何利用公交IC卡数据,挖掘单个乘客的行为特征和出行模式,还原公交乘客的出行模式特征和整个出行链特征;如果可以对个体车辆的GPS轨迹数据和车牌识别数据的行为规律进行把握,将微观个体的规律性和机理集计到宏观层面,实现对宏观规律的再现和预测. ②重视系统数据质量评估与验证工作,数据验证和质量验证是整个数据分析和应用的基石. ③推动建立行业数据标准,规范数据定义、行业用语、采集要求等. ④如何利用各种数据所具有的优势,做好大小数据融合技术攻关,实现多元数据融合以及大数据与交通模型的及时融合,实现各种大数据之间、大数据与交通模型之间的相互补充和校核具有重要的意义.

猜你喜欢
广佛公交站点IC卡
广州最新交通年报出炉!广佛每天有174万人来往!
162亿!8宗宅地!央企保利重仓广佛两市
工商业IC卡控制器改造为物联网控制器实践
七大新亮点!照耀广佛未来城的“智慧”发展之路
广佛潜力板块看这里! 下一个千灯湖传奇崛起!
合肥市高铁南站公交线路优化研究
基于GIS的哈尔滨市118路公交站点选址优化
在用电梯加装外接式IC卡运行控制系统设计改进
基于POI数据与ArcGIS空间分析技术的城市公交站点现状容量评价方法
城市公交站点选址评价分析