基于手机信令数据的通勤出行分析
——以青岛市为例

2022-03-08 04:45张志敏李同飞禚保玲
青岛理工大学学报 2022年1期
关键词:信令廊道青岛市

王 振,张志敏,李同飞,高 歌,禚保玲

(1.青岛市城市规划设计研究院,青岛 266071; 2.北京工业大学 交通工程北京市重点实验室,北京 100124; 3.山东科技大学 交通学院,青岛 266590)

在城市规划领域,居民通勤及职住特征的获取需要借助大规模的抽样入户问卷调查,在操作简单易行的同时也存在入户难度大,调查成本高的弊端。随着互联网的兴起,依托网页、终端的调查发展迅速,通过问卷星,调查派等应用进行居民出行调查,如青岛市2015年第三次居民出行调查中采用网络调查问卷调查居民的出行和通勤情况。网络调查虽然能够降低调查成本,但仍然需要被调查者主动填写,是信息主动采集的过程,存在主观臆断的可能。目前,手机信令数据、APP定位数据等互联网大数据,在信息被动采集的基础上,借助大数据处理技术和人工智能算法能够进行居民出行特征的分析。苏跃江等[1]系统分析了包括手机信令数据在内的大数据在交通调查中的应用,从挖掘特殊调查指标、实现多源数据互补与校核两个层面进行了深入剖析;付雷[2]阐述了手机信令数据在居民出行调查中关键技术,并以石家庄市为例从人口、出行以及通勤等方面进行分析。同时互联网大数据,在保护用户隐私的前提下,能够最大程度地还原用户出行轨迹,且具有样本覆盖广的特点,例如传统的居民出行调查抽样率在3%左右,手机信令数据的样本覆盖率根据不同的运营商市场份额确定,但一般都在30%左右。

目前,我国的人口普查每10年一次,经济普查每5年一次,但人口普查数据不涉及就业地,经济普查数据不涉及居住地,因此难以根据官方统计数据进行通勤特征的研究。传统职住空间的研究,尤其是通勤特征的分析往往需要借助手机信令数据、位置定位数据等多源数据。丁亮等[3]基于手机信令数据,根据居民的夜间驻留地和日间驻留地的密度分布识别出上海中心城区通勤圈;郭亮等[4]依托手机定位服务(location based service,LBS)数据识别武汉市中心城区主要通勤圈的空间分布;钟炜菁等[5]以上海市为例,构建“人口-时间-行为”关系的手机信令数据分析框架,研究职住关系和通勤出行特征;张天然[6]对比验证了手机信令和居民出行调查的职住空间和距离较为吻合,并提出了职住通道平衡的概念;钮心毅等[7]在运用手机信令数据识别职住分布时,比较分析了不同规则和参数取值的可靠性;李祖芬等[8]基于交通小区进行OD矩阵、出行期望线等居民出行时空特征提取,并与北京市第四次交通综合调查结果进行比较,得出两者偏差较小的结论;蒋寅等[9]基于手机信令数据,提出获取职住分布的方法和路线,并以天津市为例,探究轨道交通与通勤廊道之间的耦合关系;邹戴晓等[10]提出基于手机信令数据的职住识别方法,并通过交通模型对城市职住空间进行了分析;邓社军等[11]通过手机信令数据构建城市间旅游出行网络,并通过构建指标评价体系分析了客流空间分布特征;于泉等[12]从用户行为特征的角度运用手机信令数据对高速公路服务区客流进行可视化研究以及科学分析。

图1 技术路线

张逸姬等[13]采用土地利用数据、公交地铁刷卡以及微信定位数据等多源数据构建职住空间分析框架,并对影响职住空间分布的因素进行了分析;申犁帆等[14]利用腾讯宜出行等多源数据分析轨道站点周边人口分布,并通过高斯混合模型进行站点职住功能划分;吴子啸[15]通过构建时空贪婪算法识别个体出行链,能够最大程度降低信令数据定位的空间不确定性。

既有研究成果,无论是手机信令数据还是多源混合数据都对城市通勤进行了深入研究,但大多停留在通勤出行OD的获取上,并未进行个体出行路径的推演。本研究在传统通勤OD识别算法的基础上,充分利用手机信令数据自身特点,反推出行的中间点(基站定位),从而构造包含起讫点和中间点在内的近似的出行路线进行通勤廊道分析;并实例分析利用手机信令数据进行通勤时耗分析有天然的局限性,技术路线如图1所示。

图2 青岛市基站核密度分布

1 数据处理关键技术方法

1.1 数据说明

研究中手机信令数据的时间范围为2018年8月1日—10月14日共76 d超过198.48亿条数据,日均出行个体约653.49万人,约占常住人口的69%(青岛市2018年常住人口939.48万人)。传统的分析方法中,数据初始化时对基站进行栅格化处理,并以网格质心作为网格内所有基站的位置,在简化计算的同时也降低了数据的精度,因此本研究采用基站自身作为分析单元。青岛市有效基站共有约34 225个,其分布如图2所示。

1.2 常住人口识别

常住人口的识别主要基于人口活动规律进行判断,通过用户长期信令数据,分析在不同时段不同空间的时间累积判断常住人口。研究采用青岛市连续76 d数据中,同一用户在夜间时段(22:00—6:00)连接同一基站的逗留时间超过阈值,则计作为有效天数,累积有效天数超过分析数据时间的一半(38 d),即认定该基站对应的区域为该用户的住址,该用户即为常住人口,个体编号为MSID。

表1 出行链样本

1.3 通勤出行识别

首先,针对原始手机信令数据通过出行链分析模型(时空贪婪算法[1])能够最大限度地降低乒乓效应和数据漂移的影响,进而得到全样本的居民出行链数据,见表1,然后通过时间边界阈值判断出行(OD)。

如图3所示,出行链中当手机用户在某一位置A驻留时间超过阈值(取15 min),则认为该位置A为出行驻留点。当两个出行驻留点A,B的间隔时间Δ3-2超过阈值(取10 min)且两个驻留点间的直线距离超过阈值(取500 m),则认为相邻两个驻留点之间为一次出行。

Δ2-1=T2-T1,Δ3-2=T3-T2。

图3 手机用户出行(OD)定义

其次,根据青岛市人均出行次数、统计年鉴人口总数等指标进行出行扩样,得到青岛市全方式OD出行。

最后,进行通勤出行的判断。统计青岛市工作日出行量数据,如图4所示,6:00—10:00间的出行量在早高峰期间相对集中,约占全天出行的23%,考虑到此时间段内多为上班出行,故作通勤分析样本数据。在所有的出行OD中,通过常住人口(MSID)和时间边界(早高峰6:00—10:00)两个条件筛选出通勤出行。

图4 全天出行时间分布

1.4 出行轨迹反推

基于分析得到的通勤出行,将个体编号(MSID)、时间从原始数据库中提取出对应的个体原始信令数据。如图5所示,通过汇总个体原始信令数据,基站连接数据在20个以内的占比高达76%,通勤出行连接基站平均数为11.26个,大于通勤出行的起终点2个基站。

1.5 通勤廊道聚合

区域通勤廊道通过人流量叠加法,将所有个体的出行轨迹点,分别以交通小区和500 m网格两种尺度,按照个体(MSID)、基站位置去重后进行空间汇总,并进行密度分析,即得到对应尺度的通勤廊道。

2 通勤出行分析

2.1 通勤距离

为了表示手机数据的时间密度,吴子啸[15]将1 d划分为以0.5 h 为单位的时段,在一个时段内有一个或多个信令数据即表示该时段出现信令数据,而以出现信令数据的时段数表示时间密度,并据此计算信令数据出现的时间间隔。基于青岛市手机信令数据进行时间密度分析,如图6所示,在分析时段内(7:00—22:00)信令数据出现频次相对稳定,平均时段数量为11.85个,平均间隔为75.9 min,而根据青岛市第三次居民出行调查(2016年)居民的平均出行时耗为35.9 min,故运用手机数据进行时耗分析并不可靠。故本研究只做通勤距离的特征研究。

图5 通勤出行连接基站分布情况

图6 手机数据的时间密度分析

青岛市各行政区通勤人口平均出行距离呈现外围区市高于中心城区的态势,如图7所示,即墨区最高,平均出行距离7.14 km (2015年居民出行调查为6.4 km);其次为平度市,平均出行距离6.86 km (2015年居民出行调查6.4 km);城阳区平均出行距离最低,仅5.32 km。

对比青岛市各行政区的平均通勤距离,如图8所示,外围的平度市、莱西市、即墨区、胶州市、西海岸新区其外出(图8(a))和外来(图8(b))的通勤出行均位于同一层级,表明其岗位吸引范围和人口活跃范围基本一致;市南区、崂山区、城阳区外来通勤距离要大于外出,表明其岗位吸引的范围更大,进一步佐证其岗位密集的特点;受“南工北宿”城市格局的影响,市北区、李沧区居住区密集,外出通勤距离大于外来。

图7 青岛市各区市通勤出行距离

图8 青岛市各区市外出及外来通勤距离(单位:km)

进一步分析镇街尺度的通勤出行网络发现,如图9所示,中心城区的街道通勤距离集中在6 km以内;城阳区的红岛街道、上马街道、棘洪滩街道、流亭街道以及河套街道外来通勤距离要大于外出,表明其就业吸引范围相对更大;西海岸新区的海青镇、胶河管区距离中心城区较远,其外出和外来的通勤距离均在10 km以上。

图9 青岛市各街道外出及外来通勤距离(单位:km)

图10 青岛市通勤客流途经人流密度

2.2 通勤廊道

区域通勤廊道通过识别区域内人流轨迹的主要路径来模拟,即区域廊道通过人流量叠加法。如图10所示,青岛市东岸城区中的市南区、市北区、李沧区、崂山区、城阳区、即墨区整体处于通勤连绵范围内;外围的胶州市、平度市、莱西市相对独立,与东岸城区的通勤联系较弱;西海岸新区呈现为两个通勤组团,分别为开发区和原胶南组团,且两者之间通道单一。

叠加城市路网后,由图11可见,青岛市东岸城区中东西向廊道主要集中在胶宁高架-宁夏路、香港东路两个方向上,南北向廊道则以山东路-黑龙江路为主,并延伸至城阳区;城阳区、即墨区与市内四区通勤廊道单一,内部道路相对独立。

同理,以500 m网格为空间单元,按照个体(MSID)、基站位置对个体进行去重后,汇总统计进行人流密度分析得到网格尺度区域通勤廊道。如图12所示,青岛市内四区通勤客流呈现廊道一体化特征,并沿主要道路带状布局,山东路-哈尔滨路-黑龙江路与地铁3号线复合廊道贯通南北;平度市呈现东西向矩形通勤廊道,接近40%的出行分布在9 km × 6 km范围内;莱西市呈现南北向矩形通勤廊道,约50%的出行分布在9 km × 5 km的范围内;即墨区、胶州市一半以上的出行集中在5 km以内,通勤廊道围绕中心放射延伸;西海岸新区通勤廊道呈现开发区和原胶南双矩形通勤廊道结构,接近140 km2范围内集中了全区约65%的早高峰出行。

图11 基于交通小区的早高峰通勤廊道

图12 基于500 m网格的早高峰通勤廊道

3 结束语

本文运用手机信令数据对青岛市通勤距离、通勤时间等通勤特征进行分析,并通过回溯原始数据推算通勤个体出行轨迹,汇总后得到全市通勤廊道。以青岛市为例,全市通勤距离处于合理范围之内,但各行政区通勤出行距离呈现外围区市高于中心城区的态势,同时受“南工北宿”城市格局的影响,市北区、李沧区居住区密集,外出通勤距离大于外来。因此即墨区、莱西市等外围区市应通过优化引导职住空间匹配,合理控制通勤出行距离。市南区、市北区、李沧区、崂山区等市内四区通勤客流呈现廊道一体化特征,即墨区、平度市、莱西市等外围区市通勤联系呈现组团独立发展态势,因此,在城市一体化发展过程中应通过预留有限通道资源,优先发展大容量公共交通工具实现市区与远郊的便捷联系。

猜你喜欢
信令廊道青岛市
我家的“小叶子”
天山廊道与唐朝治理西域研究
青岛市城阳区礼德小学 “五育并举”,让校园充满活力
大美黄河生态廊道
打造珍贵彩色林带 建设浙中生态廊道
长城廊道能使陕西旅游更丰富多彩吗
网内信令链路负荷分担不均原因研究
浅谈JSQ-31 V5数字程控用户交换机NO.7及NO.1信令参数设定及不同