基于轨道交通数据的客流特征与城市功能结构分析

2021-06-15 12:07曹敬浛孙立山赵昇辉
都市快轨交通 2021年2期
关键词:密集型工作日客流量

曹敬浛,许 琰,孙立山,赵昇辉,王 艳

学术探讨

基于轨道交通数据的客流特征与城市功能结构分析

曹敬浛,许 琰,孙立山,赵昇辉,王 艳

(北京工业大学城市交通学院,北京 100124)

随着中国社会经济和城镇化的迅速发展,城市居民的职住空间关系不断发生变化。在城市功能结构失衡导致交通拥堵问题日趋严重的背景下,居民轨道交通出行需求也在不断增加。以北京市为例,基于轨道交通刷卡数据,从网络客运量、客流时空分布状态等方面深入挖掘乘客出行特征及规律。运用k均值聚类算法(K-Means聚类),以不均衡系数为指标对北京市各地铁站乘客出行时空分布进行聚类分析,研究居民出行规律与城市功能结构间的不均衡关系,为城市轨道交通运营组织策略的研究提供理论支撑。

城市轨道交通;刷卡数据;客流特征;站点功能

随着中国社会经济和城镇化的迅速发展,城市人口增长迅猛,居民出行需求不断增加,城市轨道交通以其运量大、准时、快捷、低污染等特点得到了快速发展。为保证城市轨道交通的运营管理、客流组织等工作的合理进行,迫切需要对轨道交通客流分布特性进行深度挖掘。在轨道交通运营数据中,刷卡数据记录了用户的进出站时间以及站点信息,具有时间连续、覆盖范围广、数据量大的特点,提供了真实、准确的客流数据来源,便于客流信息统计及出行特征研究。

在已有研究中,对于刷卡数据的研究主要包括以下3方面:乘客出行模式和行为挖掘、站点功能识别以及客流特征挖掘。在乘客出行模式挖掘中,Max[1]等根据IC卡交易数据确定了乘客的出行链,利用DBSCAN聚类算法对出行链进行分析,检测乘客的历史出行模式。Kieu[2]等在基于噪声的DBSCAN聚类的基础上提出了一种新的WS-DBSCAN方法,用于检测乘客出行模式的日常变化。Wang[3]等通过分析地铁乘客的出行数据,探讨了个人出行距离与城市中心距离间的线性关系和环聚集模式。Briand[4]等应用高斯混合模型对乘客在公共交通使用中的时间习惯进行重组,并运用刷卡数据和聚类的方法分析了公共交通乘客出行行为的变化。Devilaine[5]等利用刷卡数据分析乘客的出行起点、出行时间、出行目的等行为信息,挖掘因社会、文化和地域引发的乘客行为模式差异。Jang[6]通过刷卡数据识别乘客出行中的关键换乘点,分析两个区域间的换乘出行模式。Takahiko[7]等提出了一种基于朴素贝叶斯概率模型的刷卡数据与出行调查数据的融合方法,评估乘客出行行为属性。在站点功能识别的相关研究中,唐超[8]利用K-Means聚类分析的方法,对南京地铁车站进行聚类,为城市轨道交通站点的规划及车站差异化运营提供了参考依据。冷彪和赵文远[9]利用地铁刷卡数据并依据出行规律相似性对地铁站进行聚类分析,研究不同时段内的区域功能和相互客流关系。在客流特征挖掘的研究中,陈学武等[10]提出了将原始刷卡数据转化为可直接用于城市交通规划及公交运营调度的客流基本信息的理论方法,为发展智能化公交建立了一定基础。戴霄和陈学武[11]对单条线路的刷卡信息进行统计分析,得到了全天客流总量、高峰小时客流量、断面流量等线路客流信息,以及站点间车辆平均运行时间、运营速度、站点平均等车时间等运营信息,为线路运营评价和调整提供了数据支撑。

由于城市轨道交通站点周边的用地特征对车站客流的发生和吸引具有较大影响,为探究不均衡现象的原因,基于2018年8月北京市轨道交通刷卡数据,从网络客运量、客流时空分布以及客流变化规律等方面探究了乘客出行特点,并应用K-Means聚类对北京市轨道交通站点进行分类,结合北京市城市功能结构对站点进行功能划分,分析出行规律与城市功能结构间的职住失衡关系,为大客流冲击下城市轨道交通运营优化研究提供理论支撑。

1 轨道交通线网客流特征及规律

1.1 网络客流量

城市轨道交通网络形成后,网络可达性逐渐提高,吸引了大量客流。如图1所示,北京市轨道交通各线路的日均客流量空间分布具有不均衡性,日均客流量及客流强度较大的线路主要为城市骨干线路,日均客流量最高可达58.29万人次(10号线),日客流强度最高可达1.62万人/km(4号线);而外围线路的客流量均在15万人次之内,日客流强度均小于0.6万人/km。

图1 北京市轨道交通各线路的日均客流量及客流强度

Figure 1 Daily passenger capacity and passenger flow intensity of each line of Beijing Rail Transit

1.2 客流分布形态

1.2.1 时间分布

图2是以5 min为间隔统计的北京市轨道交通工作日分时段进出站客流量。统计结果显示,城市轨道交通网络客流时间分布具有明显的不均衡性。工作日的进、出站客流量呈双峰分布,早高峰(7:00-9:00)和晚高峰(17:00-19:00)的进、出客流量相对高于全日其他时段。表1为北京市轨道交通网络工作日高峰进站量排名前五的车站,其高峰时段的进、出站客流量均在全日客流总量的50%以上。由图2和表1可得,刷卡数据能有效呈现北京市轨道交通线网主要服务通勤出行的特点。

图2 北京市轨道交通网络分时进出站客流量统计

Figure 2 Passenger flow of Beijing Rail Transit network

表1 北京市轨道交通网络工作日高峰进站量排名前5位车站

从乘客的角度分析,不同线路以及工作日、双休日的出行时间也具有不同的特征。

图3是以5 min为间隔统计的北京市轨道交通网络单日进站客流曲线图。工作日进站时间呈现双峰特性,反映出北京居民对轨道交通的通勤依赖性,6:30- 10:00出行的乘客占全天出行量的35.95%,16:00- 19:30乘客出行量占全天出行量的29.61%,而周末则没有如此明显的规律性。对比图3和图4,各线路进站客流与全网客流呈相同的分布趋势。通过比较发现,所有线路的进站时间分布都呈双峰形,全网客流高峰较集中。

1.2.2 空间分布

在城市轨道交通网络中,由于线路的位置、辐射范围、沿线交通走廊等各不相同,不同线路的客流量差异很大,网络客流分布呈现不均衡状态。

连接北京近郊和内环的市区中心线路承担较大客流量,吸引了大量的通勤客流。如图5所示,10号线、4号线、1号线、5号线、6号线是工作日全天进站客流量排名前五的线路。10号线、4号线、1号线3条线路工作日全天进站客流总量160.96万人次,占全网进站客流总量的36.2%;3条线路工作日全天出站客流总量162.82万人次,占全网出站客流总量的36.0%。相对中心线路而言,郊区支线如燕房线等线路进出站客流量较小,主要原因是支线线路大部分位于城市边缘,线路里程比中心线路短。

图3 北京地铁进站客流时间分布曲线

Figure 3 Time distribution curve of inbound passenger flow in Beijing Metro

图4 北京地铁不同线路工作日分时流量比

Figure 4 Time distribution of passenger flow ratio on different lines of Beijing Metro on weekdays

图5 全网进出站客流量统计

Figure 5 Statistics of inbound and outbound passenger flow

通过ARCGIS对各车站的工作日早高峰进出站客流量进行可视化处理,如图6、7所示。在图6、7中可观测到北京地铁工作日早高峰时进出站客流的特征为从市郊地区向城市中心迁移。

2 轨道交通站点功能分析

对北京市轨道交通客流的时空分布分析发现,北京市轨道交通客流呈不均衡分布。轨道交通客流受沿线居住及工作等用地类型的影响。在早高峰时段,周围居住用地较集中的车站一般为主要的客流发生点,而办公用地较集中的车站成为主要客流的吸引点。由于地铁站点周边用地性质的差异性,不同类型站点的客流时变特征也存在较大的差异,周边用地性质相似的车站其客流时变特征具有一定的相似性。因此现基于轨道交通客流分布,对轨道交通站点进行用地性质的划分。

2.1 K-Means聚类算法

聚类是将数据集划分为若干相似对象组成的多个组或簇的过程,使得同一组中对象间的相似度最大化,常用的聚类方法有K-Means算法和DBSCAN算法。而K-Means算法是基于点与点距离的相似度来计算最佳类别归属,适用于轨道交通客流数据,且收敛速度快。因此采用K-Means聚类算法,算法过程如下:

STEP1:给出个数据样本,令=1,随机选择个初始聚类中心Z(),=1, 2, 3, …,;

图6 北京地铁工作日早高峰进站客流量可视化

Figure 6 Visualization of inbound passenger flow in the morning peak of Beijing Metro

图7 北京地铁工作日早高峰出站客流量可视化

Figure 7 Visualization of outbound passenger flow in the morning peak of Beijing Metro

2.2 特征指标选取

根据不同站点的早晚高峰及平峰进出站客流特征,选取早高峰、晚高峰、平峰的进出站不均衡系数为特征指标,对北京市轨道交通站点进行聚类分析。不均衡系数的计算公式如下:

基于上述客流时空分布分析结果,选取早高峰时段为7:00-9:00,平峰时段为13:00-15:00,晚高峰时段为17:00-19:00。以小时为单位,对北京地铁所有站点某工作日的进、出站量进行统计并计算不均衡系数。计算时,早、晚高峰进出站客流量分别选取该时段的最大值,平峰进出站客流量选取该时段的平均值。得到各时段的进出站不均衡系数共6项指标。

由于指标数量较多,直接聚类会影响计算精度和效果,因此运用主成分分析法对6项指标进行降维,降维结果见表2,共提取2项主成分指标进行聚类分析。

2.3 聚类结果及评价

以2项主成分指标作为特征指标,运用 K-Means算法实现北京市轨道交通站点类型的聚类分析。聚类结果见表3。

选取Inertias、轮廓系数与Calinski-Harabaz得分作为评价指标。

Inertias是K-Means模型对象的属性,表示样本到最近的聚类中心的距离总和,数值越小表示样本在类间的分布越集中。轮廓系数是所有样本轮廓系数的平均值,分数越高说明聚类效果越佳。Calinski-Harabaz得分为群内离散与簇间离散的比值,比值越大聚类效果越好。

聚类程序输出结果中Inertias为83,轮廓系数为0.42,Calinski-Harabaz得分为379,因此聚类结果准确性较高。

表2 主成分分析法降维结果分析

表3 北京地铁站点聚类分析结果

2.4 站点类别分析

兴趣点数据包括地点名称以及其经纬度、地点类型等数据。图8为POI数据及第一类站点的可视化,彩色分别为不同种类的兴趣点,黑色为分类1站点(居住密集型)。以天通苑站为例,该站点2 km半径范围内存在九台庄园、都市芳园、合木山庄、鑫利达公寓、天通西苑等共25个住宅小区,仅天通伟业、布拉格、可喜安大厦、华联商厦4个写字楼,因此依据天通苑站点周围用地类型认为其为居住密集型站点。通过图8可看出,居住密集型站点均分布在北京市四环以外的市郊地区。图9为POI数据及第二类站点的可视化,彩色为不同类型兴趣点,黑色为分类2站点(就业密集型)。该类型站点大多分布在北京市四环内的办公用地周围,少数分布于北京市望京地区、丰台科技园地区以及亦庄地区产业园周边,因此认为该类型站点为就业密集型站点。同理,根据各类地铁站周边用地类型,将上述6类地铁站分为居住密集型(分类1)、就业密集型(分类2)、居住主导型(分类3)、就业主导型(分类4)、职住混合型(分类5)、商旅文娱型(分类6)。

图8 居住密集型地铁站点及兴趣点类型可视化

Figure 8 Visualization of residentially centralization subway stations and POI

图9 就业密集型地铁站点及兴趣点类型可视化

Figure 9 Visualization of employment centralization subway stations and POI

2.4.1 居住密集型

此类型站点主要分布在连接中心城区与市郊地区的线路上,所属行政区为昌平区、房山区、通州区以及大兴区。该类型站点周围分布着大量的居住用地,早高峰进站及晚高峰出站客流很大,潮汐现象明显,平峰时段客流很少。

以天通苑站为例,某工作日客流分布如图10(a)所示。

2.4.2 就业密集型

该类型站点分布在北京市中心城区,且大多集中在四环内。站点周围主要为办公用地,早高峰出站客流及晚高峰进站客流很大,高峰潮汐现象突出,平峰时段客流量很小。以东大桥站为例,某工作日客流分布如图10(b)所示。

2.4.3 居住主导型

该类型站点大多分布在北京城区南部的丰台区,周围居住用地占比较大,存在少量办公用地。相比居住集中型,其早高峰进站及晚高峰出站客流量较低。以刘家窑站为例,某工作日客流分布如图10(c)所示。

2.4.4 就业主导型

该类型站点大多分布于北京市中心城区北部及东部,周边用地类型以商务为主,相比就业集中型,早晚高峰的进出站量相对较低,平峰进出站量略高。以五道口站为例,某工作日客流分布如图10(d)所示。

2.4.5 职住混合型

此类车站大多位于北京市四环附近,周围居住人口及就业岗位相对均衡,以望京西站为例,某工作日客流分布如图10(e)所示。

2.4.6 商旅文娱型

该类车站位于北京市的对外港站及旅游景点周边,主要服务商旅类型乘客,全日客流相对均衡。以北京西站为例,某工作日客流分布如图10(f)所示。

结合图10可得出如下结论:

1) 在居住密集型和就业密集型的站点中,工作日早、晚高峰时段客流量最大值近3 000人次/15 min,平峰时则在500人次/15 min左右。结合不均衡系数指标,居住密集型站点的早高峰进站不均衡系数与晚高峰出站不均衡系数波动范围为3.5~6.5,就业密集型站点的早高峰出站不均衡系数与晚高峰进站不均衡系数范围为3.0~7.5。

2) 对于居住主导型及就业主导型站点,工作日早、晚高峰时段客流量均小于居住密集型和就业密集型站点,且呈不均衡的双峰分布。结合不均衡系数指标,居住主导型站点的早高峰进站不均衡系数与晚高峰出站不均衡系数波动范围为2.0~4.5,就业主导型站点的早高峰出站不均衡系数与晚高峰进站不均衡系数范围为2.5~5.0。

3) 职住混合型站点的客流分布曲线呈较均匀的双峰分布。

4) 商旅文娱型站点的全日客流分布曲线较均匀。

因此,通过对北京市轨道交通站点聚类及客流量时间分布分析可发现,不同类站点的客流时空分布存在较大差异,该差异的产生原因与城市的职住空间结构相关。

Figure 10 Time distribution curves of different types of sites

3 结论

以北京市轨道交通进出站刷卡数据为基础,分析了北京市轨道交通的时空分布特征,选取了站点客流特征指标,通过K-Means聚类分析,将北京地铁的站点划分为居住密集型、就业密集型、居住主导型、就业主导型、职住混合型以及商旅文娱型6类。

研究表明,北京市轨道交通客流分布极不均匀,城市职住失衡现象明显:就业岗位多集中于北京市主城区内,包括四环内的CBD、中关村等就业中心,以及五环边缘的望京、清河地区。而随着通州城市副中心以及昌平、房山等新城区的建立,在主城区外围出现了大批居住用地。在工作日的早晚高峰时段,存在大量往返于北京近郊居住小区至主城区就业中心的通勤客流。通过对轨道交通刷卡数据的分析发现,站点客流时间分布特征与其周围用地性质紧密相关,用地性质决定了居民出行目的及出行特征。通勤客流往往集中在早晚高峰,弹性客流分散在全日各时段。根据客流特征将城市轨道交通站点进行分类,有助于地铁运营公司对车站进行差异化管理,制定灵活的运营组织模式。

[1] MA X, WU Y, WANG Y, et al. Mining smart card data for transit riders’ travel patterns[J]. Transportation Research Part C-Emerging Technologies, 2013, 36: 1-12.

[2] KIEU L, BHASKAR A, CHUNG E. A modified density- based scanning algorithm with noise for spatial travel pattern analysis from smart card AFC data[J]. Transportation research part C-emerging technologies, 2015, 58: 193-207.

[3] WANG Z, HU Y, ZHU P, et al. Ring aggregation pattern of metro passenger trips: a study using smart card data[J]. Physica A, 2018(491): 471-479.

[4] BRIAND A, CÔME E, TRÉPANIER M, et al. Analyzing year-to-year changes in public transport passenger beha­viour using smart card data[J]. Transportation research part C-emerging technologies, 2017(79): 274-289.

[5] DEVILAINE F, MUNIZAGA M, TREPANIER M. Dete­ction of activities of public transport users by analyzing smart card data[J]. Transportation research record, 2012(2276): 48-55.

[6] JANG W. Travel time and transfer analysis using transit smart card data[J]. Transportation research record, 2010(2144): 142-149.

[7] TAKAHIKO K, YASUO A. Behavioural data mining of transit smart card data: a data fusion approach[J]. Tran­spor­tation research Part C-emerging technologies, 2014(46): 179-191.

[8] 唐超. 基于客流特征的城市轨道交通站点类型分类: 以南京地铁为例.创新驱动与智慧发展[C]//2018年中国城市交通规划年会论文集. 北京: 中国建筑工业出版社, 2018: 1596-1605.

[9] 冷彪, 赵文远. 基于客流数据的区域出行特征聚类[J]. 计算机研究与发展, 2014(12): 2653-2662.LENG Biao, Zhao Wenyuan. Region ridership characteristicclustering using passenger flow data[J]. Journal of computer research and development, 2014(12): 2653-2662.

[10] 陈学武, 戴霄, 陈茜. 公交IC卡信息采集、分析与应用研究[J]. 土木工程学报, 2004(2): 105-110. CHEN Xuewu, DAI Xiao, CHEN Qian. Approach on the information collection analysis and application of bus intelligent card[J]. China civil engineering journal, 2004(2): 105-110.

[11]戴霄, 陈学武. 单条公交线路的IC卡数据分析处理方法[J]. 城市交通, 2005(4): 77-80. DAI Xiao, CHEN Xuewu. The method of intellengent card data analysis for one public transportation route[J]. Urban transport of China, 2005(4): 77-80.

Passenger Flow Characteristics and Analysis of Urban Functional Structure Based on Rail Transit Data

CAO Jinghan, XU Yan, SUN Lishan, ZHAO Shenghui, WANG Yan

(College of Metropolitan Transportation, Beijing University of Technology, Beijing 100124)

With the rapid development of China’s economy and urbanization, the spatial relationship of urban residents is constantly changing. In the context of the increasing traffic congestion caused by an imbalance of an urban functional structure, the demand for resident travel is also increasing. With Beijing taken as an example, based on the automatic fare collection (AFC) card data, the network passenger volume, passenger flow space-time distribution, and other aspects of passenger travel characteristics are analyzed. Using k-means clustering, the subway stations of Beijing are clustered with unbalanced coefficients to study the unbalanced relationship between regular travel patterns and functional urban structures, whereby theoretical support for the study of an urban rail transit operation organization strategy is provided.

urban rail transit; AFC data; passenger flow characteristics; station features

U231.4

A

1672-6073(2021)02-0071-08

10.3969/j.issn.1672-6073.2021.02.012

2020-01-15

2020-04-09

曹敬浛,女,硕士研究生,从事轨道交通运营优化研究,609159925@qq.ocm

孙立山,男,教授,博士生导师,lssun@bjut.edu.cn

北京市科委项目(Z191100002519002),北京市教委项目(KM202010005001)

曹敬浛,许琰,孙立山,等. 基于轨道交通数据的客流特征与城市功能结构分析[J]. 都市快轨交通,2021,34(2):71-78.

CAO Jinghan, XU Yan, SUN Lishan, et al. Passenger flow characteristics and analysis of urban functional structure based on rail transit data[J]. Urban rapid rail transit, 2021, 34(2): 71-78.

(编辑:郝京红)

猜你喜欢
密集型工作日客流量
压痛点密集型银质针温针灸治疗肱骨外上髁炎的临床观察
密集型快速冷却技术在热轧带钢生产线的应用
密集型自动化立体仓库解析
基于嵌入式系统的商场客流量统计算法
关于休闲的量的问题的考察
知识密集型组织的商业模式创新策略——以网络教育组织为例
基于AFC数据的城轨站间客流量分布预测
从客流量推算公交出行PA矩阵的方法
新建旅游项目客流量分析方法初探
对《资本论》中工作日问题的哲学思考