融合长短期记忆网络和图卷积网络的轨道交通短时客流起讫点预测

2022-12-13 00:33唐继强杨璐琦
重庆大学学报 2022年11期
关键词:客流间隔站点

唐继强,杨璐琦,杨 武

(1. 重庆理工大学 计算机科学与工程学院,重庆 400054;2. 重庆市轨道交通(集团)有限公司,重庆 401120)

近年来,在数字城市的推进下,中国的城市轨道交通行业高速发展。为了制定有效的管制措施、合理配置地铁运力、提高运营服务质量,需要准确、高效地对短时间内轨道交通客流量的变化进行预估,因此一个对短时间内客流的准确预测方法对于实现上述措施至关重要。

目前,对于城市轨道交通短时客流起讫点(origin-destination,OD)预测的研究仍在起步阶段[1]。已有的轨道交通短时客流预测方法一般分为参数模型和非参数模型。典型的参数模型中包括历史平均模型、回归分析方法[2]、贝叶斯方法[3]、时间序列模型和卡尔曼滤波模型[4-5]等。典型的非参数模型包括K最近邻算法[6-7]、支持向量机(support vector machine, SVM)模型[8]和神经网络[9]等。上述方法中,客流OD的短时预测通常被看作是时间序列预测的问题,神经网络具有识别复杂非线性系统的特性,因此比较适合用于短期交通流预测[10]。

轨道交通客流OD预测与交通流OD预测原理十分相似,因此很多交通流预测模型如车流量预测等都被用于轨道交通客流预测。Smith等[11]首次在短时交通流的预测研究中应用神经网络模型,通过与其他模型的比较证明了神经网络的良好效果。赵顗等[12]结合小波函数和BP神经网络模型对交通小区的生成交通进行分解后再预测,提高了交通小区生成交通短时预测精度。李洁等[13]提出了客流时间序列的分析和预测方法,构建了基于LSTM的客流预测模型,通过实验证明了该模型的预测性能较优。由于轨道交通尤其是轻轨地铁系统本质上是一个基于图的结构,且为非欧几里得图结构,借助于卷积神经网络对局部结构的建模能力及图上普遍存在的节点依赖关系,图卷积网络(graph convolutional networks,GCN)成为其中最活跃和最重要的一支[14]。陈喜群等[15]考虑路网拓扑结构和交通流时空相关性,提出基于图卷积网络的短时交通流预测模型,具有较高的预测精度,在预测性能上有较大提升。陈镇元等[16]提出一种基于图卷积神经网络的地铁客流预测模型,有效捕捉了地铁网络中复杂的空间依赖,提升了预测的精度。在短时交通客流预测方法中,单一模型适用情况不同,因此许多学者根据实际情况,选用多种单一模型组合使用,从而发挥各种预测方法的优点[17]。刘晓磊等[18]组合图卷积网络和循环神经网络构建了图卷积循环神经网络GCGRU模型;梁强生等[19]分析了短时客流在城市轨道交通网络中的空间关系,建立图卷积神经网络提取不同车站客流的空间交互关系,同时利用循环门控单元捕获客流的时间特征,进而较好地反映路网各车站客流的时空相关性。申慧涛等[20]采用残差神经网络构建新型的生成对抗网络的内部结构,提高了预测精度。以上研究表明了组合模型在轨道交通客流预测方向的优势。

基于此,笔者采用长短期记忆(long short-term memory,LSTM)和GCN建立混合深度学习模型,对连续时间间隔的重庆轻轨全网进出站客流量进行短时客流OD矩阵预测。模型聚焦于挖掘客流的时空特征,通过对基于出站口建立的OD矩阵分析,获取站点的时间相关性以及站点间的空间相关性,最后通过加权融合的方式来对重庆市轻轨的客流OD进行预测。

1 相关技术

1.1 长短期记忆网络

在时间序列建模方面,LSTM作为一种特殊的循环神经网络(recurrent neural network,RNN)结构,在之前的各种研究[21-22]中已被证明对于时间序列的处理效果优秀,用于建模长期依赖关系。LSTM可以解决长序列训练过程中的梯度消失和梯度爆炸问题。LSTM由4部分构成,输入门、输出门、细胞状态和遗忘门。记忆单元负责记录历史数据中的有用信息,并将其传递到当前任务中;遗忘门则负责删除和遗忘部分信息,解决RNN存在的长期依赖问题。LSTM的结构见图1所示,其计算过程如式(1)~式(6)所示。

图1 LSTM的结构Fig. 1 Structure of LSTM

ft=σg(Wfxt+Ufht-1+bf),

(1)

it=σg(Wixt+Uiht-1+bi),

(2)

ot=σg(Woxt+Uoht-1+bo),

(3)

(4)

(5)

ht=ot*σh(ct),

(6)

式中:ft、xt、it、ot、ct、ht分别代表遗忘门、输入数据、输入门、输出门、记忆单元和隐藏状态;W、U是权重矩阵;b是需要在训练中学习的偏置项。初始状态c0=0,h0=0,并使用反向传播算法和优化函数来对参数进行优化,t代表第t个时间间隔。

1.2 图卷积网络

GCN主要用于非欧式图结构数据的特征提取。图卷积网络的方法分为两类,分别是基于谱域的方法和基于空域的方法,笔者采用了基于谱域的方法。给定一个无向关系图G=(V,E,A),V表示顶点的合集,E为边的合集;A∈N×N是图G的邻接矩阵,即由边组成的N×N矩阵,矩阵中若vi、vj两点存在一条边,则Aij=1,否则Aij=0。从图结构可以得到邻接矩阵,同理,也可以通过邻接矩阵得到图结构。

(7)

GCN在图的拉普拉斯算子基础上对卷积神经网络对图的卷积运算进行进一步推广,在谱图卷积中使用对称归一化的拉普拉斯矩阵:

(8)

图的性质可以由图的拉普拉斯矩阵求得,对图的特征提取则可以等价为对图的拉普拉斯矩阵的特征提取。文中采用k阶切比雪夫多项式作为卷积核,减少参数,从全局卷积变为局部卷积,以降低计算的复杂度。

2 组合预测模型

客流OD存在时序特征和空间相关特征[24]。通常站点之间的进出关系即客流出行[25],客流OD可以看作矩阵时间序列, 矩阵的每个元素都表现了单个站点与单个站点间的空间相关性,所有矩阵又表现了所有站点与自身相关的时间特征。根据划分时间长度将一天分为数个时间间隔,每一个时间间隔对应一个OD矩阵,矩阵的行和列代表当前时间间隔下站点与站点间的来往客流。由于行程可能不会覆盖每个时间间隔的所有OD对,因此产生的客流OD矩阵通常是稀疏矩阵[20],如何构建有效的客流OD矩阵与如何提取时间和空间特征是主要研究内容。

2.1 基于出站口的OD预测

由于客流OD矩阵并非实时性获得,在某一时刻入站所采集到的AFC(automatic fare collection system)数据在给定的时间间隔内并不一定会完成此次出行得到出站的刷卡数据。但对于出站口,每一个出站所得到的刷卡数据则必定会有一个入站刷卡数据与之对应。文中所述客流OD矩阵是指一个基于整个路网结构和站点建立的矩阵。

给定一个路网,对于每一个站点都将其视作一个拓扑图的节点,则整个站点的集合用V={v1,v2,…,vN}来表示,集合内vi代表第i个站点,N表示站点数。将一整天分为m个时间间隔,令X表示客流OD矩阵,X∈N×N×T。其中T表示时间间隔总数,T=m*(k-1)+t,k表示第k天,m表示每天被分隔的时间间隔数,t表示当天的第t个时间间隔。Xt=xt(i,j)表示第t个时间间隔内从站点vi到站点vj的乘客数量,如式(9)所示。对于同站进出刷卡的乘客将其设为无效乘车记录,即客流OD矩阵对角线上的元素设置为0。

(9)

客流OD预测是指,在获得基于AFC数据得到的历史客流OD条件下,分析数据在时间和空间分布的特征,并对当前路网进行接下来一段时间间隔的客流OD预测。轨道交通客流OD预测的目标就是通过{XT-h,…,XT-2,XT-1}来对XT进行预测。其中h=T-1,…,1,表示历史时间间隔数。

2.2 模型构建

由于轨道交通客流OD出发地和目的地存在动态的相关性,且对时间、空间有很强的依赖性,普通的模型无法同时解决这2个问题。组合模型通过提取时间、空间位置关系对历史客流OD进行处理,来预测未来的客流OD。组合模型的结构如图2所示,包含3个关键模块,分别为时间特征提取模块、空间特征提取模块和全连接模块。

图2 模型结构Fig. 2 Model architecture

在时间提取模块中,文章采用单层的LSTM结构,将历史客流OD矩阵转化为序列作为输入;在空间特征提取模块,将LSTM的输出经过激活函数处理,并引入站点相似度矩阵和邻接矩阵进一步获取空间相关特征。文章采用3层GCN结构,如式(10)所示,

(10)

式中:θ0、θ1、θ2为3层卷积的权重矩阵;σ代表层与层之间的激活函数。

根据模型结构设计算法过程如下所示:

算法1:未来第T个时间间隔(即当天第t个时间间隔)客流OD预测。

输入:前一周的第t个时间间隔客流OD矩阵XT-m*7、前一天的第t个时间间隔客流OD矩阵XT-m、同一天前3个时间间隔客流OD矩阵XT-3、XT-2、XT-1、轨道交通路网邻接矩阵、相似度矩阵。

输出:第T个时间间隔客流OD。

步骤1 计算轨道交通路网邻接矩阵;

步骤2 计算不同时刻站点间相似度矩阵;

步骤3 将5个时刻的客流OD矩阵输入模型获取时间相关性;

步骤4 将邻接矩阵与该时刻相似度矩阵输入模型获取空间相关性;

步骤5 结果融合,得到T时刻客流矩阵。

在进行时间特征提取部分,笔者将基于出站口建立的OD矩阵作为输入数据,将每个OD对相关联的历史值作为一个单独的时间序列。为预测第k天的第t个时间段的客流OD,笔者使用第k天的第t-3、t-2、t-1这3个时间段的客流OD,以及第k-1天的第t个时间段和第k-7天的第t个时间段的客流OD输入LSTM模型中,即最近前3个时间间隔数据、一天前的同一时间数据、一周前的同一时间数据。使用LSTM模块来获取的时间特征,最终将作为GCN第0层的隐藏向量。在空间特征提取部分历史客流OD数据由地铁网络得到的表明真实地理信息的邻接图以及每一个时间间隔中站点与站点间的相似性矩阵来进行计算,通过GCN来获取客流OD的空间相关性。根据每一个站点的分布,结合客流OD来形成一个张量。模型中的邻接图由真实地理位置信息得到,即站点与站点之间的邻接关系生成的邻接图,是一个固定的静态图;站点相似度矩阵反映了站点与站点之间的动态相关性,由不同时刻的站点与站点之间的客流OD矩阵决定并根据历史客流OD采用余弦相似度进行计算,数值越大,相似度越高。

这5个时间段的历史客流OD矩阵使用LSTM获取时间相关性,并作为GCN第0层的输入信息,再使用GCN分别对由站点的邻接矩阵构成的静态图和由客流OD构成的动态图进行空间特征的提取,使用平均策略对上述2个结果进行融合来获得更好的结果。

3 实验结果

3.1 数据集来源

数据来源于重庆市轨道交通的AFC数据。乘客刷卡进出站时都会生成一条AFC数据,数据中记录了卡ID、刷卡时间、刷卡站点、刷卡事件、数据上传时间。文章采用了2018年10月份31天的重庆轻轨AFC数据来进行模型的训练和预测。系统所采集刷卡记录有105 065 115次,所采集内容有票卡号、交易日期、交易时间、票卡种类、交易事件、交易车站、交易前余额、交易金额、交易后余额、联程交易、卡计数器、设备编号、数据接收时间。关键信息如表1所示。

表1 AFC数据样例Table 1 AFC data sample

3.2 数据预处理

按照运营时间,将刷卡时间在6:30前和23:30后的数据去掉,去除工作人员的刷卡记录,只保留票卡号、交易日期、交易时间、交易事件、交易车站,以此生成完整的客流数据,基于出站口,时间间隔为15 min来建立客流OD矩阵。

在2018年10月重庆的轻轨站点总共有148个站点,根据站点与站点间的邻接关系建立邻接矩阵。由于国庆节7天假期导致客流并不规律,在这里采用第2周开始到第4周这3周数据,并将数据集分为两部分:前2周作为训练集,最后1周作为测试集。训练集与测试集的OD矩阵以热力图可视化后分别如图3所示。其中横纵坐标分别对应2018年10月重庆轨道交通路网148个站点的编号,横纵坐标交错位置为由横坐标代表站点去向纵坐标代表站点的客流数量,客流人数越多,颜色越深,在同一站点进出的记录被视为无效记录,对角线位置全部用“0”替代。

图3 训练集与测试集的OD矩阵相关热力图Fig. 3 Heat map of train set and test set of passenger flow OD

3.3 模型参数设置及评价指标

为评价预测结果的性能,笔者采用均方根误差(root mean square error,RMSE)和平均绝对误差(mean square error,MAE)来进行模型的性能评价。

(11)

(12)

实验采用切比雪夫多项式作为GCN卷积核形式,使用ReLU作为激活函数;在训练模型中,采用Adam优化函数,训练次数设置为200,学习率设置为0.000 1。

3.4 预测结果分析

对于组合模型的预测结果,取同一天的同一个时间间隔的真实值与模型预测值热力图进行对比,如图4所示。

图4 模型预测值与真实值相关热力图Fig. 4 Heat map of true value and model predietion of passenger flow OD

图4(a)表明了客流OD在10月28日22:15~22:30的真实值,图4(b)表明了客流OD在同一时刻的模型预测值,其中横纵坐标意义与图3一致,颜色越深表明从该行代表的站点到该列代表的站点之间的客流量越大,反之越少。从图4可以看出预测值与真实值之间虽然存在误差,但整体预测效果良好。

针对重庆轻轨交通客流OD数据集,将组合模型预测结果与GCGRU[26]和基于LSTM模型预测的结果对比分析。这3种方法对客流OD的预测误差如表2所示。

文中的组合模型的平均绝对误差为1.37,均方根误差为3.43;GCGRU组合模型的平均绝对误差为1.47,均方根误差为3.94;而基于LSTM神经网络的预测模型平均绝对误差为1.49,均方根误差为4.61。可以看出,组合模型结果优于LSTM模型,主要由于深度学习模型有较强的拟合能力。对于轨道交通的客流OD预测,文中组合模型效果也优于GCGRU模型。文中组合模型既可以获取在时间维度上的长时间依赖性,又可以捕获源、目的地之间的依赖关系,根据站点与站点间的空间分布来捕获动态客流流动规律。

表2 模型短时预测结果对比Table 2 Comparison of short-term forecast of models

4 结束语

笔者研究了轨道交通客流OD预测问题的时间、空间依赖关系,通过改进客流OD的处理方式,即基于每一个出站口对客流进行入站口的统计,并使用基于LSTM和GCN的组合模型来对轻轨地铁客流OD进行预测,其中LSTM用于获取交通客流的时间相关性,而GCN则用来提取交通客流的空间位置相关性,经过模型训练后得到预测的结果。为检验模型的预测效果,笔者采用了基于LSTM神经网络的模型和GCGRU作为对比模型,采集实际的轨道交通客流量,以RMSE和MAE作为评价指标,通过实验比较本文模型和其他模型的预测精度。实验表明,基于LSTM和GCN的组合预测模型的精度要优于单独的LSTM神经网络预测模型和GCGRU模型,说明文中构建的预测模型有效。

猜你喜欢
客流间隔站点
客流增多
城市轨道交通节假日期间大客流行车组织思考与实践
间隔问题
基于Web站点的SQL注入分析与防范
间隔之谜
积极开展远程教育示范站点评比活动
首届欧洲自行车共享站点协商会召开
怕被人认出
基于自学习补偿的室内定位及在客流分析中的应用
人工免疫算法在电梯客流时段划分的应用