SARIMA模型与LSTM神经网络的航空客运量的预测比较

2021-03-08 01:57李思如
河南科技 2021年36期
关键词:航空公司深度学习

李思如

摘 要:本文基于我国1999—2020年民航客运量的月度数据,分别用传统的统计计量方法(SARIMA模型)和深度学习方法(LSTM神经网络)建立模型,评估并预测航空客运量。对比结果表明:相比传统SARIMA模型,LSTM模型对民航客运量的预测效果更好。

关键词:旅客运输量;航空公司;深度学习;季节ARIMA模型;LSTM模型

中图分类号:TP391.3     文献标识码:A     文章编号:1003-5168(2021)36-0018-04

Prediction of Air Passenger Traffic of SARIMA Model and LSTM Neural Network

LI Siru

(School of Statistics and Information,Shanghai University of International Business and Economics,Shanghai 201620)

Abstract: The article is based on the monthly data of civil aviation transportation in China from 1999 to 2020, and the model is established with traditional statistical metering methods (SARIMA models) and depth learning methods (LSTM neural networks) to assess and predict airline transport. The comparison results show that:compared to traditional SARIMA models, the LSTM model has better forecasting effects on civil aviation passenger traffic.

Keywords: passenger transportation; airline; deep learning; season ARIMA model; LSTM model

民航运输业不断向前发展,且经济全球化必然要求航空运输全球化。高质量的民航市场需求预测和发展规划是国民经济与民航运输业协调发展的前提[1]。

对航空公司客运量的预测,大部分采用的是传统的时间序列预测模型和机器学习预测模型。其中,传统的时间序列预测模型[2]包括自回归移动平均模型[ARIMA]、向量自回归模型[VAR]、广义自回归条件异方差模型[GARCH]等。尧姚等[3]建立[ARIMA-BP]组合模型以及[ARIMA]模型对我国民航客运量进行了预测,结果表明,组合模型的预测精度更高。孙亚兰[4]采用季节时间序列模型[SARIMA]预测航空客运量,较好地反映了航空客运短期发展现状。虽然这些预测模型已经得到了较好的实践验证,但由于时间序列变化莫测,以及模型建立的各种假设条件的局限性,难以确保线性预测模型的精度。近年来,深度学习方法不断发展和成熟,其中包含卷积神经网络[CNN]、循环神经网络[RNN]、长短期记忆网[LSTM]等。这些模型更适合输入多种类型数据,并能够拟合变量间各种复杂的关系,一定程度上可以避免过拟合,[RNN]拓展衍生出了[LSTM],其已被证明在时间序列预测中能更好地模拟数据的长期依赖性,能记忆数据间的长期关系[5]。

本文分别建立了传统的时间序列预测模型[SARIMA]和长短期记忆网络模型[LSTM],用于预测民航客运量,并对比两种方法的预测精度,结果表明,[LSTM]模型预测效果更佳。

1 研究设计

1.1 模型构建

1.1.1 季节ARIMA模型。[ARIMAp,d,q]模型[6]是将自回归过程[(AR)]和移動平均过程[(MA)]相结合的时间序列组合模型。[p]为自回归过程滞后的阶数,[d]为使时间序列平稳差分的阶数,[q]为移动平均过程滞后的阶数。[ARIMAp,d,q]模型可表示为:

[Φ(B)(1-B)dXt=θ(B)at]     (1)

式(1)是求和自回归移动平均模型,其中,[B]为延迟算子。

[ΦB=1-Φ1B−Φ2B2-…-ΦpBp]  (2)

[θB=1-θ1B-θ2B2-…-θqBq]   (3)

其中,[Φ1、…、Φp]是实数,且[ϕp≠0;θ1、…、θq是实数,且θq≠0。对于Φz和θz,当|z|≤1,Φ(z)≠0。]

而季节时间序列呈现出一定的循环或周期性。在一些研究中,为了排除季节性造成的影响,需要把它从数据中剔除。

若将差分序列[Yt=(1-BS)Xt]拟合[ARMA(p,q)]模型[Φ(B)Yt=Θ(B)at],则原始序列的模型为[Φ(B)(1-BS)Xt=Θ(B)at],这是一般季节性[ARIMA(SARIMA)]模型[7],定义如下:

如果[d]和[D]是非负整数,则[Xt]是周期为[S]的季节性[ARIMA]过程,记作[ARIMA(p,d,q)×(P,D,Q)S],若差分序列[Yt=(1-B)d(1-BS)DXt]是如下定义的因果[ARMA]过程:

[Φ(B)Φ(BS)Yt=θ(B)Θ(BS)at,at~WN(0,σ2)]  (4)

其中,[Φz=1-Φ1z-Φ2z2-…-ΦPzP]

[θB=1+B+θ2B2+…+θqBq]

[Θ(z)=1+Θ1z+Θ2z2+…+ΘQzQ]

1.1.2 [LSTM]模型[8]。随着训练时间加长和网络层数的增多,原始[RNN]模型容易出现梯度消失和爆炸的问题,无法处理较长序列数据。而[LSTM]是更高级的[RNN]模型,其可获取长距离数据的信息,并有效记忆序列的长期依赖关系。

[LSTM]是在标准[RNN]结构的基础上,添加了若干个阀门节点。其包含一个记忆存储[Cell]单元和三个门控单元:遗忘门[Forget Gate]、输入门[Input Gate]和输出门[Output Gate]。这些阀门可打开或关闭,其输出的值域为(0,1),用于控制其他数据的数级。

[LSTM]模型第[t]层的更新公式如式(5)。

[it=σ(Wi∙[ℎt-1,xt]+bi)ft=σ(Wf∙[ℎt-1,xt]+bf)ot=σ(Wo∙[ℎt-1,xt]+bo)c~t=tanℎ(Wc∙[ℎt-1,xt]+bc)ct=ftct-1+it⊙c~tℎt=ot⊙tanℎ(ct)]    (5)

其中,输入门[it]控制流入[ct]的信息量;遗忘门[ft]控制[t-1]时刻的信息可累计到[t]时刻的信息量;输出门[ot]控制[t]时刻流入[ℎt]的信息量;[σ]为激活函数[sigmoid函数等]可将记忆信息纳入计算范围;[W]为循环层的权重矩阵;[bi]为输入门的偏置项。

[LSTM]和[RNN]都从[tanℎ(Wc∙[ℎt−1,xt]+bc)]获取信息,而[LSTM]模型是靠三个门控单元在线性自连接单元进行信息积累,并将其作为中间产物计算当期[ℎt]。[LSTM]模型考虑了信息递归过程,从状态[ct-1]到状态[ct]的信息转移不完全取决于[σ]函数计算得到的状态,还由[it]和[ft]共同控制,即[ct=ftct-1+it⊙tanℎ(Wc∙[ℎt-1,xt]+bc)],使得[LSTM]模型具有递归效应,且具有常数误差流的特性,误差向上一个状态传递过程中几乎没有衰减,故模型具有长期记忆功能。

1.2 数据来源及样本选择

为了预测我国2020年以后的民航客运量和民航运输业的稳定发展,选取的数据来源于中国民航1999年1月至2020年12月的客运量(单位:亿人),时间跨度为264个月,共264个样本点。

2 实证结果分析

2.1 基于[SARIMA]模型对中国民航客运量的实证分析

2.1.1 绘制时序图。图1为国民航国内月客运量时序图,由图1可知,中国民航国内月客运量表现出长期向上增长的趋势,且有一定的以年为周期的季节效应,客运量上升缓慢,但是下降却很快。这表明客运量数据没有遵循线性时间序列模型。

因原始数据没有遵循线性时间序列模型,对数变换是一种常用的方法,对数据取对数能够减少异方差的影响,将其转化为线性形式。

2.1.2 单位根检验。图2(a)展现了数据序列取对数后的走势,可以看出取对数后的序列变为线性增长。同时,数据序列经过差分过程剔除了数据向上趋势,但样本自相关函数表现出了周期性,即当滞后阶数为12阶、24阶和36阶时自相关函数较大,表明序列有季节性特征,仍须进行季节差分处理。

在此基础上,用单位根检验进一步判断其对数序列的平稳性,运用ADF检验,得到[p]值为0.439,大于0.05,说明其对数序列非平稳。

2.1.3 剔除季节性。由单位根检验可知,其对数序列具有季节性,故将通过12阶差分和正规差分剔除季节性因素,得到图3。

由图3可以看出,季节差分过程剔除了数据的季节性,时序图显示序列类似平稳。

2.1.4 建立SARIMA模型。令[Xt]为取对数后的中国民航国内月客运量序列,利用[R]中[forecast]包里的[auto.arima]函数对模型进行定阶。

由运行结果可得拟合的模型为[ARIMA(2,1,1)×(2,0,0)s=12]:

[1-0.689 5B+0.086 7B2(1-0.350 9B12-0.202 2B24)1-BXt=(1-0.917 9B)at]

[ σa^2=0.027 59]       (6)

其中,系數估计的标准差分别为0.068 4、0.064 8、0.031 2、0.083 7、0.083 6。

图4给出了拟合的[SARIMA]模型诊断图。由图(b)知,几乎所有的残差[ACF]都在两倍的标准误差上下限(虚线)内;由图(c)知,[p]值均大于第[I]类错误值(虚线)。最后,对残差进行[Ljung-Box]检验,得到检验统计量为4.058 3,当自由度为12时,[p]值为0.982 4,认为估计模型是显著的。

2.1.5 预测及模型评价。为了评价模型的预测性能,取中国民航国内月客运量的前254个月度数据来估计模型的参数,以[h=254]为预测原点,对新得到的拟合模型计算向前10 步预测值,并将最后10个数据点的实际观测值与预测值相对比,新得到的拟合模型为:

[1-0.696 5B+0.239 4B2(1-0.331 0B12-0.206 4B24)1-BXt=(1-0.855 6B)at]

[ σa^2=0.027 09]

其中,系数估计的标准差分别为0.108 9、0.093 2、0.076 0、0.084 4、0.085 6。

由表1可看出,预测值与实际观测值相差不大,实际观测值大部分都在区间预测内,且均方预测误差为0.258 588 3。

2.2 基于[LSTM]模型[9]对于中国民航客运量的实证分析

2.2.1 数据预处理。为加快程序构建网络模型效率,本文采用[Pytℎon]语言环境,选择高度封装的[Tensor Flow]官方支持的[Keras]板塊来构建[LSTM]神经网络框架。

在对样本数据进行训练和预测之前,为使模型快速收敛,可先将序列数据采用归一化方式进行处理,使序列数据放缩在[0,1]之间,可采用[sklearn.preproces sin g]模块中[MinMaxS cal er]函数处理,其原理如下式:

[x∗=x-minxmaxx-minx]      (7)

由于数据样本点有限,为与[SARIMA]的预测模型一致,取前96%的序列值作为训练集,其余序列值作为测试集,即1999年1月至2020年1月的数据作为测试集。本文采用单步预测即向后一步预测的方式,使用4层[LSTM]神经网络模块加一层普通的神经网络层进行训练,[LSTM]模块的激活函数默认使用[tan h]函数。使用均方误差[MSE]作为损失评价标准,采用[Adam]算法迭代更新权重参数,拟合模型中的[epoch]、[batchsize]分别设为100和1。

2.2.2 模型预测。用上述模型分别对训练集和测试集的序列值进行预测,表2展示了模型部分预测结果。该方法自动识别了数据季节性和趋势性的非线性特征,在训练集数据中模型的训练效果较好,在测试集数据中,同样取得了较好的效果。模型训练集和测试集预测的均方根误差[RMSE]分别为0.02和0.06(归一化数据),相比[SARIMA]模型的预测结果更好。

3 结语

本文通过[SARIMA]模型和[LSTM]神经网络对中国民航1999年1月至2020年12月的客运量进行预测比较,发现[LSTM]模型预测均方根误差更小。但对于不同的数据集,两种方法各有优势,对于文章中选取的数据集而言,进一步可考虑基于[LSTM]模型的多变量预测。一般相对简单的数据集可考虑使用[SARIMA]模型直接预测,因其进行了去季节性和趋势等各种数学变换,其预测结果与[LSTM]模型预测结果相差不大,应根据数据本身的特征,选择合理的模型进行预测。

参考文献:

[1] 张宗清.我国支线航空运输市场需求预测与发展规划研究[D].天津:中国民航大学,2008.

[2] 杨海民,潘志松,白玮.时间序列预测方法综述[J].计算机科学,2019(1):21-28.

[3] 尧姚,陶静,李毅.基于ARIMA-BP组合模型的民航旅客运输量预测[J].计算机技术与发展,2015(12):147-151.

[4] 孙亚兰.基于季节时间序列模型的民航客运需求预测分析[J].中国外资,2013(18):263-266.

[5] LE C Y,BENGIO Y,HINTON G. Deep Learning [J].Nature,2015(521): 436-444.

[6] 范波,宋文彬.基于ARIMA模型的产品销售量预测研究[J].工业控制计算机,2021(5):128-129,125.

[7] 徐映梅,陈尧.季节ARIMA模型与LSTM神经网络预测的比较[J].统计与决策,2021(2):46-50.

[8] 王英伟,马树才.基于ARIMA和LSTM混合模型的时间序列预测[J].计算机应用与软件,2021(2):291-298.

[9] TAWUM J M,HAIWANG Y,JIANHUA Z,et al.Using LSTM and ARIMA to Simulate and Predict Limestone Price Variations[J].Mining,Metallurgy&Exploration,2021(38):913-926.

猜你喜欢
航空公司深度学习
IATA上调2021年航空公司净亏损预测
中国航空公司新开义乌直飞符拉迪沃斯托克航线
有体验的学习才是有意义的学习
电子商务中基于深度学习的虚假交易识别研究
MOOC与翻转课堂融合的深度学习场域建构
大数据技术在反恐怖主义中的应用展望
深度学习算法应用于岩石图像处理的可行性研究
基于深度卷积网络的人脸年龄分析算法与实现
柬埔寨筹组新航空公司