基于时间序列的民航客运量分析预测

2018-08-29 11:20冯慧娇
大经贸 2018年7期
关键词:时间序列

冯慧娇

【摘 要】 本文首先对时间序列主要特征和时间序列分析步骤进行介绍,然后在平稳时间序列建模的基础上对非平稳时间序列的建模进行了分析。在分析的过程中将非平稳时间序列的建模分为基于确定性分析的建模和基于随机性分析的建模两大类,并对此进行了比较。最后本文运用 2013年 1月至 2017年 12月我国的民航客运量数据,基于 R 软件进行分析,通过 ARIMA 模型、季节效应分析和 Holt-Winters 模型分别对我国的民航客运量数据进行拟合。最后经过模型比较选择了Holt-Winters模型,并预测了我国2018年12个月的民航客运量。

【关键词】 时间序列 民航客运量 季节效应分析

ARIMA模型 R软件

第1章 绪 论

我国航空运输需求量增长的主要因素首先是经济总量扩张;其次对航空运输影响最大的是结构因素;再次,国际贸易也是航空运输需求的重要带动因素。我国全球进出口贸易总额不断增加,且城镇居民消费有温饱型转向享受型发展型,都对我国旅游支出、民航发展提供了极具前景的良好的发展空间。所以在这种情况下,对我国民航客运量进行分析预测,对于民航业的发展具有重要的意义。

第2章 时间序列分析基本方法

2.1平稳性检验

时间序列法的核心是对数据进行平稳性检验。一般有两种方法来检验序列的平稳性。其中一种是比较直观的图检验法,由时序图和自相关图的特征做出判断,另外一种是具有理论依据的假设检验的方法,手段是构造合适的检验统计量。

2.2非平稳时间序列的确定性分析

2.2.1确定性因素分解

任意一个时间序列分析都可分解为由多项式决定的确定性趋势分析和由平稳的零均值误差成分。对于平稳序列,这两种影响对序列的作用都是稳定的,而非平稳序列所受到的两种影响至少有一种是不稳定的,这也是非平稳序列产生的机理。

2.2.2趋势分析

一、指数平滑法

1、简单指数平滑

适用于非季节性变动,处于恒定水平、没有明显趋势的时间序列,可对其进行短期预测。

2、Holt两参数指数平滑

适用于对含有线性趋势、无季节性的序列进行修匀。适用于对含有线性趋势、无季节性的序列进行修匀。基本思想是假定序列有每期递增或递减的固定趋势趋势变动值,则第前一期的观察值加上每期固定的趋势变动值就应该等于该期的估计值。

3、HW指数平滑

此模型为指数平滑方法的一种,包括想加模型以及相乘模型。主要适用于有增长或降低趋势、季节性变化的时间序列。

二、季节效应分析

具有季节效应的时间序列的特点是事件呈现出了固定周期性变动。具体步骤分为三步:计算周期内的各期平均数;计算总平均数;季节指数等于时期平均数除以总平均数。

季节指数比值比1大,表示高于平均值,比值比1小,表示低于平均值,若都等于1表示序列无明显的季节效应。

2.3非平稳时间序列的随机性分析

2.3.1差分运算

对于观察值序列,无论选取的是确定性还是随机性的方法,都首先需要进行的是将序列中的确定性信息采用有效的手段提取出来。提取确定性信息的方法是差分运算的实质。

若序列蕴含固定周期,若想要比较好的提取周期信息,一般采用进行步长为周期长度的差分运算。

2.3.2求和自回归移动平均模型

许多非平稳序列差分后会显示出平稳序列的性质。这说明任何非平稳序列若能通过有效手段使序列平稳化,可以对处理后的序列进行模型拟合,而这个有效的手段就是上文介绍的适当阶数的差分运算。

第3章 基于时间序列的民航客运量分析

3.1民航客运量数据

2013年1月到2017年12月民航客运量人数(万人),数据来源于中国统计年鉴。

3.2指数平滑法模型的建立

分别为采用三种平滑法的样本内实际值与样本内预测值的拟合效果。从图中很难看出哪一种模型更适合对原始时间序列的拟合。

可以通过比较样本内误差的误差平方和来进行模型的取舍。由三种模型的样本内预测误差的误差平方和可以得出HW >平滑简单指数平滑>Holt两参数指数平滑,可见HW指数平滑模型要比简单指数平滑模型、霍特双参数指数模型的精度都要高。因此,本文在指数平滑法里选择H-W模型进行分析预测。通过STL分解进行进一步的验证,第一行为原始数据、第二行为季节成分、第三行为趋势成分以及第四行的剩余误差成分。我们可以发现是季节项影响、趋势项影响是影响序列的主要因素,剩余误差部分是非随机的波动,由于其影响很小无法用模型来描述,模型拟合时可以忽略。该模型非常成功的预测了季节峰值,其峰值大约发生在每年8月份左右。

Stl分解拟合结果中,意味着当期预测值基于平衡了最近和较远期的观测值。为0表明趋势项影响因素在整个时间序列上不变,也就是初始值,这与我们的直观感受是相符的,民航客运量的趋势部分斜率基本是不变的,水平改变则比较多。

3.3季节效应分析

时间序列的分解即估计出趋势、季节和不规则部分。R中可将时间序列的趋势部分季节部分估计出来,同时还可以估计出时间序列的不规则部分。本文选择相乘模型进行分析,首先提取模型中的趋势项影响因素,再使用线性模型进行拟合。

模型诊断得回归模型拟合效果一般,残差在0值附近波动较大,且不服从正态分布,残差出现了明显的自相关性。优化解决方法就是在季节效应分析时针对季节性影响提取出序列的季节因子,将季节因子与线性拟合的趋势项预测数据相乘就可以得到预测值。因此,可以通过提取出季节因子的方法得到季节指数sea。

8月份的季节指数最大,说明8月份是民航客运量最大的月的,12月份的季节指数最小,说明12月份的民航客运量最小。与原始序列所观察结果十分符合,所以可以认为提取出季节因子的模型能够很好对民航客运量进行拟合预测。

3.4ARIMA模型建立

由差分运算的实质可知提取确定性信息的方法可以采用差分运算,我们可以通过1阶差分来提取趋势的影响;可以通过2阶或3阶差分来提取曲线趋势的影响;提取周期性信息时则可以通过歩长为周期的差分运算来实现平稳性。通过差分使非平稳序列显示平稳性的差分后平稳序列,是可以用ARIMA模型来拟合的差分平稳序列。

本文进行时间序列的分析主要是通过R软件来实现的,首先通过R软件作出民航客运量原始数据的时间序列图,可根据观察时间序列图中民航客运量呈现出的递增的趋势性来初步判断序列是不平稳的。同时还可以发现序列的季节因素很明显,每一年份的民航客运量变动都是有规律的。因此为了是序列平稳化,我们可以尝试对数据做差分,通过使差分之后的序列平稳,进行ARIMA模型的拟合。

1阶差分之后的序列可能已经平稳了。为了验证我们的判断是否正确,对差分之后的序列进行检验。

本文判断序列平稳的手段是单位根检验。在R中ADF的检验里,得到1阶差分以后的序列的P值为0.01,就可以认为拒绝不平稳的零假设,说明1阶差分后的序列平稳。可用R来进行模型的定阶与取舍。根据AIC准则应该优先考虑AIC值较小的模型,所以最优模型阶数为为 (1,1,1) ,模型的信息赤函池准则数值为AIC,BIC均为最小的。接下来对该模型进行估计诊断,采用LB统计量来检验模型的残差是否为白噪声。

由P值显著大于显著性水平=0.05,因此可以判断残差序列为白噪声序列。此ARIMA模型拟合效果较好 。

3.5民航客运量预测及模型比较

两模型都可得出相应的预测区间,而季节效应分析无法得知预测的精度,所以优先选择前两个对原始序列进行拟合。

可根据模型的预测误差来进行模型的取舍。由预测误差的时间曲线图看出后者的预測误差值相对较小。

由预测误差的直方图可以看出第二个模型的预测误差符合正态分布。综上所诉,发现第二个模型能够好的对未来值作出预测,因此最终选择H-W进行预测。

2018年民航客运量每月份的预测值如下:

猜你喜欢
时间序列
基于分布式架构的时间序列局部相似检测算法
基于嵌入式向量和循环神经网络的用户行为预测方法
基于时间序列分析南京市二手房的定价模型