基于线性模型的民航客运量影响因素与预测研究

2020-06-01 18:41刘杨
现代营销·学苑版 2020年4期
关键词:评价指标

刘杨

摘要:本文主要用于民航客运量的预测研究,针对多元线性回归建立预测模型出现的拟合度过高、存在严重多重共线性和模型变量不显著等问题进行改进,最终使用部分线性模型进行预测。通过对经济数据进行差分来减少数据的多重共线性,根据差分之后各变量与民航客运量的相关关系,采用部分线性模型进行数据的拟合并检验。经过多种评价指标对不同模型的对比发现,该模型预测准确度高,模型拟合效果好。

关键词:航客运量;线性模型;部分线性模型;评价指标

随着民用航空的广泛发展,近年来不少学者对民航客运量的预测了进行深入研究和剖析。程小康(2008)通过改进传统的ε支持向量回归机(SVR),构造了基于进化ε-SVR的“影响因素一民航客运量”预测模型影响因素,选用国民收入、人均国内生产总值、运输客运总量、民用航空航线条数、航空运输业职工人数,城镇居民人均可支配收入、城镇居民家庭平均每人全年交通通信消费等因素,并将该模型预测结果与其他方法所得结果进行对比。纪跃芝等(2012)建立分阶段多元线性回归模型,以国民收入,最终消费,铁路客运量,民航航线里程,来华人境人数等为影响客运量的主要因素,分析了改革开放前后这些因素与民航客运量之间的关系。文军等(2016)通过主成分回归模型构建了人均国内生产值、国内生产总值、职工平均工资、居民消费水平、境旅游人数以及对外贸易总额等因素与民航客运量关系的预测模型,所得结果较好。李维,肖红专(2017)采用偏最小二乘回归方法构建预测模型,发现对民航客运量的影响程度按从高到低分别为运输、邮政业增加值、国内生产总值、居民消费水平、铁路客运量、定期航班航线里程、入境游客等因素,且模型有效解决了变量问的多重相关性和在回归中样本点少的难题。

文献多采用多元线性回归、时间序列和机器学习的方法进行预测。而在一些文献中也有提到,多元线性回归方法得到的预测模型效果虽然较好,但是存在影响因素不显著的问题,若只用单个显著变量进行预测则会丢失较多信息,导致预测效果不准确。针对此问题,本文进行模型的探索与修正,并使用部分线性模型重新建立预测模型,预测效果较好。

一、预测方法

(一)多元线性回归模型

二、民航客运量预测模型

(一)数据获取与处理

影响民航客运量的因素有很多,根据文献及相关资料选取以下7个变量作为预测模型的影响因素进行探讨分析,分别是国民总收入指数X1、第三产业增加值指数X2、年末总人口数X3、城镇人口X4、入境游客X5、国内游客X6、民用航空航线里程X7。民航客运量作为因变量y。

数据来源于中经网统计数据库,选取1999年-2017年共19年数据进行分析。

(二)多元线性回归模型的改进与修正

1多元线性回归模型

首先根据表1中Pearson相关系数判断出各个变量与民航客运量之间具有将强的线性关系。用R语言软件做民航客运量关于x的线性回归模型,得到表2回归估计结果:

从得到的结果中,F值为1000,R2为0.9984,说明模型整体通过了检验且拟合得很好。从表一相关系数中看到,国民经济收入与民航客运量为正相关,但在模型中国民总收入指数的系数为负,经济意义不明确,且只有一个变量通过了检验。经验证模型的条件数为87453,该模型存在严重的多重共线性,可能导致所得参数的估计量无效。使用逐步回归法或主成分法消除共线性使得影响民航客运量的因素变少,易丢失大量信息。

2.部分线性模型

一般来说,现实经济数据将会随着时间的变化存在着相同的变化趋势,因此产生共线性。差分变换能使数据中趋势性部分的比重降低,波动和变化部分的比重加强,从而降低多重共线性问题。因此对原始数据进行一阶差分。

图1给出差分之后各变量与因变量之间的散点图。明显的,差分之后除国民总收入指数、第三产业增加值指数、国内游客与民航客运量存在线性关系,其他变量与民航客运量的关系未知,于是本文试图建立民航客运量的部分线性模型进行客运量的预测研究。

(三)模型的评价与比较

为了比较不同模型拟合效果的优劣,本文选取了常见了三个评价指标,分别为均方误差(MSE),赤池信息准则(AIC),拟合优度(R2)。为方便评价,模型预测指标定义如下:

根据评价指标来看,部分线性模型的MSE和AIC的值小;线性模型的R2接近于1,很可能模型存在虚假信息。而部分线性模型的R2达到0.8747,较为合理。另外,部分线性模型参数部分的系数均为正,符合经济意义。

综上所述,使用部分线性模型建立民航客运量的预测模型,效果较好。

结语

本文采用1999-2017年共19年数据进行民航客运量预测模型的研究。综合之前学者的研究,发现了民航客运量线性模型虽然拟合效果较好,但共线性严重,影响因素不显著,经济意义不符合实际等问题。针对存在的问题,文章进行了模型的探索与修正,并使用部分线性模型重新建立预测模型。部分线性模型将国民总收入指数、第三产业增加值指数、国内游客作為线性部分,年末总人口、城镇人口、入境游客、民用航空航线里程作为非线性部分进行建模。最后综合对不同模型拟合效果及检验指标的对比,使用半参数部分线性回归方法建立的民航客运量的预测模型,解决了数据具有多重共线性,变量系数经济意义不明显等问题,在民航客运量的预测问题上具有良好的使用意义。

猜你喜欢
评价指标
陕南生态移民生产生活水平评价及后期扶持
旅游产业与文化产业融合理论与实证分析
基于UML的高校思想政治教育工作评价系统的分析与研究