铁路基础设施建设项目中铁路客运量预测模型研究

2016-06-05 15:02袁丽军
项目管理技术 2016年7期
关键词:共线性客运量线性

袁丽军

(天津大学管理与经济学部,天津 300072)

铁路基础设施建设项目中铁路客运量预测模型研究

袁丽军

(天津大学管理与经济学部,天津 300072)

运用多元线性回归分析方法,使用SPSS软件对影响铁路客运量的因素进行分析。在当前研究成果的基础上,建立了以铁路客运量为因变量,民航客运量、人口、国内游客量、国内生产总值以及能源生产总量五种影响因素为自变量的多元线性回归模型。利用模型对各个因素进行统计分析,得出了不同影响因素对铁路客运量的影响因子。其中民航客运量、国内游客量和国内生产总值对铁路客运量有正向的影响,人口、能源生产总量和铁路客运量有负向的影响。根据多线性回归模型的计算结果建立起了铁路客运量预测模型,利用这一合理的预测工具,可以为铁路客运量及铁路基础设施建设项目规划阶段项目体量的确定提供一定的借鉴。

SPSS;铁路客运量;多元线性回归分析

0 引言

当前我国铁路交通发展迅速,但是铁道线路和火车站等基础设施不能满足铁路客运量要求的情况时有发生。此外,在少部分地区,还存在着铁路运输基础设施建设体量过大,客运量不能达到预期,从而造成基础设施浪费的现象。如果能够在铁道基础设施建设项目的规划阶段对铁路客运量有一个准确的估计和预测,就可以很大程度上避免这种情况的发生。

学界对铁路客运量预测方面已经有过一些探索,王艳辉等曾经探究过通过数据挖掘的方式对铁路客运量大小进行预测的方法[1]。王慧晶将灰色模型引入了铁路客运量预测工作当中,从实践的角度对铁路客运量预测工作进行了细致的分析[2]。南敬林和张雪洁都通过探究铁路客运量影响因素的方式分析了可能采用的预测铁路客流量的方法[3-4]。在铁路客运量研究的发展过程中,形成了不同的预测方法和预测指标。本文在总结前人研究成果的情况下,总结出对铁路客运量造成影响的基本指标,并探究其具体影响机制。

多元线性回归是通过实际数据关系来推断不同变量之间关系的一种有效手段,是一种常用于预测的数理统计方式。关于多元回归分析模型的具体应用和在实践中的操作过程,张宇山和王振友等都进行了分析,详细探究了如何应用多元回归分析方法在实例中进行统计预测工作的过程。他们的研究发现,多元回归分析能够较好地解决实际问题[5-6]。实际上,黄邦菊等使用多元线性回归分析的方法解决了民用运输机场旅客吞吐量预测的问题[7],该问题在性质上与本文铁路客运量的预测工作有很大的相似性,而多元回归分析方法在民用运输机场旅客吞吐量预测问题中的成功也从另一个方面证实了使用该方法来解决铁路客运量预测工作的可行性和科学性。

1 数据来源分析

在实际的铁路基础设施建设项目当中,规划阶段对于项目体量的设计应当来源于当前可以掌握的现实数据。通过对历史数据的分析,可以把握铁路客运发展的趋势和规律。表1给出了我国最近18年来铁路客运量与影响和制约铁路客运量主要因素的有关数据。

表1 近18年来铁路客运量和相关影响数据

数据来源:中国国家统计局《中国统计年鉴》。

在现实生活中,影响铁路客运量的因素有很多,都可以在一定程度上对铁路基础设施建设项目的体量造成影响,但是在本文中不能一一列举。首先,本文分析了现有的研究铁路客运量影响因素的文献[1-4],提取出主要的铁路客运量影响因素,其次,按照指标的科学性、合理性以及数据可获得性的原则选择了民航客运量、人口、国内游客、国内生产总值以及能源生产总量5个影响因素作为解释变量进行了回归分析。

变量及其量纲如下:

Y:铁路客运量(万人);X1:民航客运量(万人);X2:人口(万人);X3:国内游客量(万人);X4:国内生产总值(亿元);X5:能源生产总量(万t标准煤)。

下面利用SPSS18软件对变量间的关系进行求解。

2 模型的建立和求解

2.1 变量描述性统计分析

对所有变量及对应数据进行描述性统计分析,观察变量的历史发展走向和变化趋势之间的关系。

从图1中可以看出,民航客运量、国内游客数量、国内生产总值、能源生产总量和铁路客运量间存在明显的相关关系。在铁路基础设施建设项目的规划阶段应当着重考虑当地或相关区域上述经济和社会环境条件。同时,人口与铁路客运量的相关关系不是非常明显。

为了解不同变量与铁路客运量之间的精确关系,掌握铁路基础设施建设项目规划阶段对上述变量信息的实际利用方式,本文建立铁路客运量与民航客运量、人口、国内游客数量、国内生产总值、能源生产总量之间的线性回归模型。

2.2 多元回归线性分析——参数估计

以铁路客运量Y为因变量;自变量为X1:民航客运量(万人),X2:人口(万人),X3:国内游客量(万人),X4:国内生产总值(亿元),X5:能源生产总量(万t标准煤)。用“分析—回归—线性—进入”方法进行参数的最小二乘估计,得到回归系数的表格,见表2。

图1 变量发展趋势描述性分析图

表2 回归系数①

模型非标准化系数标准系数B标准误差试用版TSig.1(常量)318361.50074459.7534.2760.001民航客运量/万人2.4082.1970.7051.0960.294人口/万人-1.8790.634-0.315-2.9630.012国内游客/百万人次17.45924.1520.3890.7230.484国内生产总值/亿元0.1100.1240.5120.8850.393能源生产总量(万t标准煤)-0.1460.151-0.354-0.9640.354

①因变量:铁路客运量(万人)。

初步得到该问题的多元回归线性分析模型为

Y=318 361.5+2.408X1-1.879X2+17.459X3+

0.110X4-0.146X5

可以得到铁路客运量与民航客运量、国内游客数量、国内生产总值成正比,与人口、能源生产总量成反比。

2.3 三种检验

(1)回归方程的拟合优度检验。表3从多个角度描述了相关系数R的值以及估计值误差以及DW的值,从这些计算结果中可以反映出自变量和影响量之间线性相关的程度。

表3 模型汇总②

①预测变量:(常量),能源生产总量(万t标准煤),人口(万人),国内生产总值(亿元),国内游客(百万人次),民航客运量(万人)。

②因变量:铁路客运量(万人)。

从表3可以看出,R2=0.978,调整R2=0.969,即样本决定系数和调整样本系数都很接近于1,拟合度很高,故通过拟合优度检验,认为解释变量应该对被解释变量有显著解释能力。说明所选取的变量在影响铁路客运量方面具有很高的有效性,在铁路基础设施建设项目中考虑以上变量的实际情况能够对建设项目体量的规划产生现实有效的影响。

(2)回归方程的显著性检验——F检验。表4描述了该模型中的多项统计量,包括因变量的方差来源、检验统计值F的观测值以及显著性水平等。

从表4中可以看出,F=108.117,回归的自由度是5,残差的自由度是12,总计的自由度是17,显著性水平是0.05。

此模型中样本数是18,自由变量是5个,故该模型的F统计量服从F(5,12),由此查表得

表4 Anova②

①预测变量:(常量),能源生产总量(万t标准煤),人口(万人),国内生产总值(亿元),国内游客(百万人次),民航客运量(万人)。

②因变量:铁路客运量(万人)。

到临界值F(5,12)=3.11,由表4可知本模型的F值是108.117,大于临界值,故拒绝原假设,认为回归方程显著,即模型通过方程的显著性检验。

(3)参数的显著性检验——T检验,显著性水平为0.05。

此模型中样本是18,自变量个数是5,则该模型各回归系数的T统计量应服从T(12)的分布,查询临界值为1.782,由表2得到的6个回归系数T的值分别是4.276,1.096,-2.963,0.723,0.885,-0.964。民航客运量T的绝对值小于临界值,人口T的绝对值大于临界值,这些模型可能存在多重共线性,下面将进行该模型是否存在多重共线性检验。

3 多重共线性分析

由以下三种方法均能看出该模型是否存在多重共线性。

3.1 变量间的相关分析

由表5各变量第一行相关系数可知,各变量间存在一定的共线性。

表5 相关性

3.2 共线性诊断

由表6可知,第3个特征值人口和国内生产总值、能源生产总量发生了多重共线性,第4个特征值国内游客与国内生产总值发生多重共线性。

3.3 通过各自变量的方差膨胀因子判断

容差在0~1之间变化,越接近0说明共线性越强,越接近1说明共线性越弱。方差膨胀因子(VIF)越接近1,说明共线性越弱。

由表7自变量的VIF值可知,各自变量之间线性相关比较明显。

4 结语

本文通过多元线性回归分析的方法对铁路客运量进行预测,建立了铁路客运量影响因素体系和具体的预测模型。通过多元线性回归模型的分析发现在铁路客运量的影响因素当中,民航客运量、国内游客数量、国内生产总值对于铁路客运量有正向的影响,其中国内游客人数对铁路客运量的影响最为显著,其次是民航客运量。人口和能源生产总量对于铁路客运总量有负向的影响,其中人口对铁路客运量的影响最为显著。

通过以上结果可以看出,在铁路基础设施建设项目的规划阶段,要根据未来预计的铁路客运量来确定建设项目的体量。本文中建立的铁路客运量预测模型可以为铁路基础设施建设项目的客运量预测工作提供一定的借鉴。

本文中选取的影响因素对于铁路客运量都有明显的影响,但是同时本文中选取的影响因素彼此之间也存在一定的相关性,对于研究结果的精确性会产生一定影响。在未来的研究当中,可以在影响因素体系的选取方面进行更加精确的界定。

[1]王艳辉,王卓,贾利民,等.铁路客运量数据挖掘预测方法及应用研究[J].铁道学报,2004,26(5):1-7.

[2]王慧晶.基于灰色预测模型的铁路客运量预测研究[J].铁道运输与经济,2006,28(6):79-81.

[3]南敬林.铁路客运量预测影响因素分析[J].综合运输,2016,38(2):35-40.

[4]张雪洁.我国铁路客运量影响因素实证分析[J].现代商贸工业,2014,26(9):5-7.

[5]张宇山.多元线性回归分析的实例研究[J].科技信息,2009(9):54-56.

[6]王振友,陈莉娥.多元线性回归统计预测模型的应用[J].统计与决策,2008(5):46-47.

[7]黄邦菊,林俊松,郑潇雨,等.基于多元线性回归分析的民用运输机场旅客吞吐量预测[J].数学的实践与认识,2013,43(4):172-178.PMT

表6 共线性诊断①

①因变量:铁路客运量(万人)。

表7 系数①

①因变量:铁路客运量(万人)。

2016-05-03

猜你喜欢
共线性客运量线性
渐近线性Klein-Gordon-Maxwell系统正解的存在性
南瓜SWEET蛋白家族的全基因组鉴定与进化分析
线性回归方程的求解与应用
银行不良贷款额影响因素分析
2018年北京市城市公共交通运行特征分析
2018年北京市城际交通运行特征分析
2018年北京市轨道交通运行特征分析
不完全多重共线性定义存在的问题及其修正建议
我国寿险需求影响因素的岭回归分析
二阶线性微分方程的解法