基于线性回归模型的铁路客货运量研究

2021-12-24 05:04白少明
西部交通科技 2021年10期
关键词:线性回归

摘要:铁路客货运量是铁路行业发展的重要指标,反映铁路客货运发展状况和相关企业的经营管理水平。为了科学准确地预测“十四五”时期铁路客货运量,文章在分析铁路客货运量主要影响因素的基础上,构建基于线性回归理论的铁路客货运量预测模型,并通过相关系数检验,得知铁路客运量与国内生产总值之间存在明显线性相关,而铁路货运量与国内生产总值之间不存在线性关系。

关键词:线性回归;运量预测;铁路客货运量

文献标识码:U292.3-A-41-141-4

0 引言

铁路客货运量趋势可以反映出铁路行业的整体发展状况,以及铁路行业对国民经济社会发展的支撑作用,其主要受国内生产总值(GDP)、产业经济政策、居民消费水平等因素的综合影响。为了提高铁路客货运量预测的准确度,应分析影响铁路客货运量的主要因素,构建线性回归模型,并研究回归检验变量之间是否存在线性关系,进而对“十四五”期间的客货运量进行预测。

1 铁路客货运量影响因素分析

1.1 客运量影响因素

铁路客运量主要受国民经济发展水平、居民收入水平等因素影响,随着高速铁路逐步成网,动车组具有安全舒适、准时便捷、票价适中等诸多优点,已成为越来越多人出行的第一选择,铁路客运量呈逐年上升趋势。

1.2 货运量影响因素

近年来我国经济结构持续转型升级,经济发展由高速度增长进入高质量发展的新阶段,全社会货物运输需求结构发生了重大变化,大宗货物运输需求下降,随着电子商务的蓬勃发展,“白货”和高附加值货物运输需求快速增加,用户对货物运输的安全性、便捷性和时效性等有了更高的要求。铁路货运市场占有率呈下降趋势,主要原因有国民经济结构调整,居民消费升级,电力、煤炭、矿石和钢铁等行业产能调整,进出口贸易,以及其他交通运输方式的激烈竞争等因素综合影响。

2 基于线性回归理论的铁路客货运量预测模型

2.1 构建模型

将预测对象铁路客货运量作为因变量y,将主要影响因素国内生产总值(GDP)作为自变量x,则变量之间的相互关系采用一元线性回归模型可以表示为:

y=a+bx+e(1)

式中:a——回归常数;

b——回归系数;

e——残差项。

2010—2019年的铁路客货运量和国内生产总值,均满足以下关系:

yi=a+bxi+ei(2)

在线性回归预测过程中,残差项ei是无法准确估计的,线性回归预测借助a+bxi得到预测对象的估计值yi。通过确定a和b,从而y与x之间的关系可表示为:

y=a+bx(3)

线性回归预测过程中一般采用普通最小乘法原理求出回归系数,由此求得的回归系数为:

b=∑xiyi--x∑yi∑x2i--x∑xi(4)

a=-y-b-x(5)

式中:xi、yi——自变量x和因变量y的实际值;

-x、-y——x和y的平均值。

-x=∑ni=1xin(6)

-y=∑ni=1yin(7)

式中:n——样本量。

对于每一个自变量x的实际值,都有拟合值:

y'i=a+bxi(8)

y'i与实际值的差,便是残差项:

ei=yi-y'i(9)

2.2 回歸检验

通过计算得出a、b值构建完成预测模型后,需要对自变量x和因变量y之间的线性关系合理与否进行验证。本文采用相关系数R检验、回归系数t检验两种方法判断变量间的线性关系是否合理。

2.2.1 相关系数R检验

相关系数R是描述两个自变量x和因变量y之间的线性相关关系强弱的指标,用式(10)表示。

R=∑ni=1(xi--x)·(yi--y)∑ni=1(xi--x)2·∑ni=1(yi--y)2(10)

由表1分析可知,R的绝对值越接近1,表明变量之间相关性越强;R的绝对值越接近0,表明变量之间相关性越弱。依据式(10)计算出R的实际值后,通过查找相关系数检验表查得在自由度(n-2)和显著性水平α(一般取α=0.05)情况下R的临界值。若R的实际值大于等于临界值,则说明自变量x和因变量y之间的线性关系合理:若R的实际值小于临界值,则说明自变量x和因变量y之间的线性关系不合理。

2.2.2 回归系数t检验

通过式(11)计算出回归系数tb,然后与t值进行比较得出自变量x和因变量y之间的线性关系是否合理。

tb=bSb=b·∑(xi--x)2∑(yi-y't)2/(n-2)(11)

式中:Sb——参数b的标准差。

Sb=Sy/∑(xi--x)2(12)

式中:n——样本数量;

Sy——回归标准差。

S2y=∑(yi-y't)2/(n-2)(13)

tb服从t分布,通过t分布表查得在自由度为n-2时的t(a/2,n-2)。如果tb的绝对值>t,则表明回归系数t检验通过,说明变量x和y之间线性假设合理;如果tb的绝对值≤t,则表明回归系数t检验未通过,说明变量x与y之间线性假设不合理。

2.3 预测流程

线性回归预测流程如图1所示。

3 客货运量预测模型构建

近年来我国经济社会发展水平不断提高,到2019年国内生产总值(GDP)接近100万亿人民币。铁路建设尤其是高速铁路的建设取得了举世瞩目的成就,“四纵四横”已经建成通车,“八纵八横”也初具规模,预计“十四五”期间将建设完成,到2019年年底全国铁路营业里程达到13.9万km,其中高速铁路3.5万km。“十四五”期间,随着我国经济社会的进一步转型升级、人民生活水平的提升,居民出行和货物运输的需求势必会增加,铁路客货运量呈现持续增长的态势。本文以2010—2019年国内生产总值(GDP)和铁路客货运量数据为基础,通过线性回归理论构建铁路客货运量预测模型,进行回归检验判断铁路客货运量与国内生产总值(GDP)是否存在线性关系,最后对“十四五”期间铁路客货运量数据进行预测(见表2)。

3.1 模型构建

以国内生产总值为自变量x,以铁路客运量为因变量y1、货运量为因变量y2分别构建线性回归模型:

y1=a1+b1x

y2=a2+b2x

依据式(4)和式(5)分别计算出a1=0.37,b1=0.36;a2=34.01,b2=0.06。

3.2 回归检验

3.2.1 相关系数R检验

分别对y1=0.37+0.36x、y2=34.01+0.06x进行相关系数检验。

(1)对国内生产总值(GDP)与铁路客运量之间的线性关系进行验证,根据式(10),R1=∑ni=1(xi--x)·(yi--y)∑ni=1(xi--x)2·∑ni=1(yi--y)2=0.99,在α=0.05时,自由度=n-2=10-2=8,查相关系数表得R0.05=0.632。因为R1=0.99>R0.05=0.632,故在α=0.05的显著性检验水平上检验通过,说明国内生产总值与铁路客运量存在明显的线性关系。

(2)对国内生产总值与铁路货运量之间的线性关系进行验证,根据式(10),R2=∑ni=1(xi--x)·(yi--y)∑ni=1(xi--x)2·∑ni=1(yi--y)2=0.34,在α=0.05時,自由度=n-2=10-2=8,查相关系数表得R0.05=0.632。因为R2=0.34<R0.05=0.632,故在α=0.05的显著性检验水平上检验不通过,说明国内生产总值(GDP)与铁路货运量不存在线性关系。

3.2.2 回归系数t检验

分别对y1=0.37+0.36x、y2=34.01+0.06x进行t检验。

(1)对国内生产总值(GDP)与铁路客运量之间的线性关系进行验证,根据式(11),tb1=b1Sb1=b1·∑(xi--x)2∑(yi-y't)2/(n-2)=31.5,在α=0.05时,自由度=n-2=10-2=8,查t检验表得t(α/2,8)=t(0.025,8)=2.306。因为tb1=31.5>t(0.025,8)=2.306,故在α=0.05的显著性检验水平上t检验通过,说明国内生产总值(GDP)与铁路客运量存在明显的线性关系。

(2)对国内生产总值与铁路货运量之间的线性关系进行验证,根据式(11),tb2=b2Sb2=b2·∑(xi--x)2∑(yi-y't)2/(n-2)

=1.03,在α=0.05时,自由度=n-2=10-2=8,查t检验表得t(α/2,8)=t(0.025,8)=2.306。因为tb2=1.03<t(0.025,8)=2.306,故在α=0.05的显著性检验水平上t检验不通过,说明国内生产总值(GDP)与铁路货运量不存在线性关系。

综上所述,可知铁路客运量与国内生产总值(GDP)存在线性关系,可以使用线性回归模型预测“十四五”期间的客运量;铁路货运量与国内生产总值(GDP)不存在线性关系,不可以使用线性回归模型预测“十四五”期间的货运量。

3.3 模型检验

国内生产总值(GDP)与铁路客运量之间存在明显线性关系,依据y1=0.37+0.36x得出2010—2019年的客运量预测值与实际值,将其进行对比分析,研究结果详见表3。

由表3分析可知,十年间平均相对误差仅为1.74%,准确程度高达98.26%,因此采用线性回归模型预测铁路客运量是可靠准确的。

4 客货运量预测结果分析

4.1 客运量预测结果

由前文可知,铁路客运量与国内生产总值(GDP)之间存在明显的线性关系,具体如式(14)所示:

y1=0.37+0.36x(14)

目前我国经济发展由高速增长进入了高质量发展的新常态,预计“十四五”期间经济结构继续转型升级,发展质量进一步提高,结构进一步优化。根据世界银行、国际货币基金组织以及国家发展改革委员会等权威机构预测,中国“十四五”期间国内生产总值年均增长6.0%左右,根据上述公式可计算出“十四五”期间的铁路客运量,详见表4。

由表4可知,2021—2025年客运量呈增长的趋势,到2025年全国铁路客运量接近50亿人次,并且增量范围在5%~7%,符合铁路客运量的增长情况,预测的结果是较为准确可靠的。

4.2 货运量预测分析

目前我国铁路货运量主要由大宗货物煤炭、矿石和钢材等构成,“白货”以及高附加值的轻快货物占比较小。随着经济结构持续转型升级,煤炭、钢铁等行业产能调整,进出口贸易政策变化等因素的影响,全社会大宗货物需求量呈下降趋势,而“白货”以及高附加值的轻快货物需求量快速增加。但既有铁路货物运输组织、运输装备、企业管理等诸多方面均不适应目前的运输需求,导致铁路货运量出现波动。

5 结语

根据预测结果,“十四五”期间铁路客运量将持续增长,符合我国的经济发展形势。为了使铁路行业在“十四五”期间继续保持适度的建设投资规模,其中高速铁路建设需加快进度以满足日益增长的客运需求,需通过优化运输组织、旅客列车开行方案及科学合理制定列车运行图、实行“一日一图”、采取浮动票价等措施,最大限度吸引客流,提高铁路客运量。同时应进一步调整铁路货运组织方式,面向市场提高企业管理水平和竞争力,提高服务意识,可利用高速动车组运送高附加值货物,提高铁路的综合竞争力。

参考文献

[1]侯维磊,刘力军,崔晶娜.基于GRA-PCA-GA-BP网络模型的铁路货运量预测分析[J].铁道货运,2017,35(1):54-58.

[2]杨 军,侯忠生.基于小波分析的最小二乘支持向量机轨道交通客流预测方法[J].中国铁道科学,2013,34(3):122-127.

[3]Dragomiretskly K,Zosso D.Variational Mode Decomposition[J].IEEE Transactions on Signal Processing,2014,62(3):531-544.

[4]冯 妍,李得伟.基于Logit模型的城际运输通道客运量分担率计算研究[J].铁道运输与经济,2016,38(4):47-51.

[5]郝军章,崔玉杰,韩江雪.基于SARIMA模型在我国铁路客运量中的预测[J].数学的实践与认识,2015,45(18):95-104.

[6]杨祺煊.基于主成分分析与GA-BP网络的铁路客运量预测研究[J].军事交通学院学报,2017,19(2):84-89.

[7]周鹏飞.高速铁路跨线客流输送模式研究[D].北京:北京交通大学,2015.

[8]张晓宇.高速铁路列车开行方案关键要素对客运需求的影响研究[D].北京:北京交通大学,2016.

收稿日期:2021-03-22

基金项目:2020年度国内主要铁路基础技术资料分析研究(编号:2020YY340313)

作者简介:

白少明(1986—),工程师,主要从事铁路运输组织研究工作。

猜你喜欢
线性回归
国道公路养护管理与规划研究
供给侧改革视角下的商业银行财务坏账研究
我国客运与城镇化关系研究
投资者情绪与股票市场收益的相互影响分析
基于差分隐私的线性回归分析
企业退休金收支平衡的研究
基于回归分析的马铃薯产值总量实证研究
企业退休金收支平衡的模型分析
中国服务业竞争力因素分析
房价与城镇化进程关系及影响研究