基于多重多元线性回归模型的京津冀物流产业发展影响因素分析

2019-02-27 13:30李春林伍信怡LIChunlinWUXinyi
物流科技 2019年2期
关键词:周转量因变量回归方程

李春林,伍信怡 LI Chunlin,WU Xinyi

(河北经贸大学 数学与统计学学院,河北 石家庄 050061)

物流的发展是依赖经济的增长和城市建设的不断扩张而发展的,随着各地区经济的不断繁荣,各地区的需求在不断增加,从而带动了各地区物流输入与输出的扩大。在物流活动中,运输是最重要的环节,目前我国运输方式分为航空运输、铁路运输、公路运输、水路运输4部分,而空运成本较大而且还受一些不可抗力(如环境)的影响,同时我国大部分省市处于内陆,少见水路,因此本文重点分析物流运输方式中的铁路运输与公路运输,找出影响这两者的因素。

1 分析变量的选择

本文研究的是影响铁路与公路运输状况的因素,对于因变量的选取,可以用铁路货物周转量y1、公路货物周转量y2来衡量。因为货物周转量是在一定时间内,由各种运输工具实际完成运输过程是以重量和运输距离的复合单位计算的货物运输量,所以能直接反映铁路、公路运输状况。对于影响因素,可以分为3部分:基础设施、承载力和市场需求,具体指标及设置见表1。

2 研究方法

由于涉及的变量有两个因变量、多个自变量,探寻影响这两个因变量的因素,即对多个因变量和多个自变量之间关系的研究,因此采用多重多元线性回归模型来进行建模。具体思路如下:

表1 目标变量及影响因素指标表

(1)如果因变量y1,y2,…,yp相互独立,即因变量之间两两不相关时,由于因变量之间相互不影响,这样就可以将多重多元线性回归模型:变成p个独立的多元线性回归模型:yj=β0j+β1jx1+β2jx2+…+βmjxm+εj(j=1,…,p)来求解。

(2)当因变量之间存在相关关系,但 (y1,y2,…,yp)构成一线性无关组时,可通过构造中间变量组转换的方式解决。中间变量是因变量的线性组合,且它们之间相互独立,这正是因子分析中因子的构建思想,也就是说,可以用全部因子 (f1,f2,…,fp)作为中间变量组,则有:①因子是因变量的线性组合;②因变量组和中间变量组均为线性无关组且变量的个数相等。从而因变量组与中间变量组可以互相线性表示。于是f1,f2,…,fp与自变量之间的多重多元回归分析就转化为第一种情况了。

3 研究思路

由于我国各地区物流发展的不均衡,影响因素及影响力度也有区别,因此不能将所有地区混为一谈。本文先对全国各地区物流发展及影响因素的面板数据进行K-Means聚类分析,得到结论见表2。

表2 各地区不同年份物流发展的聚类结果(部分)

由聚类的结果可看出北京与天津在2004~2015年内物流产业发展均被归在第二类中,可以认为京津两地物流发展影响因素大体是一致的(设为A类),同类中还有上海和重庆;而河北前4年处在第四类中、后8年处在第一类,这种类型设为B类,B类中还有辽宁、河南和山西省。

图1是在Clementine12.0软件中进行此次分析的数据流,步骤如下:首先分别对自变量与因变量做标准化处理,进而对A、B类分别进行因子分析(消除多重共线性),得到因变量与自变量的公共因子,把公共因子作为自变量与因变量独立的中间变量,将因变量的每一个公共因子分别与自变量的所有公共因子进行逐步回归,从而得到回归方程,最后将中间变量与各变量之间的关系代入回归方程来消除中间变量,得到y1,y2,…,yp对x1,x2,…,xm的回归方程即可得出最后的多重多元回归方程。

4 建模过程

(1)基于面板数据因子分析的共线性处理

为消除自变量多重共线性的影响,采取对自变量进行因子分析,得到8个公共因子,由于公共因子是相互独立的,因此消除了自变量之间的相互影响。提取8个公共因子就能完美地解释因变量的所有信息了(对因变量提取两个公共因子也是这个原因)。在软件中运行得出的结果如下:

A类的自变量主成分方程:

图1 京津冀物流产业发展影响因素分析流程图

B类的自变量主成分方程:

(2)对相互不独立的因变量的处理

由前面关于多重多元回归模型中因变量相互影响的分析思路来看,采用因子分析来得到独立的中间变量,即公共因子。结果如下:

A类的因变量主成分方程:B类的因变量主成分方程:

(3) 多元回归分析

现在分别对F1、F2与自变量的公共因子做多元回归分析,为了选择一个最优的回归方程,即指方程中包含所有对F影响比较显著的变量,而不包括对F影响不显著的变量,也就是从自变量集合f1,f2,…,fm中挑选出适当的子集合,使得建立的F与f1,f2,…,fp的回归方程,就是所谓的最优回归方程,就采用逐步回归法。

将自变量的8个公共因子分别与F1、F2做逐步回归分析,得到结果如下(操作结果由于篇幅限制故不再展示):

A类的回归分析方程:

B类的回归分析方程:

(4)整合A、B类多重多元回归分析模型

由因子分析和线性回归分析运行的结果,可以计算出多重多元回归分析的最终结果:

A类的多重多元回归分析方程(含京津两地):

B类的多重多元回归分析方程(含河北省):

上式是标准化后的铁路货物周转量与公路货物周转量与各因素标准化后的回归方程,相对效果与非标准化后的两部分是一样的,因此就不再转化为正常形式了。

5 结论

(1)对于铁路货物周转量:京津地区主要影响来自一级和二级等级公路里程、铁路和公路运货量这4个因素,其中公路货运量是最大的影响因素,且呈现负相关,毕竟京津地域有限,许多运输靠公路就够了,但对于京津偏远区域,需要铁路运输和二级公路相配合,从而二级等级公路里程是第二个影响因素,且呈现正相关;而与京津地区铁路货物周转量呈负相关关系,理由是一批货物采取铁路运输方式能到达目的地就不会考虑公路运输了,可以减少消耗大量的人力物力;河北省主要影响来自一级和二级等级公路里程、铁路货运量、公路货运量和批发成交额这5个因素,其中一级等级公路里程这个影响因素与河北省铁路货物周转量呈负相关关系,也是最大的影响因素,说明河北省的一级等级公路建设非常完备,能基本满足省内物流需求;而二级等级公路里程是第二大影响因素,这一点与京津一致。与京津两地不同的是,河北省的铁路货物周转量很大程度上依赖于批发市场成交额。

(2)对于公路货物周转量:京津地区主要影响来自各等级公路里程、公路运货量和批发市场等因素,其中高速等级公路在基础设施方面占比是最大的,说明京津两地对高速公路的建设非常好,基本上能到达运输目的地的各个点;而公路运货量的影响在所有影响因素中所占比例是最大的,京津二地的影响公路货物周转量的批零市场的作用与河北省的批零市场在其铁路货物周转量上的影响是一样的;河北省主要影响来自一级和二级等级公路里程、批发成交额这3个因素,一、二级等级公路里程的对公路货物周转量的影响与京津是一致的;在批发和零售成交额上面,对河北省公路货物周转量的影响与京津恰好相反的,即批发成交额起副作用,而零售成交额是起促进作用的,这说明对于河北省的公路运输而言,多运输零售物流商品是必要的。

(3)河北物流产业的发展策略:充分利用北京非首都功能外迁的机遇,从批发与零售市场入手,尽可能平衡两者的关系,对于批发商品可以采取铁路运输,不仅解决了批发商品运输的问题同时也扩大了河北省与各地区的经济交易;对于零售商品可以采取公路运输,让零售商品尽量不要占据铁路运输,把运输量让给其他物流货物。

猜你喜欢
周转量因变量回归方程
调整有限因变量混合模型在药物经济学健康效用量表映射中的运用
采用直线回归方程预测桑瘿蚊防治适期
线性回归方程的求解与应用
线性回归方程要点导学
走进回归分析,让回归方程不再是你高考的绊脚石
适应性回归分析(Ⅳ)
——与非适应性回归分析的比较
偏最小二乘回归方法
回归分析中应正确使用r、R、R23种符号