中国各省份经济发展水平实证分析

2018-11-29 17:01王哲璇
时代金融 2018年24期
关键词:线性回归聚类分析主成分分析

【摘要】本文利用国家统计局数据,使用R语言研究近10年各省份经济发展水平,采取聚类分析法、主成分分析法进行各省份经济发展水平的分类与评价;选取代表性省份,分析10年来经济发展水平。结果表明,各个省份发展水平不均衡,东部地区经济发展水平明显高于西部地区。最后,提出了促进经济增长、区域经济均衡发展的相关建议。

【关键词】经济发展水平 聚类分析 主成分分析 线性回归

近年来中国的经济平稳较快发展,但是各个地区、各个省份的发展水平并不均衡。地区综合实力是反映一个地区社会经济发展状况的重要因素,很多学者就地区经济发展综合评价问题作了大量研究[1]。

一、各省份经济发展水平聚类分析

为了准确客观地反映各省份经济发展水平,按照代表性、合理性、可比性、可操作性、可获得性等原则,借鉴专家学者的做法,选取7个代表性指标,包括总量指标和平均指标[2]。具体指标如下:X1为地区生产总值(亿元),X2为地区一般预算收入(亿元),X3为地区一般预算支出(亿元),X4为地区固定资产投资(亿元),X5为地区居民消费水平(元),X6为地区人均可支配收入(元),X7为地区人均消费性支出(元)。这些指标反映了各省份的经济总体发展水平以及居民生活水平情况。数据来源于国家统计局2006—2015年分省年度数据。

在各省份经济发展水平中,采取系统聚类方法,可以应用不同的并类方法:最长距离法、重心法、类平均法。通过R软件运用不同方法试算,可以看出聚类的划分结果大致相同,类平均法充分利用到各个样本的信息,具有更好的聚类效果,因此选用类平均法给出聚类结果,进行各省份经济发展水平的分类,如图1所示。

由R软件做出类平均法的各省經济水平谱系图,如图1所示,31个省份通过经济发展水平情况可分为四大类。第一类:浙江省、广东省、江苏省、山东省;第二类:天津市、北京市、上海市;第三类:河南省、辽宁省、福建省、安徽省、河北省、四川省、湖北省、湖南省;第四类:内蒙古自治区、重庆市、广西壮族自治区、江西省、陕西省、黑龙江省、云南省、山西省、吉林省、甘肃省、贵州省、新疆维吾尔族自治区、西藏自治区、青海省、海南省、宁夏回族自治区。

综合以上可以看出,第一类和第二类省份主要包括我国的政治经济文化中心和改革开放的前沿省份,有雄厚的经济基础;第三类和第四类主要是中西部地区,经济相较于前两类地区发展缓慢。

二、主成分分析下的各省份经济水平分类

由统计数据的多个指标进行经济发展水平的分析较为复杂,因此,采取主成分分析法可以满足将多指标化为少数综合性指标并反映绝大部分信息的需求。利用R语言的princomp()函数可得到相关阵的特征值和贡献率如表1所示。

由表1,前两个主成分的累积贡献率已达到97.6%,因此另外五个主成分可以舍去,达到降维的目的。

得到主成分与原始变量的线性关系为:

■ (1)

■ (2)

第1主成分对应系数的符号都相同,X1*,X4*的系数较大,其中X1*为地区生产总值,X4*为地区固定资产投资;两个均为总量性指标,反映了省份总体经济发展水平:经济总量越高的省份,X1*和X4*越大,因此第1主成分的值就越大。可称之为总量因子。

第2主成分是平均性指标与总量之差,其中X5*,X6*,X7*分别为地区居民消费水平,地区人均可支配收入,地区人均消费性支出,代表一个地区的人均经济发展水平:人均经济水平越高的省份,第2主成分越大。可以称之为人均因子。

我们画出数据关于主成分的散点图和原坐标在主成分下的方向,如图2所示。

图2数据分布显示,广东省、江苏省、山东省的总量因子较大,总体经济产量高;而北京市、上海市的人均因子较大,表明人均收入与消费水平高。与聚类分析结果较为相近。

对第一主成分进行主成分得分排序,由高到低依次是:江苏省,广东省,山东省,浙江省,河南省,上海市,河北省,湖北省,四川省,湖南省,北京市,辽宁省,福建省,安徽省,天津市,内蒙古自治区,陕西省,江西省,重庆市,广西壮族自治区,黑龙江省,吉林省,山西省,云南省,贵州省,新疆维吾尔自治区,甘肃省,海南省,宁夏回族自治区,青海省,西藏自治区。通过总量因子,分析得到东部省份经济总量远高于西部地区。

三、代表性省份经济增长情况

我们选取四个代表性省份2006年—2015年生产总值的数据来分析经济增长情况。

第一类代表性省份(北京市)特点:总量经济水平一般,人均经济水平高;第二类代表性省份(江苏省)特点:总量经济水平高,人均经济水平一般;第三类代表性省份(安徽省)特点:总量经济水平较高,人均经济水平低;第四类代表性省份(青海省)特点:总量经济水平低,人均经济水平低。

江苏省生产总值在四省份中最高,且发展速度很快,涨幅明显;而青海省生产总值最低,且十年来涨幅不明显。北京市、安徽省经济总量相差不大,但与江苏省有较大差距,在2010年前后安徽省经济总量增幅较大,经济总量有很大提升。由标准差数值可知,青海省数值最小,说明数据平均值分散程度较小,十年间总体经济变化量小;江苏省标准差最大,十年间总体经济变化量大;由平均值数值可知,江苏省数值最大,北京市、安徽省其次,青海省最低。

四、结论

总体来看,东部省份经济总量水平高,经济增量大;中部各省份居中;西部省份经济总量水平低,经济增量小。没有形成各自的产业特色,未能发挥各自的资源优势,是经济发展缓慢的重要原因。我国区域发展不平衡,中西部地区发展不充分,这是摆在经济社会发展中亟待解决的重要问题之一。

区域协调发展是构建我国现代化经济体系空间布局结构的重要路径。十九大报告指出,实施区域协调发展战略。区域协调发展应该根据各区域发展的实际情况,分门别类制定差别化的经济政策。强化举措推进西部大开发形成新格局,深化改革加快东北等老工业基地振兴,发挥优势推动中部地区崛起,创新引领率先实现东部地区优化发展,建立更加有效的区域协调发展新机制。

参考文献

[1]徐辛颖,刘振忠,李峰.河北省各设区市经济发展水平综合评价——基于主成分分析方法的视角[J].河北经贸大学学报(综合版),2012,12(03):60-62.

[2]张开宇.中国各省份经济发展综合水平的分析[J].经济研究导刊,2013,(04):146-147.

作者简介:王哲璇(1997-),女,北京林业大学理学院,研究方向:应用数学与数理统计。

猜你喜欢
线性回归聚类分析主成分分析
主成分分析法在大学英语写作评价中的应用
江苏省客源市场影响因素研究
SPSS在环境地球化学中的应用