我国各地区经济发展水平的实证分析
——基于聚类分析及判别分析法的应用

2017-09-01 01:35刘艳华
赤峰学院学报·自然科学版 2017年15期
关键词:总体省份聚类

丁 柳,刘艳华

(安徽工业大学 商学院,安徽 马鞍山 243032)

我国各地区经济发展水平的实证分析
——基于聚类分析及判别分析法的应用

丁 柳,刘艳华

(安徽工业大学 商学院,安徽 马鞍山 243032)

改革开放以来,我国经济一直保持着高速稳定的发展势头,一度跃居世界第二大经济体.虽然新常态下经济增速有所放缓,但我国经济仍处于中高速增长期.但由于国情以及地区之间差异等多种因素的影响,各个地区经济发展水平表现出不一致性.本文选取31个省市区的地区生产总值、人均GDP、货物进出口额等8项统计指标,运用聚类分析以及判别分析的方法,尝试着对各个地区的经济发展水平进行分组、归类,以寻求刻画各地区经济发展水平的有效途径,并为下一步各地区经济协调发展提出政策建议.

经济水平;聚类分析;判别分析;协调发展

1 指标体系的选取

影响经济发展水平的指标众多,我们选取其中具有代表性的若干项统计指标进行研究.根据中国统计年鉴上统计的关于2015年全国31个省、市、区的经济指标,我们抽取了各地区的8项反映经济水平主要指标为:地区生产总值(X1)、人均地区生产总值(X2)、居民消费水平(X3)、固定资产投资(X4)、货物进出口总额(X5)、财政收入(X6)、财政支出(X7)、居民储蓄存款(X8).

2 聚类分析及其应用

2.1 系统聚类中离差平方和法(Ward法)

离差平方和法是Ward于1963年首先提出的,这种方法的基本思想来自于方差分析,如果分类正确,则类内的离差平方和应该最小,而不同类间的离差平方和应该较大.

2.2 对我国各地区经济发展水平的聚类分析

我们通过SAS统计分析软件,充分利用2012年我国各个省、市、区的主要经济指标,进行系统聚类分析.为了之后进行的判别分析与聚类结果的比较,我们随机抽取5个省份为待判组,它们为安徽、云南、江苏、四川、新疆,即这5个省份不参与系统聚类.我们对剩下的26个省份进行聚类分析,SAS系统得出的聚类结果如图1所示.

图1很直观地将26个地区的经济发展水平进行了系统聚类,为了更好地确定具体的类别个数,我们对上述所提及的四个统计量进行检测评估,各个统计量的指标值在表1中列出.

何为生态因子?简单地讲,生态因子是指对生物有影响的各种环境因子。在任何一种环境中,都包含着许多性质不同的生态因子,每一生态因子都会对植物起到主要的或次要的、有利的或有害的生态作用,而且这些生态作用在时间上和空间上都不是固定不变的。甚至,在不同的情况下,同种生态因子的作用也不尽相同。根据其性质,我们可以将生态因子划分为以下5类:

图1 各地区经济水平聚类图

表1 聚类过程中输出的有关统计量

2.2.1 Ⅰ类区:北京、上海、天津

以前的很多商业街市大都以突出现代化为主,高楼林立、霓虹闪烁,令人眼花缭乱,但是我们看到现在似乎也有许多新兴的商业街区放弃了现代化的理念,反而将眼光转向了传统文化,比如有些地方修建了古代客栈式的商场,给人们眼前一亮的感觉,里面的装修结合了青花元素、戏曲元素等,唐装汉服店也林立其中,吸引了大批的顾客前往。

根据图1各地区经济发展水平的聚类结果,我们将其分为四类:

由表1可以看出,伪F统计量在归为4类或5类时较大,说明归为4类或5类较好;伪T2统计量在归为1类、3类时较大,由于伪T2大表明上一次的聚类效果较好,所以由其值可知归为2类、4类效果较好.类似地,由统计量RSQ可知归为2类、3类、4类效果较好,由统计量SPRSQ可得归为2类、3类、4类较好.综合以上四个统计量反映的结果,考虑到类的个数应该具有一定的实用性,所以我们认为归为4类效果较好.

由于本文研究对象经过聚类分析后具有4类总体,所以我们应用多个总体时的距离判别.多个总体的距离判别方法与两总体的距离判别方法基本一致,对其方法简要介绍如下:

当总体协方差阵不全相等时,这时的判别函数为:

在开展小学语文教学的过程中,合适的教学情境能够激发学生的学习欲望,同时也能够将学生引入课文中,唤醒学生的真实感受,提升学生的学习质量。相较于其他阶段的学生来说,小学生的自我控制能力以及价值观还没有完全形成,其自身的兴趣发展也会因外界的变化而受到影响。因此,在实际的教学过程中,教师就需要为学生创建合适的教学情境,引导学生的思维发展,在提升学生学习能力以及学习质量的同时,促进学生价值观的形成。在此过程中,运用网络资源能够有效地帮助教师提升教学质量。

2.2.2 Ⅱ类区:广东、山东、浙江、辽宁

广东是我国改革开放的先行者与试验田,其地理位置显著,运输网络发达,自上世纪以来,广东的经济发展十分迅速,走在了全国的前列.山东是我国东部的重要省份,资源丰富,位置优越,产业链发达,经济实力雄厚.浙江是我国又一东部沿海省份,具有其独特的发展优势.辽宁作为东北大省,自然资源丰富,工业基础优良,港口城市众多,这些因素带动了其经济的崛起.

2.2.3 Ⅲ类区:福建、内蒙古、陕西、重庆、吉林、广西、江西、黑龙江、山西、湖南、湖北、河南、河北

这些地区大部分靠近中国的中部,基础相对薄弱,经济发展相对平缓,自然和社会等原因使其相对Ⅰ类区和Ⅱ类区而言处于发展中状态.虽然有些省份处于东部或者沿海,但是其比较优势较临近省份来说不够凸显,因此总体而言,这些省份有待进一步发展.

2.2.4 Ⅳ区:甘肃、贵州、西藏、宁夏、青海、海南

这六个省份除海南以外,都处于中国的中西部地区,经济基础较为落后,资源的有效开发和利用不足,第二产业和第三产业发展滞后,再加上独特的自然地理条件使得这些省份的经济疲软,动力不足,一直也是国家重点帮扶照顾的地区.海南省虽地处我国的南端,但总体来说资源稀少,人口不足,缺少规模以上的工业企业,导致其经济的欠发达性.

3 判别分析及其应用

3.1 距离判别法中多个总体的情形

判别分析是多元统计分析中用于判别样品所属类型的一种统计分析方法,是一种在已知研究对象用某种方法分成若干类的情况下,确定新样品的观测数据,判定新样品所属类别的方法.判别分析方法众多,常见的判别分析方法包括距离判别法、Fisher判别法、贝叶斯判别法、逐步判别法等.

根据本文所研究的对象,我们采用多个总体的距离判别法.距离判别的思想是根据各观测值与各总体观测值之间的距离远近作出判断,即根据资料建立关于各总体的距离判别函数,再将各观测数据代入到判别函数中进行计算,得出各观测与各总体之间的距离.该法所采用的距离通常是马哈拉诺比斯距离,简称马氏距离,定义如下:

假设有两个总体G1和G2,X∈Rp是一个新的观测,定义X到总体G1和G2的马氏距离如下:

其中,μ(1)、μ(2)和∑1、∑2分别是G1和G2的均值向量和均方差阵.

进一步激励和支持企业加大研发投入,以前沿引领技术、现代工程技术、颠覆性技术创新作为突破口,提高知识产权的创新能力,把创新型企业当作发展目标,发展自主核心技术。同时,鼓励企业积极在全球产业链中进行知识产权布局,可以通过建立海外代工厂消减加征关税影响,或者利用提高技术许可费从而提高海外同类产品价格的方式有效反击“301调查”。

Diabetes develops in more than half of patients with chronic pancreatitis[23]. Most patients with pancreatic tumors have impaired glucose tolerance[24]. Endocrine and exocrine insufficiency are both consequences of advanced fibrosis.

设K个总体G1,G2,…,Gk的均值分别是μ(1),μ(2),…μ(k),协方差阵分别是∑1,∑2,…∑k.当各总体协方差阵全部相等,即∑1=∑2=…=∑k=∑时,定义判别函数如下:

判别规则仍为(*)式.

这三个地区均是直辖市,其中,北京作为中国的首都,处于我国的政治、经济、科技等中心位置,资源集中,人才密集,经济基础十分夯实,发展水平很高,发展速度极为迅速.上海是我国的商业中心,作为中国经济最发达的地区之一,上海的第三产业十分发达,有众多的国际投资机构和跨国组织推动了上海经贸的快速发展.天津作为华北一大工业城市,毗邻北京,地理位置优越,交通运输网络发达,经济发展处于全国发达水平.

语文学科对课外学习的质与量都有较高的要求,只靠课堂的语文学习难以获得语文核心素养的实质提升。语文是一门强调自主学习的学科,课外是自主学习最主要的阵地。课外学习的两个基本组成部分是课外阅读与课外写作,教师要在其中起到引导的作用,以合理的方式介入学习计划、学习实施。在课外阅读方面,以课本选文组织思路为依据,向学生提供趣味性与教育性俱佳的书目,并以较少占用学生课外时间为宜。应采取读写结合等方法,保证课外阅读能够取得提升语文核心素养的成效。在课外写作方面,以有目的和有梯度的方式开展个性化写作活动。

由此我们得到如下判别规则:

人体脂肪秤,又称体脂称,是除了可以测量体重外,还可以测量身体脂肪、水分、肌肉、蛋白质等的称重计。体脂称原理为通过人体生物电阻抗的测量,将测量结果结合身高、体重等数据,根据人体数学模型得出组成人体的基本成分数据。其中人体成分数据具有显著的人种、民族、地域等差异。只有建立基于中国人的人体数学模型,测量结果才不会出现偏差。

对于判别效果的检验可用错判率来进行,设总体为G1,G2,…,Gk,从各总体抽取样品数为n1,n2,…, nk,有n=n1+n2+…+nk.我们用mij表示来自总体Gi而被判为来自Gj的样品数,此时,可以定义简单的错判率为:

这是关于距离判别法在多总体的情形下的简单理论介绍,通过这种方法,我们很容易对待判总体的样本进行分类.

新时期,人们对于公路桥梁养护和加固的质量要求不断提升,要确保其养护及加固的规范,实践过程中,工程建设人员必须注重以下要点的全面把控:

3.2 多总体距离判别法的应用

在明确了多总体距离判别法思想原理的前提之下,我们将其应用到本文前面所讨论的全国各地区的经济发展水平的归类问题当中.在之前的聚类分析之中,共有26个省份地区参与了聚类,另有安徽、云南、江苏、四川、新疆这5个地区作为待判组,未参与聚类.因此,我们通过上面介绍的多总体的距离判别法,将这5个地区进行归类,分析它们的经济发展水平.利用SAS经济分析软件,我们可以得知4个总体类别的线性判别函数,并进一步得出4个总体的线性判别函数,其结果如下:

本刊讯12月 18日 ,由陕西省委教育工委、省教育厅主办,陕西艺术职业学院承办的庆祝改革开放40周年——秦腔红色经典作品大型民族管弦乐演唱会在西安音乐学院音乐厅上演。陕西省委副书记贺荣出席活动并在西安音乐学院调研。

根据各总体类别的线性判别函数和判别方法,结合SAS9.3软件,我们可以利用距离判别法判别出待判组各样品的类别.前26个省、市、区的判别结果与原类别号即聚类结果全都保持一致,总体上可以说明判别结果是比较准确的,基于此,我们进一步考察其误判率,四个总体类别的错判率均近似为0,因此错判率基本为0,我们可以认为该距离判别结果十分优良.基于此,待判组5个省、市、区中,江苏属于第Ⅱ类,安徽、四川、新疆同属于第Ⅲ类,云南属于第Ⅳ类.总体上经济发展水平东部偏高,中部次之,西部最弱.然而,这种现象有具有不确定性,即部分地区的经济发展水平与其区位条件并不吻合,如福建、四川、内蒙古、新疆等.

从之前的各个总体类别的简要分析中可知,就2015各地区的主要经济指标来看,江苏省的经济发展水平已相当高,这个可以归结于江苏省的区位优势、资源优势、从而带来的产业优势和人才优势等,使得江苏省的经济发展处于先进水平.安徽、四川、新疆三个省份同处于我国的中部和西部,经济发展较为迟缓,发展优势不够凸显,第二、第三产业相对于东部省份比较落后,所以经济发展水平相对滞后.云南省处于我国的南部边境地区,受自然条件的限制,经济基础较为薄弱,经济建设环境较为艰苦,因此导致了云南的经济发展水平相对落后.

4 结论及启示

根据聚类分析和距离判别分析的结果,我们可以清晰地看出当前我国各地区之间的经济发展水平存在不均衡性,各省、市、区之间的经济水平差距较大,经济状况悬殊明显.各级政府要审时度势,顾全大局,以经济建设为中心,强调资源有效配置的均衡性,完善经济制度,将政策的天平向中西部、边远地区、贫困地区倾斜,给这些地区的发展提供政策照顾,鼓励其发展的能动性和积极性,加大扶贫力度和考核力度,统筹中西、城乡经济发展.扎实开展试点工作,将成功的经验在合适的地区加以推广.

〔1〕王洪庆.我国地区开放型经济发展水平动态变化趋势研究 [J].江西财经大学学报,2015(04):03-12.

〔2〕张应武,李董林.基于动态因子分析法的区域开放型经济发展水平测度研究[J].工业技术经济,2017(03):123-130.

〔3〕何计文,邓玲.基于改进的TOPSIS法的开放型经济发展水平的测度与比较——以长江经济带省市为例[J].东南学术,2016(02):79-86.

〔4〕施建刚,王哲.中国城市化与经济发展水平关系研究[J].中国人口科学,2012(02):36-46.

〔5〕陈明星,等.中国城市化与经济发展水平关系的省际格局[J].地理学报,2010(12):1443-1453.

〔6〕丛海彬,等.中国社会经济综合发展水平时空格局演化及驱动因素[J].经济地理,2015(07):21-29.

F127

A

1673-260X(2017)08-0143-03

2017-04-28

猜你喜欢
总体省份聚类
用样本估计总体复习点拨
2020年秋粮收购总体进度快于上年
谁说小龙虾不赚钱?跨越四省份,暴走万里路,只为寻找最会养虾的您
基于K-means聚类的车-地无线通信场强研究
外汇市场运行有望延续总体平稳发展趋势
直击高考中的用样本估计总体
基于高斯混合聚类的阵列干涉SAR三维成像
基于Spark平台的K-means聚类算法改进及并行化实现
一种层次初始的聚类个数自适应的聚类方法研究
因地制宜地稳妥推进留地安置——基于对10余省份留地安置的调研