基于模糊聚类分析的我国区域经济发展差距研究

2017-03-09 17:22王丹丹
商业经济研究 2017年4期
关键词:差距

王丹丹

内容摘要:本文以北京市、河北省与黑龙江省等13省市作为样本,选择人均GDP、全社会固定投资总额、人均财政收入、城镇居民家庭人均可支配收入和农村居民家庭人均生活消费支出为主要聚类因子,研究我国区域经济发展状况,基于各聚类因子的统计数据,采用传递闭包法对样本进行分类。结果表明,将样本分为三类比较合理,三类省市间经济发展水平的差距明显。造成省市之间经济发展水平差距的原因主要有制度因素、区位因素、人力资本因素、自然稟赋因素与历史文化因素等。

关键词:中国区域经济 模糊聚类分析 模糊等价矩阵 差距

问题的提出

我国地域广阔,地理区划分为七个大区,包含31个省市自治区。不同省市区基于其独特的区位、资源禀赋、政治、经济及社会文化等条件形成了各省市区发展的路径模式。不同路径模式的运行效率与效果不同,造成各省市区的经济发展水平不同,导致各地的经济发展出现了较大的差异。目前,我国区域经济呈现非均衡发展的局面,且有加剧的趋势,不利于国民经济的协调发展和和谐社会建设。科学判断各省市区经济发展状况,合理地对全国各省市区的经济类型进行划分,对提高政府制定区域发展战略规划政策的科学性和针对性,促进区域经济的协同发展具有重要的现实意义。

我国区域经济的非均衡发展已受到广泛关注。杨英(2013)认为人均GDP、财政收入与支出、全社会固定资产投资总额、居民收入及居民消费等指标是对省市区域聚类分析的主因子;戚珉(2006)提出人均GDP、职工平均工资及第一二三产业在国民经济中所占的比重等指标是判断各省市区域经济类型的主要参考依据;陈海波(2015)认为省市区域GDP总量、居民最终消费支出及第三产业总产值等是区域经济实力的决定性因素,对区域经济的发展有较大影响;谢金生(2011)认为人均GDP、人均地方财政收入、城镇居民家庭人均可支配收入及农村居民家庭人均生活消费支出对省市区域经济发展水平的贡献比较大,其次是第二产业占GDP的比重。在方法的应用方面,谢明霞(2008)运用系统聚类法对全国省市区域的产业结构进行分类;左继宏(2005)综合运用因子分析法、聚类分析法、拉开档次法及对应分析法,刘爽(2013)运用拟合斜率法、黄宏亮(2003)综合运用层次分析法和聚类分析法分别研究了省市区域竞争力,并对省市区域进行分类。省市区域经济类型是由人均GDP、人均财政收入、全社会固定资产投入、第一二三产业在国民经济中所占的比重、城镇居民家庭人均可支配收入及农村居民家庭人均生活消费支出等多个因素共同决定,而各因素本身又带有一定的模糊性和不确定性。 主成分分析、因子分析等传统的分类方法不能有效地分析具有一定的模糊性和不确定性的问题。模糊聚类分析方法能够较好的处理那些具有模糊性与不确定性的数据和类,反映出省市区域类属的模糊性,建立起省市区域对于类别的不确定性描述,客观反映省市区域经济的发展状况。

理论与方法

模糊聚类概念最初是数学家查德教授于 1965 年提出来的(朱泉雯等,2015),模糊聚类分析是一种根据客观事物间的特征,通过模糊相似关系分析,对客观事物进行分类的数学方法(蒋德珑等,2011;梁宝松等,2007)。

(一)有关定义

定义 1 设矩阵 R=(rij)m×n,rij=∈[0,1] 则称 R为模糊矩阵, rij为模糊矩阵的元素。

定义 2 设 R=(rij)m×n,λ∈[0,1],记 Rλ(rij)=(rij(λ)) m×n其中 ,则称 Rλ为 R的λ 截矩阵。

定义 3 设 R∈F(U×U), λ∈[0,1],如果R(u,v)≥λ且 R(v,w)≥λ,则 R(u,w)≥λ,那么称R 是传递模糊关系。

定义 4 设 R∈F(U×U),如果(1) R是传递模糊关系且RR ;(2) Q是任意传递模糊关系且QR 和QR 。则称 R为 R的传递闭包。

定义 5 设 R∈F(U×U),如果满足:(1)自反性 RI 或 R(u,u)=1;(2)对称性 RT=R或R(u,v)= R(v,u) ;(3)传递性 RR2 或按传递定义。则称R 为U 上的模糊等价关系。

定义 6 设 R∈F(U×U),如果具有自反和对称关系,则称R 为U 上的一个模糊相似关系。

(二)模糊聚类分析的主要步骤

第一步,确定样本空间。 U=(X1,X2…Xn),Xi代表待分类的对象, n为样本容量, Xi=(xi1,xi2…xim)为第i 个待分类对象Xi 的特征属性,m 为指标数量。

第二步,数据标准化。为了使具有不同量纲的量能进行比较,需对数据做适当的处理,把所有数据都压缩到区间[0,1]上。标准化通常用平移·标准差变换:

(1)

其中:,

若所得到的 x′ik还没落在 [0,1]上,对 x′ik进行平移·极差变换:

(2)

第三步,建立对象之间的相似关系,然后建立模糊相似矩阵。建立待分类对象 Xi与 Xj之间相似关系的方法主要有数量积法、相关系数法、最大最小值法和距离法等(杨曦,2014)。

第四步,改造相似关系为等价关系。由第一步得到的矩阵 R一般只满足自反性和对称性,即R 是相似矩阵,需将它改造成模糊等价矩阵。根据等价矩阵对样本进行分类。

第五步,确定最佳分类阈值 λ。设 r为分类阈值 λ所对应的样本分类的类数,第 s类包含样本的个数为ns,第s 类的元素记为 xs1,xs2,…,xns,x=(x1,x2…xm)为总样本的中心向量,xs=(x1s,x2s…xms)为第S类样本的中心向量。

引入 F统计量,则,

(3)

其中,,

,。

此 F统计量遵从第一自由度为 r-1,第二自由度为 n-r的 F分布。分子表示类与类之间的距离,分母表示每一类的各个样本之间的距离。对于总样本的一个分类,其对应的 F值越大,表明类与类之间的距离越大,分类就越好。

给定信度 α比较每一种分类的 F值与对应的 Fα的大小,若 F>Fα,表明类与类之间的差异比较显著,分类就比较合理。在所有满足 F>Fα的分类中,选择 F与 Fα差值最大的分类对应的λ值,作为分类的最佳分类阈值,最佳分类阈值 λ对应的分类为最佳分类。

研究区域与数据来源

(一)研究区域

以我国七大区域的划分为基础,从华东地区随机抽取三个省市区,从华南、华北、西南、西北四个区域分别随机抽取两个省市区,从华中与东北两个区域分别随机抽取一个省市区作为研究对象,设 U={X1,X2…X13},表示由随机抽取的13个省市构成的集合,就所抽取的13个省市区的综合实力进行分类。其中 Xi(i=1,2…13)分别代表北京市、河北省、黑龙江省、上海市、安徽省、江西省、河南省、广东省、广西省、陕西省、新疆维吾尔族自治区、贵州省和四川省。

(二)指标及数据来源

结合我国区域经济的发展现状, 选择( A1) 人均GDP、(A2) 全社会固定投资总额、(A3)人均财政收入、(A4)城镇居民家庭人均可支配收入、(A5)农村居民家庭人均生活消费支出为主要聚类因子,对13省市区域的经济实力进行测算,区分不同发展水平的省市区域经济。根据2015年中国统计年鉴得到5类聚类因子的原始数据如表1所示。

我国区域经济发展的模糊聚类分析过程

运用平移·标准差变换和平移·极差变换对表1中的数据进行标准化,得到样本指标的标准化矩阵,基于标准化矩阵,再用欧氏距离法建立对象之间的相似关系,求得模糊相似矩阵R。欧氏距离法计算公式为:

(4)

其中,c为适当选取的参数,使得0≤rij≤1。在这里基于表2所求得的模糊相似矩阵,采用平方法求出 R的传递闭包R,经过计算得到 R4=R8,可见 R4就是所要求的传递闭包R,也就是最终所要的模糊等价矩阵,如表3所示。

按降序,依次取 λ∈[0,1],计算 λ截矩阵Rλ(rij)。根据 Rλ(rij)对样本进行分类,依次取模糊等价矩阵中的数据1,0.849,0.843,…,0.645等11个数据作为 λ,对样本进行分析,分类结果如表4所示。

利用表1中13省市的原始数据计算每个分类阈值λ 的F 统计量,选定 α=0.05的置信度,计算每一分类的 F分布临界值,并比较每个分类阈值λ 的F 统计量与F 分布临界值的大小,确定最佳分类。将样本分为1类或13类是没有意义的,故以下的计算不考虑 λ=1与 λ=0.645的情景。分类阈值 λ的F 统计量与 F分布临界值的计算结果如表5所示。

從表5可得,满足 F>Fα的分类有5种,当 λ=0.717时, F与Fα 差值最大为6.44,故λ=0.717 是最佳分类阙值,由此得到样本的最佳分类为3类,即北京与上海为第一类;河北省、黑龙江省、安徽省、江西省、河南省、广东省、广西省、陕西省、新疆维吾尔族自治区和四川省为第二类;贵州省为第三类。

结果分析与建议

(一)结果分析

第一类是我国最发达的省市区。北京作为国家的政治、文化、科技、信息中心,是物流、资金流、信息流和人才流的聚集地,具有政治资源、科教资源、高端人才资源和大企业总部资源优势,造就了北京强大的经济发展竞争力,产生了其他省市不可比拟的经济效益;上海市是我国的金融中心,金融业经济总量居全国第一,服务业高度发达并在整个GDP中的比重不断扩大,服务业结构和空间布局不断优化,以现代服务业为主的产业聚集布局逐步形成,为上海市经济社会的发展提供了强大的支持。

第二类是我国较发达的省市区。河北省位于渤海地区的中心地带,区位条件优越,是北方重要的水产品基地,同时又是矿产资源大省。能源种类齐全,储量丰富。但农业生产力偏弱,产业结构不尽合理,科技经费不足,技术创新薄弱。黑龙江省农业发达,工业基础雄厚,门类比较齐全,是国家重要的工业基地之一,但经济发展相对滞后、产业结构不尽合理、经济发展活力不足。安徽省与广西自治区都拥有丰富的劳动力资源和旅游资源,但都面临着经济基础薄弱,城镇发展水平低和人才短缺等问题。江西省矿产资源与旅游资源丰富,生态环境良好,但江西经济基础薄弱,三农问题突出,社会事业发展严重滞后。河南省区位优势明显,拥有丰富的矿产资源,人力资源和文化资源。但河南省人口比较多,开放度较低,经济基础还比较薄弱。广东省是全国第一经济大省,GDP总量、金融机构存贷款、地方财政收入和支出等指标连续多年居全国第一,但其同时也是我国第一人口大省,导致在各类平均经济发展指标上与北京、上海存在较大的差距。陕西省能源资源丰富,科教实力较强,工业基础较好,但工业结构不合理,经济效益不好,区域经济发展不均衡。新疆是全国重要的商品棉基地和畜牧基地,矿产资源丰富,但地区间的经济发展不平衡,失业问题突出,城市化水平较低。四川省自然资源丰富,劳动力成本低,能源工业比较发达,但存在经济社会发展不协调、产业发展不协调和区域经济发展不协调等问题。

第三类是我国的欠发达省市区。贵州省的能源资源、矿产资源与生物资源丰富。近几年来,尽管贵州省经济面貌已发生了巨大的改变,但经济总量仍然偏小,与周边省市区相比,其各项平均经济指标都处于较低的水平,固定资产投资相对不足,经济发展比较缓慢。

(二)建议

通过聚类结果分析,可以看出不同类别的省市区之间的经济发展水平差距明显,表明目前我国区域经济发展是不协同的,不利于和谐社会建设目标的实现。造成省市区之间经济发展水平差距的原因主要有制度因素、区位因素、人力资本因素、自然禀赋因素与历史文化因素等。结合省市区经济发展水平差距原因,文章提出缩小发展差距的建议:

1.建立健全的财政转移支付制度。政府建立财政转移支付制度,通过财政部门向经济比较落后的省市区域提供额外的投资、就业与税收等补贴,有利于促进落后省市区经济的发展,同时政府还可以为发展滞后的各区域企业减免部分税收或直接向企业拨款进行公共产品生产,发挥企业对区域经济的带动作用。

2.加大资金、货币政策的支持力度。为了促进落后省市区域改变经济发展现状,政府应加大资金与货币政策的倾斜力度,适当加大发达省市区域市场化融资比重和落后省市区域的政策性融资比重。充分发挥国家政策性银行的作用,鼓励发达省市区域通过产业转移、跨域投资办厂和联合开发等方式进行经济协作,带动落后省市区域产业的升级。

3.继续推进“一带一路”战略。中央经济工作会议提出的“推进‘一带一路、京津冀协同发展、长江经济带建设”是我国中长期最为重要的国家战略。“一带一路”战略有利于打破地区封锁和利益藩篱,强化区域经济协同发展,促进产业结构的转型升级,不断缩小我国区域经济发展差距。

4.加大对落后省市区教育的支持力度。高层次、高素质人才的匮乏也是导致落后地区经济发展滞后的根本原因。各级政府一方面要加大落后省市区域的教育投资力度,大力开发当地的人力资源,培养当地经济发展所需的高层次、高素质人才;另一方面,要促进发达省市区与落后省市区人才的交流合作,带动落后省市区人才素质的提升。

参考文献:

1.杨英,李海萍等.基于因子和聚類分析的中国各省市竞争力分析与研究[J].河北工业科技,2013(5)

2.戚珉,王霏.应用聚类分析对部分省市经济类型的分类研究[J].科技信息(学术研究),2006(10)

3.陈海波,江婷.我国区域经济发展方式转变的差异性研究——30个省市自治区视角的实证分析[J].科技管理研究,2015(11)

4.谢金生,卢永昌.中国省市经济发展水平的数量分类[J].现代财经(天津财经大学学报),2011(3)

5.谢明霞,吕安民等.人口空间聚类规则挖掘—全国各省市产业结构分类研究[J].测绘科学,2008(1)

6.左继宏.区域竞争力的理论研究与实证分析[D].武汉理工大学,2005

7.刘爽.中国省区市区域竞争力新旧方法比较研究[D].华中科技大学,2013

8.黄宏亮.区域经济综合竞争力理论研究与实证分析[D].南京农业大学,2003

9.朱泉雯,颜丽.模糊聚类分析在农业区域划分中的应用[J]. 扬州职业大学学报,2015(3)

10.蒋德珑,李盛等.模糊聚类分析系统的研究与实现[J].计算机工程与科学,2011(12)

11.梁宝松,曹殿立.模糊数学及其应用[M].科学出版社,2007

12.杨曦.模糊聚类及综合评判在变形分析中的应用[D].西南交通大学,2014

猜你喜欢
差距
中国素描与国外素描为什么有如此大的差距?
多去“扳手腕”——实际是跟差距较劲
难分高下,差距越来越小 2017年电影总票房排行及2018年3月预告榜
人力资本、城镇化与城乡居民收入差距
缩小急救城乡差距应入“法”
幻想和现实差距太大了
媒体揭秘中美教育差距
现阶段我国高等职业教育差距分析
收入机会不均、收入差距与居民消费
论收入分配差距对居民消费的影响