基于主成分分析的农业总产值评价方法

2016-07-06 01:33谢勇冯瑶王爽朴美花
吉林农业·下半月 2016年1期
关键词:主成分分析

谢勇 冯瑶 王爽 朴美花

摘要:本文利用多元统计中的主成分分析法对全国各省的农业总产值进行评价,使用SPSS软件运行,分析得出代表全国各省中的农业产值高值区,并对上述高产值区进行分类,经分析得出全国各省(直辖市、自治区)农业产值分配特征。

关键词:主成分分析;SPSS;农业总产值;统计应用

中图分类号: S2                             文献标识码:  A                          DOI编号:   10.14025/j.cnki.jlny.2016.02.026

“三农”问题始终制约着我国经济建设和改革。我国作为农业大国,农业经济的发展关系到全国总体经济的发展,而衡量农业经济的发展离不开农业总产值,将多元统计方法引入农业总产值分析的研究不但可行而且是科学的。本文应用主成分分析法对农业总产值进行判定,力求对农业布局的合理性和农业发展潜力提出评价与建议。

1 资料来源与处理

资料来源于国家统计局官网,选取全国各省和直辖市及自治区农林牧渔业总产值数据。四个指标变量是:X1=农业、X2=林业、X3=畜牧业、X4=渔业。借助SPSS算法进行主成分分析:

2 主成分分析数学模型

主成分分析是一種通用的降维技术,主成分向量的协方差矩阵;其中,即。总方差中属于第主成分的比例为称为主成分的贡献率。第一主成分的贡献率最大,称之为的第主成分得分,平均主成分得分。

3 结果与分析

3.1 主成分特征值

通过主成分分析,得出了四种农业产值相关系数矩阵的特征值,上表列出了四个主成分的特征值、贡献率和累计贡献率;结果显示,由于前2个特征值方差的累计贡献率达83.6%,大于80%,较好地反映了原始数据集的特征,故选取前2个特征向量进行分析。

3.2 主成分系数

提取方法:主成分。

(1)第一主成分:由第一主成分的表达式可知,所考察样本协方差的特征值均为正值,各变量的系数在0.6~0.9之间,呈较均匀分布,反映出四种农业总产值在各省农业生产中为一般发展水平。 (2)第二主成分:第二主成分表达式中,所考察样本协方差的特征值既有正值亦有负值,X1、X3的系数为负,X2、X4的系数为正,正负系数的和较接近,结合各变量的含义,第二主成分表示农业、畜牧业总产值与林业、渔业总产值的对比。(3)各省主成分得分情况。

由第一主成分Prin1的得分可以认为:农业生产整体发展水平最高的省为山东省,河南、江苏等地次之。显然,山东省农业经济多年来一直位于全国第一,山东农业产品的产量不算最高,但是农业产业化相对完善,把初级农产品深加工后的附加值很高,农业生产整体发展水平最低的三个省份别是西藏、青海和上海,吉林省农业整体水平居于中游。

第二主成分Prin2得分值为负的省份为农业和畜牧业生产占优势的省份为河南、河北两省;而得分值为正的市是林业和渔业占优势的省份,如广东、福建等省份,由于濒临沿海地区,捕渔业兴盛,同时处于亚热带季风气候,林业资源丰富。吉林省主要以林业经济为主。

作者简介:谢勇,本科学历,吉林省气象服务中心,工程师,研究方向:气象预报运维类。

猜你喜欢
主成分分析
基于NAR模型的上海市房产税规模预测
主成分分析法在大学英语写作评价中的应用
江苏省客源市场影响因素研究
SPSS在环境地球化学中的应用