基于SPSS数据分析的影响旅游地区发展的主要因素分析

2019-10-08 07:45黄文霞李民
软件 2019年1期
关键词:相关分析主成分分析因子分析

黄文霞 李民

摘  要: 本文主要分析北京、天津、河北、山西、辽宁、吉林、上海、江苏、浙江、安徽、福建等11个地区的基本设施建设投资、消费价格指数、公共交通人数、AAAA级旅游景点数、住宿、餐饮业服务人数、接待入境旅游人数、旅游外汇收入、园林、绿地面积等8个因素对各地区旅游业发展的影响程度,根据2015年(中国统计年鉴)的相关数据,首先进行相关分析,分析各变量之间的相关性,其次利用多元统计方法中的主成分分析方法和因子分析方法,借助SPSS软件,提取出3个影响旅游业的主要因素最后构造这3个主要因素与8个可控因素之间的线性方程及综合得分函数,通过Excel计算出各个地区的综合得分。

关键词: SPSS;相关分析;主成分分析;因子分析

中图分类号: TP391. 41    文献标识码: A    DOI:10.3969/j.issn.1003-6970.2019.01.031

【Abstract】: This paper mainly analyzes the infrastructure construction investment, consumer price index, public transportation number, AAAA-level tourist attractions, accommodation, and accommodation in 11 areas including Beijing, Tianjin, Hebei, Shanxi, Liaoning, Jilin, Shanghai, Jiangsu, Zhejiang, Anhui, and Fujian. According to the relevant data of 2015 (China Statistical Yearbook), the relevant analysis of the number of catering service, the number of inbound tourists, the foreign exchange income of tourism, the garden and the green area will be analyzed and analyzed. The correlation between the variables, and then the principal component analysis method and factor analysis method in the multivariate statistical method, using the SPSS software to extract three main factors affecting the tourism industry, the final construction of these three main factors and 8 controllable The linear equation between the factors and the comprehensive score function are used to calculate the comprehensive scores of each region through Excel.

【Key words】: SPSS; Correlation analysis; Principal component analysis; Actor analysis

0  引言

隨着我国的改革开放和繁荣发展,各地区旅游人数逐年增多,如何更好的发展旅游业是各地区面临的一个重要课题。地区基础设施的完善,经济的发展以及旅游资源的科学开发利用,管理水平的提高对旅游业的发展至关重要。本文利用2015年《中国统计年鉴》[3] 11个地区的基本设施建设投资、消费价格指数、公共交通人数、AAAA级旅游景点数、旅游服务设施情况、接待入境旅游人数、旅游外汇收入、园林、绿地面积这8个因素的数据资料。其中,从南方选取了四个地区,包括江苏、浙江、上海、福建;从中部选取了两个地区,包括山西、安徽;从北方选取了五个地区,包括辽宁、吉林、北京、天津、河北。收集的原始数据如表1所示。

1  相关分析

相关分析是适当的统计指标衡量变量之间相关程度的强弱及相关的方向。相关分析包括了简单相关分析、偏相关分析和距离相关分析。本文研究所

采用的是简单相关分析,简单相关分析是在两两变量之间进行的。不同类型的变量数据,应采用不同的相关分析方法。

运用SPSS19.0软件对表1中的数据进行相关分析,得到Pearson相关系数表如表2所示。

表2给出了Pearson相关系数,它以一个矩阵的形式表示出来。从中可以看出,各变量之间的相关系数(r)都大于或者接近0.5,说明各变量之间是相关的。

2  主成分分析

主成分分析[4–5]也称主分量分析,是由霍特林于1993年首先出的。主成分分析是利用降维的思想,在损失很少信息的前提下,把多个指标转换为几个综合指标的多元统计方法。通过主成分分析,可以从事物之间错综复杂的关系中找出一些主要成分,从而能有效利用大量统计数据进行定量分析,揭示变量之间的内在关系,得到对事物特征及其发展规律的一些神层次的启发,把研究工作引向深入。

2.1  SPSS19.0进行主成分分析[6]

根据以对十一个地区8个因素的主成分分析得到,影响各地区旅游发展的第一主成分因素为旅游规模与收入方面的因素。旅游规模的扩大、旅游收入的增加能直接影响到区域旅游事业的发展;其次是区域消费与绿化建设对旅游业的影响,据目前来看,旅游消费对于人们选择旅游地来说还是一个重要的影响因素。通过各地区的综合因素得分的排序看到:北京、上海、江苏、浙江是最强势的地区,这些地区有着很好的旅游资源与旅游环境。辽宁、福建、安徽这几个地区在区域消费与绿化建设方面比较有优势,但是景点建设还不够完善,旅游收入与规模偏低。天津、河北、山西等地区整体相对薄弱,还有很大的发展空间。

3  因子分析

因子分析的思想始于1904年查尔斯·斯皮尔曼(Charles Spearman)对学生考试成绩的研究。因子分析模型是主成分分析的推广。它也是利用降维的思想,由研究原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。相比主成分分析,因子分析更倾向于描述原始变量之间的相关关系,因此,因子分析的出发点是原始变量的相关矩阵[9]。

运用SPSS软件对原始数据进行因子分析,初始因子载荷矩阵(见表7)、公因子方差(见表7)。

由表9可知,因子分析一共提取了三个主成分,这三个主成分因子的特征值分别为 ;各因子的方差贡献率分别为54.293%、、18.657%、13.652%;提取的三个主成分因子的累计方差贡献率达到86.602%,即说明基本上保留了原来指标的信息。通过旋转平方和载入,可知主成分1的贡献率为35.069%,主成分2的贡献率为33.602%,主成分3的贡献率为17.931%。

为了解释方便对因子进行旋转得到旋转后的因子载荷矩阵,如表10所示。

其中,因子得分为正值,表示该地区此因子表现高于平均水平;因子得分为负值,表示该地区此因子表现低于平均水平。由表11的分析结果,结合各地区在三个公共因子上的得分和综合得分,即可对各地区的旅游发展状况进行评价。综合得分靠前的地区是江苏、北京和上海,他们都拥有較好的旅游资源和环境。辽宁、福建、安徽这几个地区在消费价格指数和园林绿地面积上比较占有优势,但是景点建设还不够完善,旅游收入与规模偏低,需要加强景点建设,以吸引更多的游客。而天津、河北、山西等地区整体相对薄弱,还有很大的发展空间。

4  主成分分析和因子分析的结果对比

根据两种分析方法的结果,我们可以看出在各主成分(公共因子)所体现的指标略有不同,如表12所示。

从主成分分析和因子分析的综合排名上看,两者的排名虽然顺序不一样,但是大概的分段还是一致,北京、上海、江苏、浙江都是前四名,辽宁、福建、安徽这几个地区居中,天津、河北、山西这几个地区靠后,故得出的结论基本一致。

5  结论

根据本文对这十一个地区8个因素的多元统计分析,可以得到以下结论:

第一,影响各地区旅游发展的主要因素为旅游规模与收入方面的因素,旅游规模的扩大、旅游收入的增加能直接影响到区域旅游事业的发展。

第二,区域消费与绿化建设对旅游业的影响也比较重要,旅游消费对于人们选择旅游地来说还是一个重要的影响因素。

第三,北京、上海、江苏、浙江是最强势的地区,这些地区有着很好的旅游资源与旅游环境。

第四,辽宁、福建、安徽这几个地区在区域消费与绿化建设方面比较有优势,但是景点建设还不够完善,旅游收入与规模偏低。

第五,天津、河北、山西等地区整体相对薄弱,还有很大的发展空间。

参考文献

何晓群. 多元统计分析[M]. 北京: 中国人民大学出版社, 2004.

贾俊平, 何晓群, 金勇进. 统计学[M]. 北京: 中国人民大学出版社, 2012.

中国国家统计局. 中国统计年鉴[R]. 北京: 中国统计出版社, 2015.

Javed A. Face Recognition Based on Principal Component Analysis[J]. International Journal of Image, Graphics and Signal Processing (IJIGSP), 2013, 5(2): 38.

He Lianghua. Multi-Dimension Principal Component Analy sis based on face recognition[J]. The Journal of New Indus tria lization, 2012, 2(1): 59-65.

何亮. 主成分分析在SPSS中的运用[J]. 山西农业大学学报, 2007(4): 44-46.

何应婷, 等. SPSS统计分析[M]. 北京: 电子工业出版社, 2010.

薛薇. 基于SPSS的数据分析[M]. 北京: 中国人民大学出版社, 2006.

唐功爽. 基于SPSS的主成分分析于因子分析的辨析[J]. 统计教育, 2007(2).

田里. 旅游经济学[M]. 北京: 科学出版社, 2004.

猜你喜欢
相关分析主成分分析因子分析
城乡居民医疗费用的相关性与回归分析
主成分分析法在大学英语写作评价中的应用
江苏省客源市场影响因素研究
SPSS在环境地球化学中的应用