基于聚类主成分方法对决定社会消费品支出因素的论证分析报告

2023-05-30 10:48刘浩
中国集体经济 2023年15期
关键词:聚类分析主成分分析

刘浩

摘要:文章基于聚类与主成分分析的方法研究了我國社会消费品支出的问题。为了确定我国社会消费品支出由何种因素决定,以及各个因素对社会消费品支出的解释程度,文章以我国2000~2019年的社会消费品零售总额年度数据为基础,综合多项与其相关的指标,通过SPSS软件采用聚类主成分分析法构建消费支出度量模型。利用提取每类指标的重要信息,进一步用主成分分析法确定综合评价函数。结果表明,影响社会消费品支出的因素可以分为经济发展类指标、人口类指标、价格类指标与就业水平类指标几个类别,其中,经济发展类指标对社会消费零售总额的影响最显著,其次为人口类指标。基于实证分析结果提出相关建议。

关键词:社会消费品支出;聚类分析;主成分分析

一、引言

近年来,我国国民收入水平逐步提升,居民消费需求日渐增长。国家的发展离不开经济的发展,离不开国内国际双循环的支持。尤其是当前,促进国内消费需求的增长是加快经济发展的重要法宝。在多数消费研究中,社会消费品零售总额是研究重点。社会消费品零售总额作为反映一个国家百姓消费水平的重要指标,是分析一个国家国民经济体系优劣的重中之重。然而,最终消费支出的趋势并不能得到社会消费品零售总额数据的支持。通过查询2000年以来的数据,笔者发现,前13年,最终消费支出和社会消费品零售总额两者之间同增同减、关联密切。但是2013年以后最终消费支出同比增速继续保持正增长的态势,但是社会消费品零售总额却在一直下降,最多时同比下降了2.7%。

二、文献综述

孙凯对社会消费品零售总额与消费全貌进行了调查分析,分析得出结果,最终消费支出中的居民消费支出持续增长和社会消费品零售总额不增反降可能是当前服务消费发展过快导致的;陈伟涵运用实证分析方法,通过多元线性回归模型分析了广东居民消费支出与社会消费品零售总额的情况;李小星、徐永利发现了一种预测准确、误差较小、容易解释的分析方法:函数性数据分析方法,并使用该方法预测了未来中国社会消费品零售总额的走势;宫雷、陈平在分析我国社会消费品零售总额的变化趋势时,首次在分析中使用了Mann-kendall突变检验方法;苏淼淼通过收集中国2001年1月至2011年10月社会消费品总额的数据, 采用确定性时间序列模型,最终分析结果发现运用指数模型对其进行模拟有较好的效果,得出结论,我国社会消费品零售总额增长越来越快;晁彦发现社会消费品零售总额与居民可支配收入、国内生产总值、居民消费价格这四个指标相关性极大,而人口数量、物价指数和恩格尔系数三者之间基本毫无关联。该结论运用了主成分回归分析法;吴龙在文章中发现了不同变量对社会消费品零售总额影响不一样,并依靠主成分分析法和建立PCR模型的方式,科学合理地确定了不同变量的影响因子,确定了不同变量的影响数值。彭冰、胡建廷、邓捷运用多元线性回归分析方法,对长三角社会消费品零售总额进行分析发现,如果要提高社会整体消费水平就必须大幅提高人民收入;郜奕钧、何林芮另辟蹊径,认为交通因素可能对社会消费品零售总额有所影响。基于此认知,他们在模型中加入交通因素,通过对数回归的方式,分析了公路里程与地区GDP和社会消费品零售总额三者的关系,并得出了交通因素对社会消费品零售总额有一定影响的结论;国外学者也在这个问题上提出了许多见解,Alqi Naqellari,Eros Angjeli和Nexhmi Dumani分析了阿尔巴尼亚家庭收入和支出动态的问题,得出结论,通过发展轻工业和食品工业的开发加工等将会使得GDP和国民收入增长更快,从而增加社会消费支出;Zhengshun Fei等人提出了一种混合相关结构的动态加权主成分分析方法,监测结果表明,所提出的方法效果良好。

三、理论基础与研究假设

在综合已有文献的观点之后,可以发现,社会消费品零售总额一般会与一国或地区的总体经济发展状况呈相关关系,经济发展水平越高的地区往往该地区居民的消费欲望比较强烈,与之相反的是,社会消费品零售总额会与物价水平成相关关系,这是因为当物价水平飙升的时候,居民会发现手中的实际货币量减少,无法满足其原有的消费需求,消费量自然减少;而一个人所受过的教育也会对其消费习惯造成很大影响,一般而言,受教育程度低的人群对物质方面的需求比较简单,仅仅为满足日常基本生活需求,受教育程度较高的人群则除了对基本生活物资有消费需求外,还会追求一些额外的物质或精神层面的消费品。因此,本文决定从经济发展水平、物价水平和教育水平等多个方面来探究影响社会消费品零售总额的因素。普遍认为国内生产总值在大部分时间是可以体现一国或地区的经济发展状况的,而发达经济体与发展中经济体的国民消费水平会产生很大差异,故采用国内生产总值来代表全国总体经济发展水平;在M0、M1、M2、M3几个均可代表货币供应量的变量之中,广义货币供应量不仅数据来源准确,统计口径适中,且其是最能体现居民日常消费过程中使用货币量多少的指标,故本文采用广义货币供应量来表示货币发行数量;消费者价格指数表示物价水平;人口总数代表总体人口的多少;城镇人口占比表示城镇化水平;我国目前乡村登记失业率的可靠性、科学性与完整性还不够高,因此本文选取城镇登记失业率表示就业水平;由于教育这一因素一般无法直接量化,故此处采用普通高等学校毕业生人数表示教育水平;由于财政收入的大部分来自具有纳税义务的公民的税收,而公民的税收采用的累进税制衡量纳税额度的多寡,财政收入的多少取决于纳税人可支配收入的多少,这也是影响居民消费水平的一个方面,因此采用财政收入表示国民缴税情况。

在研究以上八项因子与社会消费零售总额的过程中,本文假设选取的因子能够概括大部分的影响因变量的因素,并且假设其他外部条件是不变的,只有在这些假设条件成立的时候才能保证下文主成分分析具有可行性。

四、数据处理与实证分析

本文综合考虑数据可得性与代表性,从购买方的角度出发,采用我国2000~2019年的年度数据作为分析基础,选取了广义货币供应量M2、国内生产总值GDP、消费者价格指数CPI、人口总数pop、城镇人口占比Q、城镇登记失业率P、普通高等学校毕业生人数GRA、财政收入总额REV,以及被分析对象社会消费品零售总额Y。这九项变量数据均来源于国家统计局(2000~2019),因不同变量之间单位不一致,故后文采取聚类分析与主成分分析。

(一)指标分类

由于数据都是零散且单位不一样,笔者通过对数据进行清洗,将其变成标准化和结构化的数据后,使用Q型聚类分析对数据进行计算,得出每个指标的欧式距离,最后再聚类分析它们的最短距离。根据聚类分析的计算结果,我们可以将指标分为四类:国内生产总值、财政收入总额与广义货币供应量分为一类;总人口数、城镇人口占比与普通高等学校毕业生人数分为一类;城镇登记失业率自成一类;消费价格指数单独划分作为一类。

(二)指标简化

在本文中,笔者通过线性变换的方法重新组合了上述指标,将其转化成了尽量少的且每个指标都不相关的综合性指标,同时,确保了这些综合性的指标都能反映原指标包含的信息。笔者通过聚类分析后,让相同属性的指标根据关联,上述的每个分类都可以用一个综合性的指标来代替。

第一类(含有指标GDP、REV和M2)和第二类(含有指标population、Q、GRA)都含有多指标,则可以对上述两类都进行主成分分析。

第一类,首先对指标GDP、REV和M2三项指标分析,得相关矩阵如下:

GDPREVM2

GDPREVM21.000 0.999 0.9960.999 1.000 0.9940.996 0.994 1.000

從上述结果看出,GDP、REV、M2三者之间的相关性很强,进而对GDP、REV、M2进行主成分分析,计算后得出GDP、REV、M2关联度为98.995%。

因此可以使用GDP、REV、M2来代替最初的指标。其表达式为:

Z1=0.5769GDP+0.5774REV+0.5774M2

再对population、Q、GRA等指标进行相关性分析,得到相关矩阵如下:

POP Q GRA

POPQGRA1.000 0.999 0.9790.999 1.000 0.9830.979 0.983 1.000

从以上矩阵可以看出,popultion、Q、GRA三者之间的相关性很强,进而对popultion、Q、GRA进行主成分分析,计算后得出popultion、Q、GRA关联度为99.165%。

因此可以使用popultion、Q、GRA来代替最初的指标。其表达式为:

Z2=0.5781POP+0.5787Q+0.5752GRA

(三)综合评价

下文利用新得到的4个指标来测算我国社会消费品支出受到何种影响,可以用主成分分析法分析新的指标变量:

1.设新指标Zi,令该指标各期数值为Zti(t=1,2,3,…,T;i=1,2,…,N)构成样本矩阵ZTN,本文T=19,N=4。由于本文数据两个综合指标为绝对数,而Z3与Z4为相对数,此处采用Z =(Zi-Zi)/Zi的方式将前综合指标相对标准化,再通过新数据来计算相关阵RNN。

2.计算RNN的特征值和对应的单位特征向量Ti,再求出各个特征根对应的主成分Yi(i=1,2,3,…,N),则有

Y=T′Z

3.归一化后:wi=

记W=(w1,w2,…,wN)′,则可以推出评价函数为:

P=w1Y1+w2Y2+……+wNYN=W′Y=W′T′Y=(TW)′Y

令权重w*=TW,则有P=(w*)′Z

将新数据带入,求得综合指标值的权重如表1所示。

因此综合评价函数可得:

P=0.65775Y1+0.225Y2+0.11525Y3+0.225Y4=1.73Z1+0.20Z2+0.05Z3+0.000016Z4

从上式可以看出,综合指标Z1对我国社会消费品支出的解释力度最大。综上所述,影响社会消费品支出的因素可以分为经济发展类指标、人口类指标、价格类指标与就业水平类指标四个大类别,其中,经济发展类指标包括了国内生产总值、财政收入、广义货币供应量,该指标对社会消费零售总额的影响最显著,影响效果排在第二位的是人口类指标,包含了总人口数、城镇人口占比及普通高等学校毕业生人数。虽然毕业生人数是用来代表教育水平的指标,但其在很大程度上直接受到人口总数的影响,人口总数越多,毕业生人数越多,因此将其划分为人口类指标。

五、结论与政策建议

本文首先选取出八个影响社会消费零售品总额的因素,根据主成分分析与聚类分析的指向性,先分析各影响因素的相关性,对其进行聚类分析将其分为四个类别后分别对各小类进行主成分分析。从上文的实证分析可以看出,影响社会消费品支出的因素主要为经济类指标。疫情防控期间,我国经济增速放缓,疫情导致老百姓的消费需求减弱,国内市场普遍出现了居民消费水平低下的现象。而且,我国经济要高质量高速发展不但有内部压力,还有外部刚需,这样的内外部双重的压迫使得我国经济发展更加缓慢。由于我国人口基数庞大,这就意味着我国的消费需求呈现出多样化、层次化的特性,年龄、兴趣及工资水平均影响消费者的偏好,所以各部门应加强对消费者的动态了解,掌握其发展规律。我国经济走入新常态阶段,经济发展速度从高速增长转变为中速增长,经济发展水平与居民消费水平之间的双向互动规律决定了消费水平随之降低,但需要保证经济的平稳增长,我国政策制定者需从稳定国内消费的角度出发,以内需拉动经济增长才是根本之策。

六、结语

本文通过选取出八个影响社会消费零售品总额的因素,研究在一个发展阶段的社会消费品零售总额的影响因素,为政策制定者顶层设计提供一定的借鉴。

参考文献:

[1]孙凯.社会消费品零售总额与消费全貌的调查分析[J].大庆社会科学,2018(04):115-116.

[2]陈伟涵.广东社会消费品零售总额的影响因素实证分析[J].市场经济与价格,2015(11):49-52.

[3]李小星,徐永利.基于函数性数据分析的中国社会消费品零售总额数据的预测[J].北京化工大学学报(自然科学版),2018,45(03):107-112.

[4]宫雷,陈平.基于Mann-kendall检验的社会消费品零售总额突变分析[J].信息系统工程,2018(05):95+98.

[5]苏淼淼.中国社会消费品零售总额确定性时间序列分析[J].西藏科技,2017(12):21-24.

[6]晁彦利.中国社会消费品零售总额的相关问题研究[D].武汉:华中师范大学,2017.

(作者单位:中国人民银行萍乡市中心支行)

猜你喜欢
聚类分析主成分分析
基于NAR模型的上海市房产税规模预测
主成分分析法在大学英语写作评价中的应用
农村居民家庭人均生活消费支出分析
江苏省客源市场影响因素研究
SPSS在环境地球化学中的应用
基于省会城市经济发展程度的实证分析
基于聚类分析的互联网广告投放研究
服务贸易结构优化路径研究
“县级供电企业生产经营统计一套”表辅助决策模式研究