广东省GDP影响因素实证分析

2023-10-11 01:44程淮淋
合作经济与科技 2023年23期
关键词:共线性总产值回归方程

□文/程淮淋

(华南师范大学数学科学学院 广东·广州)

[提要]本文以广东省经济发展基本数据为基础,建立多元线性回归模型,研究社会消费品零售总额、地方财政一般预算支出、建筑业总产值、全体居民人均消费支出、工业增加值和农业总产值等六个主要影响因素,并提出广东省经济发展对策。

引言

地区生产总值(GDP)是衡量一个地区经济状况和发展水平的重要指标,也是进行宏观经济决策的重要依据。广东省的经济一直保持迅猛发展,而且广东省的经济发展状况可以代表中国一线城市和新一线城市的经济发展状况,所以对其GDP影响因素进行有效的分析有着非常重大的意义。

近年来,学者们从各个不同角度对GDP的影响因素进行研究。由于GDP这一变量受到多个变量的影响,因此许多学者运用多元线性回归模型对其进行实证研究。白雨基于多元线性回归方法建立相关指标模型来探讨影响我国GDP的重要因素,使用逐步回归的方法对多重共线性进行修正,结果表明:居民消费水平、进出口贸易总额、外商直接投资和研究与实验发展支出等指标均与我国GDP增长存在正相关关系。王威威运用最小二乘法将中国的GDP、最终消费(CS)、投资总额(I)、出口总额(EX)作为一个系统,对中国经济增长影响因素进行回归分析,检验模型的整体显著性和回归系数的显著性,运用逐步回归法的向后筛选法进行多重共线性的处理,基于检验结论而得出消费对中国经济增长的影响最大。此外,还有学者建立向量自回归模型对中国GDP的影响因素进行实证研究。周跃辉和周定根利用1992~2011年宏观经济数据,进行格兰杰因果检验,建立向量自回归模型,结果表明存贷差、间接融资与直接融资之差以及外汇储备都能显著影响M2/GDP,进而影响中国的货币化进程。曹剑涛首先在费雪的交易方程式的理论基础上进行了推导,提出了M2/GDP和CPI的交易方程式,而后根据其搜集的相关年份数据建立了向量自回归模型。结果表明:M2/GDP和CPI之间存在协整关系并且二者之间的关系是长期稳定的。

本文以广东省GDP影响因素为研究对象,利用多元线性回归模型和岭回归修正多重共线性,探讨各影响因素对广东省GDP的影响程度。

一、数据来源与变量设置

(一)数据来源。为了研究的实用性,本研究数据来源于国家统计局公开发布的国家数据网站,分别收集了2005~2021年的广东省各项经济指标数据。因部分指标数据在2005年以前没有连续统计,故本研究的数据从2005年开始收集。

(二)变量设置。考虑到影响广东省GDP的因素很多,根据研究的需要、影响因素的大小和模型本身的需要等原因,选择了六个指标作为模型的解释变量:社会消费品零售总额、地方财政一般预算支出、建筑业总产值、全体居民人均消费支出、工业增加值和农业总产值。其中,社会消费品零售总额是研究零售市场变动情况、反映经济景气程度的重要指标,对经济发展有正向作用;地方财政一般预算支出与GDP增长在数量上存在依存关系,二者有趋同的上升趋势,表现出长期平衡的特点;建筑业总产值与GDP之间存在着密切的正相关关系,对经济增长具有拉动作用;全体居民人均消费支出与GDP之间具有明显的相互影响关系;广东省农业人口较多,随着经济的发展,工业化进程也在加快,因此认为农业总产值以及工业增长值也会对广东省经济增长产生一定影响。因此,上述解释变量的选取符合经济发展的实际情况。用这六个指标来衡量GDP增长水平,并分别分析各个指标对GDP的影响。

其中,GDP为被解释变量,用y表示。社会消费品零售总额、地方财政一般预算支出、建筑业总产值、全体居民人均消费支出、工业增加值和农业总产值为解释变量,分别用x1,x2,x3,x4,x5,x6表示。

(三)模型构建。根据上述数据建立模型为:

其中,y表示GDP;x1、x2、x3、x4、x5、x6为解释变量;β0为常数项,β1、β2、β3、β4、β5、β6分别为自变量x1、x2、x3、x4、x5、x6的回归系数;ε为随机扰动项。利用SPSS软件对上述各个变量进行回归分析,得到模型回归结果。

二、实证分析

(一)参数估计

用SPSS软件进行最小二乘法参数估计,得到的初步回归方程是:

(二)模型检验

1、经济意义检验。x1的相关系数为正,说明GDP与社会消费品零售总额呈现正相关关系。从经济意义上看,社会消费品零售总额越大,经济所创造的国民财富越多,地区生产总值越多,因此此检验结果和实际相符合,所以x1通过了经济意义检验。x2的相关系数为正,说明GDP与地方财政一般预算支出呈现正相关关系。从经济意义上看,地方财政一般预算支出越高,越有利于GDP的提高,因此此检验结果和实际相符合,所以x2通过了经济意义检验。x3的相关系数为正,说明GDP与建筑业总产值呈现正相关关系。从经济意义上看,建筑业总产值的增长可以拉动地区经济的发展,因此此检验结果和实际相符合,所以x3通过了经济意义检验。x4的相关系数为正,说明GDP与全体居民人均消费支出呈现正相关关系。从经济意义上来说,全体居民人均消费支出越高,对当地的经济发展会起到正向推动作用,因此此检验结果符合经济意义,所以x4通过了经济意义检验。x5的相关系数为正,说明GDP与工业增加值呈现正相关关系。从经济意义上来说,工业增加值越高,对当地的经济发展推动作用越大,因此此检验结果符合经济意义,所以x5通过了经济意义检验。x6的相关系数为负,说明GDP与农业总产值呈现负相关关系。但从经济意义上来看,农业总产值越高,越有利于当地农民收入水平提高,从而带动当地的经济发展,因此此检验结果并不符合经济意义,所以x6未能通过经济意义检验。

2、统计检验

(1)拟合优度的检验:从回归的相对效果看,复相关系数R=1.000,决定系数R2=0.999=99.9%,回归可以减少因变量99.9%的变异,从决定系数看回归方程高度显著。从回归的绝对效果看,回归标准误差的估计值σ赞=Se=1112.2255,而2021年因变量y的水平值已经达到124369.7,标准误差和水平值相比很小,也说明回归效果很好。

(2)F检验:首先提出原假设H0:β0=β1=β2=β3=β4=β5=β6=0。在指定的显著性水平α=0.05下,F=2193.405,P值=0,所以应该拒绝原假设,表明回归方程高度显著,x1、x2、x3、x4、x5、x6整体上对y有高度显著的线性影响。

(3)t检验:x1社会消费品零售总额的P值=0.598最大,不显著。x4和x6的P值分别是0.387、0.408,也不显著。x2的P值为0.084,在0.05~0.10之间,也只是弱显著。虽然由F检验可知自变量x1、x2、x3、x4、x5、x6整体上对y有显著影响,但是每个自变量对y的显著性却较差。由此可见,对此数据的多元线性回归中,虽然回归方程整体的显著性很强,但是并不意味着每个自变量都显著。

3、异方差检验和自相关性检验

(1)异方差检验:关于异方差性的检验,可以使用残差图分析的方法,回归模型的残差图,如图1所示。残差图上的点的散布未呈现出一定的趋势,并未随x值的增大而增大或减小,因此可初步判断回归模型不存在异方差性。(图1)

图1 残差图

(2)自相关性检验:对于自相关性我们用DW检验来判断,DW≈2(1-ρ赞)=1.441,因而可以近似的计算出ρ赞=0.2795,通过查表可以判断出误差项的自相关性呈轻微的正自相关,由于自相关性不明显,因此可近似认为误差项不存在自相关性。

4、多重共线性检验。x1、x2、x3、x4、x5、x6的VIF值分别为256.003、133.064、81.010、556.140、80.640、241.032,即所有自变量的VIF均远远大于10,表明该模型存在很严重的多重共线性问题,必须进行多重共线性修正,得到的回归结果才更可靠和具有实际意义。

(三)多重共线性修正。由多重共线性检验可知,模型存在严重的多重共线性问题,因此下面尝试使用逐步回归法和岭回归法进行修正。

1、逐步回归修正。使用逐步回归法剔除对被解释变量影响不显著的变量,达到减小多重共线性的目的。逐步回归共剔除了x1、x2、x6三个变量,得到的逐步回归方程为:

这个回归方程模型通过了F检验,且三个自变量的t检验都是显著的。但是,一个主要的缺陷是包含的自变量太少,我们关心的社会消费品零售总额x1、地方财政一般预算支出x2、农业总产值x6这三个自变量都不在方程中。对这个只含有三个自变量的回归方程再做一次共线性检验,可以发现x3、x4、x5的VIF值分别为72.660、17.518、45.456,三者均大于10,说明仍然存在严重的共线性。由此看来,这个二元回归方程虽然自变量都显著,但是仍然存在较大的缺陷,不能令人满意。用逐步回归剔除变量的方法消除多重共线性不能达到预期效果,存在较大的局限性。

2、岭回归修正。在岭迹图中,各变量的岭回归系数没有特别小,岭迹稳定时的岭回归系数普遍在0.05以上,说明各经济指标对GDP都有一定程度的影响。各岭迹线均以递增或者递减的形式趋于稳定,没有出现正弦式的振荡型趋于零,说明六个经济指标中没有多余的指标,不用剔除任何的变量。(图2)

图2 岭迹图

随着k的增大,各个岭迹趋于稳定,即各个自变量的标准化系数趋于稳定。在k=0.06时,各岭迹基本就稳定了,R2=0.999仍然很大,因而可以选择岭参数k=0.06。输入岭参数k=0.06,可以得到标准化的岭回归方程为:

在指定的显著性水平α=0.05下,F=1165.135827,p值=0,表明岭回归方程高度显著。正态分布的双侧检验的临界值是1.96,t分布的临界值略大于1.96,在2.0附近。六个自变量统计量B/SE(B)的值中,最小的是x2的8.849,远远大于2,说明六个自变量都是高度显著的。每个变量的系数均符合经济意义。

该模型表明:建筑业总产值对GDP增长的影响最为明显,建筑业总产值每增加1个单位,GDP将增加0.192个单位,由此可见建筑业总产值对于广东省经济的发展具有巨大的推动作用;其次是工业增加值对广东省GDP增长也有比较大的正向作用,工业增加值每提高1个单位,GDP将增加0.185个单位;全体居民人均消费支出、农业总产值、社会消费品零售总额和地方财政一般预算支出也在一定程度上促进了地区经济的发展,这四个指标每提高1个单位,GDP将分别增加0.161、0.158、0.154和0.149个单位。

三、结论与讨论

根据上述分析结果,由逐步回归剔除其中三个自变量的回归方程未通过共线性检验,未达到消除共线性的目的,且损失了这些变量蕴含的信息;而由岭回归进行修正的模型通过了回归方程的F检验和t检验,各变量对应的系数表明该变量对广东省GDP影响程度的大小。结果表明,六项指标均与广东省GDP增长存在正相关关系,且影响程度由大到小依次为建筑业总产值、工业增加值、全体居民人均消费支出、农业总产值、社会消费品零售总额和地方财政一般预算支出。

因此,为更好地促进广东省的经济发展,政府应该坚持深化建筑业改革,完善监管体制机制,优化建筑市场环境,推动建筑产业转型升级;积极转变经济发展的方式,加大财政资金的支持力度,大力扶持地区企业,吸引外来资金的投入,促进投资循环发展;提供就业机会,扩大就业规模,促使当地居民收入增加,鼓励居民正确消费;完善收入分配制度,加强按劳动和按生产要素参与分配,加大对农民财政的投入,鼓励农产品生产大户的发展,发挥农产品生产大户对小户的示范带动作用,以提高总体地区的农业生产总值;优化产业结构,加快工业转型升级,走新型工业化发展道路,拉动经济的增长。发展工业的同时,也要增加对于环保的投入,杜绝以发展经济而破坏环境的现象发生,推动环保技术进步,始终以绿色可持续发展为前提,做到经济与生态之间矛盾得到统一。除此之外,广东省可借助粤港澳大湾区建设的发展契机以及绿色经济发展的浪潮,促进环保产业和生态农业的快速发展,促进高新技术产业的发展,促进现代服务业的形成和发展,实行可持续绿色经济发展体制,促进广东省经济顺利实现转型。

猜你喜欢
共线性总产值回归方程
采用直线回归方程预测桑瘿蚊防治适期
银行不良贷款额影响因素分析
2019年来宾市蔗糖业总产值近100亿元
文氏图在计量统计类课程教学中的应用
——以多重共线性内容为例
走进回归分析,让回归方程不再是你高考的绊脚石
不完全多重共线性定义存在的问题及其修正建议
诊断复共线性的特征分析法及其在GEO定轨中的应用