一元线性回归方法的理论及其应用

2017-09-01 01:35李玉毛
赤峰学院学报·自然科学版 2017年15期
关键词:赤峰常住人口回归系数

李玉毛,何 涛,刘 冬

(赤峰学院 数学与统计学院,内蒙古 赤峰 024000)

数理研究

一元线性回归方法的理论及其应用

李玉毛,何 涛,刘 冬

(赤峰学院 数学与统计学院,内蒙古 赤峰 024000)

一元线性回归主要研究两个变量之间的线性相关关系,本文主要论述了一元线性回归分析的基本理论,借助统计软件SPSS对一个简单的实例进行了分析,包括对实例的相关性分析、建模、对模型的显著性检验以及残差的分析,通过实例更进一步了解一元线性回归在具体问题中的应用.

一元线性回归;最小二乘法;SPSS;显著性检验

1 一元线性回归基本原理

一元线性回归是回归模型中比较简单的回归模型,它用来描述一个数值变量的变化对另一个数值变量的影响程度,一元线性回归模型用数学形式表示出来就是

其中(β0+β1x)表示解释变量x对被解释变量y的影响,也就是自变量对因变量的影响,β0和β1为未知参数,ε表示不确定的随机因素对因变量y的影响.一般情况下随机因素ε是不可预测的,通常假定ε是期望为0、方差为σ2的正态分布.

回归分析在实际问题中的作用就是通过样本观测值(xi, yi)对未知参数即β0,β1进行估计,估计值表示为0,1,通常采用普通最小二乘法来取得理想估计值为

2 应用实例

国内生产总值(GDP)是衡量一个国家或地区总体经济状况的重要指标,是指一个国家或者地区所有常驻单位在一定时期内生产的所有最终产品和劳务的市场价值,因此直观认为一个国家或者地区的常住人口与其GDP应该是有正相关关系.本文搜集了全国12个省市2013年末的常住人口和2014的GDP(表1)进行统计分析[3].

表1 全国12个省市2013年末的常住人口和2014的GDP统计数据

2.1 常住人口和GDP的相关性分析

为考察常住人口(x)和GDP(y)的关系,用统计软件SPSS绘制散点图[2],如图1所示:

图1 散点图

从散点图可以看出随着常住人口的增加,GDP有明显的增加趋势,也就是说初步判断二者之间是线性正相关,为了进一步了解二者之间的关系,利用SPSS软件计算二者之间的Pearson相关系数,结果如表2所示.

表2 相关系数

从表 2可以看出二者之间的 Pearson相关系数为0.960,显著性检验显示的P值为0,因此常住人口与GDP是高度正相关,我们利用一元线性回归来给出二者之间的具体线性关系.

2.2 建立一元线性回归模型

利用SPSS建立回归方程:

表3 回归系数

从表3可以看出回归系数分别是3231.749和6.278,因此2013年末的常住人口(x)与2014年的GDP(y)的线性回归方程为y=321.749+6.278x,对其回归系数的进一步检验,p值小于0.05,因此回归系数显著.

2.3 模型检验

一元线性回归方程的显著性检验通常用方差分析方法F检验[3],其原理是利用总的平方和可以分解为回归平方和和残差平方和,即

F统计量为

Fα(1,n-2)为临界值,当F>Fα时,回归方程显著.

对回归方程y=3231.749+6.278x进行显著性检验,得到表4:

表4 方差分析

由表得到SSR=4.206×109,SSE=3.569×108,F=117.824, P=0<0.05,因此回归方程显著,其实对于一元线性回归来说,回归方程的显著和回归系数的检验是等价的.

2.4 回归方程拟合优度的检验

为了说明回归直线的拟合效果,进一步计算回归方程的拟合优度,如表5所示,得到相关系数R=0.960,判定系数R2=0.922,调整后的判定系数为0.914,也就是说各地区GDP的不同有91.4%是由于常住人口引起的,可见二者有较强的线性关系.

表5 拟合优度检验

2.5 残差分析

上述一元线性回归模型的建立是基于假定误差项ε服从均值为0,方差为σ2的正态分布[4],如果假定成立,则实际值和预测值的残差εi=yi-i应该与自变量的变化没有关系,也就是说以自变量为横轴,以残差为纵轴做散点图的点应该落在两条水平带中间.如果这样的假定不成立,则该模型以及由此模型进行的预测的准确度将是不可信的.为进一步研究上述建立的回归模型的假定是否成立,我们用做残差图如图2所示:

图2 残差图

从图中可以看出各残差基本上落在了水平带x=-20000和x=20000之间,说明我们的假设是成立的,模型也是可靠的.

3 结论

本文通过一个实例,阐述了一元线性回归在实际问题中的具体应用,并运用统计软件SPSS对实例进行了相关性分析、建模和各种统计检验,给出了2013末地区常住人口和2014年GDP的具体线性回归方程,具有一定的现实意义.

〔1〕贾俊平,何晓群.统计学[M].北京:中国人民大学出版社,2011.

〔2〕张文彤,闫洁.SPSS统计分析基础教程[M].北京:高等教育出版社,2010.

〔3〕张敏静.一元线性回归方程有关检验问题的研究[J].价值工程,2012(2):1-3.

〔4〕林天水,陈佩树.一元线性回归中异方差的处理[J].统计与决策,2015(3):86-88.

O212

A

1673-260X(2017)08-0001-02

2017-04-22

猜你喜欢
赤峰常住人口回归系数
赤峰学院学生书法作品
赤峰学院教师书法作品
赤峰家育种猪生态科技集团有限公司
2021 年内蒙古自治区常住人口主要数据公报
多元线性回归的估值漂移及其判定方法
北京城市副中心:常住人口控制在130万以内
电导法协同Logistic方程进行6种苹果砧木抗寒性的比较
多元线性模型中回归系数矩阵的可估函数和协方差阵的同时Bayes估计及优良性
2015年上海市常住人口首现负增长
城镇居民收入差距主要因素回归分析