基于DFA和SVR的GDP预测模型研究

2016-01-20 12:55

张 鹏

(太原工业学院理学系, 山西 太原 030008)



基于DFA和SVR的GDP预测模型研究

张鹏

(太原工业学院理学系, 山西太原030008)

[摘要]首先对1980—2013年全国年度GDP数据进行消除趋势分析(DFA),发现GDP时序具有长记忆性,表明当前GDP值用来预测未来一段时间内的GDP值具有可行性,在此基础上利用具有非线性和强泛化能力特点的支持向量回归机(SVR),建立SVR预测模型,得到了较好的预测效果.

[关键词]消除趋势分析;支持向量回归机;GDP

生产总值(GDP)是一个国家或地区在某个时间段内经济中所生产出的全部最终产品和提供劳务市场之和,也是目前衡量某国或地区经济发展综合水平通用的宏观经济指标.由于其地位重要,引起了很多学者的研究兴趣.

国内外大多采用时间序列分析方法对GDP发展规律进行研究并预测,国内大多还是基于传统的时间序列分析方法.国外存在一些非线性时间序列分析方法.本文采用支持向量回归机(SVR)来对GDP进行研究.

SVR作为现代统计较为成熟的方法之一,其重要特点是在有限样本情况下训练的网络仍然具有较强的泛化能力,已被广泛应用于多个领域,均有较好的预测效果.本文结合DFA方法与SVR模型对GDP时序建立预测模型,通过DFA方法证明GDP时序的可预测性,然后使用SVR模型实现对GDP的预测.

1理论介绍

1.1 DFA方法简介

消除趋势分析(DFA)方法由Peng等人提出[1,2].该算法思路如下:

对长度为n的时间序列

x(t),t=1,…,n

(1)计算累计离差序列

(2)序列重组

(3)拟合

对每个区间V,利用LS法对其中包含的s个数据进行一阶线性拟合即得:

x=1,…,s

(4)计算区间均方差

计算每个区间滤去趋势之后的均方差,即

v=1,…,m

v=m+1,…,2m

(5)计算DFA值

计算区间长度为s的均值并开方,得相应的DFA值,即

(6)作散点图并一阶拟合

在坐标系下作关于数据(ln(s),ln(D(s)))的散点图,用最小二乘法进行一阶线性拟合,其斜率即为广义Hurst指数.当0.5

1.2 SVR网络

支持向量机算法(SVM)最初用来解决分类问题,由于其具有强泛化能力而被推广应用于解决回归类问题,即SVR.基本思想是将回归问题通过非线性映射转化为二次规划问题[3,4].

1.2.1线性回归情形

s.t.f(xi)-yi≤ε+ξi

ξi≥0,ξi′≥0,i=1,2,…,n

1.2.2非线性回归情形

非线性回归首先是通过核函数将低维非线性问题转化为高维空间的线性问题,然后再利用线性回归情形分析.

目前该算法中常用的核函数有3种类型,分别为线性核、多项式核、高斯核,一般形式分别为

2实证分析

本文选取1980—2013年的共34个全国GDP值,数据来源于中国统局官网.首先对1980—2013年的GDP序列进行DFA分析,然后再对1990—2010年的GDP值建立SVR训练模型,最后对2011—2013年的GDP值进行测试.

2.1 DFA分析

对所选数据依照2.1中算法进行DFA分析,得Hurst值,结果如表1,散点图如图1.

图1 (ln(s)、ln(D(s)))散点图及LS拟合直线

表1 不同区间长度下的DFA值

观察图1,ln(s)和ln(D(s))明显存在线性关系.利用最小二乘法对其进行一阶拟合得其关系为logD=2.76+2.10*logs,即得Hurst指数值为2.103 36>1,表明GDP序列具有长程记忆性.因而利用当前的GDP值来预测未来的GDP变化趋势是可行的.

2.2 SVR网络预测

对1990—2013年的数据,选择前4年的数据作为模型的输入,下一年作为输出.具体来说,2011—2013的数据作为测试集,见表2.1990—2010年的GDP值作为训练集,见表3.

表2 测试样本集数据

表3 训练样本集数据

(1)数据预处理

(2)构建SVR预测模型

建立SVR预测模型首先要通过一定方法进行参数的训练,找到适合该序列的模型参数.本文关于参数的选取利用回归预测法进行择优[5,6].模型经过训练,其误差达到既定误差以下,得到最优参数.见表4.

表4 相关训练参数

对模型进行外推,得到相应的预测值,最后将实际值、预测值以及相应相对误差进行综合比较.结果见表5.

表5 实际值与预测值比较

可以看出,对于训练样本,相对误差均在5﹪以内;而对于测试样本,误差距很小,充分说明支持向量机的外推能力强,实际中可以运用SVR模型对GDP进行预测.

3结语

本文通过DFA方法对全国GDP时间序列进行相关性分析,结果表明其具有“长记忆性”的特点,进而说明用过去的数据对一定范围的未来进行预测具有可行性.然后通过对数据进行归一化预处理,构建SVR网络预测模型,实现对GDP的预测,并与实际相比较.实验表明,建立的SVR预测模型对GDP具有较好的预测效果,可以用于实际的经济预测.

[参考文献]

[1]PengCK,BuldyrewSV,HavlinS,etal.MosaicorganizationofDNAnucleotides[J].PhysicalReviewE,1994,49(2):1685-1689.

[2]KantelhardtJW,ZschiegnerSA,Koscielny-BundeE,etal.Multifractaldetrendedfluctuationanalysisofnonstaionarytimeseries[J].PhysicaA,2002,316:87-114.

[3]TomMM.机器学习[M].曾华军,译.北京:机械工业出版社,2003:98-120.

[4]陈封能.数据挖掘导论[M].北京:人民邮电出版社,2006:188-203.

[5]KimKJ.Financialtimeseriesforecastingusingvectormachines[J].Neurocomputin,2004.

[6]史峰.Matlab神经网络30个案例分析[M].北京:北京航空航天大学出版社,2010:88-115.

(责任编辑穆刚)

Research of GDP prediction model based on DFA and SVR

ZHANG Peng

(Science Department of Taiyuan Institute of Technology, Taiyuan Shanxi 030008, China)

Abstract:This paper firstly uses the Detrended Fluctuation Analysis method (DFA) to analyze the national annual Gross Domestic Product (GDP) data from 1980 to 2013, which shows GDP time series has long memory, that is to say, using the current GDP data to predict the future GDP value over a period of time is practicable. Based on this and Support Vector Regression Machine (SVR) characterized by nonlinear and strong generalization, SVR prediction model is established and a better prediction effect is obtained in this paper.

Key words:DFA; SVR; GDP

[中图分类号]C812

[文献标志码]A

[文章编号]1673-8004(2015)05-0042-04

[作者简介]张鹏(1989—),男,山西长治人,助教,硕士,主要从事数据分析、统计决策方面的研究.

[收稿日期]2014-12-26