组合模型对股票价格预测的比较研究

2012-10-14 07:45胡俊桂霏杨桂元
关键词:股票价格残差线性

胡俊,桂霏,杨桂元

组合模型对股票价格预测的比较研究

胡俊,桂霏,杨桂元

股票价格预测向量是投资者、分析家以及很多学者所关注研究的对象,传统的预测模型已发展得比较成熟,而近年产生的新型统计学习理论也逐渐成为了预测的工具,比如神经网络,支持向量机等。对三种传统与新型模型混合的组合模型(ARIMA、GARCH、SVR)进行预测,并比较分析,得到一定的结论。

股票价格预测;ARIMA;条件异方差;支持向量回归;组合模型

一、前言

股票价格预测一直以来是投资者、分析家以及很多学者所关注研究的对象,但由于影响股市的因素太多,客观预测——技术分析、数据分析、公司基本面判断等尽管能判断出一定的波动趋势,但准确性不佳。因此,对于很多散户投资者甚至一些机构评论分析人都是主观加客观来做推断,这也进一步导致了股票市场的盲动性。

传统的时间学列对于股市的预测有很多模型,比如线性的ARIMA,非线性的GARCH模型等,这些模型对数据要求比较严格,尤其是GARCH模型,对于股票数据,尽管数据量大,但由于市场随机性太强,数据往往显得不“真实”。20世纪50年代以来,暗箱理论的建立使统计研究理论从传统型上发生了一些转变,特别是计算机发展普及后,这方面的实践也明显增多,从而带动了预测模型的发展。比如人工神经网络(ANN)、灰色预测(GM)、支持向量机(SVM)等。 人工智能(Artificial Intelligence)主要是通过计算机来模拟人的某些思维过程和智能行为的一种方式,从而对新的变量与环境进行较精确的经验判断或预测。

近年来,人们对新型预测模型的关注度越来越多,并且常常与传统模型结合,用组合模型来判断,取得了一定的效果。目前,国内在这方面的组合模型主要有三种模式:第一类是把时间序列分成线性部分和非线性部分,并对线性部分进行传统的时间序列模型进行预测,而对非线性部分用人工智能进行预测,如盛艳波(2006)用BP神经网路和ARIMA组合模型对浙江省人均GDP进行预测,有一定的预测性;第二类是通过对几种预测(包括传统与新型)的结果进行加权求平均处理,如张防等(2009)通过对用BPNN预测和ARIMA预测出来的销售数据进行加权平均处理,得到比用单个方法预测的效果好;第三类是将某个传统方法预测出来的结果作为神经网络、支持向量机中的一个因素,再进行神经网络、支持向量机等进行仿真预测,如高振坤等(2009)对深圳成指的收益率进行研究,其方法是用前5天的对数收益率作为输入神经元,此外还加上用GARCH估计出来的条件变异数作为第六个输入神经元,再进行仿真模拟,结果显示组合预测比较好。

本文结合以上三种组合模型,运用ARIMA、GARCH、SVR(支持向量回归机)对股票价格进行预测。

二、模型介绍

对于上面的三个模型,由于ARIMA与GARCH发展得较成熟,这里只作简单介绍,笔者将重点阐述SVR的原理。

(一)差分自回归移动平均模型(ARIMA)

ARIMA模型是由Box和Jenkins于20世纪70年代初提出的时间序列预测方法,其基本思想是将预测对象随时间推移而形成的数据序列视为一个随机序列,用一定的数学模型来近似描述这个序列,这个模型一旦被识别后就可以从时间序列的过去值及现在值来预测未来值。ARIMA(p,l,q)模型基本方程:

这里 d(sht)=sht-sht-1,即一阶差分(d=1)。这里差分的目的是建立ARMA模型的序列必须的平稳序列。

ARIMA模型的应用分析主要包括四个步骤:模型识别,即根据时间序列的特征,确定模型类型及其阶数,就是找出ARIMA模型的p,d,q值。模型估计,即用适当的参数估计方法,估计初步设定模型的参数值。模型检验,即在建立好模型以及确定好参数后,检验这些的准备性,并进一步调整。模型预测和控制,即利用所得到的模型进行预测分析,包括静态预测、动态预测等。

(二)广义自回归条件异方差模型(GARCH)

GARCH是在Engle(1982)提出ARCH模型后,T.Bollerslev(1986)提出的扩展模型。GARCH模型是一个专门针对金融数据的回归模型,除去和普通回归模型相同之处,GARCH对误差的方差进行了进一步的建模,特别适用于波动性的分析和预测。

GARCH(p,q)模型基本形式:

其中,vt独立同分布,E(vt)=0,D(vt)=1在模型中为保证ht恒取正值,保证条件方差方程是一个平稳过程,对模型的两个约束条件为:

在实际应用中,GARCH(p,q)中的q一般比较小,比ARCH(q)中的q可以小得多,事实上最常用的是GARCH(1,1)模型。GARCH(1,1)模型可以描述大量的金融时间数据,但一般是收益率序列,对于股票价格,一般很少符合ARCH效应的。应用步骤也包括建立,参数估计,检验,预测这几步。

(三)支持向量机(SVM)

SVM方法是统计学习理论的一种实现方法,它也是一种前向型神经网络 ,可以用于分类和非线性回归。其基本思想是:基于Mercer核展开定理,通过非线性映射把特征空间映射到Hilbert空间,在Hilbert空间中用线性学习机方法解决非线性分类和回归等问题。

本文因为只运用SVR即支持向量回归,所以这里只介绍SVR的理论与推导。

线性ε-SVR的模型是:给定训练集T={(x1,y1),(x2,y2),…,(xn,yn)}∈(X×Y)n然后选择适当的参数 ε 和 C〉0,构造并求解最优化问题

得到Lagrange最优目标函数为:

三、实证分析

本文为了与GARCH模型相比较,特地选取了具有ARCH效应的股票价格,即选取了2010年11月01日到2011年3月16日三峡水利的收盘价格作为研究对象,对3月17日到3月23日的收盘价格进行各种方法的预测。

1.对于ARIMA模型,对原序列单位根检验,得到为一阶差分平稳,并且平稳后的自相关系数和偏自相关系数显示都有拖尾现象,因此根据AIC和SC准则以及系数t检验进行模型阶数确定,得到最优的模型为 ARIMA(1,1,1),即

再看残差的Q统计量,显示不能拒绝原残差为白噪声序列。对股票价格进行预测,结果见表1。

2.对于GARCH模型,同样根据AIC和SC准则来确定模型,得到最好的阶数为p=1,q=1,即:

再进行残差序列的LM检验,显示不再存在ARCH效应,所以认为模型合理。对股票价格进行预测,结果见于表1。

3.本文应用SVR时,主要是考虑到股票价格的周期波动性,因为股票交易一周为5天,所以本期的波动往往跟前面5期的波动有较大关联。由前面5期,即

所取的训练集为2010-11-01到2011年3月16日,预测2011-3月17日到3月23日的价格,即本文全部模型要预测的5期股票价格。预测结果如表1所示。

表1 股票预测价格

从表1可以看出,总体来说,组合模型比单一模型预测效果要精确,而对比三类组合模型的平均绝对误差(MAE)、平均绝对百分比误差(MAPE)、均方误差(MSE)、均方根误差(RMSE),可以看到 ARIMA+SVR的预测精度最高,几乎能准确预测出实际值来,这可以看出线性与非线性的组合有比较好的效果,而加权预测结果次之,以GARCH模型预测的结果作为某一输入变量的SVR模型的预测效果却并不是很好,原因可能跟单独用SVR来仿真拟合一样,受训练集内的数据影响。

四、结论

组合模型是近年来时间序列预测精度要求提高后提出来的一种预测方法,它是单一模型的延伸,也可以说是一种新型的预测方法。但也不能乱用,比如说,加权平均模型,当各个模型都正向偏离时,组合就不能比单一模型更加精确。再说,如果作为支持向量机、神经网络等机器的输入单元以及不准备,那么进行仿真实现后的数据也会不准备,而对线性预测加非线性预测这个组合模型,非线性部分,作者持有一定的怀疑,因为经过ARIMA预测出来的时间序列值与真实值的差,也就是残差学列,其走势波动并没有特定的规律性,也就是说其很随机性很强,用前5期残差来预测本期的残差,跟实际残差可能相差很大,这就导致预测结果反而更不准确。

从本文的三种组合模型比较可以看出用时间序列ARMA模型拟合线性部分,用创新统计理论拟合残差部分,再两者相加得到预测结果可能是一种不错的组合模型,可以对很多时间序列加以运用。至于另外两类组合,应该再次实践,加以证实。但不可否认,三种组合模型都比单一的模型更加准确,这也是现阶段组合模型开始引人关注的一个原由。至于组合的方式以及用新的单一模型来组合,能使预测更加精确,这将是后面的一个研究方向。

[1]马超群,兰秋军,陈为民.金融数据挖掘[M].北京:科学出版社,2007.

[2]谢识予,朱弘鑫.高级计量经济学[M].上海:复旦大学出版社,2005.

[3]易丹辉.数据分析与EViews应用[M].北京:中国人民大学出版社,2008.

[4]沈巍.股票价格预测模型研究[J].财经问题研究,2009(7).

[5]Ping-Feng Pai,Chih-Sheng Lin.A hybrid ARIMA and support vector machines model in stock price forecasting[J].2005(33).

[6]任海军,孙瑞志,刘广利.基于AR-SVR模型的时间序列预测算法的研究[J].计算机工程与设计,2010(2).

[7]林慧君,徐荣聪.组合ARMA与SVR模型的时间序列预测[J].计算机与现代化,2009(8).

[8]盛艳波.基于AR神经网络和ARIMA组合模型测浙江省人均国内生产总值[J].商业研究,2006(8).

[9]张防,周宗放.基于ARIMA模型和BP神经网络的销售组合预测研究[J].管理学家,2009(7).

F830.91

A

1673-1999(2012)04-0085-03

胡俊(1986-),男,安徽黄山人,安徽财经大学(安徽蚌埠 233000)硕士研究生;桂霏(1987-),女,安徽池州人,安徽财经大学硕士研究生。

2011-12-01

猜你喜欢
股票价格残差线性
渐近线性Klein-Gordon-Maxwell系统正解的存在性
基于双向GRU与残差拟合的车辆跟驰建模
基于GARCH族模型的重庆啤酒股票价格波动研究
线性回归方程的求解与应用
基于残差学习的自适应无人机目标跟踪算法
基于递归残差网络的图像超分辨率重建
二阶线性微分方程的解法
论股票价格准确性的社会效益
基于线性正则变换的 LMS 自适应滤波
平稳自相关过程的残差累积和控制图