基于广义回归神经网络的黄金价格预测

2016-08-04 06:21戚婷婷楼文高
改革与开放 2016年7期
关键词:黄金价格训练样本分组

戚婷婷  楼文高

基于广义回归神经网络的黄金价格预测

戚婷婷楼文高

本文选取纽约商品交易所2014年11月20日至2015年8月27日(周末及节假日休市除外)的黄金期货价格数据和相应的影响因素指标数据,将样本数据合理分组为训练样本、检验样本和测试样本三类,建立广义回归神经网络(GRNN)模型用于预测黄金价格。建模结果表明:建立的黄金价格模型预测精度高,对黄金价格的预测相对误差绝对值都在2%以内,模型具有实用价值。

广义回归神经网络;黄金价格;样本分组

一、引言

黄金是最珍贵、最稀有且最被人类看重的金属之一,自从在12000多年前被人类发现以来,便是财富与华贵的象征,更是纯洁与神圣的体现,被视作五金之首,在人类文明发展历程中扮演着多个重要的角色,黄金价格的预测也一直是学者和投资者讨论的热点话题。国内外学者在黄金价格预测研究方面取得了众多成果。曾黎等[1]将ARIMA模型和神经网络模型相结合预测黄金价格,刘成军等[2]建立了预测黄金价格的灰色-马尔科夫模型,严威等[3]应用罚函数方法构建广义指数因子预报模型用于黄金价格的预测,张延利[4]建立了预测黄金价格的RBF模型,Esmaeil Hadavandi[5]选用粒子群优化(PSO)时间序列模型预测黄金价格,Kha⁃noksin Suranart[6]将神经网络(NN)、径向基函数(RBF)和支持向量回归(SVR)模型对黄金价格的预测作比较。以上研究均采用时间序列相关模型,仅以黄金价格本身作为建模基础,而黄金价格的变化是众多因素作用下的结果,其变化过程是非线性的复杂系统,因此时间序列模型在预测受众多因素影响的黄金价格方面具有局限性。王艳[7]建立了变系数回归模型预测黄金价格,该模型虽然弥补了时间序列模型的不足,但线性模型用于预测非线性变化的黄金价格预测精度较低。黄金价格的非线性多变量关系预测模型中,以BP神经网络模型的应用最为广泛,文献[8][9]都是建立BP神经网络模型用于预测黄金价格,文献[10][11]将投影寻踪和BP神经网络模型相结合预测黄金价格。但BP神经网络训练过程中极易出现“过训练”现象,且BP神经网络建模要求训练样本数量必须大于模型的连接权重,在3~5倍以上才可以取得较好的效果,因此以上BP神经网络模型均不满足该建模要求,模型泛化能力和可靠性无法保证。

二、GRNN的基本结构

广义回归神经网络(Generalized Re⁃gression Neural Network, GRNN)由输入层、模式层、求和层和输出层组成,网络结构见图1。

图1 GRNN网络结构示意图

输入层有R维输入向量,节点数等于变量个数,各神经元直接将输入变量传递给模式层,模式层节点数一般等于或稍小于样本训练样本个数,其神经元采用高斯径向基传递函数,求和层包含两种神经元,其中一个神经元对所有模式层神经元的输出进行算术求和,其他神经元对所有模式层神经元的输出进行加权求和,输出层中的节点数等于训练样本中输出向量的维数。

三、黄金价格预测的GRNN模型及实例分析

1.建模样本数据选取

黄金价格受到多种因素的影响,其中包括地缘政治等多种不可量化的因素,因此预测时间间隔越长不可量化因素的影响就越难以控制,因此选择预测滞后期为1天。从纽约商品交易所黄金期货日价格历史数据中随机选取一个时间段的数据用于预测模型的建立,所选数据日期为2014年11月20日至2015年8月27日(周末及节假日休市除外),共205天的数据作为GRNN模型的样本。

GRNN模型的输入变量为若干影响黄金价格的因素,根据已有对黄金价格影响因素的研究成果[11][12],本文选取以下指标作为GRNN的输入变量:美元指数:国际黄金市场主要以美元计价,美元与黄金价格的走势通常呈相反态势,而美元指数是衡量美元强弱程度的指标;原油期货价格:黄金与原油价格受到共同因素的影响,同时原油价格的变化会影响经济形势,进一步对黄金价格产生影响;美国十年期国债收益率:长期债券与利率之间具有密切关系,也是市场通货膨胀情况的衡量指标,而通货膨胀会对黄金价格产生影响;银价格:金银同为贵金属,两者的价格在很大程度上会趋于一致;黄金期货价格:要预测后一天的黄金价格,当天的黄金价格是不可忽视的影响因素。

以上分析都是基于定性的分析,为了进一步确保输入变量选择的合理性,再对所选建模数据进行定量的相关分析。调用SPSS软件,分析得出选用的输入变量与黄金期货价格的相关性,结果如表1所示。

由表1列出的相关性分析结果可见,所选各影响因素与黄金价格均显著相关,表明黄金价格影响因素的选择是合理的。

表1 输入变量与黄金价格的相关性分析结果

2.建模数据预处理

选取的样本数据依照时间顺序排列,前200组作为建模数据,最后5组用于预测。根据GRNN建模理论,建模时提取一个样本作为测试样本即可,但这样建立的模型可靠性和鲁棒性不能得到很好的保证。为了提高模型的可靠性,将200组建模样本分成三类,即训练样本(Tr)、检验样本(Ve)和测试样本(Te),训练样本根据误差平方和最小的原则调整GRNN模型的权重,从而训练GRNN模型,检验样本和测试样本用于判断和评价选取的光滑因子是否合理,同时也是判断模型泛化能力的依据。本例中设定训练样本的比例为60%,检验样本和测试样本比例各为20%,对于GRNN模型,其训练样本不同,得到的建模结果通常也不同。如果选取的训练样本比较好,模型的可靠性和预测精度可能都很高,反之,模型的可靠性和预测精度可能都很低,此时模型的适用性无法判断。为了使样本数据的分组更合理,将样本之间的欧氏距离作为分组的依据,具体分组步骤如下。

第一步,计算出所有数据间的欧氏距离;第二步,将样本数据中欧氏距离最远的两组数据归入训练样本,剩余样本中欧氏距离最远的两组数据归入检验样本,再将剩余样本中欧氏距离最远的两组数据归为测试样本;第三步,将剩余样本中与训练样本的两组数据欧氏距离最远的两组数据归入训练样本,对于检验样本和测试样本采用同样的方法进行分组处理,三类样本轮换进行,直到检验样本和测试样本的比例达到本例中设定的20%,再将剩余数据归入训练样本中。分组之后的样本具有相似的统计特性,可以提高模型的预测精度,为使数据分组的计算更便捷精准,调用Matlab软件编写分组程序,运行程序得到分组结果。

3.GRNN模型建立及预测结果

在GRNN模型中,唯一需要人为确定的参数是光滑因子σ,建模训练过程中,在0.01~0.5范围内以0.01为单位依次递增取值作为光滑因子σ值,通过训练样本,检验样本和测试样本的绝对误差平均值以及均方根误差值判断模型的可靠性,三类样本的AAE和RMSE越接近,表明模型的可靠性越强。经过多次训练,发现在σ值为0.15时,三类样本的AAE和RMSE最接近,因此取0.15为GRNN模型的合理光滑因子值。

基于上述过程建立的GRNN模型预测了2015年8月21日至2015年8月26日除周末外共5天的黄金价格,预测结果如表2所示。从表2可以看出,GRNN模型预测精度高,在未来5天的黄金价格预测结果中,绝对误差最大值为5.92美元,绝对误差最小值为1.37美元,相对误差绝对值最大值为0.40%,最小值为0.12%,预测误差绝对值平均为3.29美元,平均相对误差绝对值为0.29%。

表2 GRNN模型预测结果

在本例中,为了最大限度避免不可量化因素对建模预测结果的影响,选择预测滞后期为1天,

在实际应用中,可以根据需要设定模型的预测滞后期。笔者将滞后期设定为2天,依照前述步骤建立GRNN模型。经过多次建模训练,得到滞后期2天的GRNN模型光滑因子合理取值为0.19,2013年12 月24日至2014年9月30日205天的黄金价格预测误差绝对值平均值为10.31美元,预测相对误差平均值为0.148%,95.122%的相对误差都在3%以内,可以看出,滞后期为2天的黄金价格预测精度虽然略低于预测滞后期为1天的情况,但同样具有较高精度。因此,本文建立GRNN模型的方法可以根据实际需要设置预测滞后期,且数据的合理分组过程能够大大提高模型的可靠性和预测精度,建立的GRNN预测模型具泛化能力和稳定性,模型具有实用性。

[1]曾黎,李春.融合线性、非线性模型的黄金价格预测模型研究[J].黄金,2013(34):7-10.

[2]刘成军,杨鹏,吕文生,等.灰色-马尔科夫复合模型在黄金价格预测中的应用[J].有色金属(矿山部分),2013(65):7-11.

[3]严威,尹伟,缪柏其,等.应用罚函数方法构建广义指数因子预报模型——黄金价格预测的实证分析[J].中国科学院研究生院学报,2012(29):162-168.

[4]张延利.基于RBF神经网络的黄金价格非线性预测[J].黄金,2014(35):9-11.

[5]ESMAEIL H, ARASH G,SALMAN A N. De⁃veloping a time series model based on particle swarm optimization for gold price forecasting [C].Third International Conference on Business Intelligence and Financial Engineering.Hong⁃Kong,2010.

[6]KHANOKSIN S,SUPAPORN K,ADISORN L. Analysis of comparisons for forecasting gold price using Neural Network, Radial Basis Func⁃tion Network and Support Vector Regression [C].The 4th Joint International Conference on Information and Communication Technology, Electronic and Electrical Engineering.India, 2014.

[7]王艳.基于变系数回归模型的黄金价格预测研究[D].天津:天津大学,2010.

[8]徐向超,赵瑞.基于BP神经网络的世界黄金价格预测[J].科技情报开发与经济,2012(22): 121-122.

[9]凌晨,张骅月.基于BP神经网络的黄金价格预测分析[J].天津科技,2014(41):68-73.

[10]陈丽.基于PP—BPNN的黄金价格预测模型[J].计算机仿真,2013(30):354-357.

[11]吕想,刘辰君.关于不同趋势下黄金价格影响因素的研究[J].投资研究,2012(9):141-150.

[12]张晓丽.黄金价格影响因素的实证分析[D].昆明:昆明理工大学,2013.

(作者单位:上海理工大学、上海商学院)

10.16653/j.cnki.32-1034/f.2016.07.009

本文受上海高校“十二五”内涵建设工商管理重点学科项目资助]

猜你喜欢
黄金价格训练样本分组
人工智能
黄金价格后市继续上涨的力度不足
分组搭配
怎么分组
分组
宽带光谱成像系统最优训练样本选择方法研究
融合原始样本和虚拟样本的人脸识别算法
基于稀疏重构的机载雷达训练样本挑选方法