用于数据预测的人工神经网络

2017-06-05 16:49庞志辉
电脑知识与技术 2017年7期
关键词:ARIMA模型神经网络

庞志辉

摘要;考虑到股市情况通常受不同外部因素的影响,股票市场预测是时间序列分析中最困难的预测分析之一。本文的研究旨在调查在时间序列是非稳定状态下和最常见的情况下,研究人工神经网络(ANN)在解决预测任务中的潜力。我们使用前馈型神经网络结构,具有外部输入的非线性自回归网络。神经网络的训练函数用来跟新权重和偏差参数,神经网络模型的特点是具有反向传播算法的自适应学习速率的梯度下降算法。使用均方差(MSE)测量在评估模型的性能,通过对比使用这种技术和一些ARIMA模型得出的结果进行比较。比较分析得出的结论是,提出的模型可以成功应用于预测相关数据。

关键词:神经网络;非线性回归网络;ARIMA模型

中图分类号:TP393 文献标识码:A 文章编号;1009-3044(2017)07-0162-03

1介绍

预测股市指数及其趋势已被认为是时间序列预测中最具挑战性的应用之一。根据现有提出的有效市场理论,股价遵循随机路径,实际上不可能根据历史数据制定特定的长期预测模型。ARIMA和ANN技术已经成功地用于建模和预测金融时间序列。与作为复杂预测系统的ANN模型相比,ARIMA模型被认为是更容易的训练和预测技术。神经网络的一个重要特征是能够从他们的环境中学习,并通过学习在某种意义上提高性能。其中一个新的趋势是专门的神经结构与学习算法的发展,提供替代工具用来解决特征提取,信号处理和数据预测等问题。近年来,在使用ARIMA模型进行金融时间序列预测的金融数据分析领域中进行了一系列研究。Meyler等人使用ARIMA模型来预测爱尔兰通货膨胀。Contreras等人使用ARIMA方法预测第二天的电价。FxJiger等人用于ARIMA模型来预测在土耳其通过燃料一次能源的需求。Datta使用相同的Box和Jenkins方法预测孟加拉国的通货膨胀率。A1-Zeaud已经使用ARIMA模型来建模和预测银行部门的波动率。

本文的结构如下。在本文的第二部分,我们简要介绍ARIMA模型进行预测。接下来,给出了旨在预测特定股票收盘价的外部输入的非线性自回归网络。应用于数据预测的基于ANN的策略是针对ARIMA模型进行分析的,并且在文章的第四部分中描述了这些模型的比较分析。关于报告的研究的结论在本文的最后部分提出。

2RIM模型

自回归积分移动平均(ARIMA)模型和Box-Jenkins方法是一种统计分析模型。它主要用于时间序列分析的计量经济学和统计学。ARIMA模型使用时间序列数据来预测系列中的未来点。非季节性ARIMA模型由ARIMA(p,d,q)表示,其中p,d,q是非负整数,它们分别是自回归(AR),集成(I)和移动平均(MA)的参数。

(1)

(2)

(3)

可以使用為ARMA过程开发的预测技术的扩展来解决预测ARIMA过程的问题。预测ARMA(p,q)过程中最常用的方法之一是用于计算最佳线性预测变量(Durbin-Levison算法,创新算法等)的递归技术类。在下面我们描述使用创新算法的递归预测方法。

3用于预测股票收盘价的基于ANN的模型

具有旨在预测特定股票的收盘价的外部输入的非线性自回归网络的过程如下所示;

我们假设Yt是时间z时刻的股票收盘价。对于每个时刻t,我们用Xt=(Xt(1),Xt(2),…,Xt(n)表示与Yt显著相关的指标的值的向量,即在Xt(i)和Yt之间的相关系数大于某一阈值。

我们研究中使用的神经模型是一个动态网络。直接法用于建立股票平仓值的预测模型,具体描述如下。

(4)

(5)

(6)

所考虑的延迟对训练集和预测过程具有显著影响。我们使用相关图为我们的神经网络选择适当的窗口大小。我们需要消除部分自相关函数(PACF)在统计上不相关的滞后。

具有外部输入的非线性自回归网络(NARX)是一个递归动态网络,反馈连接包含网络的多个层。NARX网络的输出可以被认为是某个非线性动态系统的输出估计。由于在网络训练期间实际输出是可用的,所以产生串并联架构,其中估计输出被实际输出替代。这个模型的优点有两个方面;一方面,在训练阶段中使用的输入更精确,另一方面,由于所得到的网络具有前馈结构,因此可以使用静态反向传播类型的学习。

NARX网络在这里用作预测器,预测公式如下:

(7)

在图1中描述了该串并联神经网络的示例,其中d=2,n=10并且隐层中的神经元的数量是24。

隐藏层和输出层中的神经元的激活函数可以以多种方式定义。在我们的测试中,我们采用逻辑函数(8)来模拟属于隐藏层的神经元的激活函数,并且单位函数对属于输出层的神经元的输出进行建模。

(8)

在训练步骤之后,串并联架构被转换为并行配置,以便执行多级提前预测任务。相应的神经网络架构如图2所示。我们使用标准性能函数,由网络误差的平均和确定。取消数据分割过程以避免提前停止。

用于更新权重和偏差参数的网络训练函数对应于具有反向传播算法的自适应学习速率变体的梯度下降。在下面,我们考虑基于梯度的学习算法的类,其一般更新规则由下式所以:

(9)

在本文中我们用E来表示误差函数,该误差函数根据训练集合上的平方差误差函数的和来定义。具有自适应学习速率的基于反向传播梯度的算法通过使误差函数最小化而产生。

为了提供基于准牛顿法的正割方程的两点近似,在每个时期定义的学习速率为;

(10)

在这种情况下,基于梯度的学习方法可能超过最佳点或者甚至发散。

4实验结果

我们用样本数据集测试了模型。样本是在2009和2014之间的每周观察量的一组变量S。集合S包含来自证券交易所的SNP股票的开盘价,收盘价,最高价和最低价,以及从股票市场的技术和基础分析获得的七个指标。

相关图显示,对于所有变量,PACF函数在第二滞后之后立即下降。这意味着所有变量的窗口大小可以设置为2。在我们的测试中,我们使用200个样本用于训练目的和100个样本用于数据预测。

神经网络参数基于以下过程确定:

1.初始化NN的参数。

2.使用6000个时期中的训练样本集训练NN。

对于已经训练的数据,根据MSE测量计算的总体预测误差小于某个阈值。

在我们的测试中,阈值设置为0J 001。如果我们用T=(T(1),T(2),…,T(nr)表示目标值的向量,并用(P(1),P(2),…,P(nr))表示其条目对应于预测值的向量,则MSE误差测量由:

(11)

使用上述技术获得的结果报告如下。对已经训练的数据预测计算的总体预测误差为0.000 35。在已训练的数据上计算的回归系数和数据拟合在图3中示出。在已经训练样本的情况下的网络预测与实际数据在图4中示出。在新数据预测上计算的总预测误差为0.001 2。在图5中示出了在新樣本的情况下的网络预测与实际数据。

我们用基于神经网络的方法和ARIMA预测方法进行比较分析。首先,我们使用自相关函数(ACF)和部分自相关函数(PACF)来确定时间序列是否稳定。在平稳时间序列的情况下,ACF迅速衰减。由于ACF的计算值表明函数衰减非常缓慢,我们认为考虑的时间序列是非稳定的。为了调整ARIMA模型的差分参数,分别计算了一阶和二阶差分序列。由于在使用一阶差分系列的情况下,ACF的值非常小,我们得出结论,ARIMA模型的差分参数应设置为1。

基于以下标准调整与AR(p)和MA(g)过程相关的ARIMA模型的参数:BIC(贝叶斯信息准则)的相对小的值,调整的R2(确定系数)的相对高的值和相对小回归标准误差(SER)。根据这些结果,从上述标准的角度来看,最佳模型是ARIMA(1,1,1)模型。我们得出结论,最佳拟合模型是ARIMA(1,1,0)和ARMA(1,1,1)。

在使用ARIMA(1,1,0)模型的情况下,对新数据预测计算的总体预测误差为0.007 7,而在使用ARIMA(1,1,1)模型的情况下为0.009 6。预测的结果如图6所示。

5结论

本文报告的研究集中于NARX神经网络与标准ARIMA模型的比较分析。该研究是在一个数据集上开发的,该数据集包括在2009和2014之间的一组变量的800次历史每周观察结果。使用所提出的神经方法获得的结果证明了从MSE测量的观点来看更好的结果。所获得的结果是令人鼓舞的,并且需要在使用替代神经模型的情况下扩展研究的未来工作。

猜你喜欢
ARIMA模型神经网络
神经网络抑制无线通信干扰探究
基于神经网络的拉矫机控制模型建立
复数神经网络在基于WiFi的室内LBS应用
基于支持向量机回归和RBF神经网络的PID整定
基于神经网络分数阶控制的逆变电源
基于GA-BP神经网络的光伏阵列MPPT研究