灰色马尔可夫预测模型和加权加增长率移动平均法预测精度的比较

2018-12-20 07:20石盛卿
统计与决策 2018年22期
关键词:马尔可夫原始数据预测值

刘 璞,王 萌,马 苓,石盛卿

(河北工业大学 经济管理学院,天津 300401)

0 引言

近年来,学者们提出了各种预测方法[1,2],尽管灰色模型和/或它的变体可以获得良好预测结果,但获得的最佳预测结果的方法是基于灰色模型和马尔可夫状态转移矩阵,即灰色马尔可夫预测模型,由我国邓聚龙教授提出的灰色模型与俄国数学家马尔可夫提出的马尔可夫模型很早就被组合起来,很好地解决了灰色预测模型对于数据波动较大的数据预测欠准确的问题[1,3]。为了证明灰色马尔可夫预测模型预测的准确性,本文引进了现在很流行的一种预测方法——加权加增长率移动平均法,通过一个实例进行了分析,结果表明本文提出的灰色马尔可夫模型具有较高的预测精度和优良的适用性。建立基于灰色马尔可夫的制度环境预测模型,通过对历史数据的分析整合来预测制度环境未来的趋势,可以获得非常好的预测结果。

1 预测方法

1.1 灰色马尔可夫预测模型

构建灰色马尔可夫预测模型分为三步:首先根据被测的历史数据建立GM(1,1)预测模型,此时会得到灰色预测值,根据灰色预测值和实际值的残差即可以得知各数据所处的状态;第二步就是根据每个状态到达另一状态的步数建立马尔可夫多步转移概率矩阵模型,利用距离被测数据最近的几组数据所处的状态信息和相对应的多步转移概率之和即可推测出被测数据所处的状态;最后根据马尔可夫模型预测状态对灰色预测值进行修正即完成预测[4]。

1.1.1 GM(1,1)预测模型

灰色预测就是通过对历史数据的处理建立灰色预测模型,从中发现其数据波动的规律,从而对系统的未来状态做出科学预测的一种预测方法[5]。考虑到随机变量作为灰色变量,首先是对原始数据进行一次累加,预处理后的数据序列比原始数据具有更强的规律性,然后建立灰色微分方程预测预处理后的数据,运用逆累积运算得到原始数据的预测值[6]。

灰色预测模型的建模步骤如下:

(1)给定原始序列:

(2)为削弱时间序列的随机性,采用一次累加,得到弱随机数列:

(3)针对上述累加后的数列,采用线性动态模型来进行模拟,建立一阶灰色微分方程GM(1,1)预测模型:

其中,待定参数a代表模型的发展系数,b代表模型的灰色作用量,可用最小二乘法求得,即:

(4)将求得的各参数的数值代入式(3)得灰色模型的时间响应函数:

在灰色理论里,GM(1,1)是一个预测模型,表示为一阶微分具有单输入变量。灰色预测不受整个系统的复杂性的影响,针对其中的灰色信息,通过构建灰色模型对原始数据进行有效地预测[7],它可以发现一系列数据中的多个元素的未来发展动态,从而很好地反映总体的未来发展趋势走向[8]。

1.1.2 马尔可夫链

马尔可夫链是一个特定类型的随机过程,它可以作为一种预测方法,马尔可夫预测方法是对预测对象未来所处状态的预测[9]。应用Markov模型对GM(1,1)模型预测的数据进行处理,以提高预测精度。构建Markov模型的关键是划分状态和构造状态转移矩阵。这种方法非常适合随机波动较大的时间序列预测,因为它是通过状态转移矩阵求得状态转移概率,从而对预测对象的未来发展方向进行预测的,该概率本身就反映了随机因素的影响。

(1)划分状态

状态的划分并不是随意的,要遵循一定的准则,基于该预测序列符合多阶马尔可夫模型的特点,本文依照相对变化率来划分状态,相对变化率的计算方法是以实际值除以对应预测值再乘以100%。划分状态时注意每个状态所包含的真实值的个数尽量均衡,原始数据较少时,划分的状态宜少,原始数据较多时,划分的状态不妨多一些,以提高预测精度,视具体情况而定。以(t)=X(0)(t+1)为基准,可以将原始数据序列划分成若干个相对均等的状态区间,记为:Ei=[E1i,E2i],i=1,2,3...n 。式中 E1i=(t)×Ai,E2i=(t)×Bi,其中 Ai代表该状态区间的上限,Bi则代表该状态区间的下限。

一般情况下,划分的状态区间的个数、每个状态区间所包含的数据个数以及各个状态区间的上下限(即E1i,E2i),要根据预测对象的实际情况而定,由于y(t)是关于时间t的一次元函数,所以E1i和E2i会随着时间的变化而变化,即Ei具有动态性。

(2)构造状态转移矩阵

(3)确定预测值

首先构建新的概率矩阵,该矩阵的确定方法是选取离被测数据较近的几组数据,按照远近分别确定转移步数为1,2,3...i,然后从上述建立的状态转移概率矩阵中挑选出各数据转移步数所对应的行向量即可构建出新的概率矩阵,其次对新的概率矩阵的每个列向量求和,哪一列的数值最大,那么被测的数据就相应的属于哪个状态,状态确定以后,状态区间也就确定了,预测值即为该区间的中点,即(t)=(E1i+E2i)/2 ,最终得到了预测序列为:

1.2 加权加增长率移动平均法

利用加权加增长率移动平均法求预测值,赋予权数时,对近期数据给予较大的权数,对较远的数据给予较小的权数,从而弥补简单移动平均法的不足,同时考虑增长率的变化,可以提高预测精度。具体的计算公式为:

a,b,…n分别为各数据所取得权数,且a≤b≤…≤n,a+b+…n=1,一般可令a,b,…n呈等差级数或等比级数变化,n的取值视具体情况而定,当时间序列数据波动较大时,应取大一些,反之小一些,一般在3~8之间,运用加权加增长率移动平均法时,权重的选择是一个很重要的问题,它直接影响最后预测的结果,但是一般情况下,选择权重的方法主要依靠经验法和试算法,历史数据中各个时期对预测未来数据的影响值是有区别的,经验法和试算法是选择权重的最简单的方法。一般而言,离预测数据较近的几组数据更能预示未来的情况,因而设置的权重应大些,但是具体的权重分配带有很大的主观性,所以对于预测精度较高的预测应慎重考虑。本文在预测制度环境时,为了既能灵活地反应近期的变化趋势,又能保证对时间序列的敏感性,步长n设定为3,在综合考虑各方面因素后,权数取值分别为0.6、0.3、0.1。

2 预测实例

2.1 灰色Markov预测模型对制度环境的预测

通过借鉴戴魁早(2015)[10]、张敏(2013)[11]、王立清(2011)[12]、邓路(2014)[13]等学者制度环境选取指标的做法,本文主要挑选出使用频率较高的四项指标进行预测,剩余指标可以参考同等方法进行预测。选用1997—2009年全国各省份的制度环境的总体指标以及三个分项指标的数据(数据来源:采用樊刚、王小鲁和朱恒鹏编制的《中国市场化指数一各地区市场化相对进程2011年报告》中的“市场化总体得分”代替“制度环境总得分”,“政府与市场的关系”、“市场中介组织的发育和法律制度环境”、“产品市场的发育程度”作为制度环境的分项指标)作为原始数据列。

以天津市的制度环境的总体得分的数据为例,则:

X(0)={4.53,4.92,4.71,5.36,6.59,6.73,7.03,7.86,7.65,8.28,8.59,9.19,9.43};

用制度环境的实际值X(0)(t)除以对应的预测值(0)(t),得到其相对变化率,由于数据样本较少,为了得到更精确的预测结果,本文根据相对变化率将制度环境的预测值划分为4个状态:

天津市制度环境总体得分GM(1,1)预测数据和原始数据的对比及所属状态如表1所示:

表1 天津市制度环境总体得分情况

选择最近的几组数据构建新的状态转移矩阵见表2:

表2 预测2010年所属状态的状态转移矩阵表

经分析预测,根据表2可知2010年最有可能所属的状态是E3,2010年灰色预测值为10.37,E13=0.9897×10.37=10.26 ,E23=1.0123×10.37=10.50 ,根 据 公 式̂′(t)=(E1i+E2i)/2可得2010年灰色马尔可夫预测值为10.38。

在进行2011年的数据预测时,可以将2010年的数据按照已知量计算,按照上述方法,得出2011—2014年的灰色马尔可夫预测值分别为10.63、11.69、11.98、13.15。

运用以上方法分别求出全国其他各省份制度环境的灰色马尔可夫预测值。

2.2 加权加增长率移动平均法对制度环境的预测

同样选用1997—2009年全国各省份的制度环境的总体指标和三个分项指标的数据(数据来源:采用樊刚、王小鲁和朱恒鹏编制的《中国市场化指数一各地区市场化相对进程2011年报告》中的“市场化总体得分”代替“制度环境总得分”[14],“政府与市场的关系”、“市场中介组织的发育和法律制度环境”、“产品市场的发育程度”作为制度环境的分项指标)作为原始数据列。

本文以天津的制度环境的总体指标数据为例,为了既能灵活地反应近期的变化趋势,又能保证对时间序列的敏感性,步长n设定为3,在综合考虑各方面因素后,权数取值分别为0.6、0.3、0.1,要求2010年的预测值,运用公式即可求得:Y2010=(0.6×9.43+0.3×9.19+0.1×8.59)×(9.43/9.19+9.19/8.59)/2=9.72

同样在进行2011年预测时2010年的数据按照已知量计算,按照上述方法,得出2011—2014年的预测值分别为9.85、9.99、10.05、10.12。因为国外的关于制度环境的研究主要侧重于经济自由化程度的测度,聚焦于一个国家的政策,衡量个体不受过分限制和政府干预的使用劳动力和财力的自由度,因此本文在使用加权加增长率移动平均法进行预测时,采用考虑和不考虑中国经济自由度两种情况进行制度环境预测。运用以上方法分别求出全国其他各省份制度环境的预测值。

2.3 结果分析

经过查找相关资料,决定采用对比平均相对误差的大小的方式来验证这几种预测方法的精确度,从表3可以看出,灰色马尔可夫预测的精确度明显优于其他三种预测方式。为了进一步验证这一结果的可信性,本文将从全国选择部分省份对制度环境的数据进行以上处理和预测,所使用的制度环境数据涉及我国东部沿海和中西部内陆14个省份,具体选择标准是根据中国市场化进程的排名,分阶段各选取3~5个省份,14个省份分别是浙江、上海、北京、天津、山东、河南、江西、四川、湖南、黑龙江、山西、云南、贵州、新疆,由于篇幅限制,在这里不展示所有的预测结果,只在14个省份中选择了3个省份作为代表,分别是浙江、北京、黑龙江,最终结果见表4。

表3 天津市制度环境总体指标的实际值与几种预测方法的预测值对比

表4 各省份制度环境总体指标实际值与预测值对比

通过对比表5(见下页)平均相对误差的数据发现,灰色马尔可夫的预测结果明显比其他三种预测模型的预测结果精度高,灰色马尔可夫预测模型继承了灰色预测模型的优点,同时又具备马尔可夫链的优势,两者优势的结合,使其预测精度大幅提高,取得了较好的预测效果,具有较强的科学性和实用性。加权加增长率移动平均法在考虑和不考虑中国经济自由度两种情况进行制度环境预测时,预测结果没有太大的变化,说明中国经济自由度对制度环境的影响不大,在预测我国制度环境未来的变化趋势时,可以不予考虑。

3 结论

本文将灰色预测和马尔可夫预测进行结合,形成灰色马尔可夫预测模型,将这两种模型结合起来能够做到优势互补,灰色马尔可夫模型预测法实质上是在灰色预测模型的基础上,对其偏离值进行了修正,从而弥补了灰色模型预测的不足,因而准确度最高。因此,对于准确度要求比较严格的预测,灰色马尔可夫预测方法是值得推荐的预测方法。

本文最主要的贡献是为制度环境的预测提出了一个新的方法,即:将灰色马尔可夫预测方法运用到制度环境的预测中,在以往有关制度环境的研究中,大部分学者都是采用樊纲等编制的《中国市场化指数一各地区市场化相对进程2011年报告》中的数据,但是近几年樊纲等人不再更新数据,从而对有关学者进行相关学术研究产生了困扰,所以如果能在此基础上对其进行有效的预测,那么势必会解决当前研究人员的困境,对我国科学地制定中国市场化进程相关数据有着重要意义,并且灰色马尔可夫预测模型对预测类似制度环境这种数据的预测问题也有很好的借鉴意义。

表5 14个省份预测值平均相对误差对比

猜你喜欢
马尔可夫原始数据预测值
加拿大农业部下调2021/22年度油菜籽和小麦产量预测值
±800kV直流输电工程合成电场夏季实测值与预测值比对分析
AI讲座:ML的分类方法
受特定变化趋势限制的传感器数据处理方法研究
面向电力系统的继电保护故障建模研究
基于马尔可夫链共享单车高校投放研究
基于马尔可夫链共享单车高校投放研究
全新Mentor DRS360 平台借助集中式原始数据融合及直接实时传感技术实现5 级自动驾驶
基于灰色马尔可夫模型的公务航空市场需求预测
基于马尔可夫骨架过程的渔业资源管理模型研究