基于新维无偏灰色马尔可夫模型的小麦产量预测

2021-09-12 16:56李晔白雪
江苏农业科学 2021年15期
关键词:马尔可夫灰色河南省

李晔 白雪

摘要:针对小麦产量具有较大波动性的特点,结合灰色预测模型和马尔可夫理论,同时利用新信息优先的思想,以河南省2010—2019年小麦产量作为原始数据建立无偏灰色GM(1,1)模型、无偏灰色马尔可夫模型和新维无偏灰色马尔可夫模型,并对比3种模型的预测精度。结果表明,新维无偏灰色马尔可夫模型能提高预测精度,适合中长期预测,并预测出河南省未来5年的小麦产量数据。

关键词:河南省;小麦;新维无偏灰色马尔可夫模型;产量预测

中图分类号: F326.11  文献标志码: A

文章编号:1002-1302(2021)15-0181-05

收稿日期:2020-10-26

基金项目:河南省高等学校重点科研项目(编号:20A630015);河南省软科学研究计划(编号:182400410375);河南省高等学校人文社会科学研究一般项目(编号:2020-ZDJH-140)。

作者简介:李 晔(1972—),女,河南南阳人,硕士,教授,主要从事灰色系统和物流管理研究。E-mail:zzliye@163.com。

粮食问题是关系国计民生的重大战略问题,解决好粮食问题是人类生存和发展的社会基础[1-2]。随着全球新冠肺炎疫情不断的发展蔓延,粮食安全的意义更为突出。2020年5月份的全国两会期间,习近平总书记强调“农业基础地位任何时候都不能忽视和削弱,手中有粮、心中不慌在任何时候都是真理”。河南省是我国的粮食主产省,小麦生产作为河南省粮食生产的主导产业,其产量高低不仅关系到河南省的经济发展,还关系到我國粮食供需平衡和生产安全。因此,科学准确地预测河南省的小麦产量,对保障我国粮食安全具有十分重要的价值和意义。

目前国外预测粮食产量的方法主要有气象产量预测法[3]、遥感技术[4]和统计动力学模拟法[5]这3种。它们的预测提前期一般为2个月左右,预测误差为产量的5%~10%,精度较低。国内预测粮食产量的方法主要分为2类。一类是传统的线性建模预测法,主要包括投入产出模型预测法,线性回归预测法和指数平滑法等。陈锡康等利用投入占用产出技术预测了我国未来几年的粮食产量[6];刘东等基于向前选择法的多元线性回归模型来预测粮食产量的发展趋势[7];何延治等利用时间序列分析中的 ARIMA(p,d,q)模型预测了吉林省粮食产量[8];吴越等分别使用Holt两参数指数平滑法和ARIMA模型预测2019—2023年长三角地区的粮食产量,预测效果理想[9]。另一类是非线性模型预测法,主要包含灰色预测、BP神经网络、马尔可夫模型和粗糙集理论等。樊超等利用灰度极限学习机模型预测我国粮食产量,为准确预测短期粮食产量提供了一种新的技术手段[10];李炳军等利用灰色区间预测和 GM(1,N) 模型分别预测了我国主要粮食的需求量和产量[11];杨阳利用尾端残差修正的 GM(1,1) 模型预测了我国人均粮食产量,预测精度提高[12];郭亚菲等利用粒子群优化神经网络的模型预测粮食产量,为粮食产量预测提供了新的途径[13];尹宗成基于粗糙集理论预测了我国的粮食产量[14];张文政等通过比较线性回归、支持向量机和随机森林这3种方法的预测精度[15],最后选用精度较高的支持向量机预测了辽宁省的粮食产量。

线性建模预测法虽然建模简单,容易实现,可以清楚地了解各个变量之间的关系,但是需要收集大量数据才能提高预测的精度,而且仅适用于短期粮食产量预测。非线性模型预测法弥补了传统预测方法的许多缺陷,然而由于小麦生产受气候、环境和政策等多种因素影响,导致其产量数据具有较大的波动性。以上预测方法均不适合对随机波动性较大的小麦产量进行中长期预测。

为了弥补这一缺陷,提高河南省小麦产量的预测精度,解决中长期预测的波动问题,本研究采用新维无偏灰色马尔可夫模型[16-17]进行分析预测。在无偏GM(1,1)模型的基础上利用马尔可夫链修正预测值残差,同时引入新信息优先的思想,不断更新原始数据,应用于河南省小麦产量预测,不仅保留了短期预测的高精度,而且提高了中长期的预测精确度。

1 模型构建

1.1 无偏GM(1,1)模型的构建

吉培荣等对传统GM(1,1)模型的性质做了相关研究,证明传统GM(1,1)模型是有偏差的指数模型,基于此提出无偏GM(1,1)模型[18]。具体建模过程如下:

设原始序列为

X(0)=[x(0)(1),x(0)(2),…,x(0)(n)]。(1)

其中,x(0)(k)≥0,k=1,2,…,n。

(1)对X(0)做一次累加生成得

X(1)=[x(1)(1),x(1)(2),…,x(1)(n)]。(2)

其中,

x(1)(k)=∑ki=1x(0)(i),k=1,2,…,n。(3)

(2)确定数据矩阵B,Y。

B=-12[x(0)(1)+x(1)(2)]1

-12[x(1)(2)+x(1)(3)]1

-12[x(1)(n-1)+x(1)(n)]1,

Y=x(0)(2)x(0)(3) x(0)(n)。(4)

(3)使用最小二乘法,计算参数估计量a,u。

a^=[a,u]T=(BTB)-1BTY。(5)

(4)计算无偏灰色GM(1,1)模型的参数b,A。

b^=ln2-a2+a A^=2u2+a。(6)

(5)建立原始数据序列模型。

x^(0)(1)=x(0)(1),x^(0)(k+1)=Aebk,k=1,2,…,n。(7)

其中,x^(0)(k+1)在k=1,2,…,n-1时为原始序列的拟合值,在k≥n时为原始序列的预测值。

1.2 无偏灰色马尔可夫模型的构建

马尔可夫模型通过状态间的转移概率对系统将来的发展趋势做出预测,可对随机波动序列进行长期预测[19]。无偏灰色马尔可夫模型是将无偏 GM(1,1) 模型和马尔可夫模型相结合建立的[20]。具体步骤如下:

(1)建立无偏GM(1,1)模型,

得到无偏灰色预测值:X^(0)(1)=X(0)(1),X^(0)(k+1)=Aebk,k=1,2,…,n。

(2)计算预测值与实际值之间的相对误差。

Q=x(0)(it)-x^(0)(it)x(0)(it)×100%。(8)

(3)状态划分。

根据预测值与实际值之间相对误差的大小将样本数据划分为若干状态,任一状态可记为 Ei∈[1i,2i],i=1,2,…,s,其中s为划分的状态数目,灰元1i和2i分别表示第i种状态的上下界。s和1i、2i视具体情况而定。

(4)构造状态转移概率矩阵。

设N(n)ij为由状态Ei经过n步转移到Ej的频数,Ni为状态Ei出现的频数,则由状态Ei经过n步转移到Ej的概率为

p(n)ij=N(n)ijNi,i,j=1,2,…s。(9)

从而得到状态转移概率矩阵为

p(n)=p(n)11p(n)12…p(n)1s

p(n)21p(n)22…p(n)2s

p(n)s1p(n)s2…p(n)ss。(10)

(5)计算预测值。

结合状态转移概率矩阵,确定系统将来最可能所处的状态,进一步得出预测值的变动区间[1i,2i],取此区间的中值作为修正值y,具体公式为

y=x^(0)(k)×1±12(1i+2i)。(11)

1.3 新维无偏灰色马尔可夫模型的构建

随着时间的不断推移,灰色系统中会有一些随机扰动因素不断加入,从而影响系统发展;预测的时间越远,模型的精度越低。为了提高模型的预测精度,引入新维无偏灰色马尔可夫模型[21],对原始数据序列做等维信息处理,即将最新得到的预测值加入到已知序列,同时删去序列中的第1个数据,然后对新得到的数据序列再次进行无偏灰色马尔可夫预测,这样反复对原始数据进行实时修正,直到完成预测目标。由于新维无偏灰色马尔可夫模型不断增加新信息并同时删除旧信息,得到的新序列可以更好地反映系统的当前特征,进而提高中长期的预测精度[22-23]。

2 基于新維无偏灰色马尔可夫模型的河南省小麦产量预测

河南省小麦产量受环境、天气和政策等多方面因素的影响,具有较大的波动性,有效预测河南省小麦产量的变化趋势,提升预测精度,是增加其产量的关键。无偏GM(1,1)模型适用于预测随机波动性不大的时间序列变化趋势,如果用来预测波动性较大的小麦产量数据会使其预测精度变差[24]。马尔可夫模型适用于具有非平稳随机特点的序列预测,因此,结合无偏GM(1,1)模型与马尔可夫模型,使2个模型优势互补,能够预测序列的发展趋势且提高预测精度,在小麦产量预测方面有较强的理论意义和实用价值。

选取2010—2019年的河南省小麦产量数据作为原始数据(表1),数据源于《河南省统计年鉴》。

2.1 无偏GM(1,1)模型预测

根据无偏GM(1,1)模型的建模原理,结合表1中2010—2019年河南省小麦产量数据,使用灰色建模软件第7版和Matlab 2016b可以得到相应的时间响应函数:

X^(0)(1)=X(0)(1)=3 131.00,X^(0)(k+1)=Aebk=3 096.69e0.02k,k=1,2,…,n。(12)

预测结果见表2,该模型的平均相对误差为1.57%。

2.2 马尔可夫链修正灰色预测值

无偏灰色GM(1,1)预测模型反映出小麦产量数据的指数变化规律,并根据该规律外推可得出预测值。受气候、环境、政策等多方面因素影响,单一模型不能刻画小麦产量的变化趋势,因此,引入马尔可夫模型修正残差,充分发挥其在预测离散随机波动大的事件上的优势,弥补灰色预测模型的不足。

2.2.1 状态划分

根据河南省小麦产量的实际值和无偏GM(1,1)模型得出预测值之间的相对误差,

将小麦产量的数据序列划分为4个区间:E1(-0.86,0.32)、E2(0.32,1.50)、E3(1.50,2.68)、E4(2.68,3.86)。河南省小麦产量预测年份的所处状态见表3。

由于河南省小麦产量2011—2019年的所处状态已知,令对应区间的中点作为拟合值。如2011年小麦产量处于状态1,则2011年小麦产量的拟合值为:

X2011=3 159.24-3 159.24×0.5×(-0.86%+0.32%)=3 150.71。(13)

同理,可以拟合2012—2019年河南省小麦产量,拟合值见表2。

2.2.2 构造状态转移概率矩阵

由状态划分表及各年对应的状态,可得1步和2步转移概率矩阵:

p1=121200

0001

0000

130023

p2=1414012

130023

0000

71816049。(14)

2.2.3 确定预测值

因为2019年小麦产量处于状态4,根据1步转移概率矩阵计算2020年小麦产量数据:

X2020=3 782.30-3 782.30×0.5×(2.68%+3.82%)=3 905.98。(15)

同理可根据2步、3步、4步、5步转移概率矩阵计算2021—2024年小麦产量数据,分别为3 984.88 万、4 065.39万、4 147.52万、4 231.32万t。

拟合和预测结果见表2,该模型的平均相对误差为0.31%。

由于传统无偏灰色GM(1,1)模型没有考虑河南省历年小麦产量对未来预测年份小麦产量的影响,初始预测值较为准确,2011—2014年的预测误差均小于1%。但隨着年份的不断增加,小麦年产量之间的相互影响作用以及历年小麦产量数据对未来小麦产量影响逐步降低,导致模型的预测精度变差。从图1可以明显看出,2015—2017年的小麦产量的预测误差明显增加;无偏灰色马尔可夫模型综合考虑了序列的波动性以及历年产量对未来年份小麦产量的影响,结合这2种模型的优势,提高了河南省小麦产量的预测精度。2011—2019年的预测误差均降低到小于0.8%,但仍有个别年份预测误差偏大,如2017年模型的预测误差达到0.72%,模型仍需要进一步改进。

2.3 新维灰色马尔科夫模型预测

影响河南省小麦产量的各方面因素在不停地变化,不断有新的随机扰动因素加入系统,而且旧数据在预测序列中的有效作用逐步降低,对小麦产量产生重要影响。因此,需对建模原始数据序列进行实时修正。

利用无偏灰色马尔可夫模型得到的2020年小麦产量预测值添加到原数据序列,同时剔除第1个数据,即2010年小麦产量数据,以2011—2020年小麦产量数据作为新的数据序列,然后构建无偏灰色GM(1,1)模型

X^(0)(1)=X(0)(1)=3 144.90,X^(0)(k+1)=Aebk=3 179.05e0.02k,k=1,2,…,n

最后通过马尔可夫模型修正,得到2021年河南省小麦产量预测值。

由于进行1次等维新息处理后,平均相对误差为0.29%,仍比较大,所以继续对建模序列做等维处理。将该值作为2021年小麦产量数据重复使用上述的步骤,得到2022年小麦产量数据,同理可得2023、2024年小麦产量数据,其平均相对误差分别为0.25%、0.22%、0.22%,预测结果见表4。

2.4 模型比较

河南省小麦产量是非平稳的时间序列,通过结合无偏GM(1,1)模型和马尔可夫模型,并等维处理建模原始数据序列,得到新维无偏灰色马尔可夫模型,该模型充分发挥了2个模型的优势,能较好地预测非平稳时间序列。

通过表5预测模型的精度对比可以看出,通过马尔可夫修正对河南省小麦产量预测的平均相对误差减小,新维无偏灰色马尔可夫模型的平均相对误差低至0.22%,相对最小,精度最高,可以很好地反映河南省小麦产量变化趋势,在中长期的预测中更具有优势。

结合最终预测结果和预测精度检验可以得出,采用新维无偏灰色马尔可夫模型预测出2020—2024年河南省小麦产量分别为3 905.98万、3 985.99万、4 067.29万、4 151.19万、4 235.40万t。结果显示河南省小麦产量在未来5年都会呈上升趋势,但增长速度呈缓慢趋势。

3 结论

本研究以河南省小麦产量预测为例,采用新维无偏灰色马尔可夫模型,充分利用了灰色预测建模所需信息量少的特点以及马尔可夫模型能够处理随机波动性数据的特性,并利用实时修正对模型进行优化。对河南省2010—2019年小麦产量预测结果表明,该模型的预测精度较高,预测结果更精确,可以很好地反映河南省小麦产量变化趋势,对河南省制定小麦生产规划、调整和优化小麦种植结构以及促进河南省小麦生产的可持续发展具有重要意义。同时,本研究结果可以为政府相关决策部门拟定粮食配置和宏观经济计划提供依据,从而保障我国粮食安全,维护国民经济发展和社会稳定。

参考文献:

[1]杨宗辉,蔡鸿毅,覃 诚,等. 我国粮食生产的时空格局及其影响因素分析[J]. 中国农业科技导报,2018,20(9):1-11.

[2]陈光军. 乡村振兴背景下中国改革40年来粮食安全的回顾与思考[J]. 农业经济,2020(3):3-5.

[3]Ajwde W,Cavan D. Crop model data assimilation with the Ensemble Kalman filter for improving regional crop yield forecasts[J]. Agricultural and Forest Meteorology,2007,146(1):38-56.

[4]Rosegrantm W,Ringler C,Roe T L. Asian economic crisis and the long-term global food situation[J]. Food Policy,2000,25(3):243-254.

[5]Jin Z Q,Zhu D W. Impacts of changes in climate and its variability on food production in Northeast China[J]. Acta Agronomica Sinica,2008,34(9):1588-1597.

[6]陈锡康,杨翠红. 投入占用产出技术在全国粮食产量预测及乡镇企业中的应用[J]. 中国科学基金,2003,17(3):149-152.

[7]刘 东,白雪峰,孟 军. 基于向前选择变量法的我国粮食总产量多元线性回归预测模型[J]. 东北农业大学学报,2010,41(10):124-128.

[8]何延治. 基于时间序列分析的吉林省粮食产量预测模型[J]. 江苏农业科学,2014(10):478-479.

[9]吴 越,张焕明. 基于Holt两参数指数平滑法和ARIMA模型的长三角粮食产量的预测[J]. 武汉轻工大学学报,2020,39(1):30-36.

[10]樊 超,曹培格,郭亚菲,等. 基于灰度極限学习机的粮食产量预测[J]. 江苏农业科学,2018,46(5):212-214.

[11]李炳军,杨卫明. 基于灰色区间预测和GM(1,N)模型的我国粮食供需结构平衡分析[J]. 江苏农业科学,2019,47(18):325-329.

[12]杨 阳. 基于残差修正的GM(1,1)模型的我国人均粮食产量预测[J]. 统计与决策,2011(17):53-55.

[13]郭亚菲,樊 超,闫洪涛. 基于主成分分析和粒子群优化神经网络的粮食产量预测[J]. 江苏农业科学,2019,47(19):241-245.

[14]尹宗成. 运用粗糙集理论对我国粮食产量的预测[J]. 统计与决策,2008(6):46-48.

[15]张文政,孙德山,王 玥,等. 基于支持向量机的辽宁省粮食产量预测[J]. 经济数学,2019,36(1):96-99.

[16]李 东,苏小红,马双全. 基于新维灰色马尔科夫预测模型的股价预测算法[J]. 哈尔滨工业大学学报,2003,35(2):244-248.

[17]高 阳,谭阳波. 基于新维无偏灰色马尔科夫预测模型的中长期能源消费预测[J]. 统计与决策,2007(22):55-57.

[18]吉培荣,黄巍松,胡翔勇.无偏灰色预测模型[J]. 系统工程与电子技术,2000,22(6):6-7,80.

[19]张冬咏,陈泗达. 基于灰色-马尔可夫模型的国内游客总数预测[J]. 河南科学,2020,38(1):96-101.

[20]王 姗,翟 琼,许丽娜. 基于灰色马尔科夫模型的中国女子中长跑成绩的预测[J]. 数学的实践与认识,2016,46(24):161-170.

[21]Li L,Sun L,Ning G. Deterioration of urban bridges on network level using Markov-chain model[J]. Mathematical Problems in Engineering,2014(7):1-10.

[22]陈宝平 .基于新维无偏灰色马尔科夫模型的围栏草场面积的预测[J]. 数学的实践与认识,2013,43(24):58-63.

[23]赵 玲,许宏科. 基于新维无偏灰色马尔可夫的交通事故预测[J]. 计算机工程与应用,2013,49(7):35-38.

[24]向 宇,吴 琴. 改进的灰色预测模型在全国用水量预测中的应用[J]. 湖北民族学院学报(自然科学版),2015,33(1):25-30.

猜你喜欢
马尔可夫灰色河南省
河南省树人教育交流中心
河南省树人教育交流中心
浅灰色的小猪
灰色时代
她、它的灰色时髦观
保费随机且带有红利支付的复合马尔可夫二项模型
基于SOP的核电厂操纵员监视过程马尔可夫模型
应用马尔可夫链对品牌手机市场占有率进行预测
认知无线网络中基于隐马尔可夫预测的P-CSMA协议