马铃薯晚疫病短期预报模型

2015-03-18 12:23苏圣阳张寿明
安徽农业科学 2015年32期
关键词:小时数晚疫病回归方程

苏圣阳,张寿明

(1.昆明理工大学信息工程与自动化学院,云南昆明650000;2.昆明理工大学,云南昆明650000)

马铃薯晚疫病是由疫霉(Phytophthora spp.)引起的严重的真菌病。马铃薯晚疫菌因导致马铃薯茎叶死亡和块茎腐烂而成为马铃薯病害中危害最大的病原菌。由于云南地区独特的气候条件、夏秋多雨、气候湿润冷凉为马铃薯晚疫病的发生传播提供了有利条件,马铃薯晚疫病在云南发生普遍,危害呈上升趋势,已严重制约着马铃薯产业的发展[1]。研究马铃薯晚疫病发生流行规律与气象条件的关系,建立马铃薯晚疫病短期预报模型,可为种植者提供预报信息,对马铃薯产业发展有着重要意义。

马铃薯晚疫病预报常用方法有回归分析、聚类分析等。张寿明等[2]将神经网络用于马铃薯晚疫病长期预报中,取得了较好的效果;谢成君等[3]提出用灰色系统理论建立预报模型,及时对病害年度间消长动态进行预报,可作出较正确的长期预报;马旭洁等[4]采用回归分析法建立短期预报模型,为适时指导马铃薯晚疫病田间药剂防治提供了参考。回归分析法具有方法简单、预报速度快、比较容易推广应用等优点,但很难建立合适的方程使其残差满足互不相关性、平稳性、正态分布性等条件,导致拟合率低或者预报不准确。鉴于此,笔者首先采用回归分析法建立模型,然后再运用时间序列对回归模型的残差进行建模,充分提出信息,避免了上述问题,分别建立了单一的回归分析模型和混合模型,并利用历史数据资料的回代对模型进行了精度检验,旨在为马铃薯晚疫病的预报及防控提供借鉴。

1 单一模型

1.1 回归分析模型 回归分析是建立在对客观事物进行大量实验和观察的基础上,用来寻找隐藏在那些看上去是不确定的现象中的统计规律性的统计方法[5]。假设因变量y与自变量x1,x2,…,xn之间存在线性关系,则可以用线型回归模型来拟合因变量和自变量的数据,并通过确定模型参数得到回归方程:

式中,α0,α1,…,αn是 n+1 个未知参数,α0为回归常数,α1,…,αn为回归系数;y为因变量;x1,x2,…,xn为自变量;ε为随机误差。

1.2 时间序列模型 时间序列分析是通过研究数据的内在规律,利用过去的资料预测未来的变化趋势。时间序列不仅与以前时刻的自身值有关,而且还与以前进入系统的随机干扰存在一定的关系,它就是自回归移动平均模型,记为ARMA(p,q),模型的形式如下[6]:

式中,εt~WN(0,σ2ε)。用滞后算子B可以将ARMA(p,q)模型进一步写为:

2 混合模型

马铃薯晚疫病的发展流行是受到同时期和不同时期因素综合影响的结果。针对晚疫病的上述特点,该研究提出一种混合模型:先用回归分析法来提取晚疫病在同时期的影响信息,再用时间序列分析法提取晚疫病不同时期的影响信息。

假定运用回归分析法在t时期的晚疫病感染度值yt与t时期的N个主要影响因素xit之间建立模型:

式中,α0+∑Ni=1αixit为回归方程;εt是随机误差项,也就是晚疫病感染度值yt与回归方程拟合值之间的残差。

利用回归分析模型(4)可以给出晚疫病病情的预报值,而预报的误差来源于随机误差项,它的未来是不可预测的。为了避免回归模型的有偏估计,采用最小二乘法估计回归模型的参数时要求残差是互不相关,呈正态分布的。对于像晚疫病预报等很多实际系统中,往往由于研究者认识水平的局限性,很难找到全部影响因素来建立完美的回归方程,所以该残差的互不相关性、平稳性、正态分布性等条件很难满足。在建立马铃薯晚疫病预报模型的实际过程中,只能尽量提高回归模型的拟合精确度和残差的平稳性。对于残差中存在的相关性和非正态性,采用时间序列分析法发挥其在平稳数据中建模的优点,以提取残差中的相关性、非正态性的信息。也就是运用时间序列分析对回归模型的残差序列建立ARIMA模型,然后利用ARIMA模型得到残差项εt的预测,以进一步提取晚疫病感染度yt的信息,构建回归分析和时间序列混合预报模型如下:

式中,ηt是服从正态分布的误差项,它的方差与εt的方差可能不同,显然它既包含了可由回归模型描述部分的残差,又包含了回归模型描述不了的那部分yt的时间序列模型的残差。

3 实例应用

选取云南省马龙地区2003~2012年连续10年的马铃薯晚疫病病情资料,建立马铃薯晚疫病短期预报模型,并用历史资料回代来检验模型的精度。

3.1 回归模型分析 按式(1),将实例中的数据代入回归模型中,采用最小二乘法进行参数估计,运用逐步回归法筛选出最优回归方程,经过显著性F检验和t检验的方程如下:

式中,y为马铃薯晚疫病感染度值;x1为短湿润期内温度在10℃≤T<12℃的小时数;x2为短湿润期内温度在14℃≤T<16℃的小时数;x3为短湿润期内温度在16℃≤T<18℃的小时数;x4为短湿润期内温度在18℃≤T<20℃的小时数;x5为短湿润期内温度在20℃≤T<22℃的小时数;x6为短湿润期内温度在22℃≤T<24℃的小时数;x7为一天内温度在15℃≤T<20℃的小时数;x8~x13为长湿润期内各个温度段的小时数。

回归方程(6)的残差分布(图1)显示,散点大致在一个以横轴为中心线的带状区域内,但不符合正态分布的要求,表明回归模型还不能很好地满足基本假设。

3.2 混合模型分析 回归模型中的残差按顺序排列成残差序列{εt},将残差序列{εt}作为建立时间序列模型的样本序列。对残差序列进行平稳化、模型识别、参数估计、检验等操作后得到的方程为:

式中,ηt为白噪声序列。

将方程(6)进行时序转化后与方程(7)合并得到混合模型的方程:

3.3 模型检验 分别用单一回归模型和混合模型,计算马铃薯晚疫病的疫情情况。与单一回归模型的计算曲线相比,混合模型计算值更接近于实测值(图2),这与对残差项的信息提取有关,单一回归模型的残差信息提取不完全,而混合模型进一步提取了残差信息,从而提高了拟合精度。

4 结论与讨论

单一回归模型计算值与实测值的拟合曲线大体上一致,说明晚疫病病情与同时期的气象因素有很强的相关关系,回归模型可以抓住晚疫病病情变化的实质原因。但单一回归模型只提取了强劲的确定性信息,对弱的随机信息浪费严重,存在着残差不能很好满足通常的正态假设现象。

混合模型考虑到了马铃薯晚疫病发展流行是受到同时期和不同时期因素综合影响的结果。在运用回归分析提取强劲的确定性信息的同时,兼顾采用时间序列分析提取弱的随机信息,避免了单一回归模型的信息浪费问题,提高了拟合精度,适用于马铃薯晚疫病的短期预报。

该研究应用的方法只是初步尝试,加之试验区域较少,有待进一步在实践中预报验证,更新资料,不断修订预报方程,从中筛选最佳方程投入应用。

[1]孙茂林,赵永昌,李树莲.云南马铃薯晚疫病的流行及预警系统研究[J].云南大学学报,2008,30(S1):47 -52.

[2]张寿明,李灿辉,何慧龙.神经网络在马铃薯晚疫病长期预报中的应用研究[J].昆明理工大学学报(理工版),2004,29(4):139 -142.

[3]谢成君,宋杰.马铃薯晚疫病流行程度的灰色预测初探[J].马铃薯杂志,1996,10(3):162 -164.

[4]马旭洁,张文解,杨海玲.临夏州马铃薯晚疫病始发期的预测预报[J].中国农业气象,2011,32(4):627 -631.

[5]LATTINJM,DOUGLASCARROLL J,GREENPE.Analyzingmultivariate data[M].北京:机械工业出版社,2003:38 -56.

[6]史代敏,谢小燕.应用时间序列分析[M].北京:高等教育出版社,2011:168-170.

[7]朱黎,苏鹏.一种马铃薯晚疫病小型检测预警系统的研究[J].湖北民族学院学报(自然科学版),2014(1):115-117.

猜你喜欢
小时数晚疫病回归方程
临汾市马铃薯晚疫病发生趋势预报
如何防治大棚番茄晚疫病
采用直线回归方程预测桑瘿蚊防治适期
直流输电线路导线选型中的损耗小时数取值分析
英语时间表达法汇总
马铃薯晚疫病发生趋势预报
走进回归分析,让回归方程不再是你高考的绊脚石
黑龙江省发现马铃薯晚疫病菌(Phytophthora infestans)A2交配型
探究发电设备利用小时数的分析
降低小漩电站机组非计划停机小时数