基于数学模型预测森林病虫害的研究进展

2017-01-07 02:10唐国栋孙晓瑞
安徽农业科学 2016年35期
关键词:人工神经网络害虫神经网络

唐国栋,高 永,汪 季,贾 旭,梁 超,孙晓瑞

(内蒙古农业大学沙漠治理学院,内蒙古呼和浩特 010011)

基于数学模型预测森林病虫害的研究进展

唐国栋,高 永,汪 季*,贾 旭,梁 超,孙晓瑞

(内蒙古农业大学沙漠治理学院,内蒙古呼和浩特 010011)

阐述了我国森林病虫害预测预报的发展历程,介绍了近年来非线性模型和线性非线性组合模型在森林病虫害预测中的应用现状,综述了组合模型的建模方法、支持向量机回归原理及应用现状,总结了目前森林病虫害预测预报中存在的问题,并展望了其今后的发展趋势。

森林病虫害;预测预报;非线性模型;支持向量机;组合模型

森林病虫害是我国一类频发性生物灾害。据统计,我国发生的森林病虫害种类有8 000多种,其中经常造成严重危害的有200多种,发生面积超过800万hm2,约占全国森林面积的5.5%,年均减少林木生长量1 700万m3,经济损失高达50多亿元[1-2],已成为林业生产和生态工程建设的重要制约因素之一。改善这一现状的过程中,森林病虫害预测预报工作是其中的重要环节。

森林病虫害预测预报的目的是通过长期、系统观察,结合实际环境因素综合分析,探讨森林病虫害的发生发展规律,预测森林病虫害发生发展的趋势。早在20世纪50年代我国就开展了病虫害的调查工作,经历了经验预测、试验预测、统计预测和信息预测等阶段的发展,20世纪80年代人工神经网络、小波分析及混沌理论等非线性理论的引入,为病虫害预测预报开辟了一条新的道路[3]。但是由于森林病虫害的发生具有不均匀性、差异性、多样性、突发性、随机性和规律性复杂等特点,单一地运用线性或非线性理论建模都不能很好地挖掘数据中的深层规律,人们意识到若要达到好的预测预报效果,需要同时抓住病害虫发生的线性和非线性规律;因此,线性与非线性的组合模型已成为当今研究的热点之一。笔者阐述了我国森林病虫害预测预报的发展历程,介绍了近年来非线性模型和线性非线性组合模型在森林病虫害预测中的应用现状,综述了组合模型的建模方法、支持向量机回归原理及应用现状,总结了目前森林病虫害预测预报中存在的问题,最后展望了其发展趋势。

1 森林病虫害预测预报技术的发展

早在20世纪30年代国外就开展了森林病虫害的预测预报工作,注重科学技术的应用以及测报资料的系统调查、积累和基础理论研究[4]。我国森林病虫害测报工作开始于20世纪50年代,随着数学、计算机等其他学科的应用发展,我国森林害虫的测报工作大致经历了经验预测、试验预测、统计预测和信息预测4个阶段的发展。①经验预测阶段(20世纪50—60年代)。我国开展森林病虫害预测预报工作较早,早在20世纪50年代就开展了对马尾松毛虫和竹蝗的群众性调查工作,通过观察害虫基数及发育进度确定是否需要防治,随着我国森林病虫害发生面积的不断扩大、发生种类的不断增加,研究工作也逐步深入。②试验预测阶段(20世纪60—70年代)。以有效积温为基础的预测和编制主要害虫生命表是此时期国内外研究的热点,它对病虫害测报的发展和林区的综合管理起着至关重要的作用。我国对松毛虫等主要森林害虫生命表进行了大量研究,深入了解害虫种群数量的变化情况,并将研究成果应用于测报实践中,给害虫发生量的短、中、长期预报提供了可靠的依据,取得了良好的效果[5]。③统计预测阶段(20世纪80年代)。统计预测是利用数学手段探究一定范围内预测因子和生物及非生物因素之间的关系,主要统计预测方法包括回归分析[6]、逐步回归[7]、逐步判别[6]、马尔可夫链[8]、灰色系统分析[9]、预测克立格方法[10]等。目前,这类预测方法仍有广泛应用,但也存在一些弊端,例如模型在研究中拟合率较高,但实际应用中随着某些因素的改变准确率较低。④信息预测阶段(20世纪80—90年代)。主要有害虫发生预测预报系统[11-12]、专家决策系统[13-15]和地理信息系统等[16]。随着测报方法和计算机科学的发展以及害虫信息数据的积累,信息预测法逐渐成为目前国内外研究的热点。此类模型综合了许多分室模型,参数多且假定为常数,而随着时间和空间的变化,环境差异较大,导致预测准确率不高。今后随着科学的进步和信息的进一步完善,信息预测具有广阔前景。

2 非线性预测模型

20世纪80年代以来人工神经网络(Back propagatior,BP)的引入以及20世纪迅速兴起的小波分析、混沌理论等非线性理论,大大推动了森林病虫害预测预报的发展。

2.1 人工神经网络 人工神经网络(BP)是一种基于生理学上的神经系统的理论抽象模型,它是由大量被称为神经元的简要信息处理单元通过高度并联、互联而成的非线性动力学网络系统[17-18]。国外学者Alessandro和Hassoun将其形象地比喻为“黑箱”,经过训练后,输入值后通过神经网络计算出输出值[19]。人工神经网络具有很强的自学习、自组织、自适应及容错性等特点,不需假设前提条件和人为确定因子权重,就可对害虫发生等非线性动力学现象的任意非线性函数进行逼近和模拟[20-22]。其中,BP神经网络研究最为活跃,被广泛应用于病虫害预测预报领域。

杨淑香等[23]运用人工神经网络理论建立了内蒙古东部地区鄂伦春自治旗的落叶松毛虫发生面积及虫口密度与气象因子之间的BP神经网络模型,预测结果的最大误差仅为12.8%。朱寿燕等[24]、陈绘画等[9]、项云飞等[25]均根据浙江省仙居县1983—2002年马尾松毛虫的调查资料,只考虑气象因子的条件下运用相关分析和逐步回归筛选预报因子,根据BP神经网络建立模型,拟合训练后对2个预留年份进行预测,结果非常理想。但由于研究区为纯人工林,长期人为干扰和采取的防治措施也是影响病虫害发生的主要因素[9,24-25]。虽然基于BP神经网络所建立的模型拟合较高,但模型可解释性差,不能很好地反映具体环境因素的影响程度。随着研究的深入,人们发现了BP神经网络的不足之处,因其基于风险最小原则,小样本条件下容易出现局部过优、过拟合、泛化能力不强等问题,导致预测效果不佳。为弥补此类不足,专家开发了人工神经网络的衍化模型。苏小红等[26]提出径向基函数(RBF)神经网络的混合学习算法,陈绘画等[27]提出粒子群优化神经网络混合模型,都是基于BP神经网络不足之处的改进模型。

2.2 小波分析 在病虫害预测中得到的数据包含趋势项、周期项和随机项等,传统的线性方法往往会忽略掉其中的部分重要信息,而小波分析具有分层提取不同信息分量直至方便建模为止的优势[28]。我国小波分析最早引入农业病虫害预测预报是袁磊等[29]利用小波网络建立了小麦条锈病预测模型,但实际上是小波分析和神经网络的混合模型,并非纯粹的小波分析,但预测准确率较单一的神经网络有一定提升。朱军生等[30]运用小波分析多分辨率分析功能将害虫原始非平稳时间序列数据分解分层得到平稳时间序列分量,分层数通过观察和检验已得到的分量确定,再利用传统线性方法分别建模后将预测结果叠加得到最终预测结果。关秀敏等[31]采用symlets小波函数变换对二点委夜蛾测报灯逐日诱蛾数量原始数据进行分解、过滤、重组,结果发现第3层的低频重构序列可以完全反映二点委夜蛾年变化规律。这些均是小波分析在农业病虫害中的应用,在对中国知网检索的文献查询过程中,并未查到关于小波分析在森林病虫害的研究。农业病虫害与林业病虫害的发生虽有不同,但有着极大的相似性,森林病虫害预测预报的多种新兴方法都是从农业上借鉴的,并取得了很好的效果。

2.3 混沌理论 近十几年来,基于Takens相空间重构理论建立的混沌时间序列预测得到广泛应用,并被应用到不同的研究领域,研究重点主要是如何选择合适的预测模型和重构参数,以提高预测模型精度[32]。大量研究表明,害虫所处的复杂系统普遍存在着混沌现象,因此将害虫发生与混沌结合起来,害虫发生变化可看作是混沌系统策动的结果和表现,运用相空间重构原理对害虫进行测报。但是,目前在森林病虫害预测预报中的研究还较少。向昌盛等[33]建立了混沌理论的相空间重构(Phase space reconstruction,PSR)和最小二乘支持向量机(Least squares support vector machine,LSSVM)的PSR-LSSVM组合模型,以云南省普洱市思茅区1985—2006年松毛虫发生面积和浙江省仙居县1983—1989年松毛虫发生面积数据为例进行验证,预测结果优于单一的BP神经网络和差分自回归移动平均(ARIMA)模型,很好地解决了大样本要求和泛化能力弱等问题。

3 线性非线性组合模型

近年来,为了更好地利用各模型的优势,除了单纯地研究线性、非线性方法以外,一些学者提出组合模型预测法,事实证明组合模型较单一模型预测精度有大幅度提高[34]。Vapnik基于统计学习理论提出的支持向量机(Support vector machine,SVM)是目前发展最快的机器学习方法,是近年来组合模型研究中主要的非线性模型。SVM包括分类诊断和模式识别(SVC)、非线性时间序列分析或非线性回归分析(SVR)[22,35-36],SVR基于结构风险最小,与BP神经网络相比较好地解决了小样木、非线性、过拟合、维数灾和局极小等问题[37-38]。组合模型研究中的线性部分,最经典的时间序列模型是差分自回归移动平均(Autoregressive integrating moving average,ARIMA),ARIMA模型极富弹性,可表示不同种类的时间序列模型,兼具时间序列分析和回归分析的优势,在害虫种群动态变化研究中广泛应用[39]。此外,还有带控制项的自回归滑动平均模型(Controlled autoregressive integrating moving average,CARIMA)及其简化模型一带受控项的自回归模型(Controlled autoregressive,CAR)[38,40]。

3.1 SVM回归原理 对于一个给定的样本数据集{(xi,yi),i=1,2,…,k},k为样本个数,SVM回归算法的基本思想是通过一个非线性映射函数将数据映射到高维特征空间,并在这个空间进行线性回归,具体表现形式如下:

f(x)=ωTΦ(x)+b

(1)

式中,ω为平面的权值向量,b为偏置量。

支持向量机回归基于结构风险最小,使用了一种新的损失函数形式——ε不敏感损失函数(ε-insensitive cost function),ε为回归允许最大误差,控制支持向量的个数和泛化能力,ε值越大,支持向量数量就越少。回归模型既使得训练集具有更好的推广能力,又考虑经验风险的最小化时降低模型的复杂度,在这种理念指导下,SVM回归求解变成以下的优化问题:

(2)

约束条件如下:

(3)

3.2 组合模型的应用 组合模型预测研究中,差分自回归移动平均(ARIMA)和支持向量机(SVM)是目前研究较多的组合。向昌盛等[34]运用此方法建立了ARIMA-SVM组合模型,具体步骤为先以ARIMA进行线性预测,再用SVM对残差预测,最后将两部分结果相加得出最终结果。基于辽宁朝阳市1986—2006年数据,进行模型拟合和预测,结果较为理想。在此基础上进一步改进模型,为提高预测精度,采用融合了时间动态变化的ε-DSVM模型对非线性部分进行预测,近期数据值相对较小,而远期数据值相对较大,这样ε-DSVM就能够同时捕捉时间序列的非线性和动态特征。同样,用辽宁朝阳市1986—2006年数据,ARIMA-DSVM预测结果较ARIMA-SVM更加准确[41]。此外,张永生等[38]、袁哲明等[42]建立了支持向量机回归(SVR)和带受控项的自回归模型(CAR)的SVR-CAR组合模型,并结合文献数据进行了实例分析,预测结果较参比的单一线性或非线性模型更为准确。由此可见,组合模型能够融合线性和非线性2种方法的优点,挖掘到害虫数据中大量的动态特征、环境因子的影响和非线性特征,在森林害虫预测预报中将会得到广泛应用。

在建模过程中,害虫发生量具有时滞和后效性,害虫当年的发生量既与当年的各影响因素有关,也与历史害虫发生量和影响因素有关,因此确定最佳时滞阶数非常关键,也是当今研究的难点和重点。其基本原理是从低阶起对害虫发生建模,然后逐渐增加模型的阶数,并用F检验判别来确定最佳时滞阶数。传统确定时滞阶数运用回归方法,由于害虫发生的非线性特点,很难找到最佳时滞阶数。袁哲明等[42]采用留一法基于MSE最小原则确定模型阶数,预测精度有所提高,但过程较为繁琐,且容易得到局部最优解。李星等[40]提出了一种基于地统计学(Geostatistics,GS)定阶方法,半变异函数模型的后效时间长度直接给出拓阶上限,实现了对原始因变量的快速定阶,克服了传统定阶方法易陷入局部最优和耗时长等缺点。向昌盛[43]基于地统计学定阶建立了GS-ARIMA-SVM模型,ARIMA预测线性部分,GS进行模型定阶,SVM对非线性部分进行预测,叠加得到预测结果,与ARIMA-SVM模型相比,不仅提高了定阶速度,而且进一步提高了预测准确率。

4 展望

非线性和线性非线性组合模型的应用在森林病虫害预测领域取得了很大的成功,但仍需进一步完善,组合模型的研究已经展现出了一定的优势,基于机器学习领域的集大成者支持向量机的组合模型研究是当下的热点,如ARIMA-SVM、SVR-CAR、GS-ARIMA-SVM等都取得了很好的预测效果,再进一步完善模型定阶方法和核函数选取及参数确定方法,将在病虫害预测预报领域发挥越来越大的作用。同时,准确收集、更新数据是当今亟需解决的问题之一,只有准确的基础数据配合正确的方法才能对未来发展趋势做出精准判断,现阶段用于测报研究的连续数据较少,尤其是森林病虫害方面,例如浙江省仙居县1983—2002年的马尾松毛虫调查数据已被多人多次使用。目前,仅限于基础理论的研究,大范围的研究仅靠人工调查数据根本不可行,而遥感技术在森林病虫害监测领域的应用已日渐成熟。随着技术的发展,新卫星的相继升空,运用多光谱、高光谱、高空间和高时间分辨率卫星遥感数据提取病虫害发生信息已成为当今研究的重点,应用此类数据对区域性森林病虫害预测预报研究具有其他不可比拟的优势,今后应有效利用遥感数据对大区域乃至全国森林进行病虫害的预测预报。

总而言之,随着非线性科学中的神经网络、小波分析和混沌理论在森林病虫害中的应用,以及基于支持向量机的组合模型预测研究,预测效果越来越准确。其中,小波分析和混沌理论在农业病虫害预测中应用较为成熟,在林业中应用研究的报道较为少见。今后应进一步深入研究非线性理论在森林病虫害预测中的应用,结合线性模型不同方式的组合模型将具有更加广阔的应用前景。参考文献

[1] 武红敢,石进.松毛虫灾害的TM影像监测技术[J].遥感学报,2004,8(2):172-177.

[2] 国家林业局森林病虫害防治总站.森林病虫害防治工作任重道远[N].中国绿色时报,2000-02-28(2).

[3] 李祚泳,彭荔红.基于人工神经网络的农业病虫害预测模型及其效果检验[J].生态学报,1999,19(5):759-762.

[4] 张福丽.气象因素对黑龙江省三种病虫害的影响及预测预报[D].哈尔滨:东北林业大学,2009.

[5] 薛贤清,崔力,齐艳.我国森林害虫预测预报的科技进展[J].南京林业大学学报(自然科学版),1992(4):80-86.

[6] 张福丽,景天忠,王志英,等.气象因素与杨干象虫口密度的多元线性回归和判别分析[J].安徽农业科学,2011,39(15):9000-9001.

[7] 薛贤清.在马尾松毛虫测报中应用逐步回归电算方法的研究[J].林业科学,1984,20(1):42-49.

[8] 贾春生.运用马尔可夫链预测马尾松毛虫发生面积[J].信阳师范学院学报(自然科学版),2007,20(1):43-44.

[9] 陈绘画,崔相富,朱寿燕,等.马尾松毛虫发生量灰色系统模型的建立及其预报[J].东北林业大学学报,2004,32(4):19-21.

[10] 陈绘画,崔相富,张建薇.基于预测克立格方法的马尾松毛虫空间发生量预报[J].中国森林病虫,2007,26(3):5-7.

[11] WANG N H,MIAO T Y,WANG A C.Research and application of Web-based forecast expert system for forest diseases and insects[J].Journal of northeast forestry university,2008,36(1):79-82.

[12] WANG N H,LI D,PAN H.Information service platform of forest pest forecast based on WebGIS[J].Journal of forestry research,2009,20(3):275-278.

[13] 王淑芬,张真,陈亮.马尾松毛虫防治决策专家系统[J].林业科学,1992,28(1):31-38.

[14] 王阿川,缪天宇,曹军.基于Web森林病虫害防治决策专家系统研究[J].计算机技术与发展,2008,18(4):228-231.

[15] 王霓虹,缪天宇,王阿川.基于WebGIS的森林病虫害预测预报专家系统的设计与应用[J].东北林业大学学报,2008,36(1):79,80-82.

[16] LUO S Z,WANG C.Forest pests and diseases forecasting based on GIS[J].Advanced materials research,2011,250/251/252/253:2945-2948.

[17] 孙凡,陈汉容.稻瘿蚊发生趋势的B-P网络预测模型[J].计算机仿真,2000,17(3):61-63.

[18] 陈绘画,朱寿燕,崔相富.基于人工神经网络的马尾松毛虫发生量预测模型的研究[J].林业科学研究,2003,16(2):159-165.

[19] 林高飞,林乃铨,尤民生.人工神经网络在三化螟预测中的应用[J].华东昆虫学报,1999,8(2):4-5.

[20] 张爱兵,陈建,王正军,等.BP网络模型和LOGIT模型在森林害虫测报上的应用初报:以安徽省潜山县马尾松毛虫为例[J].生态学报,2001,21(12):2159-2165.

[21] 罗盛健.基于人工神经网络的刚竹毒蛾发生面积的预测模型[J].华东昆虫学报,2006,15(1):37-39.

[22] 谭泗桥,林雪梅,陈渊,等.基于地统计学的多维时间序列模型及其在生态学中的应用[J].湖南农业大学学报(自然科学版),2009,35(4):433-436.

[23] 杨淑香,赵慧颖,包兴华.基于人工神经网络的落叶松毛虫发生量预测模型的研究[J].中国农学通报,2014,30(28):72-75.

[24] 朱寿燕,陈绘画,崔相富.应用人工神经网络预测马尾松毛虫的有虫面积[J].中国农业气象,2004,25(1):53-55.

[25] 项云飞,陈绘画.应用人工神经网络预测马尾松毛虫的有虫面积[J].浙江林业科技,2004,24(3):44-46,54.

[26] 苏小红,侯秋香,马培军,等.RBF神经网络的混合学习算法[J].哈尔滨工业大学学报,2006,38(9):1446-1449.

9.1 区域阻滞麻醉还是全身麻醉 在大手术(如开腹手术)和高危患者中区域阻滞麻醉可能具有优势。一项针对各种手术患者的荟萃分析显示,与全身麻醉相比,区域阻滞麻醉降低术后30 d内肺炎发生率和死亡率[15]。在一项针对接受各类手术、并合并慢性阻塞性肺病患者的倾向性评分匹配分析中,区域阻滞麻醉伴随术后30 d肺部和其他并发症发生率降低[16]。

[27] 陈绘画,崔相富,杨胜利.基于粒子群优化神经网络混合模型预测马尾松毛虫发生量[J].东北林业大学学报,2008,36(11):88-91.

[28] 马社祥,刘贵忠,曾召华.基于小波分析的非平稳时间序列分析与预测[J].系统工程学报,2000,15(4):305-311.

[29] 袁磊,李书琴.基于小波网络的小麦条锈病预测模型研究[J].微计算机信息,2009,25(12):42-43.

[30] 朱军生,翟保平,刘英智.基于小波分解的害虫发生非平稳时间序列分析和预测[J].南京农业大学学报,2011,34(3):61-66.

[31] 关秀敏,朱军生,陈淑娟,等.小波分析二点委夜蛾发生规律[J].应用昆虫学报,2013,50(6):1643-1648.

[32] 张春涛,关文忠,刘学飞.混沌时间序列的2阶预测模型[J].数学的实践与认识,2016,46(5):186-193.

[33] 向昌盛,万方浩.基于混沌理论的害虫发生量非线性建模与预测[J].湖南农业大学学报(自然科学版),2015,41(2):172-176.

[34] 向昌盛,周子英.ARIMA与SVM组合模型在害虫预测中的应用[J].昆虫学报,2010,53(9):1055-1060.

[36] MOUSAVI S A,HANIFELOO Z,SUMARI P,et al.Enhancing the diagnosis of corn pests using gabor wavelet features and SVM classification[J].Journal of scientific & industrial research,2016,25(6):349-354.

[37] 向昌盛,周子英,张林峰.支持向量机在害虫发生量预测中的应用[J].生物信息学,2011,9(1):28-32.

[38] 张永生,袁哲明,熊洁仪,等.基于SVR和CAR的多维时间序列分析及其在生态学中的应用[J].生态学报,2007,27(6):2419-2424.

[39] 贾春生.ARIMA模型在马尾松毛虫发生面积预测中的应用[J].安徽农业科学,2007,35(19):5672-5673.

[40] 李星,陈渊,张永生,等.基于支持向量回归与地统计学的多维时间序列分析[J].中国农学通报,2011,27(29):133-138.

[41] 向昌盛,周子英,武丽娜.基于ARIMA和DSVM组合模型的松毛虫发生面积预测[J].湖南农业大学学报(自然科学版),2010,36(4):430-433.

[42] 袁哲明,张永生,熊洁仪.基于SVR的多维时间序列分析及其在农业科学中的应用[J].中国农业科学,2008,41(8):2485-2492.

[43] 向昌盛.基于地统计学定阶的松毛虫发生面积组合预测[J].计算机应用研究,2012,29(3):984-987.

Research Progress on Forecasting Forest Diseases and Pests Based on Mathematical Model

TANG Guo-dong, GAO Yong, WANG Ji*et al

(College of Desert Science and Engineering, Inner Mongolia Agricultural University, Hohhot, Inner Mongolia 010011)

The development history of forecasting forest diseases and pests in China was expounded. The application status of nonlinearity and linearity-nonlinearity models in recent years was introduced. And the modeling methods of combined model, the regression principle and application status of support vector machine were reviewed. And the existing problems in current forecast of forest diseases and pests were summarized. Finally, its developed trend in the future was forecasted.

Forest diseases and pests; Forecast; Nonlinearity model; Support vector machine; Combined model

内蒙古自治区林业厅横向项目。

唐国栋(1991- ),男,内蒙古乌盟人,硕士研究生,研究方向:森林病虫害风险评估。*通讯作者,教授,博士,博士生导师,从事荒漠化防治研究。

2016-11-30

S 711

A

0517-6611(2016)35-0008-03

猜你喜欢
人工神经网络害虫神经网络
冬季果树常见蛀干害虫的防治
利用人工神经网络快速计算木星系磁坐标
神经网络抑制无线通信干扰探究
人工神经网络实现简单字母的识别
枣树害虫的无公害防治
基于神经网络的拉矫机控制模型建立
农业害虫的冬季防治
复数神经网络在基于WiFi的室内LBS应用
基于支持向量机回归和RBF神经网络的PID整定
基于声发射和人工神经网络的混凝土损伤程度识别