几种分离方法在区域经济作物产量预测上的适用性分析:以吴中区枇杷为例*

2023-10-20 06:28陶正达赵静娴顾荆奕郑俊华汤小红陈洪良杨大强
中国农业气象 2023年10期
关键词:吴中区气候因子单产

陶正达,赵静娴,顾荆奕,郑俊华,王 俊,汤小红,陈洪良,杨大强

几种分离方法在区域经济作物产量预测上的适用性分析:以吴中区枇杷为例*

陶正达1,赵静娴1**,顾荆奕1,郑俊华2,王 俊1,汤小红1,陈洪良1,杨大强3

(1.苏州市吴中区气象局,苏州 215128;2.苏州市吴中区东山多种经营服务公司,苏州 215107;3.苏州市吴中区东山镇农林服务站,苏州 215107)

以吴中区枇杷为研究对象,对比分析ARIMA模型、GM模型、线性趋势和二次指数平滑法在区域性经济作物上气象产量分离的适用性,并对在这四种方法的基础上所构建的基于气候因子的产量预测模型预测准确度进行分析。结果表明,(1)使用GM和线性趋势方法分离的枇杷气象产量的正负性与农业气象灾害年鉴匹配较好。(2)四种方法分离的枇杷气象产量与9个气候因子间复相关程度均达到极相关,复相关系数分别为ARIMA方法0.95,线性趋势和GM方法0.94,二次指数平滑方法0.93。(3)使用GM方法预测的枇杷趋势单产均方根误差和绝对百分比误差最大,在考虑了气候因子后,均方根误差降低百分率达到50.1%,其余三种方法中线性趋势法降低49.3%,ARIMA模型降低6.7%,二次指数平滑降低14.4%。(4)四种方法所构建的基于气候因子的产量预测模型预测结果,使用GM方法的RMSE和MAPE分别为3.0kg·hm−2和15.2%,线性趋势方法次之,ARIMA方法最差。整体来看,GM(1,1)和线性趋势方法分离的枇杷气象产量与气象灾害记录更匹配,使用GM方法构建的基于气候因子的产量预测模型效果最好,表明GM模型更适用于区域性经济作物的产量分离和预测。

产量预测;产量分离;ARIMA模型;灰色模型;二次指数平滑;枇杷

种植具有地方特色的经济作物在建设宜居宜业和美丽乡村中发挥了重要作用,提高区域性经济作物产量、品质和知名度可以有效带动农村第三产业的发展[1−2]。苏州市吴中区是全国枇杷传统四大产区之一,在宋代已有文字记载[3−4]。近年来,随着人民生活水平的提高和电商物流的快速发展,素有“果中之皇”之称的枇杷得到越来越多消费者的喜爱,吴中区枇杷的种植面积和产值逐年增加[5]。2021年吴中区枇杷种植面积超过2660hm2,产值突破6亿元,枇杷产业成为吴中区农业经济的重要组成部分。对吴中区枇杷这种区域性经济作物的产量进行准确的预测不仅关系到当地果农收入,还对地区农业经济及相关产业的发展具有重要意义[6−7]。

枇杷等区域性经济作物的产量易受气候条件等自然因子以及生产力水平等非自然因子影响,产量的年际变化具有很强的波动性,因此,在经验统计学的产量预测模型中,考虑气温、积温、降水和日照等气象观测资料与作物产量的关系进而构建的基于气候因子的产量预测模型最为合适[8−9]。唐余学等[10−11]利用5a滑动平均方法分别分离中稻和早稻的气象产量,进而构建的预测模型准确率分别达到了90%和80%以上;顾雅文等[12]利用二次多项式的方法拟合苹果的气象产量,构建的预测模型在3a产量预测结果中准确率达到94.5%。由于气象产量分离方法在预测模型中的重要作用,国内外很多学者对不同的产量分离方法应用效果进行了对比分析,袁小康等[13]利用33a的油菜单产数据,对比了HP滤波法、Logistic函数拟合法、5a滑动平均法和线性趋势法所分离的气象产量的合理性,结果表明HP滤波法和5a滑动平均法的效果最为准确,相关系数皆为0.92;何虹等[14]对比了5a滑动平均法、二次指数平滑法和五点二次平滑法应用于宁夏玉米的气象产量分离,结果表明五点二次平滑法分离的气象产量更能合理反映气候因子;Li等[15]对比了二次指数平滑、HP滤波等6种方法应用于分离稻米气象产量的效果,结果表明5点二次平滑和3a移动平均方法分离效果最为合适,与气候因子匹配性较好。由此可见,不同的产量分离方法在不同作物上表现也不同,此外,鲜有研究对不同产量分离方法所构建的产量预测模型的预测效果进行对比分析。因此,本研究使用2003−2018年吴中区枇杷单产数据和对应时段的气象数据,对比使用自回归积分滑动平均模型(ARIMA)、灰色预测模型(GM)、线性拟合方法和二次指数平滑方法分离的枇杷气象产量的合理性,其中ARIMA模型综合考虑了目标数据的趋势、周期及随机干扰等因素,具有实用性强、精度高的优点[16−17];GM模型可将具有随机性的原始数据转换为具有规律性的数据,从而弱化不确定性,具有所需数据样本量少,计算简单等优点[18−19]。最后再利用2019−2021年吴中区枇杷产量数据对不同产量分离方法所构建的产量预测模型的预测结果进行分析,为准确预测年际变化较大的区域性经济作物产量提供技术支撑。

1 资料与方法

1.1 资料及其来源

吴中区地处长江三角洲太湖水网平原,属亚热带季风海洋性气候,四季分明,全年平均气温15.7℃,年平均降水量1088.5mm,无霜期240d,适宜的气候条件有利于枇杷的生长发育[5,7]。吴中区枇杷种植历史悠久,常年栽种面积在1.3万hm2以上,且呈逐年攀升趋势,其中2021年吴中区枇杷种植面积占比60%,产值占2021年上半年区农林牧渔业产值的30%,是吴中区支柱性农业产业。选取2003−2018年共16a的吴中区枇杷单产及与枇杷成熟年份生长期相对应的气象资料,构建基于气候因子的产量预测模型,并利用2019−2021年数据对模型的短期预测效果进行评价。

枇杷产量数据由吴中区农业农村局和吴中区东山镇农林服务中心提供,气象资料来自东山国家基本气象观测站(站号:58358),其中部分气象灾害数据来自吴中区第一次自然灾害风险普查工作。气象要素共14种,包括2002年6月−2021年5月的逐月平均气温、降雨日数、降水量、蒸发量、日照时数、最长连阴雨日数,以及逐年极端最高气温、最低气温、结冰日数、大风日数、雪日、积雪日数、寒潮过程日数和高温日数,逐年数据由逐月数据计算得来。枇杷逐年遭受的气象灾害情况来源于《中国气象灾害年鉴》。

1.2 气象产量分离和预测

基于气候因子的产量预测模型首先需要将农业产量分离为气象产量与趋势产量,再通过数学方法对这两种产量分别进行预测,两种产量预测结果之和就是目标作物的农业产量预测值。其原理是由于农业产量受自然与非自然因子共同影响,其中非自然因子中生产力水平起主导作用,气候条件则是自然因子中最不稳定的因素,因此,将作物产量(Y)分为以生产力水平为主导的趋势产量(Ytrend)、以气候条件为主导的气象产量(Ymet)和随机误差(e)[20−21],即

式中,Y为枇杷产量,Ytrend为枇杷趋势产量,Ymet为枇杷气象产量,随机误差项可忽略不计,产量单位均为kg·hm−2。

由式(1)可知,对气象产量模拟的准确度取决于对趋势产量的模拟是否准确,研究中使用线性趋势、二次指数平滑、灰色模型(GM)和自回归积分滑动平均模型(ARIMA)四种方法对吴中区枇杷的趋势单产分别进行拟合。

基于气候因子的产量预测模型建立首先需要挑选合适的气候因子。通过对14种气象要素与气象产量之间进行相关分析来挑选适合用于构建模型的气候因子,再根据方差膨胀因子(Variance Inflation− Factor, VIF)方法来剔除存在共线性的气候因子[22],最后利用气象产量与筛选后的气候因子,使用多元线性回归的方法构建气象产量预测模型[23−24],即

式中,n为气候因子个数,xi为气候因子,ai为相应的回归系数,e为回归方程的残差。

1.3 趋势产量模拟的四种方法

1.3.1 方法一: ARIMA模型

1.3.1.1 模型介绍

ARIMA模型全称为自回归积分滑动平均模型(Auto Regressive Integrated Moving Average Model),该模型是将时间序列平稳处理后对时间序列因变量的滞后值和误差进行回归所建立的[25]。ARIMA(p,d,q)模型可表达为

式中,yt为预测值,μ为常数项,γi为i阶自相关系数,εt为偏差,θi为误差项系数。

Note: ACF is sort of autocorrelation function,PACF is sort of partial autocorrelation function. The same as below.

计算不同参数组合下的贝叶斯信息准则BIC(Bayesian Information Criterion)判断模型是否最优,选取使BIC值最小的p、q值作为模型参数[27]。BIC计算式为

式中,K为模型参数个数,n为样本数量,L为模型的极大似然函数。

1.3.1.2 模型参数确定

(1)参数d值确定。利用差分法对2003−2018年吴中区枇杷单产数据进行平稳化处理。由图1可知,与原序列相比,经过一阶差分处理后枇杷产量的时间序列呈现围绕零值上下均匀分布的特点,用单位根检验方法对一阶差分后的时间序列是否平稳进行验证,结果表明一阶差分后的时间序列单位根检验P值的显著性水平为0.000,呈极显著性,拒绝原假设,说明一阶差分后的吴中区枇杷单产时间序列稳定,因此,ARIMA(p,d,q)模型中d取值为1。

图1 2003−2018年枇杷单产原始序列及其一阶差分序列

注:枇杷成熟年份对应的气象要素时间为上一年6月−当年5月,图中年份为枇杷成熟的年份。下同。

Note: The time period of meteorological data corresponding to the ripening year of loquat refers to last June to May that year. The year in the figure is the ripening year of the loquat. The same as below.

(2)参数p和q值确定。对一阶差分后的吴中区枇杷单产时间序列进行自相关(ACF)和偏自相关分析(PACF),结果表明自相关及偏自相关系数皆呈现明显拖尾的分布形式(图2),因此,模型中的p和q值都不为0。

利用贝叶斯信息准则(BIC)对ARIMA模型中的参数p和q进行最优分析,结果见表2。由表可以看出,当p、q取值皆为1时BIC值最小,因此使用ARIMA(1,1,1)模型进行模拟。

1.3.2 方法二:灰色模型

灰色模型(GM, Grey Model)是通过少量的、不完全的已知信息建立数学模型进行预测的方法,适用于处理小样本预测问题[18−19]。研究中选择使用该体系的基础模型GM(1,1),主要是由于GM(2,1)模型更适用于具有指数变化规律数据[28],而吴中区枇杷单产的时间序列并未表现这一特征(图1),具体算法为:

图2 一阶差分后的枇杷单产序列自相关系数(ACF)和偏自相关系数(PACF)

表2 p和q不同取值时ARIMA(p,1,q)模型的贝叶斯信息准则值

(1)构建原始数据序列

式中,X0为枇杷单产原始数据时间序列。

(2)构建1次累加序列

(3)构建灰色模型

定义X1的导数为

定义由X1临值生成的数据序列为

由此定义GM(1,1)的微分方程为

由此可得矩阵

(4)预测值x0(t)

1.3.3 方法三:线性回归模型

线性趋势法(LT,Linear Trend)也叫线性回归法,该方法假定样本时间序列与其对应的时序值具有线性关系,进而构建一元线性回归方程,即

式中,i=1,2,…,16,xi为第i期的枇杷单产,ti为对应的年份,a为回归系数,b为回归常数,e为偏差,由回归分析的方法求解参数a、b,即可获得枇杷单产的线性预测方程。

1.3.4 方法四:二次指数平滑模型

指数平滑法是在移动平均法基础上发展起来的,它具有移动平均法的优点,同时还考虑了不同时期的数据所起的不同作用,相比于一次指数平滑,二次指数平滑(QES, Quadratic Exponential Smoothing)具有更强的适应性和稳定性。因此,选取二次指数平滑法对枇杷趋势产量进行拟合,具体步骤为

(1)构建一次指数平滑时间序列。

(2)对一次指数平滑进行递归。

式中,Dt为二次平滑序列。

(3)对目标进行预测。

式中,T为t期到预测期的间隔数,参数a、b的计算式为

(4)对二次指数进行平滑运算。

由于二次指数平滑方法计算的准确性依赖于初始值的合理估计,因此,研究中使用一种以所有历史数据加权平均,且权重呈等比变化的平滑初值计算公式[29],算法为

式中,n为样本量的大小,取值为16。

在进行二次指数平滑运算时,为了使计算结果更加准确、合理,平滑系数α的取值并不是主观赋值,而是根据样本量的大小确定的,本研究样本量为16,故α取值为0.3[29]。

1.4 实验步骤与评价方法

1.4.1 实验步骤

第一步,气象产量获取。利用2003−2018年吴中区枇杷单产数据使用ARIMA(1,1,1)、GM(1,1)、线性趋势和二次指数平滑方法分别进行拟合,得到相应的拟合方程及拟合值,形成趋势产量序列;利用实际产量减去趋势产量,分离得到2003−2018年枇杷气象产量序列。

第二步,气候因子筛选。分析四种分离方法得到的2003−2018年枇杷气象产量与同期吴中区逐月和逐年气象要素间的相关性,筛选出与气象产量相关性较大的气候因子并利用方差膨胀因子方法来剔除存在共线性的。

第三步,模型构建。利用多元线性回归方法构建枇杷气象产量拟合与预测方程,再利用气象产量与趋势产量相加即可对枇杷产量进行拟合与预测,预测时效为3a即2019−2021年。

第四步,结果分析。对四种方法的合理性和有效性进行对比分析,具体方法见1.4.2节。

1.4.2 评价方法

首先是趋势产量与气象产量的合理性分析,将四种方法拟合的枇杷趋势产量与实际产量进行对比分析,由于趋势产量主要受生产力水平影响[20−21],而近年来随着吴中区枇杷产业的快速发展,生产力水平逐年提高,因此合理的趋势单产应呈现出增加的趋势;将分离的枇杷气象产量正负性与《中国气象灾害年鉴》记录情况对比,正的气象产量表明当年气候条件较好,适宜枇杷生长,而负的气象产量表明当年气候条件较差,枇杷遭受了气象灾害。此外,在筛选气候因子时,对气象产量与气候因子间的相关性分析也可以反映出气象产量的合理性。

其次是对四种方法的有效性进行评价,也就是对所构建的基于气候因子的产量模型的预测效果进行评价,包括均方根误差(RMSE)和平均绝对百分比误差(MAPE)[30−31]两个指标。

最后使用引入气象产量前后枇杷产量预测结果的均方根误差降低率(IRRMSE)来评价四种方法的有效性[32],均方根误差改进率的大小反映了气象产量对趋势产量订正效果的好坏,同时也反映了四种方法有效性的高低。

1.5 数据处理

ARIMA模型及多元线性回归方程使用SPSS软件实现,灰色模型使用MATLAB编程实现,线性回归方程及二次指数平滑模型由Excel进行拟合。

2 结果与分析

2.1 四种方法拟合的枇杷趋势产量和气象产量合理性分析

2.1.1 趋势产量

按照1.3节所述方法计算后获得的四种趋势产量拟合与预测方程为

由图3可见,从枇杷实际单产的变化趋势来看,2003−2018年吴中区枇杷单产呈现先减少后波动上升的趋势且波动幅度较大,表明枇杷这种地方性经济作物的单产易受地方经济、地方政策和气候条件等因素共同影响,具有明显的脆弱性。四种方法拟合的枇杷趋势单产中GM(1,1)与线性趋势方法的拟合结果都呈现递增的趋势(图3b、图3c),这与生产实际情况相符,科技和果园管理水平的进步,枇杷品种的不断改良与适应,电商、物流的快速发展以及社会生产力水平的稳步提高,导致吴中区枇杷的趋势产量也随时间稳步提高。另一方面,这两种方法的拟合结果也呈现一定的差异性,GM(1,1)拟合的趋势单产并不是线性的,与实际单产的相关性也较线性趋势方法更高,Pearson相关系数分别为0.22和0.13。ARIMA(1,1,1)拟合的趋势产量除2004年外,其余年份呈现先减后增的变化趋势,与实际单产的Pearson相关系数为0.38。2004年的趋势单产不符合整体变化趋势的原因是ARIMA(1,1,1)拟合枇杷趋势产量的时间序列存在一定的滞后性,这与该模型考虑了一阶的移动平均有关,是计算方法导致的,而2010年后吴中区枇杷单产呈增加趋势与地方政府的大力支持有关。据统计,1986−2006年苏州市枇杷种植面积的年平均增长速率不到15hm2·a−1,2007−2015年的年增长率超过210hm2·a−1,增长率扩大了十倍,表明自2007年开始苏州市枇杷种植业得到了快速的发展,而枇杷种植后3~5a之后才会结果,因此从这个角度来看,ARIMA(1,1,1)模型拟合的吴中区枇杷趋势产量在2010年之后呈增加趋势是合理的。二次指数平滑方法拟合的趋势产量与实际产量变化趋势最为相似,两者的Pearson相关系数达到了0.86,达到显著相关水平。拟合的趋势产量呈现与实际产量基本一致的波动性,但整体上符合先减后增的变化趋势。

图3 四种方法拟合枇杷趋势产量对比

总体来看,四种趋势单产拟合方法中二次指数平滑方法的结果与实际单产最为接近,ARIMA(1,1,1)次之,线性趋势方法表现最差。但趋势产量是用来表征受果园管理水平、农业生产水平和地方政府支持力度等非自然因子而影响的那部分产量,因此,哪种方法拟合的趋势单产更合理,还需要对据此分离的气象产量以及最终构建的预测模型的预测效果进行进一步分析。

2.1.2 气象产量

使用枇杷实际单产分别减去四种方法拟合的枇杷趋势单产获得枇杷气象产量,由于ARIMA(1,1,1)和GM(1,1)无法对时间序列的初始值进行准确估计,因此这两种方法获取的枇杷趋势单产时间序列缺少2003年,为了使其具有可比性,在分析和构建模型时均使用2004−2018年数据。从图4可以看,四种枇杷气象产量时间序列整体表现较为一致的波动性且时正时负(正为增产,负为减产),这符合气象产量是表示受气象条件影响的那部分产量的定义。但在个别年份,四种气象产量表现正负相反的情况,例如2005年和2006年使用ARIMA(1,1,1)和二次指数平滑方法分离的枇杷气象产量为负值,而使用GM和线性趋势两个方法则表现为正值,因此哪种方法分离的气象产量更合理,需要进一步分析。对四种方法分离的枇杷气象产量正负性不一致年份2005年、2006年、2013年的气象灾害进行分析,结果显示,2005年成熟的枇杷遭遇了秋季干旱,其中10月总降水量仅为0.8mm,应为减产年;2006年成熟的枇杷遭遇了花期连阴雨,花期总雨日达到37d,最长连阴雨日数达到8d,应为减产年;2013年成熟的枇杷整体气象条件较为适宜,应为增产年。四种方法分离的枇杷气象产量符合以上条件的为GM(1,1)和线性趋势两种方法,因此这两种方法分离的气象产量更合理。

图4 四种方法分离的枇杷气象产量对比

2.2 基于气候因子的产量预测模型构建

2.2.1 模型中气候因子筛选

基于气候因子的产量预测模型中包含预测趋势产量和气象产量两部分,趋势产量的预测方程已在2.1.1节中给出,气象产量预测方程的构建是利用气候因子与气象产量之间的强相关性,使用多元线性回归的方法来构建的,因此筛选合适的气候因子就显得尤为重要。首先利用逐年的气候因子,包括总雨日、平均气温、总降水量、总蒸发量、总日照时数、高温日数、极端最高气温、最长连阴雨日数、大风日数、降雪日数、积雪日数、≤−3℃日数、≤−3℃极端最低气温和≤−3℃冷积温共14个气象要素序列,分别与四种方法分离的枇杷气象产量进行相关性分析,结果见图5。由图中可见,除大风日数外,其余13个气候因子与四种方法分离的气象产量的相关性皆呈现相同的正负性,表明同一种气候因子对气象产量的影响具有同质性,即同时表现为增产或减产。但14个因子中仅逐年总蒸发量、逐年高温日数和逐年极端最高气温三个因子与四种气象产量的相关系数通过了0.05水平的显著性检验。

三个气候因子无法完全解释枇杷气象产量,为提高预测模型的准确度,对未通过显著性分析的气候因子分别进行讨论。因未有研究表明降雪量或积雪会导致枇杷减产,且吴中区种植的枇杷未遭受过明显的大风灾害,故逐年降雪日数、积雪日数和大风日数这三个气候因子可直接剔除。对逐月气象资料与枇杷气象产量的相关性分析表明,气象产量与7月、11月、12月和1月的雨日相关系数较大(表3),其中11月−翌年1月正处于枇杷的花期[25],因此尝试使用枇杷花期的总雨日作为新的气候因子。而7月雨日与枇杷气象单产负相关表明梅雨季过多的降水会导致枇杷遭受涝渍灾害,但由于相关性较低,不适合作为单独的一个气候因子。另外,逐月平均气温中相关系数较大的为7月和8月平均气温,且都通过了显著性检验,该时段恰好为枇杷的夏梢期[7],因此选择使用夏梢期平均气温作为新的气候因子。通过相同方法相继确立夏梢期降水量、10月降水量、夏梢期总日照时数和花期最长连阴雨四个气候因子。

注:*、** 表示相关系数分别通过0.05、0.01水平的显著性检验。下同。序号1−14分别代表总雨日、平均气温、总降水量、总蒸发量、总日照时数、高温日数、极端最高气温、最长连阴雨日数、大风日数、降雪日数、积雪日数、≤−3℃日数、≤−3℃极端最低气温和≤−3℃冷积温。

Note: * is P<0.05,** is P<0.01. The same as below. No. 1-14 represents annual rainy days, annual average temperature, annual precipitation, annual evaporation, annual sunshine hours, annual high temperature days, annual maximum temperature, annual longest persistent rainy days, annual gale days, annual snow days, annual snow cover days, annual days of the minimum temperature less than -3℃, accumulated the extreme minimum temperature less than -3℃ and accumulated the minimum temperature less than -3℃(cold accumulated temperature), respectively.

表3 逐月的气象要素与四种方法分离出的气象产量间的相关系数(以雨日和平均气温为例)

由图6可见,整体来看,筛选的9个气候因子即花期总雨日、夏梢期平均气温、夏梢期降水量、10月降水量、夏梢期总日照时数、花期最长连阴雨日数、年总蒸发量、年高温日数和年极端最高气温与枇杷气象产量的相关程度皆达到了中等及以上,相关系数皆通过了0.05水平的显著性检验。其中,达到极显著相关的分别为ARIMA(1,1,1)分离的气象产量与花期总雨日间(相关系数为−0.80),GM(1,1)、线性趋势和二次指数平滑方法分离的枇杷气象产量与高温日数间(相关系数分别为0.86、0.87和0.84)。此外,四种方法分离的气象产量与9个气候因子间复相关程度都达到了极显著水平,复相关系数从大到小依次为ARIMA(1,1,1)方法0.95,线性趋势和GM(1,1)方法0.94,二次指数平滑方法0.93。表明这四种方法皆可用于枇杷的气象产量分离,同时也反映枇杷对气候条件的依赖性和敏感性。

2.2.2 基于气候因子的产量预测模型建立

利用气候因子与气象产量来建立多元线性回归方程,为避免构建的回归模型存在多重共线性问题,研究中选择方差膨胀因子(Variance Inflation Factor,VIF)方法剔除存在共线性的气候因子。根据当10≤VIF<100时自变量存在较强的多重共线性,剔除了夏梢期平均气温和夏梢期总日照时数两个气候因子,其VIF值分别为28.2和11.6。所构建的预测方程如下:

据此,可根据产量等于趋势产量与实际产量之和的原理,结合式(22)−式(25)获得基于气候因子的枇杷产量预测模型。

图6 四种方法分离的气象产量与筛选的9种气候因子间的相关系数

注:气候因子序号1−9分别代表花期总雨日、夏梢期平均气温、夏梢期降水量、10月降水量、夏梢期总日照时数、花期最长连阴雨日数、年总蒸发量、年高温日数和年极端最高气温。

Note: No. 1−9 represents rainy days during the florescence, average temperature during the summer-shoot stage, precipitation during the summer-shoot stage, precipitation in October, sunshine hours during the summer-shoot stage, longest persistent rainy days during the florescence, annual evaporation, annual high temperature days, annual maximum temperature, respectively.

2.3 模型预测效果评价

由表4可以看,使用GM(1,1)方法进而构建的基于气候因子的产量预测模型预测的枇杷单产与实际单产的均方根误差和平均绝对百分比误差最小,RMSE和MAPE分别为3.0kg·hm−2和15.2%,表明GM(1,1)方法来分离气象产量进而构建的产量预测模型的预测效果最好,方法最有效,更适用于预测枇杷这种区域性经济作物的产量。

表4 基于气候因子的产量预测模型对2019−2021年枇杷产量预测效果评价

对比表5中枇杷趋势单产的预测效果,四种方法预测的趋势单产的均方根误差和平均绝对百分比误差比在表4中更大,也就是气象产量对趋势单产的订正效果皆为正效果,表明了基于气候因子的产量预测模型的有效性。其中使用GM(1,1)方法RMSE降低百分率最大,达到50.1%,表明该方法的改进效果最佳。此外,使用线性趋势方法和GM(1,1)方法的均方根误差降低百分率明显较另外两种方法更高,表明这两种方法分离的枇杷气象产量更合理,由于气象产量是利用产量与趋势产量的差计算出来的,因此这也说明了这两种方法模拟的趋势单产更合理。对比图3可发现,这两种方法模拟的趋势单产时间序列具有线性或近线性递增的变化特征,这一结果从侧面反映了气象条件是导致枇杷单产波动较大的主要原因。

表5 四种方法对2019−2021年枇杷趋势产量预测效果评价

3 结论与讨论

3.1 结论

(1)从ARIMA、GM、线性趋势和二次指数平滑四种产量分离方法拟合的枇杷趋势单产与实际单产的相关性来看,使用二次指数平滑方法的Pearson相关系数最大,为0.86,ARIMA(1,1,1)方法次之,为0.38,GM(1,1)与线性趋势方法接近,分别为0.22和0.13。

(2)从四种产量分离方法的合理性上来看,四种方法分离的枇杷气象产量的正负性与农业气象灾害年鉴最为一致的是GM(1,1)和线性趋势两种方法,另外两种方法表现稍差。

(3)从四种产量分离方法的有效性来看,考虑了气候因子对枇杷趋势单产预测结果订正效果最好的是GM(1,1)方法,其均方根误差降低了50.1%,线性趋势方法次之,为49.3%,ARIMA(1,1,1)与二次指数平滑方法表现较差,分别为16.7%和14.4%。

(4)从预测结果上来看,使用GM(1,1)方法分离枇杷气象产量进而构建的基于气候因子的产量预测模型预测效果较其余三种方法更好,预测结果的RMSE为3.0kg·hm−2,MAPE为15.2%,线性趋势方法次之,其后是二次指数平滑方法,ARIMA(1,1,1)方法最差。

3.2 讨论

吴中区枇杷作为当地的特色经济作物,其产量的准确预测对地方经济发展尤其是农业经济以及第三产业具有重要意义。与粮食作物不同的是,像吴中区枇杷这种地方性经济作物的产量年际变化波动较大,基于气候因子的产量预测模型可以有效地对其进行预测,但由于这种预测模型的准确度依赖于其中使用的产量分离方法,因此有必要对不同产量分离方法的适用性进行对比分析。研究中发现14种逐年的气象要素中仅有3种可通过与枇杷气象产量间相关性显著性检验,通过对逐月气象要素与枇杷气象产量进行相关性分析发现,相关系数较高月份多处于枇杷的关键生育期,与吴中区栽种枇杷的气候适应性基本一致。这与陆杰英等[33]在对增城香蕉上的研究结果相似,使用这种方法所获取的气候因子具有更好的科学性和针对性,避免了高俊杰等[11]在研究中主观选取关键气候因子的不确定性。

王秋京等[34]的研究结果表明,GM模型具有将随机性的原始数据转换为具有规律性的数据,从而弱化原始数据时间序列不确定性的优点,这在拟合吴中区枇杷趋势产量上得到了很好的体现,使用GM(1,1)方法分离的枇杷气象产量更合理、有效,据此构建的产量预测模型预测效果在四种方法中表现最好。此外,从预测效果上来看,四种方法预测的平均绝对百分比误差皆小于20%,达到了Paudel[35]等对欧洲区域作物产量预测的效果,但与孙少杰等[36]使用神经网络方法预测冬小麦产量的准确率超过90%的结果相比还有差距,可在下一步研究中予以考虑。

研究中使用张旭晖等[37]关于枇杷低温冻害的三种气象指标与气象产量进行相关性分析,但最高的相关系数仅为0.45,未通过显著性检验。然而陶正达等[7]的研究表明,吴中区枇杷遭受过多次的低温冻害影响,仅2021年成熟的枇杷就遭受过2次寒潮冻害影响,≤−3℃日数为8d、≤−3℃极端最低气温−7.0℃、≤−3℃冷积温−13.3℃·d。因此,下一步将构建更合适的低温冻害指标并引入预测模型中,这可以进一步提高基于气候因子的枇杷单产预测模型的精度。

[1] 王润红,茹晓雅,蒋腾聪,等.基于物候模型研究未来气候情景下陕西苹果花期的可能变化[J].中国农业气象,2021, 42(9):729-745.

Wang R H,Ru X Y,Jiang T C,et al.Based on the phenological model to study the possible changes of apple flowering dates under future climate scenarios in Shaanxi province[J].Chinese Journal of Agrometeorology,2021,42 (9):729-745.(in Chinese)

[2] 顾仲阳,常钦,李晓晴,等. 建设宜居宜业和美乡村[N].人民日报,2022-11-25(001).

Gu Z Y,Chang Q,Li X Q,et al.Build a livable,employable and beautiful countryside[N].People’s Daily,2022-11-25 (001).(in Chinese)

[3] 黄霄,王化坤,薛松,等.大棚栽培对枇杷果实品质和矿质元素吸收与积累的影响[J].果树学报,2020,37(4):540- 552.

Huang X,Wang H K,Xue S,et al.Effects of greenhouse cultivation on fruit quality and mineral nutrition in loquat fruit[J].Journal of Fruit Science,2020,37(4):540-552.(in Chinese)

[4] Huang X,Wang H K,Qu S C,et al.Using artificial neural network in predicting the key fruit quality of loquat[J]. Food Science & Nutrition,2021,9(3):1780-1791.

[5] 贾文艺, 姚婕.苏州东山枇杷营销策略分析[J].中国市场,2021(15):130-131.

Jia W Y,Yao J.Analysis on marketing strategy of Suzhou Dongshan loquat[J].China Market,2021(15):130-131.(in Chinese)

[6] 贺金娜,刘布春,刘园,等.鲜食葡萄天气指数保险设计:以环渤海主产区瓦房店连阴雨灾害为例[J].中国农业气象,2022,43(10):810-820.

He J N,Liu B C,Liu Y,et al.Insurance design of table grape weather index: taking the continuous rain disaster in Wafangdian,the main production area around the Bohai sea as an example[J].Chinese Journal of Agrometeorology,2022, 43(10):810-820.(in Chinese)

[7] 陶正达,李浩宇,赵静娴,等.2019-2021年东山枇杷气候(气象)条件评价与对比分析[J].中国农学通报,2022,38(23): 95-101.

Tao Z D,Li H Y,Zhao J X,et al.Analysis report of agrometeorological conditions during growing season of summer harvest crops in 2022[J].Chinese Agricultural Science Bulletin,2022,38(23):95-101.(in Chinese)

[8] Kommareddi L S,Sha L.Machine learning using satellite remote sensing to predict agricultural yield of cash crops in USA[M].Singapore:Springer,2021:585-598.

[9] Das B,Murgaonkar D,Navyashree S,et al.Novel combination artificial neural network models could not outperform individual models for weather-based cashew yield prediction [J].International Journal of Biometeorology,2022 (1):1-12.

[10] 唐余学, 罗孳孳, 范莉,等. 基于关键气候因子的中稻单产动态预报[J].中国农业气象,2011,32(2):140-143.

Tang Y X,Luo Z Z,Fan L,et al.The dynamic prediction of mid-season rice yield based on key meteorological factors [J].Chinese Journal of Agrometeorology,2011,32(2):140- 143.(in Chinese)

[11] 高俊杰,袁业溶,梁应.高要区早稻产量预测模型的建立[J].广东气象,2022,44(2):50-52.

Gao J J,Yuan Y R,Liang Y,et al.Establishment of early rice yield prediction model in Gaoyao district[J].Guangdong Meteorology,2022,44(2):50-52.(in Chinese)

[12] 顾雅文,姚艳丽,傅玮东.基于关键气候因子的阿克苏地区苹果产量预测模型[J].新疆农业科技,2021(2):22-24.

Gu Y W,Yao Y L,Fu W D.Apple yield prediction model based on key meteorological factors in Aksu region[J]. Xinjiang Agricultural Science and Technology,2021(2):22- 24.(in Chinese)

[13] 袁小康,刘富来.油菜气象产量4种分离方法的效果对比[J].贵州农业科学,2022,50(8):112-118.

Yuan X K,Liu F L.Comparative study on four method forseparating rape meteorological yield[J].Guizhou Agricultural Sciences,2022,50(8):112-118.(in Chinese)

[14] 何虹,王巧娟,李亮,等.宁夏引黄灌区玉米趋势产量与气候产量分离方法研究[J].灌溉排水学报,2022,41(4):30-39.

He H,Wang Q J,Li L,et al.Separating the effect of meteorology on maize yield from the impact of other factors in the Yellow River-water irrigated regions in Ningxia of China[J].Journal of Irrigation and Drainage, 2022,41(4):30-39.(in Chinese)

[15] Li X Y,Zhang Y,Zhao Y X,et al.Comparative study on main crop yield separation methods[J].Journal of Applied Meteorological Science,2020,31(1):74-82.

[16] Rahman M M,Islam M A,Mahboob M G,et al.Forecasting of potato production in Bangladesh using ARIMA and Mixed Model approach[J].Sch J Agric Vet Sci,2022,10: 136-145.

[17] 蔡淑芳,林营志,吴宝意,等.利用线性和非线性耦合方式建立温室温湿度预测模型[J].中国农业气象,2022,43(7): 527-537.

Cai S F,Lin Y Z,Wu B Y,et al.Greenhouse temperature and humidity prediction models based on linear and nonlinear coupling methods[J].Chinese Journal of Agrometeorology, 2022,43(7):527-537.(in Chinese)

[18] 李威,顾峰雪.区域作物产量的模型预测研究[J].农业展望,2020,16(3):104-111.

Li W,Gu F X.Prediction of regional crop yield based on model[J].Agricultural Outlook,2020,16(3):104-111.(in Chinese)

[19] 冯敏玉,孔萍,胡萍,等.基于花前物候利用灰色关联分析法建立油菜花期预报模型[J].中国农业气象,2021,42 (11):929-938.

Feng M Y,Kong P,Hu P,et al.Prediction model of flowering date of rape established by using grey relational analysis method based on pre-flowering phenology[J].Chinese Journal of Agrometeorology,2021,42(11):929-938.(in Chinese)

[20] Li X Y,Zhang Y,Zhao Y X,et al.Comparative study on main crop yield separation methods[J].Journal of Applied Meteorological Science,2020,31(1):74-82.

[21] Prodhan F A,Zhang J,Sharma T P P,et al.Projection of future drought and its impact on simulated crop yield over South Asia using ensemble machine learning approach[J]. Science of the Total Environment,2022,807(3):151029.

[22] Cheng J,Sun J,Yao K, et al.A variable selection method based on mutual information and variance inflation factor [J].Spectrochimica Acta Part A:Molecular and Biomolecular Spectroscopy,2022,268:120652.

[23] 孙朝锋,林雯,黄川容,等.华南芒果种植区寒冻害危险性区划与评估[J].中国农业气象,2022,43(7):563-575.

Sun C F,Lin W,Huang C R,et al.GIS-based risk zoning and assessment of mongo cold and freezing injury in south China[J].Chinese Journal of Agrometeorology,2022,43(7): 563-575.(in Chinese)

[24] 马凡.基于气象数据的安徽省冬小麦产量预测模型研究[D].合肥:安徽农业大学,2020.

Ma F.Research on forecasting model of winter wheat yield in Anhui province based on meteorological data[D]. Anhui:Anhui Agricultural University,2020.(in Chinese)

[25] Zhou Y,Wang L,Qian J.Application of combined models based on empirical mode decomposition,deep learning,and autoregressive integrated moving average model for short-term heating load predictions[J].Sustainability,2022, 14(12):7349.

[26] Ning L,Pei L,Li F.Forecast of China’s carbon emissions based on ARIMA method[J].Discrete Dynamics in Nature and Society,2021:1-12.

[27] Mohamed J.Time series modeling and forecasting of somaliland consumer price index: a comparison of ARIMA and regression with ARIMA errors[J].American Journal of Theoretical and Applied Statistics,2020,9(4):143-153.

[28] 孔令森,阎虎勤.对我国中小板股指预测的可行性研究[J].统计学与应用,2020,9(3):403-411.

Kong L S,Yan H Q.Feasibility study on the forecast of China’s small and medium board stock index[J].Statistics and Application,2020,9(3):403-411.(in Chinese)

[29] 叶德谦,王毅.一种对二次指数平滑预测中参数和初值的研究[J].燕山大学学报,2008(2):173-175.

Ye D Q,Wang Y.A study on parameters and initial values in quadratic exponential smoothing prediction[J].Journal of Yanshan University,2008(2):173-175.(in Chinese)

[30] 马兆骏,帅艳民,邵聪颖,等.基于WOFOST模型分析不同气候情景对辽宁典型雨养春玉米产量的影响[J].中国农业气象,2021,42(11):939-950.

Ma Z J,Shuai Y M,Shao C Y,et al.Effects of various climate scenarios on yield of typical rain-fed spring maize in Liaoning based on WOFOST model[J].Chinese Journal of Agrometeorology,2021,42(11):939-950.(in Chinese)

[31] 程准,鲁植雄.拖拉机液压传动系统特性模型修正与参数辨识[J].农业工程学报, 2022, 38(19):33-41.

Cheng Z, Lu Z X. Model modification and parameter identification of tractor hydraulic transmission system characteristics[J]. Transactions of the Chinese Society of Agricultural Engineering, 2022, 38(19):33-41.(in Chinese)

[32] 吴柏莹,智协飞,陈超辉,等.基于复卡尔曼滤波技术的华东区域风的多模式集成预报研究[J].气象,2022,48(4): 393-405.

Wu B Y,Zhi X F,Chen C H,et al.Multi-Model ensemble forecasts of wind over east China by using augmented complex extended Kalman Filter[J].Meteor Mon,2022,48 (4):393-405.(in Chinese)

[33] 陆杰英,孙丽颖,吴健达,等.增城香蕉产量的气象预报模型[J].广东气象,2022(3):64-67.

Lu Y J,Sun L Y,Wu J D,et al.Meteorological yield forecasting model of banana in Zengcheng[J].Guangdong Meteorology, 2022(3):64-67.(in Chinese)

[34] 王秋京,马国忠,王晾晾,等.基于灰色模型的黑龙江省水稻生育期热量指数分析及预测[J].中国农业气象,2018,39 (3):177-184.

Wang Q J,Ma G Z,Wang L L,et al.Prediction on heat index of rice in Heilongjiang province based on grey model[J]. Chinese Journal of Agrometeorology,2018,39(3):177-184. (in Chinese)

[35] Paudel D,Boogaard H,de Wit A,et al.Machine learning for regional crop yield forecasting in Europe[J].Field Crops Research,2022,276:108377.

[36] 孙少杰,吴门新,庄立伟,等.基于CNN卷积神经网络和BP神经网络的冬小麦县级产量预测[J].农业工程学报,2022, 38(11):151-160.

Sun S J,Wu M X,Zhuang L W,et al.Forecasting winter wheat yield at county level using CNN and BP neural networks[J].Transactions of the CSAE,2022,38(11):151-160. (in Chinese)

[37] 张旭晖,杨建全,王俊,等.江苏枇杷冻害发生规律及风险区划[J].江苏农业科学,2015,43(8):157-160.

Zhang X H,Yang J Q,Wang J,et al.Occurrence law and risk zoning of loquat freezing injury in Jiangsu province[J]. Jiangsu Agricultural Sciences,2015,43(8):157-160.(in Chinese)

Applicability Analysis of Several Separation Methods on Regional Yield Prediction of Cash Crops:Take Loquat in Wuzhong District as an Example

TAO Zheng-da1, ZHAO Jing-xian1, GU Jing-yi1, ZHENG Jun-hua2, WANG Jun1, TANG Xiao-hong1, CHEN Hong-liang1, YANG Da-qiang3

(1. Wuzhong District Meteorological Bureau, Suzhou 215128, China; 2. Dongshan Diversified Service Company of Wuzhong , Suzhou 215107; 3. DongshanAgriculture and Forestry Service Station of Wuzhong, Suzhou 215107)

Four yield separation methods were used in this study to analyze the applicability on meteorological yield separation of regional cash crops, which are the ARIMA model, GM model, linear trend and quadratic exponential smoothing method. With the use of these four methods, the yield forecast models based on meteorological factor are built for analyzing the prediction accuracy. The results showed that the meteorological yield of loquat separated by GM model and linear trend method were well matched with the agrometeorological disaster records. The correlation coefficients between the meteorological yield of loquat separated by four methods and nine meteorological factors were high. The correlation coefficients were 0.95(separated by ARIMA), 0.94(separated by GM model and linear trend method) and 0.93(separated by quadratic exponential smoothing method). The root mean square error(RMSE) and the mean absolute percentage error(MAPE) between the loquat yield predicted by GM model and the actual yield were the largest, which was reduced by 50.1% after taking the meteorological factors into account. RMSE between the loquat yield predicted by linear trends, ARIMA model and secondary exponential smoothing methods and the actual yield was 49.3%, 16.7% and 14.4%. Comparing the four yield separation methods, the GM model significantly outperformed other methods, followed by the linear trend method. Moreover, the ARIMA model was the worst. The RMSE and the MAPE between the loquat yield predicted by GM model and the actual yield were 3.0kg·ha−1and 15.2%. Overall, loquat meteorological yields separated by GM model and the linear trend method matched well with the agrometeorological disaster records. The GM model performed the best on loquat yield prediction, which shows that the GM model is more suitable for yield separation and prediction of regional cash crops.

Loquat production forecast; ARIMA model; GM model; Meteorological output

10.3969/j.issn.1000-6362.2023.10.002

收稿日期:2022−12−19

江苏现代农业产业技术体系建设项目实施方案[JARS(2021)121];苏州市吴中区农业干旱识别及危险性评估(SZKJ202007)

通讯作者:赵静娴,硕士,工程师,主要研究方向为气象为农服务,E-mail:1003635781@qq.com

陶正达,E-mail:15996370014@163.com

陶正达,赵静娴,顾荆奕,等.几种分离方法在区域经济作物产量预测上的适用性分析:以吴中区枇杷为例[J].中国农业气象,2023,44(10):876-888

猜你喜欢
吴中区气候因子单产
苏州吴中区创新七项举措 提升执法质效
苏州吴中区创新精准执法工作见成效
苏州吴中区坚守学训制度 实现动态夯基强能
农大农企联手创山西小麦最高单产新纪录
油菜“不务正业”,单产3.4吨
吴中区水土保持科技示范园
单产948.48千克!“金种子”迸发大能量
我国玉米单产纪录第七次被刷新
气候因子对烤烟质量风格特色的影响
四川水稻产量及其构成要素对不同生育期气候因子的响应分析