基于深度学习及传统机器学习模型估算山东省参考作物蒸散量

2022-04-06 05:06任传栋王志真
节水灌溉 2022年3期
关键词:中位数斜率阀门

任传栋,王志真,马 钊,张 敏

(山东省水利勘测设计院,济南250013)

0 引 言

蒸散(Evapotranspiration,ET)由植株蒸腾与株间蒸发2部分组成,其值的准确估算对灌溉需水量确定及农田生态系统评价意义重大[1,2]。参考作物蒸散量(Reference crop evapotranspiration,ET0)的估算精度在一定程度上决定了ET的估算精度,它是作物系数法估算区域ET的重要参数之一[3]。FAO-56 分册规定的Penman-Monteith(PM)模型综合考虑了能量平衡和空气动力学的相关理论,是估算ET0的标准模型[4,5]。PM 模型计算时涉及到了多个气象参数,例如最高温度、最低温度、相对湿度、风速等,这使得该模型的广泛应用性受到了一定的限制[6]。因此,研究区域ET0估算的简化模型,在保证估算精度的前提下使用较少的气象参数,这对区域灌溉决策的制定具有十分重要的意义。

为更好地估算区域ET0,研究学者采用了多种ET0简化计算的经验模型,例如温度模型、辐射模型、质量传输模型、蒸发皿模型等,在这些模型中,温度模型、辐射模型和质量传输模型的应用较广泛[7,8]。Almorox 等[9]研究比较了11 种温度模型的计算精度,指出了Hargreaves(HS)模型精度最高;杨永刚等[10]在中国三大灌区比较了8 种温度模型的精度,指出HS 模型在河套灌区的精度最高;Feng 等[11]比较了Priestley-Taylor(PT)、Makkink(MK)和Ritchie (RC)3 种辐射模型的精度,指出PT 模型在3 种辐射模型中的精度最高;吴宗俊等[12]利用差分进化算法对MK 模型进行了改进,并在四川盆地验证了该模型精度,指出改进后的MK 模型R2可达0.87,精度优于其余模型;褚荣浩等[13]比较了质量传输模型与其余10 种模型的精度,验证了质量传输模型的适用性。尽管经验模型已表现出了出色的性能,但它们的性能在不同地区之间存在很大差异[14]。

近年来,深度学习模型已在不同领域证明了其精度,深度学习模型应用最广泛的包括深度神经网络(DNN)、时间卷积神经网络(TCN)和长短期记忆神经网络(LSTM)3 种[14]。Zhang 等[15]基于LSTM 模型预测了中国西北干旱地区河套灌区五个分区的地下水位深度动态变化;Wang 等[16]在地下水流动中验证了DNN 模型的精度;邢立文等[17]在华北地区验证了LSTM模型的精度。

深度学习模型已在不同领域取得了较高的精度,但在ET0估算中的应用仍然较少。为证明深度学习模型在ET0估算中的适用性,本文以山东省为研究区域,选择DNN、TCN 和LSTM 3 种深度学习模型估算区域ET0,并将计算结果与传统机器学习模型和经验模型进行对比,在有限气象资料输入的条件下,找寻最优模型。

1 研究区域概况与研究方法

1.1 研究区域概况及数据来源

山东省位于我国中东部沿海地区,属暖温带季风气候区,降水时空分布不均,旱涝灾害频发对当地经济造成了严重影响。由于区域地形变化较大,导致区域水循环差异明显,因此,研究山东省的ET0最优估算模型,对当地防旱防涝政策的制定具有十分重要的意义。本文选择山东省惠民、青岛、济南等10 个站点1980-2018年的逐日气象数据,气象数据来自国家气象数据中心,质量控制良好,主要包括日最高气温(Tmax)、最低气温(Tmin)、日照时数(n)、相对湿度(RH)和10 m处风速(U10),站点分布情况可见图1。

1.2 研究方法

1.2.1 Penman-Monteith模型

Penman-Monteith 模型(PM 模型)可作为ET0计算的标准模型[4],具体公式如下:

式中:Rn为作物表面的净辐射,MJ/(m2·d);T为2 m 高处的日均气温,℃;G为土壤热量通量密度,MJ/(m2·d);U2为2 m 高处风速,m/s;采用FAO 推荐方法[4]由10 m 风速换算得出;es为饱和水汽压差,kPa;ea为实际水汽压差,kPa;Δ为蒸汽压曲线的斜率,kPa/℃;γ为干湿计常数,kPa/℃。

1.2.2 深度学习模型

(1)长短期记忆神经网络。长短期记忆神经网络模型(LSTM)可有效记忆数据历史规律,避免了传统神经网络模型数据参数的随机性。该模型由输入阀门、遗忘阀门、更新阀门和输出阀门4部分组成。通过阀门的开启与关闭,判定模型计算结果能否满足精度要求,模型具有步骤可见文献[17]。

①遗忘阀门。LSTM 模型的遗忘阀门Fi基于sig 激活函数,读取旧元素的输出值Yi-1和新元素的输入值Xi,并基于模型权重判定是否应该保留新元素,原理公式如下:

式中:Fi为模型遗忘阀门;W为权重;b为偏执矢量;σ为sig激活函数。

②输入阀门。输入阀门Ii可判断输出值能否达到预期,输入阀门不但可以决定当前元素的输出值Yi,同时可基于tanh激活函数创建新的候选变量,从中选出最优值,原理公式如下:

式中:Ii为模型输入阀门;tanh 为模型激活函数;Ui为候选变量,其余参数含义同上。

③更新阀门。更新阀门Zi将输入阀门与遗忘阀门相乘,来判断当前元素的状态是否由Si-1更新到Si,原理公式如下:

④输出阀门。输出阀门Oi计算当前元素的输出值Yi,基于sig和tanh 2个激活函数最终确定模型输出值,原理公式如下:

式中:Yi为模型输出值;Oi为输出阀门,其余参数含义同上。

(2)时间卷积神经网络。时间卷积神经网络(TCN)是Bai 等[18]在传统卷积神经网络(CNN)的基础上发展起来的。与CNN 模型相比,TCN 模型具有因果卷积和扩展卷积两个显著的特征,使得TCN 模型在解决序列问题上明显优于一些传统神经网络模型,在TCN 模型计算中,时间t的输出包含了之前的信息,这意味着TCN 模型可以“记忆”更长的过去信息。当考虑随意卷积和扩张卷积时,时间t的输出可用下式表示,模型具体步骤可见文献[18]。

式中:F(t)为时间t的输出函数;fi为滤波函数;xi为输入项;d为修正系数;K为输入项的个数。

(3)深度神经网络。深度神经网络(DNN)是一种新型的人工神经网络模型,其权值和偏差通过BP 神经网络模型进行训练。与传统的BP 神经网络模型相比,DNN 模型具有更多的隐藏层,使其具有强大的能力来处理许多行业的回归和分类任务,DNN 模型包括两个主要过程,分别为前馈过程和误差反向传播过程,具体步骤可见文献[6]。

1.2.3 传统机器学习模型

为进一步证明深度学习模型的精度,本文选择了3种传统机器学习模型,分别为极限学习机模型(ELM)、广义回归神经网络模型(GRNN)和随机森林模型(RF),在相同气象参数输入的条件下,比较3 种传统机器学习模型与3 种深度学习模型的精度,3种传统机器学习模型步骤可见文献[2]。

1.2.4 经验模型

为进一步验证深度学习模型在不同气象参数输入下的精度,本文选择了6 种经验模型进行精度对比,包括2 种温度模型、2 种辐射模型和2 种质量传输模型,具体公式和参数含义可见表1。

表1 经验模型公式及参数

1.3 模型验证与精度对比

采用3 种气象参数输入组合训练模型,分别对应基于辐射、温度的和质量传输的经验模型。基于1980-2010年的气象数据训练模型,2011-2018年的数据预测模型,不同气象组合方式可见表2。

表2 不同模型参数组合输入方式

选择均方根误差(RMSE)、决定系数(R2)、平均绝对误差(MAE)和效率系数(Ens)组成模型精度指标评价体系,公式如下:

式中:Xi和Yi分别为模型模拟值及实测值;-X和-Y分别为Xi和Yi的平均值。

GPI指数可整合4个指标的综合评价结果[24],公式如下:

式中:αj为常数;MAE和RMSE取1,Ens和R2取-1;gj为不同指标的缩放值的中位数;yij为不同指标的尺度值。

2 结果与分析

2.1 不同温度模型模拟精度对比

表3 反映了不同温度模型与PM 模型计算结果拟合方程斜率对比。表4 显示,TCN 模型拟合方程斜率最接近标准值“1”,在不同站点均达到了0.80 以上。3 种深度学习模型的拟合效果均优于其余模型,拟合效果由高到低依次为TCN 模型>LSTM模型>DNN模型,3种模型拟合方程斜率均在0.749以上。相同气象参数输入条件下,机器学习模型精度普遍优于经验模型,HS模型、DA模型与PM模型计算结果的拟合性较差。

表3 不同温度模型ET0日值与PM模型标准值拟合方程斜率对比

图2 为不同温度模型的计算精度对比。由图2 可以看出,不同温度模型计算精度存在差异,其中TCN 模型在不同模型中的精度最高,其RMSE、R2、Ens、MAE的中位数分别为0.523 mm/d、0.874、0.870和0.388 mm/d。3种深度学习模型精度普遍优于其余模型,3 种深度学习模型的RMSE、R2、Ens和MAE的中位数分别为0.523~0.674 mm/d、0.788~0.874、0.784~0.870 和0.388~0.502 mm/d。3 种传统机器学习模型精度优于2种经验模型,其中RF 模型和ELM 模型的精度较高,GRNN 模型的精度较低。HS 模型和DA 模型的精度较低,其RMSE、R2、Ens和MAE的中位数分别为0.964 和1.117 mm/d、0.741 和0.736、0.560 和0.507、0.761 和0.897 mm/d。总体而言,与其余模型相比,深度学习模型表现出更好的计算精度,其在不同站点的精度均较高,计算结果的随机性较低。

图2 不同温度模型模拟ET0精度对比

2.2 不同辐射模型模拟精度对比

表4 为不同辐射模型与PM 模型计算标准值拟合方程斜率对比。表4显示,辐射模型的拟合效果明显优于温度模型,同时TCN 模型效果最优,其在不同站点的拟合方程斜率在0.904~1.021之间。3种深度学习模型的拟合效果均优于其余模型,拟合效果表现为TCN模型>LSTM模型>DNN模型,拟合方程斜率均在0.85 以上。相同气象参数输入条件下,机器学习模型精度普遍优于经验模型,HS 模型、DA 模型与PM 模型计算结果的拟合性较差,拟合方程斜率距标准值“1”的偏差较大,表明经验模型在计算ET0时具有较大的随机性。

表4 不同辐射模型ET0日值与PM模型标准值拟合方程斜率对比

图3 为不同辐射模型的计算精度对比。由图3 可以看出,不同辐射模型计算精度存在差异,但精度总体优于温度模型,其中TCN 模型在不同模型中的精度最高,其RMSE、R2、Ens、MAE的中位数分别为0.319 mm/d、0.952、0.950和0.231 mm/d。3 种深度学习模型精度普遍优于其余模型,RMSE、R2、Ens和MAE的中位数分别为0.319~0.409 mm/d、0.920~0.952、0.921~0.950 和0.231~0.307 mm/d,其中,TCN 模型精度最高,LSTM模型精度次之。3种传统机器学习模型精度优于2种经验模型,其中ELM 模型和RF 模型的精度较高,RMSE、R2、Ens和MAE的中位数分别为0.416 和0.444 mm/d、0.915 和0.907、0.914 和0.904、0.330 和0.328 mm/d。HS 模型和DA 模型的精度较低,其RMSE、R2、Ens和MAE的中位数分别为0.726 和0.769 mm/d、0.806和0.838、0.738和0.712、0.555和0.601 mm/d。

图3 不同辐射模型模拟ET0精度对比

2.3 不同质量传输模型模拟精度对比

表5 为不同质量传输模型与PM 模型计算标准值拟合方程斜率对比。表5显示,质量传输模型的拟合效果介于温度模型与辐射模型之间,同样表现为TCN 模型拟合精度最高,其在不同站点的拟合方程斜率均在0.886~0.979 之间。3 种深度学习模型的拟合效果均优于其余模型,拟合方程斜率均在0.85以上。HS 模型、DA 模型与PM 模型计算结果的拟合性较差,拟合方程斜率与标准值“1”的偏差在0.163~0.367之间。

表5 不同质量传输模型ET0日值与PM模型标准值拟合方程斜率对比

图4 为不同质量传输模型的计算精度对比。由图4 可以看出,不同质量传输模型的精度明显优于温度模型,但略低于辐射模型。TCN 模型在不同模型中的精度最高,RMSE、R2、Ens、MAE的中位数分别为0.358 mm/d、0.943、0.939 和0.263 mm/d。相同输入参数下的机器学习模型精度普遍优于经验模型,其中3种深度学习模型的精度较高。HS模型和DA 模型的精度较低,其RMSE、R2、Ens和MAE的中位数分别为0.851 和0.870 mm/d、0.706 和0.740、0.683 和0.685、0.731 和0.714 mm/d。

图4 不同质量传输模型模拟ET0精度对比

综上所述,深度学习模型精度普遍优于其余模型,其中,TCN模型在不同气象参数输入下均表现出了较高的精度。

2.4 不同模型GPI对比

为综合判定不同输入参数组合下不同模型的计算精度,本文综合比较了24 种模型的GPI,结果见图5。由图5 可以看出,在不同模型中,辐射模型精度最高,质量传输模型精度次之,温度模型精度较低。TCN2 模型在所有模型中精度最高,GPI 中位数为1.036,LSTM2 模型精度次之,GPI 为0.975。温度模型和质量传输模型中,均表现为TCN 模型精度最高,GPI 分别为-0.006 和0.873。相同参数输入下的经验模型精度较低,其中HS和DA模型GPI仅为-2.365和-2.877。

图5 不同参数输入组合下不同模型GPI对比

3 讨 论

已有研究表明,输入气象参数组合的不同对模型预测ET0的精度起着主要作用[25]。不同区域研究均表明,辐射数据是保障ET0较高估算精度的关键参数[26]。Feng 等[27]指出基于温度和辐射参数作为机器学习模型的输入组合,可保证模型较高的精度。3 种类型模型表现出的精度由高到低依次为辐射模型、质量传输模型、温度模型,表明辐射是影响山东省ET0变化的关键因素。董旭光等[28]指出近50年,日照时数和风速是影响山东省ET0变化的主要因素,这与本文结论基本一致。当仅有温度数据输入时,机器学习模型精度高于经验模型,可满足ET0估算的精度要求。需要指出的是,本文中不仅使用了气温数据(Tmin和Tmax),而且将Ra数据作为了温度组合重要的输入参数,Ra数据可从年日和纬度得到,可近似作为全球太阳辐射,引入Ra作为训练数据的输入,提高了基于温度模型的准确性。在中国,温度资料的获取是最为方便的,因此基于温度的机器学习模型可实现实时快捷预报ET0,从而改善灌溉和水资源管理[29]。对于质量传输模型,与温度模型相比,引入相对湿度和风速等气候数据,可提高模型精度,但其精度低于辐射模型,因此,对于质量传输模型的应用性有待进一步讨论。

传统机器学习模型参数确定的随机性导致了模型误差较大,影响了最终模型模拟的结果。本文比较了3种深度学习模型与其余传统机器学习模型的精度,指出了3种深度学习模型的精度普遍较高,因此,深度学习模型可以有效避免参数的随机性选取,从而产生随机初始化权值和隐藏偏差,最终避免了非最优解,提高了模型精度[30]。深度学习模型通过对模型训练数据的学习,从而自行进行数据特征选择,能够更好地揭示数据的客观规律,提高模型精度。TCN 模型的广泛应用可为农业、水利、气象部门活动提供数据支撑,保证国家粮食生产及水资源的合理利用。

4 结 论

本文以LSTM 模型、TCN 模型和DNN 模型3 种深度学习模型为基础,与ELM、GRNN、RF3 种传统机器学习模型和HS、DA等6种经验模型对比,找到山东省ET0估算的最优模型,得出以下结论:

(1)3 种深度学习模型精度普遍优于其余模型,TCN 模型具有最高的精度,在不同站点拟合方程斜率最接近标准值“1”,RMSE、R2、Ens、MAE的中位数在0.318~0.523 mm/d、0.874~0.952、0.870~0.950、0.231~0.388 mm/d,TCN 模型在所有模型中GPI数值均最高;

(2)基于辐射的模型优于基于温度和质量传输的模型,TCN2 模型在所有模型中精度最高,其RMSE、R2、Ens、MAE的中位数分别为0.318 mm/d、0.952、0.950、0.231 mm/d,同时GPI达到了1.036,在所有模型中排名第1位。

综上所述,深度学习模型可作为区域ET0估算的推荐模型使用,其中以TCN模型精度最高。

猜你喜欢
中位数斜率阀门
上海一核阀门股份有限公司
数据的数字特征教学设计
巧甩直线斜率公式解数学题
核电站阀门紧急采购系统的构建
核电站阀门紧急采购系统的构建
求斜率型分式的取值范围
省力阀门瓶盖
中位数教学设计
导数几何意义的深层次应用
2011年高考山东卷.理22(Ⅰ)别解