陈志超,蒋贵印,张正,芦俊俊,王新兵,娄卫东,刘昌华,苗宇新,3,郝成元
(1.河南理工大学 测绘与国土信息工程学院,河南 焦作 454000;2.中国农业大学 资源与环境学院,北京 100194;3.明尼苏达大学 精准农业中心,明尼苏达大学土壤、水和气候系,圣罗保 55108,美国)
玉米产量受诸多因素影响,其中氮素作为植株中叶绿素、蛋白质和酶的重要组成部分,对作物的生长发育起着重要作用。玉米对氮素的需求量随生长期而变化,其含量充足与否,显著影响作物的产量与品质[1]。遥感技术因其无损、快速、大面积、低成本[2-3]的独特优势,在快速无损准确诊断氮营养状况方面得到了的广泛应用。
高光谱遥感因其分辨能力强[4]、重访周期已系统应用于田间冠层光谱遥感信息获取、农作物产量预测、生长养分检测和病虫害监测防治等领域。国内外已有大量基于无人机低空高光谱成像遥感技术作物养分检测的试验研究。通过对作物冠层高光谱信息进行遥感技术处理,采用传统经验算法和机器学习算法等数学及计算机知识,建立作物氮营养指数的定量反演估测模型。芦俊俊[5]基于无人机搭载Mini-MCA多光谱相机,获取了不同生育期和不同处理的田间水稻多光谱遥感影像,利于红外波段建立并筛选出最优植被指数,构建水稻氮素含量的最优反演估测模型(决定系数R2=0.87);刘昌华等[6]研究了冬小麦在不同氮梯度下的冠层高光谱遥感信息,对比不同光谱预处理方法,并与机器算法结合,建立并对比分析获得了基于冬小麦冠层高光谱遥感信息的氮营养指数最佳反演模型。
本文以东北春玉米为研究对象,利用UHD185高光谱成像系统,采集春玉米冠层高光谱信息,基于传统遥感技术数据处理方法,采用5种常见算法对原始春玉米冠层高光谱遥感数据进行光谱预处理,结合3种回归算法探索最佳春玉米氮素营养诊断模型。从数据分析角度,东北春玉米冠层高光谱遥感数据与春玉米氮营养指数构建模型,对比不同模型春玉米氮素诊断精度,筛选出最佳高光谱预处理方法和回归算法,基于构建模型探讨了春玉米氮营养指数反演能力。
研究区位于我国东北吉林省四平市梨树县,县界极值大地坐标为(123°45′~124°53′)E,(43°02′~ 43°46′)N,总面积为4 209 km2,地处吉东低山丘陵与辽河平原过渡带,东依大黑山,西接辽河平原,地势东南高,西北低。土壤肥力上等,土层深厚,土质较好,大约70%的耕地用于种植玉米。研究区属北温带半湿润大陆性季风气候,四季分明,日照、降水较充足。
试验在不同密度、不同氮梯度和不同氮肥管理的田块小区进行。供试土壤类型为黑土,玉米为当地春玉米品种(良玉66)。试验田采用裂区设计,采用随机区组排列,共3个重复(R),(6×3×3)个小区,每个小区面积为9 m×12 m,各小区用于生育期内取样的面积占比为2/3,剩余面积用于成熟期取样测产。其中,设置主处理为种植密度D株/hm2,分别设置为D1=55 000,D2=70 000,D3=85 000;设置副处理为施氮量N,kg/hm2,共设有6个梯度,分别为N0=0,N1=60,N2=120,N3=180,N4=240,N5=300。除肥料以外的栽培、灌溉与农药防治、杂草及病虫害等管理方式均参照当地标准进行,且试验均在相同田块进行。试验田小区示意图如图1所示。
图1 试验小区示意图Fig.1 Sketch map of experiment plot
地面取样和无人机高光谱遥感数据获取工作同时展开,在春玉米生育关键时期进行高光谱测定后立即取样。
地上部生物量(w)测定方法:将每个试验小区量测过的3株玉米洗净泥土,茎叶分离后杀青处理(烘箱温度为105 ℃,时长为30分钟)、烘干(烘箱温度为70 ℃),恒重后称量,得到植株生物量,再根据玉米的实际种植密度换算得到群体地上部生物量。
植株氮质量分数测定方法:将烘干后的部分玉米植株部分样品粉碎研磨成均匀粉末状,放置于H2SO4-H2O2溶液中矿化消煮,用凯氏定氮仪测定,获得的数据即为玉米植株氮质量分数[9]。
植株临界氮质量分数(Nc)是玉米地上部生物量干重达到最大增长率时所需的最低氮质量分数值,通常根据氮质量分数稀释模型求得,其计算公式为
Nc=36.5×W-0.48,
(1)
氮营养指数(nitrogen nutrient index,NNI)作为重要的氮素诊断指标,直接反映作物氮营养是否充足[10],已广泛应用于作物氮营养诊断研究。根据玉米NNI阈值,将玉米氮营养状态划分为3种情况:氮不足(NNI<0.95);氮适宜(0.95≤NNI≤1.05);氮过量(NNI>1.05)。其计算公式[11]为
(2)
式中:PNU为植株吸氮量(Plant Nitrogen Uptake,kg/ha);PNUa为实测吸氮量;PNUc为临界吸氮量。
通过测定,本研究中春玉米氮营养状况的农学指标描述性统计如表1所示。
表1 春玉米地上部生物量、株氮浓度及氮营养指数的描述性统计Tab.1 Descriptive statistics of spring maize plant,N concentration and N nutrition index
采用UHD185高光谱成像系统,光谱波段共138个,相邻光谱波段采样间隔为4 nm。经筛选,共选用UHD185高光谱成像仪中的125个波段进行研究,光谱为454~950 nm,选用旋翼无人机系统作为遥感数据采集平台(图2)。无人机高光谱遥感数据获取和地面取样工作同时展开,在春玉米生育关键时期进行高光谱测定后立即取样,具体时间分别为2016年7月30日、2017年6月30日和2017年7月30日,且均在晴朗无云天气下,于当天10:00 AM—14:00 PM进行。试验使用的飞行控制系统可记录无人机在飞行过程中的位置姿态系统信息,以确保良好的影像质量。由于田块间地物特征点区别不明显,为获得更好的拼接效果,无人机航线设定为航向重叠率85%,旁向重叠率75%。为提高效率,本试验在实际操作中将无人机航线设置为4条,相对航高设置为100 m,拍照间隔设置为等距离,实现整个玉米试验田区域的全覆盖。
图2 无人机高光谱成像系统Fig.2 UAV hyperspectral system
基于传统遥感技术数据处理方法,选用5种常用算法对获取的春玉米冠层原始高光谱遥感数据进行预处理。5种算法分别为:卷积平滑滤波法(savitzky-goIay smoothing,SG)、基线校正法(baseline correction,BC)、多元散射校正法(muItipIe scatter correction,MSC)、标准正态变换法(standard normaI variate transformation,SNV)、去趋势算法(de-trending,D)。为了与原始高光谱遥感数据对比,将原始高光谱遥感数据简记为Unt(untreated hyspectral data)。分别将预处理后获得的玉米冠层高光谱反射率、原始高光谱反射率与春玉米生育关键时期通过地面取样工作测定的氮营养指数进行相关性分析,分析结果见图3。
图3 春玉米氮营养指数与不同预处理高光谱遥感数据的相关性曲线Fig.3 Correlation curves of Hyperspectral reflectance and nitrogen nutrition index of spring corn under different pretreatment
在不同年份、生育期的作物冠层波段反射率易受土壤背景、大气参数及自身饱和性等影响,通过高光谱特征参数筛选和植被指数变量归一化或参数优化后可减少这一影响。本文基于3种变量类型(位置、面积、植被指数)进行高光谱特征参数[12]筛选,并将获取的高光谱特征参数根据筛选原则分为3大类:
(1)基于位置的高光谱特征参数。分别从原始高光谱和一阶微分处理的高光谱中选取绿光波段反射率最大值、红光波段反射率最小值、红边波段反射率最大值、黄边波段反射率最大值和蓝边波段反射率最大值及其对应的光谱波长位置,其中蓝边波段为490~530 nm;黄边波段为550~582 nm;红边波段为680~780 nm。
(2)基于面积的高光谱特征参数。分别选取红边波段、黄边波段和蓝边波段,并在其波长范围内计算出对应的一阶微分波段值的总和。
(3)基于植被指数的高光谱特征参数。将(1)、(2)筛选获得的参数进行比值或归一化运算,构建出植被指数型的高光谱特征参数。
在此筛选方法下,共获取了19种高光谱特征参数进行春玉米氮营养指数模型构建与研究。
以春玉米冠层高光谱遥感各波段反射率组合计算的19个高光谱特征参数为自变量(x),春玉米关键生育时期获取的氮营养指数为因变量(y),分别选用偏最小二乘回归分析、BP神经网络回归分析和随机森林回归分析对春玉米氮营养指数数据与春玉米冠层高光谱特征参数进行建模。为进一步筛选最佳模型,依据3个判定指标检验构建模型的精度与可靠性,即决定系数(determination coefficient,R2)、相对误差(relative error,RE)和均方根误差(root mean square error,RMSE)。
2.5.1 偏最小二乘回归分析
偏最小二乘法是一种多元统计数据分析方法[13],建模过程中,可以克服共线性问题,选取特征向量时,强调自变量对因变量的预测作用,去除对回归无益噪声的影响[14],从而解决用普通多元回归无法解决的问题[15]。本文利用UnscrambIer 9.7软件构建偏最小二乘回归分析模型。
2.5.2 BP神经网络回归分析
对于解决多参数、非线性拟合问题,人工神经网络因其深厚的理论支撑、有效的技术指导、学习性、容错性、实时性等优势,已广泛应用于诸多领域[16]。误差反向传播(back-propagation,BP)算法是目前人工神经网络应用中较为广泛的学习算法之一,由输入层、隐藏层和输出层组成,因其高度自学习和自适应等特点,能够较好地解决非线性问题[17]。本研究中,输入层神经元为择优筛选的高光谱特征参数,输出层为待估测的春玉米氮营养指数。BP神经网络回归分析模型在MATLAB R2014b软件中构建。神经网络采用3层结构,输入层到隐藏层激励函数和隐含层到输出层激励函数分别为tansig和purelin函数。其中,BP神经网络迭代次数为100;结点数为10;学习率调试为1%;学习目标为0.01%。
2.5.3 随机森林回归分析
随机森林算法是将多个决策树构成一个随机森林,是基于决策树算法的一种改进[18]。在处理回归问题时,随机森林算法保证了构成的所有决策树的平均值作为因变量预测的结果;在处理分类问题时,随机森林算法采用投票制方案,确定了最终分类类别。输入向量在多个决策树上运行,运行效率和准确率较高,善于学习复杂且高度非线性的关系[19]。基于随机森林回归分析算法构建模型,不仅训练和预测速度快,且对多元共线性问题不敏感,能较好地避免过拟合现象发生,降低异常值和噪声在构建模型中的干扰,因而备受国内外学者关注。本文利用MATLAB R2014b软件构建随机森林回归分析模型,其分类树设置为2 000,分割变量设置为2。
在春玉米关键生育时期对其氮营养状况进行快速判定和诊断评价有重要作用,可为进一步合理调控春玉米各时期氮肥施用量提供理论依据和技术支撑。
采用偏最小二乘回归分析方法,基于不同变量筛选出19个高光谱特征参数,结合不同传统遥感技术数据预处理方法,构建春玉米氮营养指数反演模型,模型精度(建模数据集、预测数据集)如表2所示。由表2可知,不同数据预处理方法下,采用偏最小二乘回归分析方法构建的春玉米氮营养指数反演模型精度相差较大。其中建模数据集均表现出较好的拟合效果,经过预测数据集验证后,除使用去趋势算法预处理外,其他方法拟合效果均表现稳定,差异较小。建模数据集中基于基线校正预处理方法结合偏最小二乘回归分析(baseline correction-partical least-squares regression,BC-PLSR)构建的春玉米氮营养指数反演模型,拟合效果最好,R2=0.85,且验证数据集验证后,评估效果达到最高,R2,RMSE,RE分别为0.79,0.10,11.84%(图4)。
图4 基于BC-PLSR回归模型反演春玉米氮营养精度Fig.4 Accuracy of BC-PLSR model between observed and predicted NNI of spring
表2 基于高光谱特征参数与氮营养指数的偏最小二乘回归分析的模型精度Tab.2 Model accuracy of partial least squares regression models between the hyperspectral characteristic parameters and NNI of spring maize
采用BP神经网络回归分析方法,基于不同变量筛选出19个高光谱特征参数,结合不同传统遥感技术数据预处理方法,构建春玉米氮营养指数反演模型,模型精度(建模数据集、预测数据集)如表3所示。由表3可知,在不同数据预处理方法下,采用BP神经网络回归分析方法构建的春玉米氮营养指数反演模型精度相差较大。其中建模数据集均表现出较好的拟合效果,经过预测数据集验证后,除未经预处理方法外,其他方法拟合效果均表现稳定,差异较小。建模数据集中基于多元散射校正预处理方法结合BP神经网络回归分析(multiple scatter correction-back-propagation,MSC-BPANN)构建的春玉米氮营养指数反演模型拟合效果最好,R2=0.91,且验证数据集验证后,验证评估效果达到最高,R2,RMSE,RE分别为0.80,0.10,12.21%(图5)。
表3 基于高光谱特征参数与氮营养指数的BP神经网络回归模型精度Tab.3 Accuracy of BPANN regression model between the hyperspectraI characteristic parameters and NNI of spring maize
图5 基于MSC-BPANN回归模型反演春玉米氮营养精度Fig.5 Accuracy of MSC-BPANN regression model between observed and predicted NNI of spring corn
采用随机森林回归分析方法,基于不同变量筛选出19个高光谱特征参数,与不同传统遥感技术数据预处理方法相结合,构建春玉米氮营养指数反演模型,模型精度(建模数据集、预测数据集)如表4所示。由表4可知,在不同数据预处理方法下,采用RF随机森林回归分析方法构建的春玉米氮营养指数反演模型精度均表现稳定,差异较小。建模数据集与预测数据集均表现出较好的拟合效果,相差较小。其中建模数据集中基于多元散射校正预处理方法结合RF随机森林回归分析(multiple scatter correction-random forest,MSC-RF)构建的春玉米氮营养指数反演模型拟合效果最好,R2=0.97,且验证数据集后,评估效果达到最高,R2,RMSE,RE分别为0.84,0.09,10.51%(图6)。
图6 基于MSC-RF回归模型反演春玉米氮营养精度Fig.6 Accuracy of MSC-RF regression modeI between observed and predicted NNl of spring maize
表4 基于高光谱特征参数与氮营养指数的RF随机森林回归模型精度分析Tab.4 Accuracy of random forest regression model between the Hyperspectral characteristic parameters and NNI of spring maize
综合对比6种光谱预处理方法和3种建模方法,在春玉米拔节时期追肥前,运用表现最好的反演模型,即MSC预处理结合RF随机森林算法构建的模型对试验田进行无人机遥感反演(图7)。随着氮肥施用量不断增加,春玉米的氮营养状态呈现出“不足→适宜→过量”的阶梯变化趋势。由于无人机高光谱影像空间分辨率较高,因此能清楚观测小区田块内的春玉米氮素变异,随着施氮量增加氮营养变异减小,有利于小区田块的精准氮素调控。
图7 MSC结合RF随机森林反演氮营养指数Fig.7 Result of validation NNI by using MSC-RF model
对比5种常用算法,对获取的春玉米冠层原始高光谱遥感数据进行预处理,其差异表现较为明显。基于基线校正法、去趋势算法、多元散射校正法、标准正态变换法的4种预处理结果相差较小;基于卷积平滑滤波法的预处理结果和未经处理的高光谱原始数据相关性轨迹趋于一致,差异较小。其中基于多元散射校正法和标准正态变换法的预处理效果较好,在450~520 nm的可见光波段和760~950 nm的近红外波段内呈极显著正相关关系。在550~750 nm波段内,对比5种预处理方法,其变化趋势较大。对比6种高光谱遥感数据预处理方法应用结果,使用多元散射校正法进行数据预处理效果最好。
对比3种建模方法的应用结果,RF随机森林算法最佳。综合3种回归分析方法与春玉米氮营养指数构建反演模型,使用随机森林算法构建的反演模型精度最大值比BP神经网络模型精度最大值提高了6.59%,比偏最小二乘回归模型精度最大值提高了18.29%。其中,基于多元散射校正预处理方法结合RF随机森林回归分析所构建的春玉米氮营养指数反演模型拟合效果最好,R2=0.97,且验证数据集后,验证评估效果达到最高,R2,RMSE和RE分别为0.84,0.09和10.51%。随机森林回归分析相较于偏最小二乘回归分析提升较明显,相较于BP神经网络回归分析略有提升,但随机森林算法训练速度快、效率高,当诊断大面积多样本春玉米氮营养状况时,随机森林算法优势更明显,在实际应用中具有实时、高效等优势,能够在理论、技术等领域为未来精准农业的进一步发展提供更优质的服务。
对比5种高光谱遥感数据预处理方法的应用结果,使用多元散射校正法进行数据预处理效果最好。综合3种模型,平均值建模数据集精度:RF随机森林回归模型(R2=0.96)>BP神经网络回归模型(R2=0.87)>偏最小二乘回归模型(R2=0.79);平均值预测数据集精度:RF随机森林回归模型(R2=0.82)>BP神经网络回归模型(R2=0.70)>偏最小二乘回归模型(R2=0.68)。其中基于多元散射校正法预处理数据构建的随机森林回归模型的反演效果最好,精度最高,模型最稳定,R2=0.97,建模数据集与预测数据集均表现出较好的拟合效果,相差较小,评估效果达到最高,R2,RMSE,RE分别为0.84,0.09,10.51%。
本文验证了氮营养指数农学指标诊断春玉米氮素营养状况的适用性,对比了多种预处理与回归模型反演春玉米氮营养指数的优势。通过建立春玉米氮营养指数高光谱估算模型,揭示春玉米生长过程中氮营养指数与高光谱特征参数之间的动态关系及规律,有利于在春玉米关键生育时期对其氮营养状况进行快速判定和诊断评价,为进一步合理调控春玉米各时期的氮肥施用量提供理论依据和技术支撑。