高光谱成像的水稻冠层穗颈瘟早期识别

2023-06-15 02:55袁建清仇逊超贾银江南洋苏中滨
关键词:感病植被指数冠层

袁建清, 仇逊超, 贾银江, 南洋, 苏中滨

1. 哈尔滨金融学院 计算机系,哈尔滨 150030;2. 东北农业大学 电气与信息学院,哈尔滨 150030

稻瘟病传染速度快, 危害严重, 是水稻重要病害之一[1]. 水稻稻瘟病最为普遍的是水稻拔节期的叶瘟病和灌浆期的穗颈瘟. 穗颈瘟病斑位置主要集中在穗颈、 穗轴或穗粒上, 直接影响水稻的质量和产量. 在水稻安全生产中, 加强穗颈瘟病害的防治是很重要的环节. 目前实际生产中的主要防治措施是政府组织集中利用无人机进行统一喷药或由农户凭经验提前喷药预防, 农药的过度施用, 使得农产品药残超标, 从而破坏生态, 污染环境. 因此, 水稻田间发病情况的准确监测和早期识别, 对水稻稻瘟病的提前防治、 精准施药具有实际指导意义.

高光谱成像技术具有无损、 高效的特点, 被广泛应用于作物品质检测[2-4]、 作物养分及产量监测[5-8]和病虫害识别[9-12]等. 在水稻病虫害方面, 黄双萍等[13]使用一种改进的深度卷积神经网络算法, 提取水稻穗株的穗颈瘟病斑, 建立了水稻穗颈瘟的检测模型; 袁建清等[14]采用不同光谱预处理方法, 结合不同特征提取方法和分类算法构建模型, 实现水稻缺氮叶片和不同感病程度水稻叶瘟病叶片的判别; Zhang 等[15]构建了基于叶片光谱比值的支持向量机评价模型, 实现了水稻叶片尺度的叶瘟病分级检测; 朱梦远等[16]采用多种预处理方法和不同分类算法建立模型, 实现水稻纹枯病的早期检测; 康丽等[17]提取特征变量作为输入, 建立了支持向量机多级分类模型, 实现水稻叶瘟病早期检测. Kobayashi等[18]利用航空高光谱遥感图像, 根据特征波段对水稻稻瘟病田间感病区域进行评估; 孔繁昌等[19]利用无人机高光谱平台获取水稻穗颈瘟冠层数据, 使用随机森林方法构建了水稻穗颈瘟分类模型. 综上所述, 研究者们对于实验室条件下的水稻病害机理做了深入的研究, 对田间稻瘟病的外业监测和识别还处于探索阶段, 需要进行更深入的研究.

近地冠层水稻稻瘟病的监测同航空、 航天遥感环境接近, 可以衔接机理研究和实际应用研究. 本研究在之前初探性研究的基础之上, 进行新数据采集, 扩充数据量, 对水稻冠层穗颈瘟的早期识别进行深入研究. 研究利用高光谱成像平台获取自然感病水稻大田的近地冠层图像, 提取并分析其光谱反射率特征, 采用不同特征提取方法, 分别结合判别分析和支持向量机分类算法, 构建水稻冠层穗颈瘟早期识别模型, 以期为稻瘟病的无人机航空、 卫星航天大面积遥感监测和识别提供一定的理论和技术支持.

1 材料与方法

1.1 高光谱图像采集

近地冠层水稻穗颈瘟数据的采集在黑龙江省哈尔滨市方正县水稻研究院和稻作博物馆进行. 方正县位于黑龙江省中南部, 松花江中游南岸、 长白山支脉张广才岭北段西北麓, 地理位置为128°13′41″-129°33′20″E, 45°32′46″-46°09′00″N, 面积约为3 000 km2. 方正县以水稻生产为主, 水稻为一年一熟, 一般在每年的5月中旬进行移栽插秧, 10月初进行收割. 本研究的信息采集于2019年8月16日和8月17日的11: 00-14: 00进行, 天气晴朗少风. 水稻穗颈瘟为自然感病, 处于感病初期. 共采集5块自然感病地块图像, 水稻品种均为“黑绥1166”.

研究使用Head Wall高光谱成像系统的室外平台进行数据采集, 室外采集系统由高光谱相机、 图像采集仪、 推扫平台、 笔记本电脑、 三脚架和白板构成, 另有发电机、 稳压器、 线轴和电源等设备. 每次采集数据时, 首先在推扫平台上把高光谱成像仪固定好, 进行高光谱成像仪的推扫设置, 根据实景情况设置倾斜角度和左右摆扫角, 角速度设置为0.5 deg/s, 接着进行相机镜头的对焦调试, 再进行暗电流校正和亮电流校正, 用镜头盖遮住镜头进行暗电流校正, 获得暗场高光谱图像, 用白板进行亮电流校正, 获得标准光谱图像, 对待校正光谱图像经公式(1)计算后, 最终得到校正后的高光谱图像, 即为真实的水稻冠层穗颈瘟高光谱图像.

(1)

式中:R为校正后高光谱图像的光谱反射率;Rr为待校正高光谱图像的光谱反射率;Rd为暗电流光谱反射率;Rw为亮电流光谱反射率.

为了消除拍摄时可能产生的几何变形和失真现象, 消除光照等产生的图像误差和辐射噪声, 使用RPC正射校正法和暗像素法对水稻穗颈瘟冠层影像进行几何校正和辐射校正. 对校正之后的影像, 使用ENVI软件的RIO工具进行感兴趣区的选取, 如图1所示, 每个感兴趣区大小为40×25 Pix, 这1 000个像素的平均反射率光谱即为一个冠层光谱样本. 根据5块水稻地块穗颈瘟感病情况, 结合图像采集时的标记, 共提取得到中度感病样本36个, 轻度感病和无病样本各32个(图像采集为穗颈瘟感病早期, 经植保专家鉴定, 没有重度感病情况), 共计100个光谱样本用于研究.

图1 水稻冠层穗颈瘟样本RIO选取示意图

1.2 高光谱数据预处理与裁剪

本研究采用5幅图像, 由于图像采集时间和地点不同可能会引起偏差, 因此对提取的水稻冠层穗颈瘟反射率光谱通过公式(2)进行标准化处理, 得到标准化光谱[20].

(2)

然后对标准化后的光谱进行5点、 3项式Savitzky-Golay卷积平滑预处理, 以消除样本间散射所引起的误差, 降低仪器和环境等产生的噪声影响.

Head Wall高光谱成像系统采集的光谱范围为400~1 000 nm, 采样间隔为3 nm. 910~1 000 nm波段范围光谱波动剧烈, 说明受环境、 机器噪音等的影响较大, 失真严重, 因此对这部分数据进行裁剪, 保留400~910 nm波段的光谱用于后续分析.

所有样本平滑后的反射率光谱如图2所示.

图2 水稻冠层全样本光谱

1.3 特征变量提取

高光谱数据中的大量冗余、 多重相关性的信息, 会增加模型复杂度, 降低模型精度和运算速度. 本研究采用主成分分析、 竞争性自适应重加权算法和植被指数方法提取水稻冠层穗颈瘟的光谱特征参数.

主成分分析法(Principal Component Analysis, PCA)是通过线性变换的方式将多变量转换为信息不重叠、 相互正交的新变量, 即为主成分. PCA能够尽可能多地保留有效信息, 并解决了大量原始数据信息的重叠性问题, 在高维数据降维、 特征提取等方面得到广泛应用.

竞争性自适应重加权法(Competitive Adaptive Reweighted Sampling, CARS)是基于蒙特卡洛采样法和偏最小二乘PLS模型回归系数的特征变量选择方法. 每次通过自适应加权采样技术保留PLS模型中回归系数绝对值权重较大的变量, 去掉权重值较小的变量, 建立基于新子集的PLS模型, 反复多次运算后, 选择交互验证均方根误差最小子集中的变量作为特征波长.

植被指数法(Vegetation Index, VI)是由两个或多个光谱数据, 经线性和非线性变换得到的具有一定植被指示意义的各种数值. 植被指数被广泛地应用于外业监测中, 研究参考文献, 选取能够反映植被胁迫和病害识别的植被指数、 适合于冠层遥感观测的植被指数以及三边一阶导数参数, 用于水稻穗颈瘟的判别.

1.4 分类建模算法

研究主要采用支持向量机(Support Vector Machine, SVM)和线性判别分析(Linear Discriminant Analysis, LDA)两种分类算法进行水稻冠层穗颈瘟早期识别模型的构建.

支持向量机是一种具有监督机制的机器学习方法, 它通过结构风险最小化原理、 最优化理论和核方法来提高泛化能力, 适用于小样本、 非线性以及高维特征空间等复杂问题的处理, 在很多领域得到广泛应用. 线性判别分析的主要思想是将一个高维空间中的数据根据特征投影到一个低维的空间向量上, 使得投影后各类别的类内方差小而类间均值差别大, 即相同类别的样本投影点聚在一起, 异类样本的投影点相距较远. LDA是一种经典的线性学习方法, 广泛地被应用于模式分类等领域.

本研究按照2∶1的比例随机划分建模集和预测集, 随机取出中度感病样本24个、 轻度感病和无病各21个, 共计66个样本用于模型的建立, 剩余34个样本用于模型的验证.

光谱数据提取与处理、 数据预处理、 光谱特征提取和建模用到的软件有ENVI 5.1, Excel 2010, SPSS 21, The Unscrambler 10.4和Matlab 7.1.

2 结果与分析

2.1 近地冠层水稻穗颈瘟光谱特征分析

分别计算水稻冠层中度感病、 轻度感病和无病样本的光谱平均值, 得到3类样本的平均高光谱反射率光谱曲线. 如图3所示, 感病水稻冠层反射率光谱整体变得平缓, 感病越严重越平缓. 比较3类样本存在着3个明显差异区间: 首先是绿波段反射蜂处, 这里是以566 nm为中心的波段区域, 感病水稻低于健康水稻, 感病越严重反射率越低. 其次是红光吸收谷处, 感病水稻在这个区间反射率高于健康水稻, 且中度感病高于轻度感病, 说明感病越严重在红光区域吸收作用越弱. 最后是近红外高反射平台, 感病水稻反射率低于健康水稻, 感病越严重反射率越低. 分析出现这些特征的原因, 主要是感病水稻因稻瘟病病菌的侵入破坏了水稻叶片、 穗颈、 穗轴等的细胞结构, 引起其间隙发生变化, 使得叶绿素等生化含量、 持水量降低, 光合作用强度降低, 导致感病水稻在绿光区间和近红外区间反射能力降低, 在红光区域吸收能力减弱. 通过上述分析得到水稻冠层穗颈瘟反射率光谱的3个敏感波段区域, 分别是以566 nm为中心的绿波段区域、 以786 nm为中心的近红外波段区域及以682 nm为中心的红光吸收谷处的波段区域.

图3 水稻冠层穗颈瘟的平均光谱曲线

2.2 PCA降维与植被指数选取

用PCA方法对水稻冠层光谱进行降维处理, 提取主成分, 前8个主成分(PCs)累积贡献率为97.78%, 各个主成分贡献率如表1所示.

表1 水稻冠层穗颈瘟前8个主成分的累积贡献率

研究参阅文献[21-25], 选取能够反映植被受病害胁迫、 表征生物量变化的植被指数, 包括氮反射指数NRI、 光化学植被指数PRI等5个植被指数, 以及适合冠层观测的土壤调整植被指数SAVI和可见光大气阻抗指数VARI, 加上植被病害分析中常用的蓝边、 黄边和红边3边参数共计13个参数. 通过单因素方差分析检验这13个参数对水稻冠层穗颈瘟均具有显著区分能力(显著水平为sig=0.05). 植被指数的定义和描述见表2. 根据2.1中水稻冠层穗颈瘟的光谱反射率特征分析得到的敏感波段, 计算宽波段植被指数时各参数取值为: 蓝光为450 nm, 绿光为566 nm, 红光为682 nm, 近红外光线为786 nm.

表2 冠层穗颈瘟植被指数

13个植被指数数量比较多, 参数间有可能存在数据共线性, 因此本研究尝试使用PCA法对13个植被参数做进一步降维处理, PCA处理显示前4个主成分的累积贡献率达到99.13%, 将这4个植被指数主成分(记为VI-PCs)用于模型构建分析.

2.3 CARS特征选取

用CARS对水稻冠层全部样本进行降维, 蒙特卡洛采样次数设为50, 特征波长的筛选过程如图4所示. 图4a显示, 随着采样次数的增加, 特征波长的个数逐步减小, 图4b显示, PLS模型的RMSECV随着采样次数的增加先是缓慢下降后又增大, 图4c表示变量回归系数的变化趋势, “*”是RMSECV的最小位置, 即采样次数为24次时, RMSECV值最小, 得到最优的特征变量组合. 共筛选出14个CARS特征波长, 分别是412.77, 534.27, 590.57, 620.21, 688.37, 709.12, 729.86, 753.57, 765.42, 800.98, 812.84, 827.65, 851.36, 860.25 nm.

图4 CARS特征波长选择过程

CARS筛选出14个特征波长, 与训练样本数量相比较, 特征数量偏多, 可能存在过拟合的风险, 本研究用PCA法对14个CARS特征波长进行降维处理, PCA处理得到前5个主成分的累积贡献率达到99.29%, 将这5个CARS主成分(记为CARS-PCs)也用于后续模型构建分析.

2.4 模型评估与分析

分别将全谱、 PCA提取的8个主成分因子、 13个植被指数、 14个CARS特征波长、 4个VI-PCs特征和5个CARS-PCs特征作为输入, 采用LDA线性判别分析和SVM支持向量机算法构建水稻冠层穗颈瘟早期识别模型. LDA算法选用Fisher线性判别; SVM算法采用RBF核函数, 利用GRID网格搜索法确定分类机参数惩罚系数C和gamma的最优组合. 建模结果如表3所示.

表3 不同特征变量建模结果

从表3可以看出, 特征变量选取方法中PCA主成分分析的降维方法在水稻冠层穗颈瘟建模中没有体现出明显的效果, 与全谱建模相比基本没有多大改善, 分析原因可能PCA方法不能够很好地剔除室外光线和环境等噪声的影响. 作为外业遥感特别是航空航天遥感常用的植被指数法在近地冠层水稻穗颈瘟的识别中取得了较好的效果, 基于植被指数的SVM模型和LDA模型总体分类精度分别达到了94%和96%, 说明将不同波段进行组合、 变换确实可以从不同角度反映植被受病害胁迫而引起的生化指标的变化, 从而反演植被受病虫害胁迫的情况. 用CARS方法进行特征波长的筛选取得效果也很好, 以CARS特征波长作为输入的SVM模型和LDA模型总体分类精度分别达到了96%和97%.

然而, 与训练样本数量相比较, 选取的植被指数特征和筛选的CARS特征数量偏多, 可能会存在过拟合的风险, 因此本研究将选取的植被指数和CARS方法筛选出的特征波长再结合PCA方法进一步降维, 得到4个VI-PCs特征和5个CARS-PCs特征用于建模: 基于VI-PCs特征的SVM模型和LDA模型的总体分类精度分别达到94%和95%; 基于CARS-PCs特征的SVM模型和LDA模型总体分类精度分别达到95%和97%. 实现了用较少变量获得较好区分的效果, 同时避免了过拟合的风险.

从模型构建算法上看, LDA线性判别的方法更适合于水稻冠层穗颈瘟分类模型的构建, 无论以哪种特征变量作为输入, 模型的分类精度都优于SVM模型. 图5是基于VI-PCs参数和CARS-PCs参数的LDA模型建模分类结果图. 从图中可以清晰看到, 基于VI-PCs参数和CARS-PCs参数的LDA模型在建模时分别出现两个中度感病被误判为轻度感病和一个中度感病被误判为轻度感病的情况.

图5 LDA模型的建模分类结果图

3 结论

本研究以大田自然发病为基础, 用室外高光谱成像系统采集早期发病大田的近地冠层水稻穗颈瘟图像, 提取、 分析反射率光谱. 对光谱进行标准化处理和Savitzky-Golay卷积平滑预处理, 分析水稻冠层的光谱反射率特征, 采用不同数据降维、 特征提取方法和LDA,SVM分类算法, 构建水稻冠层穗颈瘟早期识别模型. 主要结论有:

1) 研究水稻灌浆期中度感病、 轻度感病和无病3类样本的冠层反射率光谱, 发现感病水稻的光谱反射率较无病水稻整体平缓, 感病越严重水稻在红光区域吸收能力越低, 在绿光区域和近红外区域反射能力越低. 分析得出水稻冠层穗颈瘟反射率光谱的3个敏感波段区域, 即以566 nm为中心的绿波段区域、 以786 nm为中心的近红外波段区域、 以 682 nm为中心的红光吸收谷区域.

2) 本研究分别采用PCA、 植被指数和CARS 3种方法提取光谱特征, 构建识别模型. 单独使用PCA降维方法, 获得主成分因子构建水稻冠层识别模型, 没有取得明显效果. 选用植被指数和CARS方法筛选特征波长进行模型构建, 模型都获得较高的区分精度. 为了避免所用特征波长数量较多、 训练样本数量不多而可能存在过拟合的风险, 本研究尝试对筛取的植被指数和CARS特征波长, 用PCA方法进一步降维, 获得4个VI-PCs参数和5个CARS-PCs参数用于建模, 模型都获得较好的区分效果: 基于VI-PCs参数的SVM模型和LDA模型总体分类精度分别为94%和95%; 基于CARS-PCs参数的SVM模型和LDA模型总体分类精度分别为95%和97%.

3) 从模型构建算法看, LDA方法更适合于水稻冠层穗颈瘟识别模型的构建, 基于各种特征模型的分类精度均优于SVM算法模型.

本研究实现了田间水稻冠层穗颈瘟病害的早期识别, 可以为无人机航空遥感和卫星航天遥感的大面积病虫害监测与识别提供一定的理论和技术依据.

猜你喜欢
感病植被指数冠层
基于低空遥感的果树冠层信息提取方法研究
基于激光雷达的树形靶标冠层叶面积探测模型研究
土壤pH和主要养分含量与山核桃干腐病的相关性研究
安徽省淮南森林冠层辐射传输过程的特征
基于植被指数选择算法和决策树的生态系统识别
AMSR_2微波植被指数在黄河流域的适用性对比与分析
甘蔗实生苗早期阶段黑穗病抗性鉴定与评价
河南省冬小麦产量遥感监测精度比较研究
5个欧亚种葡萄品种感染霜霉病后4种酶活性的变化
施氮水平对冬小麦冠层氨挥发的影响