基于灰度关联分析的苹果病害识别方法研究

2013-08-02 06:08霍迎秋唐晶磊尹秀珍
实验技术与管理 2013年1期
关键词:训练样本特征向量识别率

霍迎秋,唐晶磊,尹秀珍

(西北农林科技大学 信息工程学院,陕西 杨凌 712100)

苹果病害是危害苹果生产的主要障碍之一,目前严重的苹果病害有22种,其中叶部、果实病害各有6种,根部病害7种,枝干病害有3种,每年因病害给果农造成损失巨大。

目前病害识别方法一般分为人工识别、依靠专家系统和基于图像分析3类方法,其中前2类方法对果农和专家的依赖性高,主观性强,由于苹果病害病斑症状复杂,特征不够明显,难以对病害作出科学、准确的识别。基于图像分析进行病害检测是一种有效方法,但研究对象一般为黄瓜、西红柿、玉米、水稻等叶部常见病害图像的识别。国内外关于苹果病害识别的文献从2008年才开始出现,且数量极少。但图像分析的每个步骤,如分割、特征提取、分类识别等已有很多前人的成果可以借鉴[1-3],表明基于图像分析的苹果果实病害识别是可行的。

随着手机照相功能的普及,果农用自己的手机将苹果病害部位拍下来,用彩信方式发送变得极为简单。李宗儒等[4]对基于手机拍摄的5种常见苹果叶部病害识别进行了研究,平均正确识别率达到92.6%。为了实现远程服务中心对苹果果实病害图像进行识别,本文重点研究自然场景下拍摄低分辨率苹果果实病害图像的自动识别方法。

1 图像采集及预处理

1.1 图像采集

使用华为T5211手机,在陕西省杨凌区五泉镇农户果园中,在晴天上午10:00~11:00的自然光照条件下,拍摄获取苹果果实病害图像,图像大小为320×240像素。为了便于后续处理,病害果实若被其他物体遮掩,则采用用手将病果托住的方法获取图像。

1.2 图像预处理

图像质量的好坏直接影响分割及特征提取。在图像采集过程中,由于受到采集设备、环境等的影响,图像存在分辨率低、背景复杂、病斑边缘模糊等特点。为了有效去除噪声,较好地保留图像的细节,并突出边缘信息,本文在试验对比的基础上,首先选用自适应直方图均衡化方法,扩展图像灰度范围,对图像进行对比度增强,然后选用彩色图像中值滤波方法,即在图像的R、G、B通道上分别应用中值滤波方法滤波后,再进行通道融合,得到滤波后的彩色图像,较好地抑制了图像的噪声,保留了图像的边缘信息。

1.3 图像分割

图像分割是图像分析与模式识别中的重要环节,病斑分割的好坏直接影响后续特征提取与识别。由于本文研究对象是自然环境下拍摄的果实病害图像,背景十分复杂,分辨率低,模糊不清晰,直接准确地提取病斑区域十分困难。因此,本文采用改进的水平集彩色图像分割方法,即基于区域和边缘的变分水平集彩色图像分割方法。该方法充分利用了目标图像的区域信息和边缘信息,并用欧氏距离代替了灰度加权值,使得彩色图像的颜色空间信息得到充分利用,获得了更加精确的颜色边缘。同时,还考虑了各个彩色通道之间存在的关系,尽可能减少了各个通道里由于形状信息的不同造成的失真,提高了分割的准确率[5],达到了将原始图像中病斑直接分割出来的目的。3种病害原图与病斑提取结果分别如图1和图2所示。

图1 3种病害原图

图2 3种病害病斑分割结果

2 病斑有效特征提取

为对病斑图像做分析和识别,必须对病斑的特征进行分析。分类器的设计和性能在很大程度上依赖于特征的选择和提取,也就是说依赖于用来代表图像信息的特征向量。本文在大量实验的基础上,优化选取8个纹理特征参数作为病害的有效识别特征。

目前,纹理特征提取与分析过程中最常用的是基于统计方法的灰度共生矩阵法[6]。共生矩阵反映了图像灰度分布关于方向、局部邻域和变化幅度的综合信息。本文在试验的基础上选取d=1,θ=0°、45°、90°、135°,灰度级为16。根据式(3)—(6),提取能量、熵、对比度、相关性的均值和标准差等8个参数作为纹理特征[7-8]。

2.1 能量(纹理的一致性)

式中:L为图像的灰度级;i、j为2个不同元素的灰度值。当p(i,j)中有少数值为大时,ASM的值也大。它表明特定的像素对较多时,一致性较好,反映了图像灰度分布均匀程度和纹理粗细程度。

2.2 熵

熵是图像信息量的量度,当p(i,j)的值分布越均匀,则ENT的值越大,它描述了纹理均衡的逆性质。

2.3 对比度(惯性矩)

惯性矩可理解为图像的清晰度。粗纹理图像,由于矩阵的数值集中在主对角线附近,相应的CON值较小;反之,则CON值较大。

2.4 像素对灰度相关性

相关量是用来描述矩阵中行或列元素之间的相似程度。

经大量随机抽样分析发现,轮纹病、炭疽病和新轮纹病3种苹果病害的纹理特征区别明显,所以本文将纹理特征作为病斑识别的主要特征。

3 基于灰度关联分析的苹果病害识别

灰度关联分析是用关联度大小来描述不同事物之间或不同因素间关联程度的一种灰色系统理论的分析方法,它的基本思想是根据曲线的几何形状判断不同事物之间的联系,曲线的几何形状越接近,说明相应的联系就越紧密,反之,则联系不紧密[9]。灰度关联分析方法对样本的多少和样本有无规律都同样适用,而且灰度关联度计算量小,能够有效降低算法的时间复杂度和空间复杂度,并且量化结果与定性分析结果一致[10-11]。

本文利用灰度关联分析,研究待识别病斑图像与训练集中各样本的相关性,以平均灰度关联度表示待识别病斑图像与训练集中各类病害的相似程度,确定测试病斑归属于哪类。

假定待识别病斑图像特征为一个n维特征向量F0=[f0(1),f0(2),…f0(n)],训练集中有m个训练样本,各类病害训练样本均为1/m。每个训练样本为一个n维特征向量,Fi=[fi(1),fi(2),…fi(n)],i=1,2,…m。

灰色关联分析病害识别模型具体实现方法如下:

(1)对待识别病斑特征向量以及训练集中各个样本特征向量进行归一化,以消除病斑图像不同物理特征的量纲对分类识别的影响。模型采用级差变换实现特征向量的归一化。归一化之后的特征向量记为F′i=[f′i(1),f′i(2),…f′i(n)]。

式中:mini=min(f′i(k)),每个特征向量中的最小的元素。maxi=max(f′i(k)),每个特征向量中的最大的元素。

(2)计算待识别病斑特征向量与训练集中每个特征向量的距离,记为Δi=[Δi(1),Δi(2),…Δi(n)](i=1,2,…m),Δi(k)=|f′0(k)-f′i(k)|(k=1,2,…n)。组成距离序列矩阵Δ为:

(3)计算两极差,即求距离序列矩阵Δ中的最大值和最小值,分别记为maxValue和minValue。

(4)计算待识别病斑特征向量F′0与训练集中每个样本特征向量F′i的关联系数εi(k):

式中:ρ为分辨系数,取值范围是[0,1],本模型中ρ取值为0.5。依次计算待识别病斑特征向量F′0与训练集中每个样本特征向量F′i的关联系数εi(k),组成关联系数矩阵ε。

(5)根据关联系数矩阵计算待识别病斑特征向量与训练集中第i个样本特征向量的灰色关联度γi,γi是关联系数矩阵ε的第i行元素的加权和。

(6)根据关联度γi向量,计算待识别病斑与训练集中3种病斑,每个病斑类的关联度Di。

式中:i为病斑类别号,选取最大关联度Di,即表示待识别病斑与第i类病斑训练样本关联度最大。可以认为其病斑属于第i类苹果病害。

4 实验结果与分析

以轮纹病、炭疽病和新轮纹病等3种发病率较高的苹果果实病害为研究对象,实验图片共78张,每类病害各26张,分别选取30张、50张、60张图片作为训练样本,对应各类剩余图片作为测试样本。采用灰度关联分析进行识别实验,识别结果如表1所示。

表1 灰色关联分析识别结果

由表1可知,选取30个训练样本、48个测试样本时,平均正确识别率最高,达85.41%;个别病害,如新轮纹病,正确识别率也很高,达100%,但是炭疽病识别率较低,为75%。选取60个训练样本、18个测试样本时,由于测试样本很少,平均正确识别率最低,为72.22%。选取48个训练样本、30个测试样本时,识别情况最好,平均正确识别率为80%,每个病害的识别率也为80%。实验结果表明,采用基于灰度关联分析的病害识别模型,能够对苹果病害进行有效识别。

5 结论

针对本研究的3种病害果实图像特点,在大量实验的基础上优选8个纹理特征作为病害的有效识别特征;病害训练样本选择30、48和60,相应的测试样本分别为48、30和18,构建基于灰度关联分析的病害识别模型进行训练识别,3种病害的平均正确识别率最高达到85.41%。

本文识别的结果接近人类病理专家的诊断精度,但识别率仍有待提高,今后将在病斑自动提取和特征优选方面作进一步研究。

(References)

[1] 刁志华.大田小麦叶部病害智能诊断系统研究与应用[D].合肥:中国科学技术大学,2010.

[2] 陈红,吴谋成,熊利荣,等.霉变花生的计算机视觉识别[J].农业机械学报,2008,39(1):110-113.

[3] 胡春华,李萍萍.计算机图像处理在缺素叶片颜色特征识别方面的应用[J].计算机测量与控制,2004,12(9):859-862.

[4] 李宗儒,何东健.基于手机拍摄图像分析的苹果病害识别技术研究[J].计算机工程与设计,2010,31(13):3051-3053.

[5] 石娜.基于snake和水平集的图像分割方法的研究及应用[D].长春:吉林大学,2011.

[6] 马帅营.基于灰度共生矩阵和BP神经网络集成的纹理图像分类[J].大连民族学院学报,2009,11(3):260-263.

[7] 田有文.基于纹理特征和支持向量机的葡萄病害的识别[J].仪器仪表学报,2005,26(8):606-608.

[8] 王惠明,史萍.图像纹理特征的提取方法[J].中国传媒大学学报,2006,13(1):49-52.

[9] 马苗,谭永杰,何雪莉.基于灰色关联分析的图像置乱程度评价方法[J].计算机应用研究,2009,26(4):1595-1597.

[10] 赵韩,张彦,方艮海,等.灰色关联分析方法在汽车零部件故障分析中的应用[J].农业机械学报,2005,36(8):125-128.

[11] 马苗,鹿艳晶.基于灰色模糊熵的SAR图像快速分割方法[J].计算机应用研究,2009,26(10):3968-3970.

猜你喜欢
训练样本特征向量识别率
二年制职教本科线性代数课程的几何化教学设计——以特征值和特征向量为例
克罗内克积的特征向量
基于类图像处理与向量化的大数据脚本攻击智能检测
人工智能
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
提升高速公路MTC二次抓拍车牌识别率方案研究
一类特殊矩阵特征向量的求法
EXCEL表格计算判断矩阵近似特征向量在AHP法检验上的应用
宽带光谱成像系统最优训练样本选择方法研究
融合原始样本和虚拟样本的人脸识别算法