基于直觉模糊C均值聚类算法的作物病害图像分割

2019-03-18 13:11张晴晴张云龙齐国红

安徽农业科学 2019年5期

张晴晴，张云龙，齐国红，李瑶

(郑州大学西亚斯国际学院，河南郑州 451150)

中国作为农业大国，农作物是人民赖以生存的物质源泉，农作物的产量和质量直接影响农民的经济收入和我国农产品的输出[1]。近年来，工业技术的飞速发展导致严重的空气污染，造成自然灾害严重化，进而导致农作物病害种类和程度大大加重。农作物病害直接威胁着作物的健康，过量的农药喷洒又会造成作物的品质无法保证。及早发现病害并做好防治是提高作物产量和质量的关键[2]。利用机器视觉对农作物病害进行自动检测和识别已成为农业信息化和智能化的必然趋势。而高精度的病害图像分割是准确识别的关键步骤，因此对一种效果好且实时性高的分割算法进行研究具有重要意义。

随着科学技术的不断发展，分割算法不断涌现，许多其他学科理论被应用到图像分割领域，形成了一些基于特定理论的图像分割算法[3]。早在2008年，毛罕平等[4]将模糊C均值聚类用于作物病害图像的分割，并取得了一定的分割效果。Hu等[5]、Deshpande等[6]应用K均值聚类算法分别对香蕉和石榴病害图像进行分割，并实现了其自动分级的功能。赖玉霞等[7]提出了一种基于遗传算法的K均值聚类，在自适应交叉和变异概率的遗传算法中引入K均值，克服了K均值算法对初始中心的敏感性。关海鸥等[8]利用模糊集和遗传算法相结合建立植物病斑区域分割模型，并根据不同植物病斑区域的特点实现植物快速分类。Zhang S等[9]采用全局局部奇异值分解算法实现了黄瓜病害叶片图像的分割。张武等[10]、Sigh等[11]利用支持向量机(SVM)算法以及改进的SVM实现复杂背景下小麦和豆类不同病害类型的分割。张星龙等[12]利用光源不变图特性采用聚类算法实现阴影下的叶片病斑图像分割，达到很高的准确率。王海青等[13]在传统的BP神经网络基础上提出了参数自适应脉冲耦合神经网络，实现了黄瓜目标分割。Chuang等[14]提出了一种基于空间领域的模糊C均值聚类算法实现了图像分割。由于自然环境的差异性，叶片结构和形状复杂多样，病斑形状的不确定性以及差异性导致一些经典的图像分割方法不具有通用性，至今未找到一种分割算法能够适用于各类图像，并且没有一个较完善的统一的评价准则来判定分割结果的好坏，所以仍需要不断探究新的分割方法和评价准则[15-17]。由于FCM算法实现过程中目标函数的迭代容易进入局部极小值化，并且函数的收敛速度较慢，对噪声的敏感度较低[18]。基于传统的模糊C均值聚类算法的研究基础上，笔者提出了模糊熵的概念，将隶属度、非隶属度和犹豫度(不确定度)3方面信息综合起来表示模糊集，形成了直觉模糊C均值聚类算法[19]。

1 直觉模糊聚类理论

1.1传统的FCM算法原理早在1973年，Bezdek等[20]就提出了模糊C均值聚类算法，它引入了隶属度的概念来优化目标函数，把样本间的关系定量表示，从而准确客观地聚类，使得类内差别尽可能小，类间差别尽可能大，实现自动对样本数据进行分类的目的。

首先定义FCM算法中聚类的类别是C，其中包含N个L维向量数据xk，元素的隶属度为uij，它代表的含义是数据元素xj属于第i类的概率，可以通过式(1)的最小值求取[21]。

(1)

其中，根据经验一般令m=2，uij需要满足：

(2)

(3)

由上式的约束条件通过对各变量求偏导可得式1目标函数取最小值式对应的隶属度变量uij和聚类中心vi。

(4)

(5)

根据算法原理，FCM算法实现步骤如下：

①设置目标函数的3个参数：精度e，模糊指数m(通常取2)和最大迭代次数；

②将隶属度变量uij进行初始化设置；

③更新隶属度变量uij和聚类中心ui；

④判断目标函数J(t)-j(t+1)

⑤把隶属度变量取最大值多对应的类作为最终的样本聚类结果。

1.2直觉模糊C均值聚类原理尽管FCM算法优于传统的C均值聚类算法，定义了隶属度在[0,1]范围内连续取值，能够将类间样本数据进行良好地分类，但是FCM算法实现过程中目标函数的迭代容易进入局部极小值化，并且函数的收敛速度较慢，对噪声的敏感度较低。因此提出了基于直觉模糊集聚类(IFCM)算法，同时引入隶属度、非隶属度和犹豫度(不确定度)三方面信息的来表示模糊集，从而引入了直觉模糊熵(IFE)的概念，IFE用来表示模糊集的模糊度[22]。

定义，若一个实函数fIFE(x)为x的直觉模糊熵，则需要满足以下几个条件：

①若是普通模糊集，则fIFE(A)=0；

②若uA(xi)=γA(xi)=0,∀xi,则fIFE(A)=n;

③若每个元素的隶属度和非隶属度都减少，则不确定度增加，即:

如果A≤B,uA(xi)≤uB(xi),γA(xi)≤γB(xi),∀x∈X,

则uA(xi)+γA(xi)≤uB(xi)+γB(xi),

所以πA(xi)≥πB(xi),fIFE(A)≥fIFE(B)

其中，uA(xi)、γA(xi)、πA(xi)分别代表集合X={x1,x1,…，xn}的隶属度、非隶属度和不确定度，则：

uA(xi)+γA(xi)+πA(xi)=1

(6)

若πA(xi)不确定度为0时，直觉模糊集就变成普通的模糊集。

我们定义表示模糊集的直觉度的直觉模糊熵fIFE(A)为：

(7)

很据Yager直觉模糊集互补公式(参考文献)，非隶属度可以表示为：

γA(xi)=[1-uA(xi)α]1/α,x∈X

(8)

不确定度公式可表示为：

πA(xi)=1-uA(xi)α-[1-uA(xi)a]1/a,x∈X

(9)

模糊集A可表示为：

=[uA(xi),(1-uA(xi)a)1/a,1-uA(xi)a-[1-uA(xi)a]1/a|x∈X]

(10)

式中，a的取值范围为0≤a≤1。

同FCM算法的实现相类似，IFCM的算法可以按如下步骤实现：

①先定义评价准则函数，对相关参数和隶属度变量进行初始化，并确定好初始聚类中心的个数C；

②依据式(4)定义不确定度参数πA(xi)、隶属度参数uA(xi)、非隶属度参数rA(xi)，并建立模糊隶属度矩阵；

③利用模糊隶属度矩阵计算各样本点到聚类中心的距离，对样本进行分类；

④重复计算每个类的聚类中心到样本的距离，每次都用直觉模糊隶属度矩阵代替原来的隶属度矩阵，并将样本重新划分到各个类中；

⑤重复第2、3、4步骤，直到评价准则函数达到最小值，计算停止；

⑥将多次迭代后的聚类中心值映射到原图像对应的灰度图像中，从而将原图像中各像素点的灰度值进行分类。

2 基于直觉模糊聚类的图像分割

图像分割就是按照一定的算法和准则把1幅图像划分成2个或多个具有相似性的区域，并能够用轮廓线区分各个区域，各个区域界定的实质是根据图像的像素值大小来划分的。分割的最终目的就是把对研究者有用的目标信息从复杂的背景中分离出来，为更好的做进一步的分析和处理。

应用于图像分割，模糊隶属度的函数式衡量1幅灰度图像中某一像素点xj属于一个灰度值中心grayi的程度。因此，需要计算出图像中像素点对某灰度值中心的最大隶属度，便可将该像素点划分到该灰度级的区域中。对于灰度图像模糊隶属度的公式可表示为式(11)：

(11)

图像分割的好坏主要取决于图像像素各中心灰度值的选取，结合公式(2)和(8)可推得：

(12)

式中，xj代表灰度图像中某一像素点的灰度值。

使用IFCM进行图像分割的流程图如图1所示。

图1 IFCM图像分割流程图Fig.1 Flow chart of IFCM image segmentation

3 结果与分析

为验证直觉模糊C均值聚类算法用于病害图像分割的有效性，实验选取了黄瓜病害叶片图片作为研究对象，图片存储格式统一设定为.png，分辨率大小为160×160。计算机性能采用主频为2.2 GHz的CPU，内存大小为4 G，仿真运行环境使用MATLAB 7.10。

3.1IFCM算法分割结果

实验选取三种不同种类的黄瓜病害叶片(红粉病、灰霉病和褐斑病)图像各50张，利用文中改进的FCM算法进行病斑分割。由于直觉模糊C均值聚类算法中不确定度πA(xi)直接受参数α取值的影响较大参数，经多次试验发现当α取值为0.85时分割效果最好，因此图1是设置α=0.85得到的试验结果。

图1a～c是经过预处理的3种不同病种的黄瓜病害叶片，利用改进的IFCM分割算法通过设置不同的参数得到最好的病斑二值分割图像如图1d～f所示，最后经过与原彩色图像取与运算得到彩色病斑分割图像结果如图1g～i所示，试验过程中参数的设置直接影响到分割效果的好坏。

3.2IFCM算法和其他算法的结果对比为更好地说明该文算法的有效性，采用最大类间方差(Otsu)分割算法、K均值聚类分割算法、传统FCM分割算法和该文改进的IFCM分割算法的结果进行了对比。通过4种分割算法分别对3种病害类别(红粉病、灰霉病和褐斑病)各50张进行试验测试，算法的执行时间和分割的准确度都采用平均值，具体对比结果见表1和2。

注：a.红粉病彩色图像；b.灰霉病彩色图像；c.褐斑病彩色图像；d.红粉病二值病斑图像；e.灰霉病二值病斑图像；f.褐斑病二值病斑图像；g.红粉病彩色分割结果；h.灰霉病彩色分割结果；i.褐斑病彩色分割结果Note:a.Color image of Cephalothecium roseum;b.Color image of Botrytis cinerea;c. Color image of tan disease;d.Binary disease spot image of Cephalothecium roseum;e.Binary disease spot image of Botrytis cinerea;f.Binary disease spot image of tan disease;g.Color segmentation result of Cephalothecium roseum;h.Color segmentation result of Botrytis cinerea;i.Color segmentation result of tan disease图2 不同种类黄瓜病害叶片图像的分割结果Fig.2 Segmentation results of different diseased leaf images of cucumbers

从表1和2可以看出，利用该文算法对作物进行病斑分割准确率较其他算法都高一些，平均分割准确率高达94.5%，算法执行时间也较短，有很好的时效性。

表14种不同算法平均时间比较

Table1Comparisonoftheaveragetimeoffourdifferentalgorithmmethods

表24种不同算法的分割准确率比较

Table2Comparisonofsegmentationaccuracyoffourdifferentalgorithmmethods

4 结论

该研究在模糊C均值聚类(FCM)算法的基础上，引入了直觉模糊熵对FCM算法进行了改进，即IFCM算法，该算法既体现出原FCM算法运行时间短、实现简单等优点，又克服了FCM算法分割时计算目标函数容易陷入局部极小值，而且聚类数目需要提前设定初值的缺点。IFCM算法通过引入不确定度这一参数，确保在分割过程中既滤除了噪声的干扰又保留了图像的细节特征，达到了很好的分割效果使得图像分割。因此，IFCM算法可以改善图像的噪声影响，对于噪声干扰较为严重的图像选用IFCM算法分割效果较传统的FCM算法效果好。但是，对于IFCM算法，引入的不确定度参数依靠经验值的判断，参数的自动最有选取是下一步研究的重点。