基于K均值聚类和二维Otsu的棉花HSV图像分割

2020-12-24 08:01夏亚飞
软件 2020年7期
关键词:均值棉花背景

摘  要: 针对棉花识别中由于光照不均、背景复杂等不利影响降低识别率的问题,提出了一种基于K均值聚类的棉花HSV图像分割算法。基于HSV颜色空间下棉花目标在颜色上与背景存在着明显差异的特点,在分割中使用K均值聚类算法将复杂背景下的棉花分成棉叶、棉花、土壤和棉枝四类。首先对样本采取预处理操作,然后使用空间转换算法和K均值聚类算法进行图像处理,进一步在HSV颜色空间下依据色彩信息确定聚类的数目,利用二维Otsu算法对图像进行分割操作。通过实验验证,基于K均值聚类和二维Otsu的棉花HSV图像分割算法可以使分割结果更加准确且边缘更加整洁,分割正确率达到80%,同时该方法对具有同类特征的花卉采摘视觉系统的设计具有参考价值。

关键词: 棉花;K均值聚类;HSV颜色空间;二维Otsu

中图分类号: TP391.4;S562;TP391.9    文献标识码: A    DOI:10.3969/j.issn.1003-6970.2020.07.034

本文著录格式:夏亚飞. 基于K均值聚类和二维Otsu的棉花HSV图像分割[J]. 软件,2020,41(07):170-173

Cotton HSV Image Segmentation Based on K-means Clustering and Two-dimensional Otsu

XIA Ya-fei

(Zhengzhou Baoye Steel Structure Co., Ltd., Zhengzhou, Henan 450000, China)

【Abstract】: A cotton image segmentation algorithm based on K-means clustering and two-dimensional Otsu is proposed to solve the problem of cotton recognition which is affected by uneven illumination and complex background. Based on the color difference between the cotton target and the background in HSV color space, K-means clustering algorithm is used to divide the cotton image in complex background into four categories: cotton leaf, cotton, soil and cotton branch. Firstly, the sample is preprocessed, then the image is processed by spatial conversion algorithm and K-means clustering algorithm, and then the number of clusters is determined according to the color information in HSV color space. Finally, the image is segmented by two-dimensional Otsu algorithm. Through the experimental verification, the cotton HSV image segmentation algorithm based on K-means clustering and two-dimensional Otsu can make the segmentation result more accurate and the edge more neat, and the segmentation accuracy reaches 80%. At the same time, this method has reference value for the design of flower picking vision system with similar characteristics.

【Key words】: Cotton; K-means clustering; HSV color space; Two-dimensional Otsu

0  引言

隨着计算机、电气技术和人工智能的突飞猛进,智能设施开始出现在现代的生产和生活里。一些专家和科研组织提出了利用农业机器人摘取棉花的设想[1]。在采棉机的研发中首先要解决的问题是将棉花图像从复杂的背景中分离提取出来。

目前关于棉花目标的分割方法还处于研究探索阶段,国内外学者们已取得一定的探索性研究成果。Rao U[2]对棉花图像的R-B、R-G、G-B三个通道进行分析,提出通过设定颜色差值的阈值来判断棉花图像,该方法算法简单且成本低;刘坤等[3]提出采用色差模型和随机Hough变换对棉花图像进行识别操作,该方法算法快捷、可行,对因遮挡造成形状残缺的图像也能取得比其他算法更好的效果;王玲等[4]分别对HIS、L*a*b*展开研究,在HIS和Lab下结合阈值和预处理算法完成了棉花分割,该算法复杂度低,但是易受光照等环境因素的影响。

本课题研究的棉花图像分割技术在农业采棉机的研发里占据重要的科研地位,也是棉花识别、空间定位的前提。针对棉花识别中由于光照不均、背景复杂等不利影响降低识别率的问题,提出了一种基于K均值聚类[5-9]和二维Otsu的棉花HSV[10-11]图像分割算法。首先利用空间转换算法对经过预处理的棉花图像进行转换得到棉花HSV图像,进一步基于HSV颜色空间下棉花目标与背景在颜色上存在明显差异的特点,确定棉花图像的聚类数目为4,最后在V通道[12]下利用二维Otsu[13-15]算法对图像进行分割操作。通过实验验证,基于K均值聚类的棉花HSV图像分割算法可以使分割结果更加准确且边缘更加整洁,显著提高了识别率,同时该方法对具有同类特征的花卉采摘视觉系统的设计具有参考价值。

1  棉花K均值聚类算法

利用棉花目标在颜色上与背景存在明显差异的特点,首先在HSV颜色空间下对经过预处理的棉花图像依据颜色信息确定聚类的数目并进行聚类操作,然后在棉花和背景存在显著不同的V通道下使用二维Otsu算法进行分割。

1.1  棉花图像预处理

由于光照不均、复杂背景的干扰会影响棉花图像分割效果的原因,需要寻找能够有效提取完整棉花目标的颜色空间。经研究发现,棉花图像在HSV颜色空间中有明显的颜色差异,且在V通道下棉花目标和背景在亮度方面存在显著差异,因此预处理中利用空间转换算法得到棉花HSV图像,并根据颜色信息确定聚类数目。

1.2  K均值聚类算法

在原彩色棉花图像中存在着丰富的颜色信息,且在HSV颜色空间下棉花目标与背景在颜色上存在着明显的差异,因此使用聚类算法具有合理性和高效性。

K均值聚类算法的研究关键和热点是聚类数目和中心的选择,其选择的结果直接影响到所得聚类的效果。该算法的聚类准则函数通常选择误差平方和函数[16],公式如(1)、(2)所示:

其中S代表给定的数据集,ci代表聚类中心。

1.3  棉花图像聚类数目和聚类中心的选择

通过K均值聚类算法,依据颜色信息对棉花图像进行聚类处理,整幅棉花图像分为四类:棉花、棉枝、棉叶和土壤,在去噪的同时减小了后续分割操作的难度。研究表明棉花图像聚类个数的设定会直接影响K均值聚类的效果。不同聚类个数的效果如下图1所示。

由于聚类的对象是棉花图像的颜色信息,因此在确定聚类数目时可以参考棉花图像在HSV颜色空間中的主要颜色区域个数,即H分量直方图的峰值个数。实验中经反复实验选取具有普适性和效果最佳的聚类数目4。

进一步在HSV颜色空间下,将100幅棉花聚类后的图像做直方图分析, 发现棉絮与棉叶等背景在V分量上明显不同,经过研究观察到棉絮在直方图里突出为尖峰形状, 在棉絮和背景相交边缘的两侧亮度值差距悬殊[17-19],因此选用棉花HSV图像的V通道展开目标的分割研究。

2  棉花同态滤波与二维Otsu算法

2.1  同态滤波

同态滤波[20]可以减少棉花图像的低频成分并增加高频成分,在不损失亮区图像细节的同时增强暗区图像细节,从而减少光照影响和锐化图像边缘。

一张棉花样本可以看作为由光源的入射部分ix,y)和反射部分rx,y)组成,可以表示为:

其中ix,y)表示低频成分,代表光照条件;rx,y)表示高频成分,代表了棉花图像的细节等。通过消减ix,y)与放大rx,y)能够实现对光照不足或者不均图像的补偿目的。

基于DCT的同态变换流程如下图2所示。

2.2  二维Otsu算法概述

二维Otsu算法在分割中综合考虑与研究了本身灰度和邻域灰度均值的具体情况,首先计算出图像的二维直方图,然后利用阈值选择出包含有棉花目标和背景的两类,之后采用最大类间方差法进行图像的分割。

把棉花图像用阈值(st)划分成棉絮目标与背景区域,其中s代表了fxy)进行图像分割时的阈值,t表示了gxy)进行图像分割时的阈值,其中st∈[0,L-1],L表示此图像的灰度级。设C1C2分别代表了目标与背景,则有下面的概率公式:

其中P1C1)、P2C2)分别表示像素被分到C1C2中的概率,即像素属于目标或背景的概率,pij表示图像的二维联合概率密度。由此可以推出C1C2类中像素的平均灰度值依次是:

则所有像素的平均灰度为:

在二维Otsu里,忽略了棉絮和背景以外的信息,有以下公式:

类间方差可以表示为:

由此可以推出最佳阈值,其公式表达式为:

2.3  边缘检测

图像的边缘是指一幅棉花图像中灰度值发生剧烈变化的区域,主要存在于棉花目标之间、棉花目标与背景之间、区域与区域之间,是图像中最基本的特征。Canny算子可以抑制噪声的干扰,解决了其他传统检测算法里效果不理想的问题。Canny算子的处理过程如图3。

2.4  棉花分割的实验结果与分析

综合考虑了各分割方法的优缺点,实验中研究了基于K均值聚类和二维Otsu的棉花HSV图像分割,算法过程如图4。

为了检验该算法的分割效果,在100个样本中能够有效分割出80幅图像,分割正确率达到80%。以下是其中两组的分割效果。实验过程如图5所示。

其中图a是初始棉花样本,图b是棉花HSV图像,图c是进行聚类得到的结果,图d是V通道,图e是进行滤波的结果,图f是分割结果,图g是为了获得理想的分割效果进行的形态学处理,图h是Canny边缘检测结果,图i是棉花图像的识别显示结果。

为了验证K均值聚类在棉花分割中的影响,进行了不使用聚类操作的比较实验,结果如图6所示,发现未使用K均值聚类算法的分割结果不理想,含有更多的干扰区域。

为了验证本章算法的优越性,利用文献[21]中的算法进行了对比实验,在100个样本中能够有效分割出50幅图像,分割正确率达到50%。其效果如图7所示,与本文所提算法进行实验对比,结果如表1所示,可以看出由于该算法没有在V通道下进行处理的原因,使计算得到的分割阈值不够理想,导致分割结果中含有干扰区域,效果不如本章算法。

3  结束语

针对棉花识别中光照不均、背景复杂等不利影响降低识别率的问题,提出了一种基于K均值聚类和二维Otsu的棉花HSV图像分割算法。使用空间转换算法得到棉花HSV图像,基于棉花目标的颜色与背景存在的明显差异,确定棉花图像的聚类数目,最后在V通道下对图像分割。通过实验验证,分割算法可以使分割结果更加准确且边缘更加整洁,分割正确率达到80%,同时该方法对具有同类特征的花卉采摘视觉系统的设计具有参考价值。考虑到该算法仅利用了色彩和灰度信息,分割方法单一,后期还会结合分水岭算法进行研究,以获得更高的分割率。

参考文献

  1. 樊建荣, 采棉机的现状研究和发展趋势[J]. 机械研究与应用, 2011, 24(01): 1-4.

  2. Rao U. Design of automatic cotton picking robot with Machine vision using Image Processing algorithms[C]// International Conference on Control. IEEE, 2014.

  3. 刘坤, 费树岷, 汪木兰, 等. 基于改进随机Hough变换的棉桃识别技术[J]. 农业机械学报, 2010, 41(8): 160-165.

  4. 王玲, 王萍, 陈兵林, 等. 基于颜色阈值的田间籽棉图像分割技术[J]. 作物学报, 2010, 36(3): 502-507.

  5. 任磊, 赖惠成, 陈钦政, 等. 基于改进K均值聚类与HSV模型的棉花分割算法[J]. 计算机工程与设计, 2013, 34(5): 1772-1776.

  6. 安计勇, 高贵阁, 史志强, 等. 一种改进的K均值文本聚类算法[J]. 传感器与微系统, 2015, 34(5): 130-133.

  7. 翟东海, 鱼江, 高飞, 等. 最大距离法选取初始簇中心的K-means文本聚类算法的研究[J]. 计算机应用研究, 2014, 31(03): 713-715+719.

  8. 张雪凤, 张桂珍, 刘鹏. 基于聚类准则函数的改进K-means算法[J]. 计算机工程与应用, 2011, 47(11): 123-127.

  9. Amir Ahmad, Lipika Dey. A k -mean clustering algorithm for mixed numeric and categorical data[J]. Data & Knowledge Engineering, 2007, 63(2).

  10. 孙琦龙, 张明亮. 一种HSV颜色空间量化的藏毯图像检索方法[J]. 软件, 2016, 37(03): 36-39.

  11. 孙琦龙, 张明亮. 基于颜色特征的藏毯图像检索研究与实现[J]. 软件, 2015, 36(08): 25-29.

  12. 任磊. 棉花图像分割算法研究[D]. 新疆大学, 2013.

  13. 王宁, 姜全春, 蒋林华. 高噪声环境下的快递包裹条形码的快速定位分割识别[J]. 软件, 2019, 40(07): 80-83.

  14. 王浩, 孙福明, 贾旭. 基于图像分割的葵花籽脱壳率在线估计技术[J]. 江苏农业科学, 2018, 46(18): 229-234.

  15. 李仁忠, 杨曼, 俱寒,等. 基于二維Otsu算法的织物疵点检测[J]. 毛纺科技, 2017, 45(10): 75-80.

  16. 毛嘉莉. 基于K-means的文本聚类算法[J]. 计算机系统应用, 2009, 18(10): 85-87.

  17. 任磊, 赖惠成, 陈钦政, 王星. 基于改进K均值聚类与HSV模型的棉花分割算法[J]. 计算机工程与设计, 2013, 34(5): 1772-1776.

  18. 戴天虹. 基于计算机视觉的木质板材颜色分类方法的研究[D]. 东北林业大学, 2008.

  19. 陶霖密, 徐光祐. 机器视觉中的颜色问题及应用[J]. 科学通报, 2001(03): 178-190.

  20. 曲蕴慧, 汤伟, 文豪, 雷涛. 基于DCT同态滤波的纸病图像去噪算法研究[J]. 中国造纸, 2018, 37(05): 45-49.

  21. 张豪. 基于机器视觉棉花图像的分割和棉田视觉导航研究[D]. 新疆农业大学, 2015.

猜你喜欢
均值棉花背景
棉花是花吗?
“新四化”背景下汽车NVH的发展趋势
《论持久战》的写作背景
棉花
晚清外语翻译人才培养的背景
均值不等式失效时的解决方法
均值与方差在生活中的应用
关于均值有界变差函数的重要不等式
对偶均值积分的Marcus-Lopes不等式
第三讲 棉花肥害诊断及其防治