基于模糊聚类的颜色块自动模式识别方法研究

2016-12-27 05:06
浙江水利水电学院学报 2016年5期
关键词:像素点均值聚类

张 怡

(浙江水利水电学院 电气工程学院,浙江 杭州 310018)

基于模糊聚类的颜色块自动模式识别方法研究

张 怡

(浙江水利水电学院 电气工程学院,浙江 杭州 310018)

在线图像监测的快速发展对计算机图像识别技术的应用提出了越来越迫切的需求.从计算机决策支持系统(DSS)的设计出发,根据在线图像监测的特点,分析了将模糊模式识别技术应用于在线监测图像颜色识别与分类的优越性,提出了一种适用于在线监测图像颜色自动识别与分类的方法.算法首先根据专家给出的样本学习集获取各类识别色中心,引入改进模糊C均值聚类方法和连通图遍历技术,在获取该像素对应颜色模式关于各种识别色中心的隶属度的基础上,基于颜色不突变的规律综合分析整个图像形成各个颜色图块,得到图像各个区域的颜色分类结果.此方法可用于指导各行业类似颜色块自动识别和分类技术的运用.

在线监测;颜色;模糊模式识别;连通图遍历

近年来,医学图像诊断、文字识别、车牌识别、卫星拍照等领域,越来越需要基于图像处理的实时在线监测技术的发展.在线图像监测技术的成功运用体现出方便、便利、安全等强大优势.计算机图像处理技术实现的基础之一,就是计算机能够根据图像颜色自动识别同一类颜色,进而组成一类色块,构成图像处理的颜色分类基础.以往,很多在线监测系统更多是依靠运行人员人为观察与分析采集图像,缺乏自动识别和分析功能,其原因是对背景复杂的图像分析方法的研究还不够系统和成熟.本文在研究图像识别和分析系统的构架基础上,提出了一种基于连通图遍历的聚类方法实现监测图像的颜色识别和分类方法,同时考虑工业环境下采集的图像由于畸变和噪声所导致的图像模糊处置正符合模糊理论精神,故引入模糊C均值聚类方法来提高算法的适用性和鲁棒性[1-4].算例分析表明,该方法具备较强柔性处理能力的同时,又具备了较好的识别准确性.

1 系统介绍及算法简介

图1构成了图像采集的硬件系统,系统通过CCD图像传感器将监测设备图像进行采集,借助具备多通道处理能力的数据采集卡将采集到的所有图像送入监控计算机.监控计算机配置有本地数据库来保存图像数据并将需处理的图像通过通讯网络传送给主站计算机,主站计算机通过配套软件系统进行处置并将处置结果展示给运行人员予以参考[5-6].

图1 图像监测与分析系统总体结构图

对于一幅图像,可分解出多项指标,而其中最重要的信息是色块颜色和色块形状.这些色块从图像学上来说,都有一个颜色中心,并以这个颜色中心形成一块颜色相近的颜色块.要实现各个颜色块的颜色分析,算法利用统计工具对典型样本集进行加权平均,求取各个样本色块的颜色中心.在确定样本集颜色中心的前提下,以这些颜色中心作为约束条件,将整个图像每个像素点作为运算单位,通过模糊数学和图遍历算法,获取每个像素点对应典型样本集各类颜色块中心的隶属度,并按照最优隶属进行分类.按照以往传统分类方法,通常使用“最大隶属度原则”,也就是将单个像素点按照其最大隶属度一次性归属为某一颜色类,过程中不考虑该像素点归属于其它颜色类的隶属情况,这样,模糊聚类算法所获得的结果无法得到充分利用.由此,本文特将多种模式识别的方法进行组合并予以改进,提出一种颜色识别新方法.其原理是基于一张图像颜色不会发生突变、相邻之间具有耦合的特性,通过引入模糊C均值聚类方法,并利用计算机技术进行图遍历算法,实现多层去模糊化处理聚类识别.这个方法的优势体现为在进行在线监测图像各个颜色色块聚类分类的同一过程,也可以获取完整图像的整体颜色块分布状况,能够更为有效地利用算法求取的模糊隶属度所包含的各类丰富信息,同时模糊算法的引入也提高了整个算法的鲁棒性和抗噪性.

2 典型颜色块类中心学习

由图1所示硬件采集装置所获取的在线监测图像中,在资深设备专家的遴选下,挑出足够数量的若干例,并以之为基础,形成典型颜色块的颜色类中心,并由此构建各个典型颜色块类中心的学习集.具体方法是利用统计方法计算其颜色类中心对应的RGB值(以RGB色系为例),典型颜色块颜色类中心的RGB分量值分别对应该典型学习集全部样本对应RGB分量总加后取平均值而得,具体计算方法见下:

(1)

其标准差为:

(2)

式(1)、式(2)中:

N—样本个数;

mean(R、G、B)—各个颜色块颜色类中心的RGB分量值;

std(R、G、B)—RGB各分量的标准差.

由此可以得到若干典型设备颜色类中心,如电力系统中接近红色的互感器、灰色的变压器、黄色(A相)、绿色(B相)、红色(C相)、白色安全帽(领导人员)、蓝色安全帽(管理人员)、黄色安全帽(施工人员)、红色安全帽(外来人员)等,这些颜色类中心下一步将用来指导监测图像的颜色识别.从图像学可知,三原色RGB色系与常用的彩色刺激色系XYZ、PAL亮度色系YUV、Otha色系I1I2I3之间可以相互变换.故,可以根据需要分别计算在线监测图像在各个色系下的典型颜色块类中心.

3 单个像素点模糊隶属度求取

为计算在线监测图像中任意单个像素对于典型颜色块颜色类中心的隶属度,并为整个图像的色块分类和形状分析打下基础.综合比较,以采用模糊C均值聚类方法为宜[7-9].

传统模糊C均值方法以X={x1,x2,…,xk,…,xn}代表样本集,目标是使聚类准则函数式(3)为最小.

(3)

其中,隶属度矩阵U={uji}是隶属度函数;uji代表xj归属Ci类的隶属度,要求满足以下条件:

(1)uji∈[0,1],i=1,2,…,C;j=1,2,…,N;

传统模糊C均值方法通过对目标准则函数Jm迭代优化来完成算法,可得:

(4)

(5)

算法具体步骤为:

(1)设定样本类别数为C,并设置允许误差Emax,令t=1;

(2)根据式(5)求的类中心W(t)={w1,w2,…,wi,…,wc};

(3)根据式(4)求的新隶属度矩阵U(t+1)={uji};

(4)计算误差Δ=max‖U(t+1)-U(t)‖.

若误差Δ>允许误差Emax,则退回第2步,否则计算结束.

从以上逻辑实现来看,传统模糊C均值聚类得到的类中心仅仅是计算最优解(该解为多次迭代获取),用于分类时还需要干预来对这些类中心进行解读使其符合分类定义.从在线监测图像颜色识别的实施过程来看,专家进行图像颜色块分类时,先天已经形成了一个典型色类的主观印象(这一印象符合大家对分类的认同).专家在进行识别判读时就是把对比对象与各个典型颜色类进行比较,并将之划分到最合适类的过程.这就相当于,在计算模糊C均值聚类算法的目标函数时将类中心提前固定,这样类中心固定的模糊C均值聚类算法不需迭代,可以通过一次计算求得约束条件下的最优解.改进的模糊C均值聚类算法简化为:

(1)由式(1)计算典型样本各颜色块类中心;

(2)根据式(4)求取计算对象对应各颜色类的隶属度矩阵;

(3)通过模糊数学工具对隶属度矩阵去模糊化;

(4)获取最终分类结果.

从以上逻辑实现来看,类中心固定的模糊C均值算法实施过程与专家判读过程是一致的,且过程不需迭代,又可以快速求取最优解,故利用类中心固定FCM算法进行在线监测图像自动分类较传统FCM算法具有明显优势.

4 在线监测图像颜色块分析

经过前文提出的改进模糊C均值聚类方法,可以求取到整个图像各个像素点归属于各典型颜色块类的隶属度矩阵U={uji},通过对该隶属度矩阵进行去模糊化处理,可以得到每个计算单位的类别归属.去模糊化的经典方法“最大隶属原则”具有简单便捷的特点,但该方法仅仅注重了最大隶属的成分,没有充分利用模糊C均值方法获取的隶属度矩阵所包含的丰富信息,难以进一步优化分类结果.

为充分利用算法结果并实现最优分类,本文依据模糊数学思想提出模糊点的概念.工程实践表明,图像采集、传输、处理等环节都可能引入模糊点[10].在此定义模糊点为,计算单位(像素点),若其最大隶属度值不大于次大隶属度值20%以上的点.对于模糊点,如果仅基于点运算并按照“最大隶属原则”对其分类,其结果往往可能是错误的.为避免这类情况的发生,较好抑制消除噪声的影响,本文提出一种新的思路.该思路基于颜色块不突变的原理,即某点颜色的归属同时取决于自身的颜色属性归属及相邻点的颜色属性归属,也就是在算法中将相邻域运算考虑进来.

工程实践表明,图像颜色往往是成块分布的,同一颜色块像素点会相互连通构成一个同色区域,其中的像素点颜色往往具有不突变的特点.于是,可以利用计算机连通图遍历算法,在计算单位(像素点)分类获取过程中,充分考虑邻域的属性情况,由此可以确定整个监测图像所有区域的颜色分布信息结果(颜色类和形态),从而将图像分解形成多个颜色接近的色块,在实现分类的同时还未下一步处理打下基础.

算法中,定义像素点可存在三种状态:①尚未处理状态:该计算单位尚未被遍历过,其颜色分类结果未知;②处理进行状态:该计算单位已被遍历过,但尚未有明确颜色分类结果;③处理完毕状态:该计算单位已有明确的颜色类分类结果.

为实现同一颜色块的区域划分隔离,算法在此基础上定义一个当前颜色类处理堆栈,其进栈第一个对象为某一颜色类确定的非模糊点.算法通过引入连通图遍历方法,在遍历过程中利用该堆栈,设计的去模糊处理方法(基于相邻区域)为:

第1步 各计算单位(像素点)均为尚未处理状态,取图像左上位置第一个计算单位(像素点)为起始处理对象,判断当前计算单位是否为尚未处理的非模糊点.如判断为非,则按照从上至下,从左至右的顺序进行扫描继续查找尚未处理的非模糊点.如判断为是,则设置该点状态为处理完毕状态(颜色分类属于其隶属度最大的类),令当前处理类别即为该类别,并将其压入堆栈,跳至第2步进行处理.若扫描到结束位置,均未发现合适的非模糊点,则从头扫描,对尚未分类的模糊点按第3步分类,直到整个图像所有像素点都处理分类完毕.

第2步 判断颜色类处理堆栈是否为空.若判断为非空,则执行出栈处理,若该点为模糊点,则跳转至第3步进行处理,否则判断该非模糊点颜色类别是否为当前类别,若是,则设置该计算单位状态为处理完毕状态,该点属于其隶属度最大的颜色类别.并以该点为基准,按从上至下,从左至右的扫描顺序将该点周围3×3计算单位的相邻区域中尚未处理的像素点压栈,继续执行第2步.若判断为空,则属于当前颜色类的颜色块已遍历完成,返回第1步继续在上次扫描位置寻找非模糊点.

第3步 当前计算单位为模糊点时,判断该点周围3×3计算单位的相邻区域中是否存在尚未处理状态点.若判断为非,则结合其相邻区域颜色类已确定的计算单位信息决定其颜色类别归属.具体判据是取该点周围3×3邻域所有像素点颜色类别信息,并取这些点归属最多的颜色类做为该模糊点所属颜色类.设置该点状态为处理完毕状态,转向第2步处理.若判断为有,则设置当前处理点状态为处理进行状态,将其重新压回堆栈,并将其周围区域尚未处理的点压入堆栈,转向第2步进行处理.

第4步 统计各颜色区域并将像素点最多的颜色类指定为该区域归属的颜色类,在分类完成的同时,也为后续进一步分析和判断打下基础.

从该算法的逻辑实现来看,算法通过引入计算机连通图遍历、模糊点相邻区域判断两种方法,从而实现了在对像素颜色更为准确分类的同步过程中,也完整得到了监测图像颜色块分布和形态信息.按照上述逻辑可实现程序编写,算例分析表明,该方法实用有效,识别率超过90%,本方法对于颜色块自动分类有较好的识别性能.

5 结 论

图像的在线监测识别技术日趋重要,基于计算机实现智能识别和图像处理分析是此技术的重要基础.本文在研究在线检测图像颜色识别特点的基础上,提出一种适用于在线监测的颜色自动识别和分类方法,且该法对于类似颜色色块自动分类具有普遍的指导意义.方法是基于固定类中心的改进模糊C均值聚类方法,快速计算图像各像素点对于各典型颜色块的隶属度矩阵,并在此矩阵的基础上,在连通图遍历的框架下通过引入相邻区域模糊点判别方法,能够快速实现同时获取整个图像的颜色和形态信息.研究将重点解决采集图像质量不高,相机聚焦不准确造成漏报和误报问题.伴随计算机技术和图像处理、识别算法的不断完善,图像处理与识别技术在在线图像监测中将得到进一步的深入研究与应用实践,这将对未来的在线监测和控制技术的进步产生深远的影响.

[1] 项 春,严爱芳,杨 为.计算机图形学在旋转机械故障诊断中的应用[J].浙江水利水电专科学校学报,2001,13(3):60-62.

[2] SHARMA GANRAV,JOEL TRUSSELL H. Digital Color Imaging[J].IEEE Trans on Imaging Processing,1997,6(7):901-932.

[3] CHEN SHOUYU. Fuzzy Recognition Theoretical Model[J].Fuzzy Math,1993,1(2):261-269.

[4] 刘普寅,吴孟达.模糊理论及其应用[M].长沙:国防科技大学出版社,1998.

[5] 赵忠旭,王爱民,沈兰荪.舌像分析仪中彩色校正的研究[J].电子测量与仪器学报,1999,13(3):1-5.

[6] 吴健康.数字图象分析[M].北京:人民邮电出版社,1989.

[7] KAMEL M S,SELIM Z. New Algorithms for Solving the Fuzzy Clustering Problem[J].Pattern Recognition,1994,27(3):421-428.

[8] 黄凤岗,宋克欧.模式识别[M].哈尔滨:哈尔滨工程大学出版社,1998.

[9] 崔 海,康剑莉.基于片相似各项异性扩散的BP神经网络的磨粒识别研究[J].浙江水利水电学院学报,2016,28(3):77-80.

[10] 何 斌,马天予,王运坚.Visual C++数字图像处理[M].北京:人民邮电出版社,2001.

StudyofComputerPatternRecognitionMethodforColourBlocksBasedonFuzzyClustering

ZHANG Yi

(College of Electrical Engineering,Zhejiang University of Water Resources and Electric Power,Hangzhou 310018,China)

The rapid development of online image monitoring has put forward more and more urgent needs for the application of computer image recognition technology. According to the design of Decision Support System (DSS) and the characteristics of online image monitoring,this paper analyzes the advantages of applying fuzzy pattern recognition technique to online monitoring image colour identification and classification,and proposes a new method. Firstly,the algorithm acquires all kinds of identification colour center based on sample learning sets given by experts and introduces fuzzy c-means clustering method and connected graph traversal technique. Based on identification colour membership of pixel’s corresponding colour pattern and colour’s no-mutation rules,this paper comprehensively analyzes the whole image to form each colour pattern and to obtain the colour identification results of each area. This method is prevalently instructional to similar colour automatic identification.

online monitoring; colour; fuzzy pattern recognition; connected graph traversal

2016-07-06

张 怡(1977-),女,浙江杭州人,硕士,讲师,主要研究方向为电力系统自动化、新能源技术、计算机技术在电力系统中的应用.

TP391.4

A

1008-536X(2016)10-0080-04

猜你喜欢
像素点均值聚类
基于局部相似性的特征匹配筛选算法
基于K-means聚类的车-地无线通信场强研究
均值—方差分析及CAPM模型的运用
均值—方差分析及CAPM模型的运用
基于5×5邻域像素点相关性的划痕修复算法
基于canvas的前端数据加密
基于逐像素点深度卷积网络分割模型的上皮和间质组织分割
基于高斯混合聚类的阵列干涉SAR三维成像
基于Spark平台的K-means聚类算法改进及并行化实现
基于改进的遗传算法的模糊聚类算法