基于颜色和边缘的快速图像检索研究

2011-03-06 09:16王海波艾斯卡尔艾木都拉
通信技术 2011年3期
关键词:库中特征向量直方图

王海波,艾斯卡尔·艾木都拉

(新疆大学 信息科学与工程学院,新疆 乌鲁木齐 830046)

0 引言

颜色特征是基于内容的图像检索(CBIR,Content Based Image Retrieval)中一个非常重要的特征,其对图像本身的尺寸、方向和视角的依赖性较小,具有很强的鲁棒性。颜色直方图[1]是一个使用非常广泛的颜色特征图像索引技术,该技术提取特征方便,有平移和旋转不变性,但这种技术仅统计全局颜色特性,失去了颜色空间分布信息,检索效果不佳。直方图相交法[2]、色彩聚合矢量法[3]、累加直方图法[4]等方法的提出,一定程度上改善了颜色直方图方法的不足,但仍失去部分颜色空间分布信息。文献[5-6]采用颜色和边缘综合特征进行检索,文献[7]采用基于小波的 Contourlet变换(WBCT,Wavelet-based Contourlet Transform)与平滑共生矩阵相结合的方法进行图像检索,文献[8]采用信息代理技术(Agent)进行图像检索,这些方法虽检索精度有了提高,但其复杂的算法使得检索消耗大量的时间,增加了用户的等待时间。

提出了一种改进的基于颜色和边缘特征的快速图像检索技术。算法可分为两步:①是统计HSI颜色空间的H分量并计算色调直方图,通过计算特征相似性度量获得初级检索图像库;②是通过改进的数学形态学算法对图像库进行二次检索得到检索结果。

1 初级检索图像库的建立

1.1 颜色特征提取

常用的颜色空间有RGB颜色模型、CMY和CMYK颜色模型、HSI颜色模型等。由于HSI色彩空间是从人的视觉系统出发,用色调、饱和度和亮度来描述色彩,更符合人的视觉特性,故这里采用HSI颜色模型。

统计图像中H分量的数量,建立色调直方图。用向量(1)和向量(2)分别表示待检测图像q和图像库中第i个图像的色调直方图特征。

其中N为特征向量的维数,0<N≤360,N越大,特征信息越丰富,检索效果越好,然而计算量也越大。在检索效果允许的情况下,为减少计算量,经实验现选择特征分辨率为R=5°。则N=360°/R,即特征向量的维数为72。

1.2 相似距离计算及初级检索图像库建立

相似距离的选取其对检索结果有非常重要的影响。距离越大,两幅图像的相似性越小。

由公式(3)可计算图像库中每个图像与待检测图像之间的距离向量D如公式(4),

其中I为图像库中图像的数量。

假设Pr为初级检索图像库中图像的数量P′与原图像库中图像数量P的比例,则

其中 Pr的值通过实验得出,具体方法在实验结果及分析部分有阐述。

在公式(5)中Pr及P的值都是已知,则可得到P′得值。

对距离向量D进行从小到大排序,得到排序后的距离向量D′,如公式(6):

取出向量D′前P′个向量元素,查询这P′个向量元素在原图像库中所对应的图像。所查询的P′个图像构成的图像集合,即是初级检索图像库。

2 二次检索

2.1 数学形态学边缘检测算法

传统的数学形态学边缘检测梯度算子有:

膨胀型:

腐蚀型:

膨胀腐蚀型:

其中⊕为膨胀运算,Θ为腐蚀运算,A为原图像,B为结构元素。

这些方法实现简单,降低时间复杂度,然而其对噪声较为敏感,导致检索结果不佳。

使用一种改进的数学形态学边缘检测梯度算子[5],如公式(10)所示。

其中“◦”表示开运算,“•”表示闭运算。

该算子边缘定位准确、连续性好且具有较强的抗噪能力。

2.2 选取结构元素

结构元素的选取是非常关键的,它的选取会直接影响边缘检测的结果[6]。

根据边缘方向和结构元方向的最佳匹配关系[9]-10]和实验对7种3×3结构元素进行检索结果对比,根据对比结果结构元素分别选取:

2.3 相似距离的计算及二次检索

由公式(13)可得到数学形态学边缘检测的边缘像素点集合。为获得边缘像素点集合的直方图,使用公式(14)将边缘像素点对应的彩色值转化为转化为灰度值。

其中S(i,j)为转化后的灰度值,r(i,j)、g(i,j)、b(i,j)分别为RGB颜色空间中位置为(i,j)的R、G、B分量值。

假设待检测图像在像素点(i,j)处的灰度值是Sr(i,j),初级检索图像库的第 K幅图像在像素点(i,j)处的灰度值为 Sk(i,j),则初级检索图像库的第 K幅图像与待检索图像的距离定义如公式(15):

其中 DS(i,j)(k)为相似距离值。

计算待检索图像与初级检索图像库中每一幅图像的相似距离值,可得到距离特征向量:

对Ds从小到大排序,得到排序后的向量Ds′:

假设用户期望获得M个检索结果,则Ds′前M个向量元素对应的原图像库图像即为最终检索结果。

综上所述算法步骤如下:

步骤1 将图像库中所有图像的 RGB颜色空间转化为HSI颜色空间,并计算出色调直方图,作为颜色特征向量保存到文件中;

步骤2 计算待检测图像颜色特征向量,作为目标颜色特征向量。将步骤1中的颜色特征向量与目标特征向量进行距离计算,得出颜色距离向量。对距离向量按从小到大的顺序排序,按一定比例取舍排过序的颜色距离向量,即可得到初级检索图像库;

步骤3 将初级检索图像库中的图像二值化,并使用公式(10)求出二值图像的边缘集合点。在原图像中找出这些边缘集合点,用公式(11)将这些集合点对应的彩色值转化为灰度值,统计并求出这些集合点的特定灰度直方图,作为边缘特征向量;

步骤4 计算待检测图像的边缘特征向量,作为目标边缘特征向量,由公式(12)可求得边缘距离向量。对边缘距离向量按从小到大的顺序重排序。在排过序的边缘距离向量中取出排在前面的N个图像,即可作为整个检索算法的结构(N由用户指定)。

3 实验结果及分析

3.1 实验结果

使用matlab7.1在WindowsXP平台上进行仿真。主机配置为:AMD Sempron(tm) processor 1.81 GHz,512M内存。实验中使用的图像库为image.orig。该图像库中有1000幅大小为256×384的彩色图像,内容包括人物、海滩、建筑、恐龙、花卉、动植物、山峰等,共10个内容,每个内容100幅图像。

假设初级图像库在总图像库中所占的比例用 Pr表示;检索结果中检索到的目标图像数与数据库中全部目标图像数之比(即查全率)用Re表示。图1给出了通过实验得出的Pr与Re之间的关系。

图1 Pr/Re

图2是三种检索方法在检索恐龙图像时的结果对比。在图像库中恐龙的图像共 100幅。几种检索结果都是 11×11的矩阵块显示,共121幅图像。

图2 几种方法检索结果对比

表1是三种方法分别检索恐龙、巴士、马匹、花卉的查准率。检索结果为121幅图像。检索过程中,从每个检索内容的100幅图像里随机抽取10幅图像,分别计算其查准率,求平均值作为表中检索的查准率。

表1 几种方法查准率对比表

表 2是这里方法和文献[6]方法检索时所用时间比较。检索过程中,从每个检索内容的 100幅图像里随机抽取 10幅图像,分别计算其检索时间,求平均值作为表中检索的检索时间。

表2 这里和文献[6]检索时间/s对比表

3.2 结果分析

在图1中,当Pr=0.121时,这里算法检索结果等同于仅使用色调直方图检索结果;当 Pr=1.0时,检索结果等同于仅使用数学形态学方法。实验表明当Pr=0.37时,Re可以达到最大值。故建立的初级图像库为总图像库的37%,即370幅图像。

图2(b)中由于一些花卉的色调直方图与带检索图像相似,在检索结果中具有较强干扰;图2(c)是仅使用数学形态学进行边缘检测,并建立边缘直方图的检索结果。由于马匹的形状和恐龙有些相似,检索结果中混入了一些马匹图像。图2(d)是这里的检索方法,数学形态学边缘检测算法把初级检索图像库中的恐龙图像前移,使得检索效果得到了明显提高。

表1和表2表明这里算法在提高检索精度的同时,也大大缩短了检索时间。时间的缩短,是由于引入了初级检索图像库,使得检索时间复杂度大大降低。

4 结语

综合了颜色和边缘特征进行图像检索,先使用色调直方图建立初级检索图像库,然后使用数学形态学对初级检索图像库进行再次检索。由于初级检索图像库的引入,使得检索时间大大缩减,并且初级检索图像库在原图像库中的比例由实验得出,检索精度也得到提高。实验结果证明了这里方法的有效性。

[1] SWAINM,BSLLARD D.Color indexing.Intemational Joumal of Computer Vision[J].1991,7(01):11-32.

[2] PASS G ,ZABIH R,MILLER J Comparing images using color coherence vectors[M].MA:ACM,1996.

[3] STRICKER M,ORENGO M.Similarity of color images[M].USA:[s.n.],1995:381-392

[4] 韩轩,陈海山.综合颜色和局部空间特征的彩色图像检索方法[J].计算机技术与发展,2008,18(01):122-125.

[5] 成晓倩.一种基于数学形态学的边缘检测算子[J].河北理工大学学报:自然科学版,2009,31(02):54-58.

[6] 郑秋梅,王红霞,刘康炜.基于边缘和颜色特征的图像检索技术[J].微计算机应用,2008,29(11):19-24.

[7] 向丽.基于 WBCT与平滑共生矩阵的图像检索[J].通信技术,2009,42(12):150-152.

[8] 张峰,尹东,吴文宇.基于Agent技术的遥感图像检索[J].通信技术,2008,41(10):119-121.

[9] Schonfeld D.Optinal Semeturing Elements for the Morphological Pattern Rescoration of Binary Images[J].IEEE Trans on HMI,1994,16(06):589-601.

[10] 陈虎,王守尊,周朝晖.基于数学形态学的图像边缘检测方法研究[J].工程图学学报,2004,25(02):112-115.

猜你喜欢
库中特征向量直方图
二年制职教本科线性代数课程的几何化教学设计——以特征值和特征向量为例
英语专业学士学位论文摘要的元话语特征研究
符合差分隐私的流数据统计直方图发布
克罗内克积的特征向量
街头的人
用直方图控制画面影调
一类特殊矩阵特征向量的求法
从今天开始
EXCEL表格计算判断矩阵近似特征向量在AHP法检验上的应用
智能盘库在自动化立体库中的探索和应用