基于新疆维吾尔医草药图像形状特征的检索研究

2014-07-13 06:46严传波木拉提哈米提员伟康
新疆医科大学学报 2014年1期
关键词:查全率查准率草药

严传波, 木拉提·哈米提, 李 莉, 员伟康, 杨 芳

(新疆医科大学医学工程技术学院, 乌鲁木齐 830011)

基于内容的图像检索是从图像的颜色、纹理、形状等信息中提取图像特征进行图像匹配的过程,其中形状特征是图像重要的视觉特征。同类物体可能有不同的颜色或纹理,但其形状特征却可能相近,不会随图像的颜色或纹理改变而发生变化。在基于维吾尔草药图像的检索匹配中,草药形状特征相对颜色、纹理特征更有其独特的检索优势。

形状特征描述方法可分为两类,一类是基于图像区域的描述如几何不变矩、Zernike矩等描述方法;一类是基于图像边缘信息的描述包括链码、傅里叶描述、小波描述等。Hu不变矩是一种经典的形状特征描述方法,它通过应用图像区域的普通矩和中心矩构造图像区域的二阶、三阶中心矩,从而形成7个描述图像形状的不变矩特征,具有图像旋转、平移和尺度变化的不变性,已成为图像识别的主要判别方法之一。目前,Hu不变矩已有许多应用,如应用Hu不变矩和Affine不变矩对高速公路上行驶的车辆进行检测和车型识别[1];应用商标图像的Hu不变矩特征结合SIFT特征进行图像检索, 减少精确匹配需要的计算次数,降低计算复杂度[2]。Hu不变矩是基于图像区域的形状描述,应用范围有限制,针对这一问题,研究人员同时结合图像的区域不变矩和边界不变矩信息构造改进的统一不变矩形状特征,针对图像旋转特点引入权向量进行图像检索,提高了图像旋转变换后的识别命中率[3-4]。Hu不变矩运算量较大,人们提出了采用正交矩如Zernike矩等方法计算图像形状特征用于图像检索,采用基于Zernike矩形状特征的水果形状分类方法,在水果分类应用中取得较好效果[5]。

在基于维吾尔草药图像检索中,本研究首先对维吾尔草药图像做图像分割、尺度归一化等预处理,通过Matlab编程,使用Canny算子、轮廓跟踪等方法获取草药图像的形状,然后根据Hu不变矩理论提取草药图像的形状特征,并对其进行草药图像的检索匹配和有效性实验验证。

1 草药图像形状提取

1.1用Canny算子提取维吾尔草药图像边界草药图像边界的提取是准确提取形状特征的前提。图像边界是图像中2个具有不同灰度的均匀区域的边界,即图像中灰度的急剧变化区。由于边缘是图像的信息丰富区域,具有图像的几何变换和旋转不变性特性,可通过边界检测算子提取图像的边界。Matlab常用的边界检测算子较多,如Roberts算子、Canny算子等,经比较,本研究在提取草药图像边界时采用Canny算子。以草药石蜡红为例,对草药图像(图1a),采用Canny算子进行图像边缘提取,得到图像边缘图像(图1b)。继续对图像边缘进行轮廓跟踪,得到草药石蜡红图像外轮廓,然后使用种子填充,对图像外轮廓进行开闭运算等优化操作后得到图像的最后形状(图1c)。

1.2草药图像Hu不变矩特征提取Hu不变矩是由Hu在1962年提出的用于形状识别的图像矩描述。在图像像素数目一定时,Hu不变矩具有对图像的旋转、平移和尺度变化的不变性特性,已被广泛用于图像形状识别。

Hu不变矩定义-幅大小为M×N的图像f(x,y)的p+q阶矩为:

(1)

(2)

(3)

根据以上定义,Hu不变矩的7个不变矩定义为:

φ1=η20+η02

(4)

(5)

φ3=(η30-3η12)2+(3η21-η03)2

(6)

φ4=(η30-η12)2+(η21+η03)2

(7)

φ5=(η30-3η12)(η30+η12)[(η30+η12)2-3(η21+η03)2]+

(3η21-η03)(η21+η03)[3(η30+η12)2-(η21+η03)2]

(8)

φ6=(η20-η02)[(η30+η12)2-(η21+η03)2]+4η11(η30+η12)(η21+η03)

(9)

φ7=(3η21-η03)(η30+η12)[(η30+η12)2-3(η21+η03)2]+

(3η12-η30)(η21+η03)[3(η30+η12)2-(η21+η03)2]

(10)

已经证明Hu不变矩具有平移、旋转、比例尺度变化不变性,这些矩的幅值反映了物体的形状,因而可用于形状检索和模式识别[6-7]。以玉兰花为例,其原图及其形状如图2。

表1 玉兰花图像在图像平移、旋转、缩放后的Hu不变矩特征值

从表1中的测试数据可以看出,在原始图像进行平移、旋转、缩放后,Hu不变矩特征值在数值上变化不大,符合形状特征的特点,能够较准确地表达图像的形状信息。

本研究根据图像Hu不变矩理论,应用Matlab进行草药图像形状特征的提取。由于计算所得草药图像形状特征数据分量数值变化范围较大,部分数据出现溢出现象,为此对Hu不变矩做了变换,在计算形状特征向量时做了归一化处理,得到7个Hu不变矩特征分量T1~T7。另外,草药图像形状的宽高比也是图像的基本形状特性,可作为图像形状的另一特征分量。本研究对Hu不变矩特征做了一定改进,除了Hu不变矩的7个分量外,引入了草药图像形状的宽高比T8作为图像形状的第8个特征分量。提取的部分草药图像形状特征如表2所示。

表2 部分草药图像的Hu不变矩形状特征

2 基于形状特征的草药图像检索

本研究根据改进的图像形状特征,构建了基于内容的草药图像检索系统,将草药分为花、叶、皮、根、种子等类别,采集了300多种草药的基本信息、草药图像及其改进Hu不变矩形状特征。系统根据用户输入的草药图像,计算和提取其形状特征,按照选定的图像相似度匹配算法如(欧氏距离、马氏距离、余弦距离等算法)在维吾尔草药数据库中检索与之形状相似的草药图像,按照相似度高低从大到小排列顺序将匹配图像反馈给用户,实现基于内容的图像检索匹配。图3、图4是根据欧氏距离、余弦距离算法进行基于图像形状特征内容检索的图像匹配结果图。

图3 欧氏距离算法图像检索结果 图4 余弦距离算法图像检索结果

图像检索系统的性能评价主要考查检索速度和准确度2个因素。检索速度主要取决于选取的图像内容特征相似性匹配算法的复杂度;检索准确度主要取决于选取的图像内容特征的实用性和相似性度量方法的有效性,目前常用的图像检索系统的性能评价方法有查准率(Precision Rate)、查全率(Recall Rate)和检索速度等。

查准率是在一次查询过程中,系统返回的相关图像数目占所有返回图像数目的比例;查全率则指系统返回的查询结果中相关图像数目占图像库中所有相关图像数目的比例[8]。在本研究草药图像检索系统中,收录了318幅各类草药图像,每幅图像将尺度归一化为最长边300像素点,定义检索结果的图像返回数目为10。经过实验验证,草药图像对花类、叶类草药图像的平均查准率达到70%,平均查全率达到80%,检索效果较好;对根类与皮类草药图像检索效果不够理想,平均查准率不到70%,平均查全率仅为50%(表3),这可能是由于根类、皮类草药图像形状较复杂,图像分割不精细造成的。系统需要进一步研究图像的分割算法,以提高系统的检索效率。

表3 各类草药图像的平均查全率和平均查准率/%

3 结论

基于图像形状的检索是基于内容检索中一个最具挑战性的问题之一。本研究以草药图像为研究对象,从图像整体入手,提取图像的形状特征,构建了基于草药图像形状特征的草药图像检索系统,并进行了检索效率验证。结果表明,以本实验方法提取草药图像的Hu不变矩形状特征对基于内容的维吾尔草药图像的检索有较好的检索效果,对叶类、花类草药图像的平均查准率达到70%,平均查全率达到80%。对根类、皮类图像的检索效果不够理想,图像分割算法不够精细,系统需要进一步研究较好的图像分割算法,以提高系统的检索效率。

参考文献:

[1] 张明恒,王华莹,郭烈. 基于改进K-Means算法的车辆识别方法[J]. 计算机技术与发展, 2012, 22(5):53-56.

[2] 王振海. 融合HU不变矩和SIFT特征的商标检索[J]. 计算机工程与应用, 2012, 48(1):187-190.

[3] 张琪,屈严,董志芳. 改进的统一Hu矩在图像目标识别中的应用[J]. 电子器件, 2012, 35(6):679-682.

[4] Chaur-Chin C. Improved moment invariants for shape discrimination[J]. Patten Recognition, 1993, 26(5):683-686.

[5] 应义斌,桂江生,饶秀勤. 基于Zernike矩的水果形状分类[J]. 江苏大学学报:自然科学版, 2007, 28(1):1-3,67.

[6] 刘威,孔英蕾,肖宏涛. 基于形状特征的图像检索技术[J]. 兰州理工大学学报, 2011, 37(1):100-105.

[7] 吴建. 基于颜色和形状特征的彩色图像检索技术研究[J]. 苏州大学学报:自然科学版, 2012, 28(1):47-52.

[8] 李莉,木拉提·哈米提,艾克热木·阿西木,等. 基于灰度共生矩阵的新疆地方性肝包虫CT图像特征提取方法[J]. 科技导报, 2010, 28(16):31-35.

猜你喜欢
查全率查准率草药
小草药里的大梦想
草药王
海量图书馆档案信息的快速检索方法
基于数据挖掘技术的网络信息过滤系统设计
基于词嵌入语义的精准检索式构建方法
大数据环境下的文本信息挖掘方法
基于深度特征分析的双线性图像相似度匹配算法
基于Web的概念属性抽取的研究