基于图像索引内容结合数据库检索方式的应用与实现

2019-05-14 08:25周文博王思贤刘帅
数字技术与应用 2019年2期
关键词:应用方法

周文博 王思贤 刘帅

摘要:本文介绍了以往的图像处理技术和现在的发展以及应用的情况;同时介绍了图像数据库的应用原理;以及现在技术中比较常见的图像数据库的数据结构,通过两者进行相应的结合,来介绍基于内容的图像索引系统,可以更为直观的理解图像索引系统。

关键词:图像索引;数据库检索;应用方法

中图分类号:TP391.3 文献标识码:A 文章编号:1007-9416(2019)02-0059-01

1 简述图像索引概念

图像处理广泛应用于人们的日常生活中,从上个世纪七十年代以来,一直成为研究的热点内容,早期的图像索引技术是以图像文本作为关键词进行检索的,即为基于文本的图像检索技术。基于图像文本的图像检索系统中一般由人工标注的关键信息来建立索引,这些信息可以是图像的名称、包含对象、建立日期等[1]。但是这个方法显然比较耗费人力,要知道,每幅图形的内容标注是个不轻松的活,并且标注完成后,还要将信息以文本的方式存储到数据库中进行检索,这又是一个很庞大的工作量。并且随着图像的增多,人工标注的工作量也越来越大;而且这种方式基于人工完成,每个人对于图像的解释自然不尽相同,语义实际的含义,常存在较大误差,对图像的识别有很大的影响,所以这种基于文本的索引方式已经慢慢的被淘汰。

自1990开始,我国图像检索研究有了新的发展,通过数据库查找满足用户视觉特征的图像,即为基于内容的图像检索技术。

2 图像数据库介绍

在我们进行图像处理时,提取到一幅图像的特征之后,一幅图像就可以用多维特征向量来表示。一般地,我们通过两个特征向量的距离来判断两个特征向量的相似程度,通常我们所使用图像相似性技术有明考夫斯基距离、直方图相交、马氏距离和余弦距离。在我们对图像进行特征提取时,我们一般将所提取的特征表示为高维向量,但是由于处理的数字图像相对比较多,对应特征量的高维向量的数量也会尤为的庞大,所以对高维向量的处理以及图像数据库的设计就显得尤为重要。在我们的认知中,图像是服务于人类视觉的一种表现形式,但在数字的角度理解中,图像只是一种数据形式,它可以很好地通过媒介传递,它不包含代码文本,故所有图像都以非文本图形或编码的形式出现。图像数据属于非结构化数据的范畴,简单来说,图像数据就是一个集合,集合里面的数值代表的是把图像分为有数个区域的灰度值,我们通常把这些区域称为像素。在设计图像数据库时,我们要考虑数据的有效存储和查询途径的可靠性。图像数据库由两个层面组成,分别为特征层面和基础数据层面,特征层面由图像的所有总体特征构成,但我们在图像检索时通过这一层的信息去索引到基础数据层的基础数据,并进行相应的处理。根据图像数据库存储的图像种类的不同,我们通常可以找到不同作用的数据库,例如人脸数据库AFLW,年龄、性别数据库Adience,车辆数据库KITTI和字符数据库MNIST等,这些数据库让我们在使用时更加的方便。

3 图像数据库索引实现

一般图像特征的表示是高维向量,且在大型图像数据库中,特征量通常非常庞大,顺序的特征比较过程将非常耗时,建立索引结构的目的是尽可能减少每个查询所需的距离计算次数,从而提高检索效率[2]。因此高维索引结构是图像检索研究的一个基本问题。常见的高维索引结构有R树、四叉树、网格等,本文介绍了这三种索引的类型和实现方式。

在介绍R树之前我们先引入另一种结构B树,B树与平衡二叉树具有相似结构,不同的是B树的非叶子节点可以拥有两个及以上节点,与平衡二叉树相比,B树可以根据节点的不同數量去存储数据,减少了查找的次数和复杂度。

R树可以看作是B树在多维空间的扩展,具有类似于B树的一些性质。它可以很好的用字节来表示复杂对象,但是由于R树节点的指针可以指向多个数据块,并且数据块之间会有重合,造成了在查询过程中不能很快速的将存储数据的数据块选择出来进行处理,对于节点相对较多的R树来说,它的查询速度和节点数目是成反比的。许多组合结构只能做到局部的优化,无法保证由此形成的R树的整体组合结构的最优,因此随着空间对象的频繁插入和删除,会将R树的查询效率带向不可预知的方向[2]。

相对于R树来说,四叉树的结构更为简单,我们可以近似地把四叉树中的一个节点看做是平面直角坐标系的原点,它把二维平面分为四个部分,即为一个节点对应四个部分,利用这种方法递归,把整个图像平面可以分为N个区域,直到树的深度达到限定或者一个区域只包含一个对象。相比较于R树在查询效率方面来说,四叉树查询效率要高于R树;在所需要的存储空间方面四叉树内存需求比较小,由于结构相对简单,可以创建线性表来进行索引。但是不足的是当一幅图像的特征不是均匀分布的时候,会造成四叉树的不稳定,所以四叉树经常用于均匀特征的图像处理。

网格索引和四叉树有着相似之处,网格索引把研究区域按照一定的规则分为小的网格,网格大小不定,并且记录小的网格中所对应的数据,在索引过程中需要用已知的对象数据来和网格中的数据做对比,查询所需要的数据。

对于基于内容的图像索引,为了能利用上述的索引方法,必须将高维向量降维[3]。解决高维数据聚类可视化的方法主要通过降维把高维数据投影到二维或者三维空间,从而达到可视化的目的。但维数降低会带来信息丢失,导致查询结果中有较多的错误[4]。所以应该考虑如何去使用一种方法去处理高维向量的降维,使损失的信息量达到最小。

4 结语

本文对基于内容的图像检索技术的方法和应用做了一定的介绍,并且比较了基于文本的图像检索和基于内容的图像检索的不同。对图像数据库的应用原理和设计做了相关的说明,并且介绍了几种常见的图像数据库;介绍了常见的几种空间索引结构,为实现快速检索,应用不同的方式去实现索引,在高维向量维度较低时使用上述三种索引结构。若维度数量庞大,则进行特征聚类,建立树形索引结构。由于篇幅有限,索引这块,不能逐一详细讲解,但是笔者还是尽可能介绍了一些比较主流的索引方式,希望能帮助读者们了解这门技术的发展和意义。

参考文献

[1] 金铭.基于内容的图像检索算法研究[D].北京:北京工业大学通信与系统系,2016.

[2] 张艳.基于内容的图像检索技术研究[D].天津:天津工业大学计算机与自动化系,2006.

[3] 张培珍.基于聚类索引的图像检索系统的研究[D].吉林:吉林大学通信与系统系,2004.

[4] 何东健.数字图像处理[M].西安电子科技大学出版社,2003(7):8-10.

Application and Implementation of Image Retrieval Based on Image Index Content

ZHOU Wen-bo,WANG Si-xian,LIU Shuai

(School of Information Engineering, North China University of Technology,Tangshan Hebei  063000)

Abstract:This paper introduces the previous image processing technology and the current development and application; also introduces the application principle of the image database; and the data structure of the image database which is more common in the current technology, through the corresponding combination of the two, Introduce a content-based image indexing system to understand the image indexing system more intuitively.

Key words:image index; database retrieval; application method

猜你喜欢
应用方法
核心力量训练在游泳训练中的应用方法探讨
现代教育技术在高职数学教学中的具体应用
初中英语课堂教学中故事教学法的应用刍议
愉快教学法在初中英语教学中的应用
巧用结合教学,提高课堂质量