基于SVM的复杂版面分割方法

2018-07-16 12:04曾凡锋许博臣
电子技术与软件工程 2018年10期
关键词:特征向量版面纹理

文/曾凡锋 许博臣

1 引言

版面分割是对版面内的图像、文本、表格等信息和位置关系所进行的自动分析、识别和理解的过程。其目标是将图像划分成若干个独立的区域,使各区域内的具有相同的特征,而不同区域间的特征在很大程度上是不同的。目前常使用的分割方法有:阈值分割法、边缘检测法、神经网络法、区域生长发等等。近年来,模式识别和机器学习中的许多算法逐渐被运用到了版面分割中,支持向量机(SVM)便是其中一个。

支持向量机(SVM)以结构风险最小化原则为理论基础,避免了过拟合现象,学习机的泛化能力得到了进一步的提升。另外,其采用的核函数技术实现由低维到高维空间的非线性映射,能够准确地处理复杂版面。采用SVM的关键步骤之一为图像特征的提取。很多研究人员对此进行了相应的工作,如一些学者[2-4]提取图像中每个像素的灰度值作为特征向量;瑞安等人[8]在上述方法的基础上对这些像素进行了简单的重组以作为新的特征向量;此外还有研究人员在特征提取中利加入了灰度统计特征来构成训练特征向量,如欧宗瑛等人[5]将图像的对比度、方向、频率偏差作为特征向量;陈新建等人[7]将图像的灰度均值、方差以及聚集度作为特征向量。总之,上述这些方法在图像的特征提取方面较为单一,当遇到诸如纹理信息较为丰富的版面,可能会使得版面分割的准确率下降。所以上述这些方法对处理具有复杂版面的图像来说是较不适用的。

针对具有复杂版面的图像,本文选取图像的纹理特征和相位一致性统计特征,借助SVM对图像进行版面分割,得到最终的分割结果。

2 图像特征提取

2.1 相位一致性统计特征

相位一致性是指在图像的频率域中,边缘相似的特征在同一阶段出现的频率较高,其理论基础是图像信号的相位。相较于基于灰度的边缘特征提取方法,该方法是通过计算图像的相位一致性来查找图像的边缘,并且它不受图像光照不均所带来的影响,能够将图像中的角、线、纹理等信息完整地反映出来。近年来,一些学者已将相位一致性统计特征应用在了图像处理的课题中,如高分辨率遥感图像分割。因此,本文对图像的相位一致性特征进行了提取工作。

图1:原始图像

图2:版面分割结果

首先,信号F(x)的傅里叶展开为:

相位一致性定义为:

其中,An是指局部幅值,即第n个余弦分量的幅度值;是指局部相位,后面的均值是指相位的加权平均值。

利用相位一致性计算出一幅图像的相位一致性PC图像,进而得到该图像的一些统计量,它们分别为均值方差V、偏度SK、峰度BK、熵Ent,本文利用上述统计量作为特征向量,为后续SVM进行版面分割做准备。

2.2 纹理特征

在纹理特征提取方法中,灰度共生矩阵(GLCM)属于最经典的一个。这种算法的优点是检索纹理图像的精度高,缺点是该阵为稀疏矩阵,导致计算量庞大,所占内存也非常大。因此为了减少计算量和存储量,本文对灰度共生矩阵做了一定的修改。

灰度共生矩阵是沿主对角线的对称阵,将主对角线右上区域的值与左下区域对应的对称元素值进行求和,右上区域的值赋值为0,以形成下三角矩阵。接下来对新形成的矩阵计算和差向量,当相对位移没有发生变化时,和与差的定义为:

和向量定义为:

差向量定义为:

正规化的和矢量与差矢量分别定义为:

其中:Hs和Hd分别表示和向量与差向量的长度。Haralick定义的常用纹理特征值中的四种可以由和差统计法直接计算出来,分别为角二阶矩(UNI)、对比度(CON)、相关度(COR)、熵(ENT),将统计出的特征值作为特征向量,为后续SVM进行版面分割做准备。

3 支持向量机SVM

支持向量机(SVM)是一种基于结构风险最小化原则建立起来的统计学习方法,该学习器具有较强的泛化能力,其本质是一个分类器。版面分割的目标是根据人们的需要,将一幅图像所需要的部分分割出来。显然,SVM可以应用到版面分割中,它将图像的像素划分为两类:一类是边缘点像素、另一类是非边缘点像素。

利用第二节提取出的相位一致性统计特征及纹理特征,本文构造了支持向量机(SVM)对图像进行版面的分割。

分割过程如下:

首先,将一幅图像的每个像素点构成特征向量xi。设A,B分别代表边缘点与非边缘点,则类别标志yi可以表示为:

线性判别函数须满足如下条件:

其中,w为权重向量,b为常量。

两类样本的分类空隙(M)的间隔大小为:

此时,最优分类面问题即在条件(3)的约束下,求公式(4)的最小值:

通过式(2)的须满足的条件求解式(4)的最小值,得到全局最优解则线性最优分类判决函数为:

4 实验结果与分析

使用本文方法对如图1所示图像进行版面分割,分割结果如图2所示。

为了检测算法的分割效果,本文选取了包括文献内容、报纸、网页等各类具有复杂版面的图像。

利用传统方法对图像进行版面分割,具有复杂版面分割的准确率在75%左右,一般版面的准确率在85%左右;而本文算法的平均准确率达到了87.2%。实验结果及与其他算法的比较表明,本文的算法对含有复杂内容的版面具有较好的分割效果。

与传统方法相比,时间复杂度偏高,这主要是由于在相位一致性统计特征的计算上所花时间较长,如果再对算法进行进一步的改进,相信算法在时间的花费上也会得到进一步的优化。

5 结束语

本文提出了一种基于SVM的版面分割方法,即将图像相位一致统计特征和纹理特征组合成训练特征向量,再利用支持向量机对版面进行分割。实验结果表明,该方法可以有效地进行复杂版面的分割工作。

猜你喜欢
特征向量版面纹理
二年制职教本科线性代数课程的几何化教学设计——以特征值和特征向量为例
克罗内克积的特征向量
使用纹理叠加添加艺术画特效
一类特殊矩阵特征向量的求法
TEXTURE ON TEXTURE质地上的纹理
EXCEL表格计算判断矩阵近似特征向量在AHP法检验上的应用
版面撷英
好版面要有独到的创新技巧
消除凹凸纹理有妙招!
新版面 新视角