灰度文本图像的扭曲文本行信息检测提取

2017-05-17 12:44王景中王兆亮
数字技术与应用 2017年3期
关键词:脊线

王景中++王兆亮

摘要:文本行的检测提取是文本图像分析的支柱。这里提出一种新的扭曲文本行信息检测提取方法,直接从灰度图像进行文本行的检测。首先用高斯平滑滤波增强文本行的结构,然后用脊线检测找出文本行的中心线,在脊线的基础上用自适应主动轮廓模型来估算出文本行的边缘线。理论分析和实验结果表明,该算法检测文本行边缘线的精确度较好,而且具有一定的鲁棒性和较好的适应性。

关键词:灰度文本图像;扭曲图像;高斯平滑滤波;脊线;主动轮廓模型

中图分类号:TP391 文献标识码:A 文章编号:1007-9416(2017)03-0130-03

近十几年以来,一直都是用扫描仪来采集文本图像。现如今已是数字化时代,数码相机以其高质量和低成本正在逐渐替代扫描仪,此外相机还具有远距离、非接触、快速采集等特点,这些特性使得相机适用于多功能的OCR相关应用,如移动OCR、数字化厚书、数字化历史文献等。但也出现了如运动模糊、低分辨率、光照不均、曝光不足或曝光过度以及扭曲和透视变形等影响因素,这给传统的OCR系统带来了新的问题。因此在文字识别之前需要做二值化和扭曲校正这样的预处理。扭曲文本行检测和文本线的估算是校正处理非常重要的步骤。之前的扭曲文本行检测方法都是基于二值图像的,这些方法可以分为两类:(1)基于连通域处理[1-3]和(2)基于文本线处理[4-5]。基于连通域方法是从单个连通域开始并搜索邻域区域中的其他连通域,而且需要使用某些复杂的标准规则来进行文本行搜索,这种方法由于处理单个连通域导致速度比较慢,但优点是处理较为细致;基于文本线方法优点在于处理速度快,这主要得益于以文本行为单位处理的,但因此也会对精准度造成一定偏差。此外,这些方法大多数是处理英文文本图像的,由于中英文字符的结构差异,应用到中文文本图像上效果较差,难以适用。

通常,基于连通域处理和基于文本线处理的方法都依赖于自适应阈值处理的二值化方法作为文本行检测之前的预处理步骤,在存在诸如不均匀阴影、低分辨率、运动模糊、曝光不足或曝光过度等情况下,二值化可能会产生不良的结果。如图1所示,因此二值化可以对文本行检测结果产生不利影响。本文提出一种直接从灰度文本图像进行扭曲文本行信息检测提取的方法。我们用基于匹配滤波器组方法的多方向多尺度各向异性高斯平滑来增强扭曲文本行的结构,然后从平滑的图像中检测到脊线,其中脊线定义为通过文本行中心的未破坏的中心线结构,然后用自适应主动轮廓模型作用在脊线上估计出文本行的边缘线。

1 扭曲中文文本图像的特征分析

在获得图像的过程中,由于书本的摆放以及相机的位置,或者书的厚度等都会导致图像出现扭曲,如图2所示,这些都会使得OCR识别率大大降低。扭曲一般分为两种情况:行扭曲和字扭曲。从识别处理的思维来说,扭曲文本行的信息更容易检测提取出来。本文提出的方法是基于灰度图的,因此需要对拍摄的文本图像作灰度化处理。图像灰度化是数字图像处理中一种经典的处理方法,目的在于将彩色图像转换成灰度图像。常用的灰度化算法是加权平均法,即对原始图像像素数据中的RGB分量代入权重求其均值,式(1)是该方法的常见加权均值公式:

其中,R(i,j),G(i,j),B(i,j)分别是原始图像中像素(i,j)的R、G、B分量值,Gray(i,j)为计算得到的灰度值,也就是新图像中像素(i,j)的值。

2 扭曲文本行信息检测提取方法

我们的扭曲文本行信息检测提取方法包括三个步骤:(1)使用多方向多尺度各向异性高斯平滑增强灰度文本行的结构;(2)使用脊线检测扭曲文本行的中心线;(3)自适应主动轮廓模型作用在脊线上估算出文本行的边缘线。

2.1 增强文本行结构

3 实验结果分析

之前的方法都是基于二值图像的,没有针对灰度图的文本行信息检测的直接评估方法,为了检验效果,同时选取针对外文的文本行检测方法进行对比,通过和外文的检测正确精度对比可以看出,本文的算法正确度较高,而且相对于传统的需要二值化处理的方法,本方法对诸如光照不均,低分辨率,运动模糊等鲁棒性较好,对扭曲程度较高的情况也能得到稳定的保证。

4 结语

本文针对扭曲文本行信息的检测提取提出了一种新方法,此方法独立于二值化算法,文本行检测精度高达93%以上,针对低分辨率,运动模糊,过度曝光等问题鲁棒性较好,能准确的在这些情况下检测出文本行。对扭曲度较高的文本行也不需要后续处理,该方法可以直接从灰度图像提取文本行信息,对传统的通过影响二值化导致文本行提取不精确的情况提出了挑战。

参考文献

[1]Liu Hong, Ye Lu, A method restore Chinese warped document images based on binding characters and building curved lines [C]// International Conference on Systems, Man and Cybernetics(ICSMC),2009:984-990.

[2]Gatos B, Pratikakis I, Ntirogiannis K. Segmentation based recovery of arbitrarily warped document images[C]//9th International Conference on Document Analysis and Recognition, 2007:989-993.

[3]宋麗丽,吴亚东,孙波.改进的文档图像扭曲校正方法[J].计算机工程,2011,37(1):204-206.

[4]张伟业,赵群飞.读书机器人的版面分析及文字图像预处理算法.[J].微型电脑应用,2011, 27(1):58-61.

[5]Liu Hong, Ding Run-wei. International Conference on Systems Man and Cybernetics: ICSMC 2009: Restoring Chinese warped document images based on text boundary lines, [C].2009:571-576.

猜你喜欢
脊线
基于改进脊线法的超冗余机器臂逆运动学求解*
一种脊线提取方法在轴承故障诊断中的应用
中国长头象蜡蝉属一新种记述(半翅目:蜡蝉总科:象蜡蝉科)
基于脊线模态法和RRT算法的蛇形机械臂避障控制研究 ①
任意多边形坡屋面屋脊线生成方法
匹配压缩脊线提取在齿轮箱故障诊断中的应用*
树状结构引导下的脊线层次划分方法研究
基于相位法的密集小波公共脊线提取方法
一种改进的基于细节点的脊线追踪算法
UG建模中边倒圆失败的处理方法