基于阈值与形态学的女红女书图像分割方法

2021-01-25 08:00包苹苹李玲香段华斌

湖南科技学院学报 2020年5期

包苹苹李玲香段华斌宋均

（湖南科技学院电子与信息工程学院，湖南永州 425199）

女书字符，也称女字，其识别技术是信息化处理的重要环节，而图像分割是女字识别技术的重要前期工作。近年来，国内一些学者对女书信息化处理研究取得一定的进展[2-4]，提出了一些女书字符图像分割算法[5-10]，这些算法都是针对背景简单的手写女书分割，目前国内外学者对布帕、绣品等女红作品的女字分割研究甚少，因为女红作品样式繁多、图形多样，进行女字分割时，复杂图案的处理成为图像分割的难点。本文针对背景复杂的女红作品，在自适应阈值图像分割的基础上，结合形态学，提出了一种半自动化的女书图像分割方法。

1 基于阈值的图像分割原理

1.1 基于阈值的图像分割原理

阈值法分割是一种基于区域的图像分割技术，其基本原理是：通过设定不同的特征阈值，把图像分为若干类。特征包括来自原始图像的灰度或彩色特征、由原始灰度或彩色值变换得到的特征。设原始图像为 f(x,y)，按照一定的准则从f(x,y)中找到特征值T，将图像分割为两部分，分割后的图像为

当 b0=0 ， b1=1 ，就是图像的二值化。

1.2 基于阈值的女书字符分割

图1 给出三种女红作品的原始图，像绣帕类的女红作品因材质存在较强的褶皱，如图1(a)所示。对图像二值化处理带来困难，可以采用自适应阈值方法进行分割，高灰度区用高阈值分割，低灰度区就使用低阈值分割，可以在一定程度上减小光照不均的影响，分块数目大，每块的光照都近似均匀，这样分割的效果更好，但是分块数并不是越大越好，太大的分块数会对目标像素产生损耗。

图1 女红作品原始图

本文分别对图1 女红作品的原始图进行了自适应阈值女红的女字图像分割，其效果图如图 2 所示。

图2 自适应阈值女红的女字分割效果图

对于绣帕类的女红作品采用自适应阈值算法进行女字分割实验表明：作品1 背景简单，无多余图案，女字分割后清晰，正确率高，见图2（a）效果图。作品2、作品3 背景复杂，含有多余图案，女字分割后不清晰，分割效果较差，见图2(b)和(c)效果图。

2 基于阈值与形态学结合的女书图像分割

2.1 女红女字分割处理流程

针对背景复杂的女红作品，如背景含有多余的图案，如图1 中的作品2 和作品3，本文提出了一种基于阈值和形态学结合的女书图像分割方法，其处理流程是：先进行图像二值化预处理，再进行人机交互自主选定文字区域，将图案多样的女红作品中的女字区域裁剪出来，然后利用阈值与形态学相结合的分割法实现女书字符与背景分离，最后对处理后的二值化图像做单个文字切割，其处理流程如图3 所示。

按照中图分类法，对比改革开放40年前后图书出版种类，文化、科学、教育、体育类，文学类和工业技术类始终排列前三。改革开放40年，其他两类变化不大，文化、科学、教育、体育类增量较大，在改革开放前所占图书出版总量20%基础上又增加了7个百分点。对比1978年与2017年图书出版种类可见，总体分布基本保持了一致。

图3 女红女字图像处理流程

2.1.1 二值化预处理

图像二值化使图像呈现出黑白效果，点的像素值为1 或0。根据需求选择灰度图二值化还是彩色图二值化。二值化的目的一是为了将背景与目标分离凸显感兴趣的目标，二是减少计算量，三是为随后的文字切分和后续处理奠定基础。

2.1.2 人机交互定位文字区域

要分割出复杂背景中的女字，女字区域的准确定位是非常重要的。人们将柔美的女字绣在布帕上，想要除去如此复杂的图案背景是比较困难的，而且图案与文字的位置关系灵活多样，虽然深度学习的文本检测看似灵活有效，但是训练所需的女字数据集制作有限制，难以获得足够多的样本数据。手动定位文字区域的方法虽略显笨拙，对于字数量少且图案复杂的文本能体现其特有的优势。人机交互自定义功能函数如下：

function g=getROIbyIter(f)

bw=roiploy(f);%交互式定位文本区

[I,J]=find(bw==1);%获得目标区域的数据矩阵

G=find(min(I):max(I), min(J):max(J));%自动裁剪

2.1.3 迭代自动阈值分割

裁剪后的女红女书图像虽已经去除了背景图案的大干扰，但仍然存在一部分干扰，比如光照不均匀、明显的折痕、各类噪声、图像对比度差等情况使得图像有效二值化处理阈值的确定更加复杂。

迭代法自动阈值分割首先要为全局阈值选择初始估计值（灰度值）作为初始阈值，用初始阈值分割图像，获得新的阈值，依次迭代进行分割获得最佳阈值。其实现步骤如下：

①选择整幅图像的最小灰度值和最大灰度值的平均值为初始阈值Gk，k 为迭代次数，初始时k=0，这样选取初始阈值既能较好地保留重要像素值，也能去除部分无关像素值。

2.1.4 形态学去噪

图像形态学中最常用的两种基本操作就是膨胀与腐蚀。在形态变换中，结构元素相当于信号处理中的“滤波窗口”，但结构元素的合理选择也影响着去噪的效果。考虑到女字形体娇小纤细、外轮廓光滑，为了防止去噪处理后女字的轮廓出现较大程度上的失真，本文选择圆形结构元素做膨胀操作，根据数字图像本身的特性，选取方形结构元素做腐蚀操作，更易腐蚀掉多余的像素点，半径与长度大小需根据二值图像中白斑的大小进行人工确定。鉴于腐蚀后的图像还存在少许孤立的白色小点，通过最小值滤波与均值滤波结合使用滤除白色噪声点，最后通过膨胀操作对文字轮廓进行修缮。

2.1.5 文字切割

女书字符识别技术是信息化处理的重要环节。女书识别的关键在于单个文字的切割，文字区域定位之后，需要将区域内的文字切分出来。通过观察发现，大部分绣帕上的女书行与行之间不存在平行关系，且绣帕上的女书文字都是独立的个体，在进行预处理后排除非目标像素的影响，每个女字属于一个独立的连通域。由于投影法切割属于手动切割，效率低且麻烦，而连通域的切割方法可以避免第二次手动切割，本文采用连通域的切割方法对单个女字进行切割。

2.2 实验结果及分析

2.2.1 基于阈值和形态学的女红女字分割效果

本文以图 1 中的像素尺寸分别为509 ×493的女红作品1、273 ×300的女红作品2和800 ×766的女红作品3 的原始图为例，用本文提出的新方法进行女红字符图像分割，其分割效果图如图4 所示。

图4 基于阈值和形态学的女红女字分割效果图

从图4 实验结果表明：本文的方法对于图1(a)光照不均、严重皱褶以及图1(b)和图1(c)有背景图案的女红女字图像分割均可获得较好的分割效果，此方法也适用于其他女红类的古典文字分割，但对于污染严重的女红女字分割效果较差。

2.2.2 基于连通域的女字切分效果图

本实验利用阈值与形态学相结合的分割法实现了图1 中的作品1、作品2、作品3 原图的女书字符与背景分离，然后对处理后的二值化图像采用连通域法实现单个女字切割，其效果图如图5 所示。

从图5 分割效果图可以看出：采用连通域的女字切分法对于图1(a)和(b)粘连不是特别严重的女字能够取得较好的切分效果（见图5(a)和(b)），但是对于图1(c)粘连、重叠严重的女字切分效果不尽如人意(见图5(c))。

图5 基于连通域的女字切割效果图

图5（续）

3 结语

本文针对女红类女书无论从颜色还是文字布局、文字大小都存在多样化的特点，采用人工交互的方法灵活定位文字区域，利用自适应阈值、形态学去噪等方法实现了女红女字的分割、提取。实验结果表明：该方法对图案复杂的绣品女书字符图像分割具有较高的正确率和较强去噪声能力，为女书字符识别提供一定的理论参考，对于女书粘连的单个女字切分效果欠佳、而且字符图像预处理后采用了一种半自动的文字区域定位，不适合于大批量女书图像样本处理。