集装箱箱号字符识别关键技术的研究

2019-08-12 02:35马欣欣李小平
现代电子技术 2019年14期
关键词:字符识别

马欣欣 李小平

关键词: 集装箱箱号; 字符识别; 加权模板匹配法; 字符结构; 权值分配模板; 字符定位

中图分类号: TN919.3+2?34; TP391.41             文献标识码: A                文章编号: 1004?373X(2019)14?0131?04

Research on key technologies for character recognition of container numbers

MA Xinxin, LI Xiaoping

(School of Mechanical Engineering, Lanzhou Jiaotong University, Lanzhou 730000, China)

Abstract: Taking the recognition of container numbers as the research object, the accurate recognition of container numbers is realized on the basis of preprocessing and positioning of the existing container pictures. Various key factors affecting character recognition are mainly discussed. A new recognition method by combining the weighted template matching method with character structure is proposed on the basis of traditional template matching. In the method, it is not to use a unified template to conduct matching recognition of 36 characters. Instead, the characters are classified according to character structures, and each class is assigned a different weight assignment template. Character structure recognition is a kind of secondary recognition. The combination of the two methods can realize the recognition of broken, glued, and slanted characters. The effectiveness of the method is proved by means of theoretical analysis and experiment. The problems that need further study are given.

Keywords: container number; character recognition; weighted template matching method; character structure; weight assignment template; character positioning

0  引  言

目前,在字符識别领域,国内外大量学者在此领域进行了大量的研究:贾婧等提出基于轮廓结构和统计特征的字符识别研究方法[1];沈清波等提出基于字符特征叠加提取与BP神经网络的字符识别研究方法[2];罗辉武等提出基于结构特征和灰度特征的字符识别方法[3];吴晓军等提出基于边缘几何特征的高性能模板匹配算法[4]。基于以上文献,在传统模板匹配的基础上,本文提出基于数学形态的加权模板匹配法和字符结构特征相结合的字符识别方法。

1  基于数学形态的加权模板匹配和字符结构特征相结合的识别方法

数学形态的加权模板匹配是在对图片进行数学形态处理的基础上,对标准模板和归一化后的样本模板同时进行特征模板加权改造,予以模板中的字符笔画不同的权值,最后通过模板库字符与目标字符进行对比实现识别。在此基础上,可以最大程度地降低字符周围以及内部噪声点的影响。字符结构特征法是通过提取字符笔画实现识别的[5],可以进一步提高识别的准确率。具体的流程如图1所示。

1.1  数学形态法

数学形态法是一种非线性滤波方法[6]。数学形态法的开运算能够清除小于结构元素的噪声点,去除孤立的小点、毛刺,连接两连通区域的小桥和保持总的位置及形状不变;闭运算能够填补小于结构元素细节部分,可以填平小孔、弥补小裂缝。所以可以利用闭运算来使字符边缘粘连,利用开运算来消除字符边缘噪声[7]。

1.1.1  数学形态的加权模板匹配

因为集装箱字符边缘分布相对比较集中,一般在对其进行闭运算处理后,很容易形成块状区域,所以选择小的结构元素来去除这些孤立噪声点。对于横向噪声点的去除,主要是通过横向线性结构元素使每个字符边缘横向连接,最后用开运算去除噪声[8]。同理,竖向噪声的去除和横向噪声的去除类似。

1.1.2  结构相似字符分类

模板匹配法主要通过公式(1)计算两者的相似度[8]。这种方法实际上只考虑到了标准模板和样本模板之间标准差的不同,最后用最小的方差来判断两者的相似度,对噪声点少的字符较为适用。

猜你喜欢
字符识别
一种改进深度学习网络结构的英文字符识别
基于深度学习法的视频文本区域定位与区别
基于深度学习法的视频文本区域定位与区别
基于自动智能分类器的图书馆乱架图书检测
一种基于OpenCV的车牌识别方法
仪表字符识别中的图像处理算法研究
纸币冠字号提取的方法研究
基于CUDA和深度置信网络的手写字符识别
机加工件点阵字符识别研究