基于轮廓特征的车牌英文和数字识别方法

2016-01-22 01:05王忠飞,陈元正
浙江工业大学学报 2015年5期

基于轮廓特征的车牌英文和数字识别方法

王忠飞,陈元正

(浙江工业大学 特种装备制造与先进加工技术教育部重点实验室,浙江 杭州 310014)

摘要:车牌字符识别是智能车牌识别系统中的核心部分,而车牌字符识别的关键在于提取有效的字符特征.字符的轮廓特征能很好地反应字符图像的局部和全局的结构特征,在分析字符凹凸轮廓结构的基础上,定义了字符凹凸轮廓方向和圈,提出一种基于字符凹凸轮廓特征的字符识别方法.通过对字符凹凸轮廓背景赋值,标记凹凸轮廓方向,提取字符不同凹凸轮廓方向的特征及轮廓特征个数;根据字符轮廓特征及其个数可以对待识别字符粗分类识别;对未识别的字符提取局部特征分类识别.该方法不需要对待识别的字符进行细化,计算量小,识别率高.经实验证实该方法识别效果较好.

关键词:车牌字符识别;轮廓特征;凹凸特征

收稿日期:2015-03-24

作者简介:王忠飞(1971—),男,河南南阳人,副研究员,博士,硕士生导师,主要从事机电系统控制技术、并联机器人机构及相关理论方面的研究,E-mail:wzf1225@hzcnc.com.

中图分类号:TP391.4

文献标志码:A

文章编号:1006-4303(2015)05-0522-05

Abstract:License plate character recognition is the centre part of Intelligence Vehicle License-Plate Recognition System, and the key to it is extracting character feature effectively. The outline feature of character can partly or wholly reflect the architectural feature of character, and based on the analysis of concave-convex outline structure of a character, defining the orientation and circle of concave-convex outline, which is a character recognition method based on the concave-convex outline feature. By assigning to the background of concave-convex outline of a character and marking the orientation of the concave-convex outline, the concave-convex outline orientation feature of a character can be extracted. Then the concave-convex outline orientation feature can be used to classify and recognize the character roughly. To the unrecognized character, local feature should be extracted before classify and recognize. With proposed recognition method, the process of thinning the character to be recognition can be moved, and the calculation is smaller, the recognition rate is higher.

Keywords:license plate character recognition;outline feature; concave-convex feature

Recognition method based on outline feature for alphabetic and

digital characters on vehicle license plate

WANG Zhongfei, CHEN Yuanzheng

(Key Laboratory of Special Purpose Equipment and Advanced Manufacturing Technology, Ministry of

Education, Zhejiang University of Technology,Hangzhou 310014, China)

车牌识别系统作为智能交通系统的核心部分,在城市道路交通、停车场和高速公路等车辆管理项目中显得十分重要.随着道路上行驶车辆数量不断增加,使停车场和道路交通管理越来越棘手,对车牌识别系统的识别速度和识别率提出了更高的应用需求,例如,车库自动道闸系统对车牌快速识别需求,利用车牌作为机动车“身份证”,快速识别认证车牌,可避免出入口停车取卡、还卡操作.车牌字符识别是车牌识别系统中最核心部分,输入经过车牌定位、字符分割后获取的字符图片,提取出字符特征,设计合理的字符分类器,输出字符图片的识别结果[1-3].

目前,我国车牌数字和字母字符的识别,最常用的是基于人工智能的神经网络算法和模板匹配算法两大类[4].张旭兰[5]对BP(Back propagation)神经网络参数优化,改进收敛性,改善BP神经网络对字符识别的应用;郭荣艳等[6]采用改进的神经网络进行特征提取训练,提出基于分级网络的车牌字符识别方法;NAGARE[7]结合BP(Back propagation)神经网络和LVQ(Learning vector quantization)神经网络,建立混合神经网络,提高字符识别率;陈玮等[8]提出基于欧拉数的模板匹配,去除了模板匹配过程中冗余背景信息,改善某些相似字符的识别率.众所周知:神经网络算法需要选择大量可靠的训练样本,面临神经网络结构设计及参数优化等问题,模板匹配需要提取的特征维数多,计算量大,识别速度相对较慢,不能很好得满足在线、快速识别车牌的需求[9-12].因此,很多学者热衷于研究分析字符整体结构特征,特征提取的过程中计算量小,字符识别速度快.胡金蓉等[13]基于字符的凹凸性、弯曲度和交点数等形状特征,设计了一种字符形状特征的车牌字符识别算法;MENG等[14]分析字符连通域的凹凸性和圈特征,提出一种基于字符连通域特征的车牌字符识别算法;宋加涛等[15]选用字符细节特征:三叉点,四叉点和笔画端点,将笔画中的拐点作为辅助结构特征,闭合曲线作为字符的整体特征,构造三级字符分类器.笔者基于字符凹凸轮廓结构的分析,提出一种基于字符凹凸轮廓特征的字符识别方法,实现对凹凸背景区域快速赋值,根据背景值快速判断字符轮廓特征,提取字符特征.笔者算法相较于字符结构特征匹配的文献,计算量更少,识别率更高,能够满足在线、快速车牌识别系统应用的实时性需求.

1字符轮廓特征提取

对车牌字符图像归一化和二值化预处理,字符图片背景区域有两种分布方式:一种是分布在字符笔画内部,即背景区域被字符笔画包围;一种是分布在字符笔画外轮廓上,形成凹凸区域,前者称为轮廓圈,后者称为凹凸轮廓区.因此,若字符图像上一个区域为字符轮廓圈,则从该区域的任意一点出发,向上、下、左、右4个方向作射线,则4条射线必定与字符笔画区域相交;对于凹凸轮廓区域,从该区域的任一点出发,向上、下、左、右4个方向作射线,至少存在一个方向不会与笔画区域相交.

1.1图像预处理

字符分割、字符识别和车牌定位是智能车牌识别系统中的三个重要组成部分.经过分割后的字符通常大小不一,首先将待识别字符归一化到15×30像素,其次,在RGB颜色空间上将其二值化[16].经过预处理后的车牌字符图片如图1所示,其中白色部分为前景,黑色部分为背景.

图1 字符预处理效果 Fig.1 The character pre-processing

1.2字符图像背景区域赋值

字符的二值化图像矩阵可以分为前景和背景两部分,前景是字符笔画区域,背景是非字符笔画区域.字符前景像素取为1(或255,这里取1),字符背景像素取为0.从任意一个背景点向上、下、左、右4个方向作射线,经过对字符轮廓分析,这些方向射线有的不会与字符的笔画区域相交,直接到达图像边缘,而有的会与字符笔画区域相交,.

设定背景像素点射线与笔画相交取值规则:从背景点B出发,向上、下、左、右4个方向作射线,且对4个方向的射线赋予属性值,如图2所示.背景点B的初值p=0,若4个方向的射线中存在与字符笔画区域相交的射线,将相交射线对应方向上的射线属性值相加赋值给p.

18B24

图2背景点4方向射线属性值

Fig.2The four-way directional value of the background point

例如,背景点B1只有右射线与字符笔画区域相交,则背景点B1的值p1=2;背景点B2的上、下、右射线与字符笔画区域相交,则背景点B2的值p2=1+2+4=7.如图3所示,对字符A和字符C处理后的结果.

图3 A和C背景处理结果 Fig.3 The background result of character A and C

1.3字符轮廓圈特征的提取

由字符轮廓圈定义可知:该区域的点,4个方向的射线都与字符笔画相交,字符背景图像区域被字符笔画围绕.因此,若字符图像连通域背景具有字符轮廓圈特征,则该字符背景区域上的任一像素点B的背景值p就为15.根据背景值可以提取字符轮廓圈的特征:提取字符背景值为15的连通域,并统计连通域个数,即轮廓圈个数.其中,背景值为15的连通域有完全被字符笔画包围和非完全被字符笔画包围两种情况,前者如图3中字符A背景处理结果所示,背景值为15的连通域只与字符笔画区域相邻;后者如图3中字符C背景处理结果所示,背景值为15的连通域除了与字符笔画区域相邻外,还与值为13的连通域相邻.因此,字符轮廓圈可分为轮廓真圈和轮廓伪圈,提取字符轮廓圈的算法步骤为:

1) 提取字符背景值为15的连通域.

2) 判断背景值为15的连通域邻接是否存在非字符笔画区域,若存在,则该连通域定义为轮廓伪圈;若不存在,则该连通域定义为轮廓真圈,并分别统计轮廓伪圈和轮廓真圈的个数.

1.4字符凹凸轮廓特性的提取

字符在轮廓上除了轮廓圈外,根据字符轮廓的凹凸位置,可以把凹凸区分为左凹凸、右凹凸、上凹凸、下凹凸、上左凹凸、上右凹凸、下左凹凸、下右凹凸8种.图4中所示,B为目标背景点,黑色填充区域是字符笔画所在的区域,白色填充区域是非字符笔画所在区域,从目标背景点B向左、右、上、下4个方向作方向射线,除了向上的方向射线,其他方向射线都与字符笔画区域相交,则该背景区域称为上凹凸(图4),同理可以定义字符的下凹凸,左凹凸,右凹凸,并且上凹凸、下凹凸、左凹凸、右凹凸所对应B点的背景值p分别为14,11,7,13.

图4 上凹凸轮廓 Fig.4 The up concave-convex outline

若在4个方向射线中,只有向下、向右射线与字符笔画区域相交,则该区域称为上左凹凸,同理可以定义字符的上右凹凸,下左凹凸,下右凹凸.并且上左凹凸、上右凹凸、下左凹凸、下右凹凸所对应B点的背景值p分别为6,12,3,9.因此,可以根据背景值判断该字符背景区域轮廓特征,如表1所示.

表1 字符背景轮廓特征

对于二值化图像可以很容易得到背景区域矩阵,在背景矩阵中,即有轮廓圈,也有凹凸轮廓区域,通过分析,根据表1中字符背景值,可判断字符轮廓是否存在字符背景值对应的字符背景轮廓特征,并可统计该轮廓特征个数.

2基于字符轮廓特征的分类识别

根据对字符轮廓特征的分析研究,可以提取待识别字符的轮廓特征,如表2和表3所示.其中24个英文字母(除去字母“I”和“O”)和0~9这10个阿拉伯数字,数字字符“1”可以根据其宽高比来识别.字符识别分两步完成:1)根据字符轮廓特征及特征个数,对待识别字符粗分类识别;2)对粗分类完成后未识别字符,采用其他字符特征进行细分类.

表2 字符轮廓特征个数

表3 字符轮廓特征个数

根据字符不同轮廓特征及其个数,对24个英文字母和0~9(除“1”以外)这9个阿拉伯数字识别分类.根据字符的轮廓真圈个数可以将待识别字符分为三个待识别字符子集:没有轮廓真圈特征的字符子集、具有一个轮廓真圈特征的字符子集和具有两个轮廓真圈特征的字符子集,利用字符轮廓伪圈和凹凸轮廓特征可以对字符进一步分类识别.一个轮廓真圈字符识别流程如图5所示,两个轮廓真圈字符只有“8”和“B”,可通过轮廓左凹凸特征分类识别,无轮廓真圈字符识别流程如图6所示.

图5 单轮廓真圈字符识别流程 Fig.5 The process of identifying character which has only one true circle

图6 无轮廓真圈字符识别流程 Fig.6 The process of identifying character which has no true circle

经过字符轮廓特征的粗分类,字符A,E,F,J,K,L,M,R,S,T,W,X,Z,1,2,6,7,9可以直接分类识别,剩余待识别字符C1~C6,共6个字符集,需要使用其他的字符局部特征处理识别.如表4所示,对待识别字符提取局部特征分类识别.

表4 待识别字符集识别策略

3实验结果与分析

在eclipse开发环境下,对上述算法使用C++编写了基于轮廓特征的车牌字符识别程序,在华硕A43SD笔记本电脑(Intel酷睿i5,2 450 M,2.5 GHz的CPU,8 GB内存,ubuntu12.04操作系统)上运行,在确保所抽取车牌覆盖了所有英文字母和数字字符的前提下,随机抽取500个汽车牌照,对3 000张字符图片实验测试,实验结果如表5所示.从表5中显示:笔者提出的车牌字符识别算法具有较高的识别率和较好的实用价值,并且整个字符识别的平均时间为20 ms/字符,识别效率较高.车牌原图和正确识别字符图片如图7所示.

表5 实验及相关文献中的识别效果

图7 车牌和正确识别字符 Fig.7 License plate and correct recognition characters

分析字符识别实验结果发现,图像中存在的噪声是影响字符识别率的主要原因,例如字符“8”的笔画中若出现断裂情况,影响字符轮廓特征的提取,导致无法识别该字符.同时,噪声也容易引起字符笔画出现粘连情况,破坏完整的字符结构特征,使得提取的字符特征无效,并直接影响字符识别的准确性.一些噪声引起误识和拒识字符图片如图8所示.实验表明:笔者提出算法具有较高的车牌字符识别率,并且识别速度快.进一步提高识别率的关键是加强字符图像预处理,实现具有自适应能力的数学形态学方法来消除字符笔画噪声的影响,并提高字符轮廓特征的鲁棒性.

图8 噪声影响的字符 Fig.8 The noisy characters

4结论

在分析车牌英文字母和数字字符整体轮廓特征的基础上,对字符背景凹凸轮廓进行方向性标记,快速提取出字符轮廓特征,对字符实现快速简便的识别.方向性凹凸轮廓特征具有字符特征提取快速简单,特征数据量小,形状相似字符识别能力强等特点,能很好的满足当前高效、快速、在线的智能车牌识别系统的技术要求.以往在停车场、高速路口和工厂的自动道闸系统等管理中,需要在入口停车取卡、出口停车还卡等操作,在出入高峰时容易引起堵车,在线、快速识别车牌,且场内自助缴费的需求非常强烈,笔者提出的算法能很好地满足这一需求.

参考文献:

[1]CHANG S L, CHEN L S, CHUNG Y C, et al. Automatic license plate recognition[J]. IEEE Transactions on Intelligent Transportations Systems,2004,5(1):42-53.

[2]翟中,常庆丽,王永昆,等.改进的车牌相似字符分级分类识别算法研究[J].计算机工程与设计,2013,34(4):1336-1340.

[3]DEDGAONKAR S G, CHANDAVALE A A, SAPKAL A M. Survey of methods for character recognition[J]. International Journal of Engineering and Innovative Technology,2012(1):180-189.

[4]WEN Y, YUE L, YAN J Q, et al. An algorithm for license plate recognition applied to intelligent transportation system[J]. IEEE Transactions on Intelligent Transportation Systems,2011,12(3):830-845.

[5]张旭兰.基于BP人工神经网络的车牌字符识别优化算法[J].计算机工程与应用,2012,48(35):182-185.

[6]郭荣艳,胡雪惠.BP神经网络在车牌字符识别中的应用研究[J].计算机仿真,2010,27(9):299-301.

[7]NAGARE A P. License plate recognition system using neural network[J]. International Journal of Computer Application,2011,25(10):36-39.

[8]陈玮,曹志广,李剑平.改进的模板匹配方法在车牌识别中的应用[J].计算机工程与设计,2013,34(5):1808-1811.

[9]ANAGNOSTOPOULOS C N, ANAGNOSTOPOULOS I E, PSOROULAS I D, et al. License plate recognition from still images and video sequences: a survey[J]. IEEE Transactions on Intelligent Transportation Systems,2008,9(3):377-391.

[10]许红平.基于不变矩理论的字符串图像识别方法研究[J].浙江工业大学学报,2007,35(2):210-213.

[11]吕刚,郝平.基于神经网络的数字验证码识别研究[J].浙江工业大学学报,2010,38(4):433-436.

[12]何通能,贾志勇.基于小波矩的车牌字符识别研究[J].浙江工业大学学报,2005,33(2):170-172.

[13]胡金蓉,周激流,王玲,等.一种新的基于字符形状特征的高效车牌识别算法[J].计算机应用研究,2010,27(6):2398-2400.

[14]MENG Q Y, HU H P, BAI Y P. A method of character recognition based on general characteristic and connected regions[C]//Multimedia and Signal Processing. IEEE International Conference on. Guilin, Guangxi:IEEE,2011:94-98.

[15]宋加涛,刘济林.车辆牌照上英文和数字字符的结构特征分析及提取[J].中国图像图形学报,2002,7(9):945-949.

[16]张引.基于空间分布的最大类间方差牌照二值化算法[J].浙江大学学报:工学版,2001,35(3):272-275.

(责任编辑:刘岩)