基于L—M算法及不变矩特征值优化的神经网络图像识别

2017-07-08 22:37张鑫孙勇
科技创新与应用 2017年19期
关键词:图像识别BP神经网络

张鑫+孙勇

摘 要:文章采用基于L-M算法的BP神经网络,并在图像特征提取量的选择中,结合了不变矩特征值和灰度共生矩阵导出的基于纹理的特征量,以车牌识别为例进行图像识别。经过训练和测试,得到L-M及特征量优化的神经网络,在精度和识别速度上都优于BP神经网络。

关键词:图像识别;不变矩特征值;L-M算法;BP神经网络

中图分类号:TP183 文献标志码:A 文章编号:2095-2945(2017)19-0001-03

引言

随着图像识别技术的不断发展,应用于图像识别技术领域的算法也在不断优化升级,人工神经网络算法作为一种高度非线性的智能自适应算法,在图像识别领域中的应用越来越广泛。基于人工神经网络实现图像识别的主要特点是构建分类器,将预处理后图像样本中提取出来的特征量输入神经网络,经过自学习和自组织,不断地训练,最终达到能够稳定正确识别图像的状态。[1]本文识别车牌号为例,对基于L-M算法及不变矩特征值优化的神经网络进行研究和实验。

1 图像预处理

1.1 倾斜校正及灰度处理

实际图像实时采集系统得到的图像质量参差不齐,本文采用方差公式推导法进行图像校正。该方法基于正置图像的投影图像边缘点的方差最小的原则来确定倾斜角度,具有较好的校正效果[2]。通常灰度处理方法有平均值法,最大值法和加权平均值法。平均值法和最大值法一定程度上淡化了图像中目标物与背景分界,对后续边缘检测会产生影响,本文选用加权平均值法,通过最优权值的选择,能够获得较好的处理效果。计算公式为:

式中,WR=0.59,WG=0.30,WB=0.11,此权值设置能获得最佳灰度图像。[3]

1.2 图像分割及卡尔曼滤波

获得灰度图像后,通过Ostu算法确定合适的分割阈值,当像素点灰度值超过阈值,将该像素点灰度值赋值为255,否则赋值该像素点灰度值为0,由此得到二值图像。在分割过程中会产生高斯白噪声,采用卡尔曼滤波的方法进行滤波。[4]

2 图像特征提取

2.1 不变矩特征值提取

图像特征提取可以从基于图像颜色的统计特性、图像形状和图像纹理特征这些方面入手。为了克服图像旋转、平移导致的图像特征提取误差较大的情况,本文采用形状不变矩来提取图像熵矩阵的特征,作为神经网络的输入层参数。

根据不变矩理论,定义图像f(x,y)的p+q阶中心矩为:

由计算得到的单元熵组成熵矩阵,n表示网格分辨率。熵矩阵中包含着局部和全局的图像信息,从熵矩阵中提取不变矩特征值。[5]

2.2 灰度共生矩阵特征提取

在图像f(x,y)任取一点组点对,偏移量为(a,b),点(x,y)处灰度值为i,点(x+a,y+b)处灰度值为j,固定(a,b),通过点对在图像上的移动获得不同的点对的灰度值(i,j),由于经过二值化以后灰度等级为{0,255},故得到的(i,j)组合共有4组,统计整幅图中每一种点对灰度出现的频数,归一化后得到[Pij]灰度共生矩阵。由此获得对比度,相关性,能量,逆差矩,分别为Con,Cor,Ene,Hom。[6]

综合从熵矩阵中提取的7个不变矩特征值和依据灰度共生矩阵得出的4个参数,构成用于进行识别的图像特征向量,作为神经网络输入层参数。表示为

3基于L-M算法的BP神经网络

3.1 L-M算法概述

BP神经网络算法基于误差梯度下降标准,通过实际输出与期望输出的误差来调整连接权值使之达到最优。但通常情况下,BP神经网络存在学习速率慢,容易陷入局部最小值等问题[7]。作为优化算法之一的L-M算法是梯度下降法与高斯-牛顿法的结合,利用了近似的二阶导数信息,具有快速收敛,准确度高的优点,本文尝试将其与神经网络算法结和用于图像识别。

3.2 原理及实现步骤

4 实验仿真及结果分析

本文以车牌识别为例。在试验中,选取了数字0-9、英文字母A-Z及车牌上常见的30个汉字共66个字符,每个字符50张训练样本图片进行训练。由于车牌号由不同字符组合而成,在图像处理过程中,进行了字符分割和图像增强,为具体字符的识别提供分类基础。经过训练后,将50张测试图片输入神经网络进行测试。经过测试,识别率能达到98%以上,且识别速度快,性能明显优于传统BP神经网络。

4.1 图像预处理

灰度处理选择的标准是经过灰度变换后,像素的动态范围增加,图像的对比度扩展,使图像变得更加清晰、细腻、容易识别,处理结果如图2。图像二值化处理,结果如图3。

可以通过求梯度局部最大值对应的点,并认定为边缘点,去除非局部最大值,可以检测出精确的边缘。一阶导数的局部最大值对应二阶导数的零交叉点,这样通过找图像强度的二阶导数的零交叉点就能找到精确边缘点,如图4。

对图像做了开运算和闭运算,闭运算可以使图像的轮廓线更为光滑,它通常用来消掉狭窄的间断和长细的鸿沟,消除小的孔洞,并弥补轮廓线中的断裂,如图5。

对水平投影进行峰谷分析,计算出车牌上边框、车牌字符投影、车牌下边框的波形峰上升點、峰下降点、峰宽、谷宽、峰间距离、峰中心位置参数,如图6。

通过以上水平投影、垂直投影分析计算,获得了车牌字符高度、字符顶行与尾行、字符宽度、每个字符的中心位置,为提取分割字符具备了条件。

4.2 训练库的准备

通过预先的图像识别提取,得到部分数字与汉字的训练库,如图7。

在车牌识别的过程中数字库的建立很重要,切割出来的数据要与数据库的数据作比较,只有数字库准确才能保证检测出来的数据正确。

4.3 车牌的识别

进行车牌识别前需要使用样本对神经网络进行训练,然后使用训练好的网络对车牌进行识别。其具体流程为:使用汉字、字母、字母数字、数字四个样本分别对四个子网络进行训练,得到相应的节点数和权值。对已经定位好的车牌进行图像预处理,逐个的特征提取,然后从相应的文件中读取相应的节点数和权值,把车牌字符分别送入相应的网络进行识别,输出识别结果,如图8。

5 结束语

基于神经网络的图像识别具有广阔的前景,随着对识别质量和识别效率要求的不断提高,用于识别的算法也在不断更新和优化。基于L-M算法的BP神经网络在识别速率和精度方面有着巨大的优势,但是限于计算量较大这一问题,在一些特征向量较多或内存较小的设备中难以适用,而图像识别所需要的特征量往往又较多,为此进一步研究特征量提取方法的优化和高性能运行设备是图像识别进一步发展的关键。[8]

参考文献:

[1]牛博雅,黄琳琳,胡健.自然场景下的车牌检测与识别算法[J].信号处理,2016(07):787-794.

[2]曾晓娟.一种基于神经网络的图像识别算法[J].电脑知识与技术,2015(17):171-174.

[3]江伟.机器视觉图像中目标识别及处理方法研究[D].华北电力大学,2015.

[4]李康顺,李凯,张文生.一种基于改进BP神经网络的PCA人脸识别算法[J].计算机应用与软件,2014(01):158-161.

[5]张泽琳,杨建国,王羽玲,等.煤粒图像识别系统的设计与实现[J].煤炭工程,2011(02):17-19.

[6]孙君顶,毋小省.基于熵及不变矩特征的图像检索[J].光电工程,2007(06):102-106+115.

[7]王建梅,覃文忠.基于L-M算法的BP神经网络分类器[J].武汉大学学报(信息科学版),2005(10):928-931.

[8]韩思奇,王蕾.图像分割的阈值法综述[J].系统工程与电子技术,2002(06):91-94+102.

猜你喜欢
图像识别BP神经网络
基于计算机视觉的图像识别技术研究
图像识别技术的应用与发展
人工智能背景下图像识别技术浅析
《图像识别初探》教学案例
基于字典学习的正则化鲁棒稀疏表示肿瘤细胞图像识别
就bp神经网络银行选址模型的相关研究
图像识别交互系统
基于DEA—GA—BP的建设工程评标方法研究
复杂背景下的手势识别方法
BP神经网络在软件质量评价中的应用研究 