基于改进BP神经网络的手写邮政编码识别

2018-05-10 18:43
数字通信世界 2018年4期
关键词:字符识别手写训练样本

徐 力

(四川大学锦江学院,眉山 620000)

字符识别研究中最普通的手段是光学字符识别(OCR(Optical Characters Recognition)),作为模式辨认的一个支系,字符识别具有很有效的理论指导和广泛的应用远景。特征提取,探索和计算等方面,统计模式识别方法着重于量化特征,然而,在这个方法中,将字符当做一个具有随机性的二维点阵而非结构性的信息框架,所以,这种手段具有识别性,她可以根据不同种类的字体辨别,实验验证可以得知该手段对单个字符进行辨别更加有效果。

手写邮政编码在字符识别方面具有特征性、适应性以及抗干扰性,在字符识别的时候可以根据周围的有效字符进行抗干扰数字分割,一般而言,主要有统计模式识别以及结构模式识别。在传统的观念中,邮编手写识别它并不能够完善解决相同数字在不同位置的识别,尤其是一些笔画较少的数字字符,在很多在字形与笔画这两方面差距较小的字符,区别上具有一定困难,因此,将人工智能引进专家系统方法以及人工神经网络的方法到手写邮编的识别码中,将神经网络与不同种类的技术相融合,意义非凡。

1 粗网格特征提取和数值化

特征提取在手写邮编识别系统中发挥着重要的角色。从二十世纪八十年代起,手写邮编的识别系统一直将特征提取作为重点研究对象,其实现途径具有简便性。与此同时,数字的本质特征在写作中具有随机性以及渐变性,因此,在数字识别之前,首先将信封上的邮政编号转换为具有灰度值f(i,j)(i=1,2,,,32 ;j=1,2,,,32)的32×32点阵 光学扫描仪和信封上的A/转换。通过以下公式将两个公式转换为0或1的32或32点阵。

式中,T是门槛。32×32点阵直接作为神经网络的输入,由于其具有数据量大以及网络时间长的特点,只有将粗网络特征提取的手段来实现神经网络的输入减少,这样才能实现网络速度加快并且同时不会减缓数字的识别能力。即将32×32点阵数据分为64×4 *从左到右,上下4个区域。该方法以每个单元的点阵密度为描述特征,即4 * 4点阵数/10与16的比值为特征数据,8 * 8的特征数据矩阵可以为获得。该数据矩阵被用作神经网络的输入。

2 基于 LM 算法的 BP 神经网络

2.1 BP 神经网络的基本结构

本文选择经典的三层BP神经网络。模型的输入节点数为64,即从上到下8×8特征数据矩阵,从左到右从0到1为64;输出层节点数为4,0000~1001表示/00~900阿拉伯数字。由于隐层节点数量在选择上具有复杂性,加上数量过大,网络学习时间过长,网络泛华能力会渐渐减缓。然而反过来,如果数字节点过少,网络在建立上就会存在识别性的判断性事失误,其网络被训练能力也会随之下降,或者呈现出网络不强的特征。当前,学者们还没有研制出影响数量节点隐藏层的数量节点选择特征的原因。

2.2 LM 算法

BP算法可以将样本以非线性优化的办法实现网络学习,通过梯度算法,可以将网络权值问题以迭代式算法进行实现。针对以上问题,很多学者应用不同算法进行BP算法改进。然而,由于迭代算法在计算上容易造成局部最小的现状,想要实现整体优化不容易实现,这是向非线性梯度的优化算法的缺点,然而,在进行网络权值的计算时,应该采用LM算法,该算法是通过改进高斯牛顿法而来,以达到提升计算精确度,提升学习效率等等目的。在本文中,我们应用LM(Levernberg Marquardt)算法来调整网络权重。以下是LM算法的简要说明。样本P中L(l>1)层神经元I的输出如下:

式中,wij为前一层神经元j到l层神经元i的网络连接权值;是输入向量;Hi为神经元的阀值;f(·)为节点的激活函数。给定P组训练样本,定义网络输出误差函数为:

式中,ep(w)=然后根据不同的学习算法训练网络权值,以最小化网络输出误差,即:

令J(w)为e(w)的Jacobian矩阵,则E(w)的梯度为:

E(w)的Hesse矩阵为:

从而提出了LM(Levernberg-Marquardt)算法:

式中,Z是单位矩阵;L是一个控制向量。当L较大时,LM算法与小步长梯度算法关系更为密切。当L很小时,LM算法变成一个近似Hessian矩阵的Newton方法。在迭代过程中,如果训练成功,则L的值将减小。如果训练失败,L值将会增加。

3 网络训练及其识别结果

此研究和测试样本是U CI,这是加利福尼亚大学的机器学习数据库。整个数据库由3723个训练样本和1797个训练样本组成,如图1所示。从随机选取/00到900个阿拉伯数字作为20个神经网络的训练样本,我们使用改进的粗网格特征提取方法,然后随机地 选择/00至/90×10个测试样本作为神经网络,并且获得一组简化的64位0,1数据,例如表1,用于每个训练和测试样本,其被用作神经网络结构64位输入。

图1 32×32的数字6点正数据

网络性能具有收敛性以及稳定性,在计算方面,它可以形成最初的网络权值的筛选,本事次计算总共包括五组,采用LM算法对两百个训练样本进行稳定性网络权重,再从其中筛选出一百个样本进行测试识别,得出的识别率是百分之九十二。200个训练样本用不同的改进的BP算法训练。训练精度为10-5。隐层激活函数采用双曲正切S传递函数,输出层激活函数采用对数S传递函数。通过LM算法的13次迭代计算得出训练的结果,可以发现LM算法比BP算法识别性更高,对手写邮编的识别更加有效。

4 结束语

本文通过研究了手写邮编的因域差异性。在研究中由于优化后的粗网格特征提取办法可以有效帮助手写邮编的识别,对于神经网络的有效性也直接通过稳定性得以解决。LM算法对于BP神经网络的权值具有筛选性,通过一组权值的计算将以数据验证神经网络具有自主学习型以及抗干扰性,智能性和处理高效性,证明对手写邮政编码识别具有实践意义。

[1] 左云波,张怀存.一种改进的 BP 网络快速算法[J].北京机械工业学院学报,2005,20(1):31-34.

猜你喜欢
字符识别手写训练样本
我手写我心
抓住身边事吾手写吾心
人工智能
基于集成学习的MINIST手写数字识别
一种改进深度学习网络结构的英文字符识别
仪表字符识别中的图像处理算法研究
宽带光谱成像系统最优训练样本选择方法研究
融合原始样本和虚拟样本的人脸识别算法
基于稀疏重构的机载雷达训练样本挑选方法
深度学习在手写汉字识别中的应用综述