虹膜图像处理与识别技术研究

2011-01-29 06:25孙光民
制造业自动化 2011年13期
关键词:虹膜特征向量特征值

齐 霁,孙光民

QI Ji, SUN Guang-min

(北京工业大学 电子信息与控制工程学院,北京 100022)

0 引言

生物特征识别技术是指计算机利用人体所固有的生理或行为特征来进行个人身份鉴定。常用的生物特征包括:指纹、掌纹、虹膜、脸像、声音、笔迹等(如表1所示)。

表1 各种生物识别方法安全等级比较

虹膜识别技术作为人体生物特征识别技术的尖端代表,具有的普遍性、唯一性、稳定性、可靠性、非侵犯性、可采集性等特点,错误接受率和错误拒绝率较低如表2所示,因而具有无可比拟的优势和很高的研究价值。

表2 虹膜与指纹识别方法性能比较

虹膜识别技术重点应用于领域包括:门禁和考勤;金融和证券;电子护照和第二代身份证;医疗保险和养老保险的发放:公安和司法;电子商务;信息安全;特殊行业等,相对其他生物识别技术具有广阔的应用前景。因此,国内外学者对其高度重视,并进行深入而广泛的研究。

虹膜识别系统由虹膜图像预处理、特征提取及编码和匹配识别等部分构成。

虹膜图像的预处理包括对虹膜内外边界的定位,对提取出的虹膜部分进行直方图均衡及归一化操作等。而虹膜图像纹理的特征提取本文采用了多尺度二维Gabor滤波器对图像进行滤波,再对输出的卷积结果计算平均绝对偏差值作为特征值,最后采用两种方法对特征值进行分类已达到识别图像的目的。一种方法是计算标准图像和待测图像特征值间的加权欧式距离(WED);另一种方法是将标准图像的特征值输入BP神经网络进行学习和训练,再用训练好的网络对待测图像的特征值进行分类,并输出判断结果。

1 虹膜图像的预处理

虹膜是瞳孔之外巩膜之内的圆环部分,包含了丰富的纹理信息。为了减少眼睑、睫毛、图像拍摄角度以及拍摄距离等因素对虹膜识别效果的影响,须对图像进行预处理。本文将预处理分为虹膜定位、虹膜图像归一化和虹膜图像增强三个步骤。虹膜与巩膜、瞳孔的边界均近似为圆形,可将虹膜的内外边缘近似看作两个不同心的圆。因此定位的过程就是找出内外两个圆的半径和圆心的过程。而归一化的目的是将每幅图像调整到相同的尺寸和位置,以消除拍摄角度和距离的不同而带来的影响。增强是为了消除光照不均的影响,这里对图像作直方图均衡使虹膜的纹理信息更加清晰。

1.1 虹膜图像处理和识别系统

虹膜识别系统由光源、摄像头、图像分析系统(计算机)三部分构成,对光源、摄像头、计算机均没有特殊的要求。图像为8bit256级灰度图。光源提供照明,使虹膜可以清晰地成像。光源应稳定,因为随入射光线强度的变化,瞳孔会产生收缩或扩张,牵动虹膜变化,增大匹配时的误差。稳定光源,即稳定了虹膜,可以提高匹配的精度。

图像分析系统对拍摄下的虹膜图像进行预处理,包括对虹膜内外边界的定位,提取出虹膜部分进行直方图均衡及归一化操作等。之后从处理后的虹膜图像中提取需要的纹理特征,包括像冠、水晶体、细丝、斑点、结构、凹点、射线、皱纹和条纹等。识别阶段即将待识别的图像的特征向量与预存的参考图像的特征向量进行匹配的过程,是典型的模式识别问题。通过比较提取的特征向量之间的相似性,进而确定图像是否来自同一对象,以达到鉴定身份的目的。

图1 虹膜图像处理和识别系统框图

虹膜图像识别问题的关键在于特征的选取和算法选择,特征是否有足够代表性,其包含的信息量是否够多直接影响到了识别效果,进而对最后的身份鉴别起决定性的影响。目前,国内外有许多虹膜图像的识别算法均能取得不错的识别效果,如英国剑桥大学的John Daugman教授提出了一种利用多尺度二维Gabor滤波器提取虹膜纹理的识别算法,这是目前应用最广泛的算法,在很多场合均取得了较高的识别效果。而本论文也采用了Daugman教授的多尺度二维Gabor滤波算法对图像滤波从而提取出特征信息。

虹膜图像是基于已提取的特征向量进行识别的,不同的图像特征提取和编码方式通常有不同的比较方法,要根据具体的特征选择和编码算法自行设计匹配算法。但也有多种通用的判别方法,如利用汉明距离(Hamming Distance)、加权欧几里得距离(Weighted Euclidean Distance)、相关系数、Hausdorff 距离、不同虹膜间的归一化码间距等对待测图像和参考图像的相应信息对比,从而达到鉴定身份的目的。本文中就应用加权欧几里得距离(WED)对提取的特征向量进行了识别,取得了令人满意的鉴定效果。此外,神经网络(Neural Network)由于其强大的分类和自适应学习能力而被广泛用于模式识别领域,本论文也尝试了应用BP神经网络对虹膜进行了识别。

本文采用的眼部图像取自中国科学院自动化研究所下属的虹膜图像数据库(CASIA),均为8bit320×280大小的BMP位图如图2所示。

图2 CASIA的虹膜图像样本

该数据库中有108个不同人的虹膜图像,每人在不同光照和角度的照片7张,分为两组,分别用于测试和检验。本文采用的两种虹膜识别方法均用到了两组图片,WED识别中作为标准图片和待测图片,BP神经网络中用作训练样本和测试样本。这样提高了系统识别的复杂性,使最终结果更加具有普遍性,更具有说服力,也使得算法更加严谨,客观。

1.2 虹膜图像的内边界定位

眼睛的外观图由巩膜、虹膜、瞳孔几部分构成。虹膜在角膜和水样液的后方,晶状体的前方,是瞳孔之外巩膜之内的圆环部分。它包含了最丰富的纹理信息。虹膜与巩膜、瞳孔的边界均近似为圆形。因此,可将虹膜的内外边缘近似看作两个不同心的圆。定位的过程就是找出内外两个圆的半径和圆心的过程。

本文暨采用粗定位与精定位相结合的定位方法:先用灰度阈值分割法对图像进行粗定位,得到内边界参数,然后利用瞳孔的圆心及半径来缩小搜索的范围,再检测图像边缘,对其使用Hough变换提取外边界参数,这种方法定位虹膜的内外边界。

由于虹膜与瞳孔的灰度差值很大,而且虹膜和瞳孔本身内部的灰度值比较均匀,因此本文采用灰度阈值法分离瞳孔和虹膜,具体方法是先得到整个眼部图像的灰度直方图,再对图像作二值化处理分离出瞳孔,即选择一个阈值,将图像转化为黑白二值。变换函数形式如式(1),其中T为阈值,如果图像中某个像素灰度值大于该阈值,则将该像素灰度值设定为255,否则置为0。

图3 虹膜内边界的定位

之后对瞳孔图像的二值灰度矩阵各行(列)灰度值依次求相邻行(列)的灰度差,差值最大的减数行(列)与差值最小的被减数行(列)的序号(即坐标)的差值即为瞳孔直径,再除以2即为内边界的半径;然后用差值最大的减数行(列)的序号与半径作差,得到的序号(即坐标)值为圆心的纵(列)横坐标,这样便得到了内边界的圆心坐标。最后依照圆心坐标及半径在原始图像上画出内边界如图3所示。

1.3 虹膜图像的外边界定位

虹膜与巩膜的边界灰度差值不十分明显,用灰度阈值法求外边界的效果十分不理想,必须另想他法。Hough变换是理想的替代方法,其具体方法是:首先在图像直角坐标系中定义一个圆心和半径均可变化的圆。将参数适当离散化后,枚举出图像中所有可能的圆,统计每个圆经过的外边界点数目,数目最多的就是与外边界最吻合的圆。但Hough变换需要遍历整幅图像,运算量巨大,而且虹膜图像细节信息大,边缘特征复杂,定位外边界的效果不十分理想,因此需要先验信息缩小遍历范围,降低运算量,提高定位准确率。本文先用Canny算子对图像进行外边界边缘检测,然后根据已知的内边界参数划定外边界参数的范围,最后再结合这些先验信息用Hough变换定位出虹膜外边界如图4所示。

图4 虹膜外边界的定位

1.4 虹膜图像的归一化和增强

由于光照和拍摄距离及位置等条件的不同,即使同一个人的虹膜图像也会出现平移,缩放或旋转,进而对识别效果造成影响,得到的虹膜图像不尽相同。而多尺度二维Gabor滤波器对图像的旋转等因素十分敏感。为了尽可能消除这个因素的影响,需要对虹膜图像作归一化和增强处理。归一化的目的就是将每幅原始图像调整到相同的尺寸和位置,以消除平移,放缩和旋转的影响。此外为了便于纹理特征的提取,还需对图像作增强处理,而增强是为了消除光照不均的影响,使得到的纹理信息更加清晰,突出细节信息,便于下一阶段的特征提取。

虹膜的内外边界都为圆形,为此可以利用几何方法。虹膜拉伸数学模型由于比较接近虹膜真实变化因而是个较好的选择,利用该模型可将虹膜图像的直角坐标转化为极坐标形式,并展开成矩形。对虹膜图像进行归一化处理后,再用直方图均衡处理,以突出虹膜的特征部分,便于观察、检测。

具体方法是利用拉伸模型将虹膜图像从直角坐标系转化到[0,1]间的极坐标系并展开为矩形,再作直方图均衡,以增强纹理特征如图5所示。

图5 虹膜图像的归一化和增强

2 虹膜图像的特征提取

人眼的虹膜从形状到纹理结构具有许多可供区分、鉴定的特征,为了提取这些特征信息,需对虹膜图像进行分解,对从中提取的信息编码。现在最常用的特征提取算法为利用Gabor函数对图像滤波,提取相位信息编码。

二维Gabor函数是一维Gabor函数的二维拓展形式,引入高斯函数作为其窗函数。在窗形区域内,该函数与人眼视觉细胞的二维接受域波形极其相似,适合分析图像不同频率的细节信息,而通过参数调整,可以使Gabor函数具有不同的空间局部化特征,如方向选择性、频率选择性和二次相位关联性等。

本文提取虹膜特征的具体方法是先将虹膜环形图像等分为12个子图,由于上眼皮处的两区域经常被眼睑、睫毛阻挡,这里除去不用,只选取10个子图,用多尺度二维Gabor滤波器从4个频率、4个角度分别对每个子图以不同频率、不同角度进行滤波,然后计算滤波后得到的子图信息的平均绝对偏差,并将这些绝对偏差值作为特征值,排列形成统一大小的特征向量用于识别。设计思路如图6所示。

图6 虹膜图像纹理特征的提取

选取这10个子图不但能降低眼睑、睫毛对识别效果的影响,还可以保证有足够丰富的纹理信息被提取出来;而Gabor滤波器在空域和频域具有良好的联合定位能力,能够提供空间频率、位置和方向的最大分辨率,因而非常适合纹理特征分析。本文选择滤波器的频率为2、4、8、16周/度,每个频率分别从0°、45°、90°、135°处对所有子图滤波,每幅子图有16个结果图,再计算每幅结果图的平均绝对偏差值,输出共160个特征值,这样能够在最大程度上保证体现图像的纹理特征。而图像的平均绝对偏差定义如式(2),其中N是图像的像素数,m是图像的均值,f(x,y)是在(x,y)点的值:

3 虹膜图像的匹配与识别

在提取了虹膜图像的特征信息后,要对其进行分类,以达到识别图像的目的。本文提出了两种匹配方法对虹膜图像进行识别,一种是计算图像特征值之间的加权欧式距离(WED)的方法,另一种是利用学习了足够特征信息的BP神经网络对图像进行识别的方法。

3.1 基于WED的虹膜图像识别

具体方法是先将参考图片的特征向量编译成.mat文件保存,再对测试图片提取特征向量并分别载入,用算法计算待测图像特征值与每幅标准图像特征值间的WED值,将结果一一对比,通过算法得到最小WED值的序号和数值。若待测虹膜特征值的WED在k时最小,并且此WED值小于设定的阈值,则认为待测虹膜是第k个虹膜,从而识别出虹膜,达到身份鉴定的目的。加权欧式距离(WED)的定义如式(3),其中Ai代表第i个子图的加权系数,BN和N分别代表子图的数目和从每个子图提取的特征总数。f(i,j)和fk(i,j)分别代表未知虹膜和第k个虹膜中第i个子图的第j个特征分量。

3.2 基于神经网络的虹膜图像识别

人工神经网络是指利用工程技术手段模拟人脑神经网络的结构和功能的一宗技术。它的目的是使机器有人脑那样的感知、学习和推理能力。人工神经网络模型具有与人脑相似的高度并行性,良好的容错性和联想记忆功能、自适应和自学习能力、强大的分类能力、鲁棒性,可以实现输入到输出的非线性映射,因此各类神经网络在图像识别领域得到越来越多的应用。

本文使用的BP神经网络,是一种采用反向传播算法的多层前馈网络,能够逼近任意的非线性映射关系,而且有很好的泛化能力。BP网络模型处理信息的基本原理是:输入信号通过中间节点作用于输出节点,经过非线性变换产生输出信号。网络训练的每个样本包括输入向量和期望输出量,通过分别调整输入层与隐层间、隐层与输出层间的参数(权值和阈值)使误差沿梯度方向下降,经过反复学习训练,确定与最小误差相对应的网络参数,训练即告停止。此时经过训练的神经网络既能对类似样本的输入信息,自行处理输出误差最小、经过非线性转换的信息。

利用神经网络识别虹膜的具体方法是先输入标准图像的特征值让神经网络训练网络各层的权值和阈值,当输出与理想输出的误差达到某一设定值时,认为网络收敛已训练完毕,之后输入待测图像的特征值令神经网络根据训练结果自行分类,从而达到识别图像的目的。

4 试验结果和结论

在WED法中采用20人的虹膜图像,每人有不同拍摄角度和拍摄距离的图像3幅共60幅图像进行测试。从中各选取1幅共20幅作为标准图像,将每人剩余的2幅共40幅图像作为待测图像提取特征值,并一一与20幅标准图像的特征值计算WED距离,取每次对比中最小WED距离为该算法的判断结果,如表1所示。

在BP神经网络中采用10人的虹膜图像,每人有不同拍摄角度和拍摄距离的图像7幅共70幅图像参与测试。每人用其中的4幅共40幅图像提取特征值作为训练样本输入到神经网络中进行训练,再用其余的3幅共30幅图像输入到训练好的神经网络中进行分类识别,结果如表3所示。

表3 两种方法对虹膜图像的识别结果

结合试验结果得出结论:

试验结果表明,用两种方法对虹膜图像进行识别的效果都比较理想,WED法的计算结果清楚明了,便于比较,准确率高,但判断耗费的时间较BP神经网络长;神经网络需要训练特征,对样本数量的需求比WED法大,但判断时间短,输出结果简单直观,便于分析。若改进神经网络的输入样本特征类型,有望提高神经网络识别虹膜图像的准确率;而WED法受图像的拍摄角度和拍摄距离的影响较大,若要减弱这种影响,提高识别的准确率,需要对提取特征的算法作进一步的改善。

5 结束语

本文介绍了虹膜图像处理和识别系统,对各阶段从图像预处理到最终的虹膜识别用到的方法进行了研究与探讨。在图像预处理方面,选用灰度阈值和Hough变换的方法分别对虹膜内外边界定位,并实现预期功能;通过算法实现了对虹膜图像归一化以及直方图均衡的处理以突出其纹理特征。在特征提取方面,选取了业内著名的Daugman教授的多尺度二维Gabor滤波器方法对虹膜图像滤波,编程实现了提取滤波后图像的信息;选择滤波后图像的平均绝对偏差作为特征值,利用算法将其编译成特征向量保存,为识别阶段做准备;在特征识别方面选用了两种方法:用加权欧几里得距离(WED)对虹膜图像的特征向量识别,鉴别效果十分理想;使用BP神经网络学习、训练样本特征值,进而对虹膜图像识别,鉴别效果达到预期。

[1]庞尚珍,雷跃荣,冯雪,杜玲艳.虹膜识别技术研究[J].四川理工学院学报,2008,21(5):95-97.

[2]黄惠芳,胡广书.虹膜识别算法的研究及实现[J].红外与激光工程,2002,31(5):404-409.

[3]孟浩,徐翠平.虹膜识别算法的研究[J].哈尔滨工程大学学报,2006,27(3): 400-403/452.

[4]史鹏举.孙光民.虹膜识别系统的研究[J].计算机应用研究,2004,23(增):509-511.

猜你喜欢
虹膜特征向量特征值
二年制职教本科线性代数课程的几何化教学设计——以特征值和特征向量为例
双眼虹膜劈裂症一例
克罗内克积的特征向量
一类内部具有不连续性的不定Strum-Liouville算子的非实特征值问题
一类带强制位势的p-Laplace特征值问题
基于一类特殊特征值集的扩散算子逆谱问题
单圈图关联矩阵的特征值
基于轮廓匹配和多项式拟合的虹膜分割算法
一类三阶矩阵特征向量的特殊求法
一种基于虹膜识别技术的车辆启动系统