基于距离测度的PCA人脸识别研究

2016-09-13 03:05张二喜蒋卓芸
关键词:测度贡献率人脸识别

杨 浩, 张二喜, 蒋卓芸

(成都理工大学 管理科学学院, 四川 成都 610059)



基于距离测度的PCA人脸识别研究

杨浩,张二喜,蒋卓芸

(成都理工大学 管理科学学院, 四川 成都 610059)

应用主成分分析法对ORL人脸库及YALE人脸库进行特征提取,采用最近邻分类器及5种不同的距离测度进行人脸识别。结果表明:不同的距离测度及累计方差贡献率对PCA(Principal Component Analysis,主成分分析)人脸识别结果影响较大,在累计方差贡献率分别取0.75,0.8,0.9,0.95的条件下,对于ORL人脸库,曼哈顿距离和闵可夫斯基距离下PCA人脸识别正确识别率随累计方差贡献率增大而呈减小趋势;欧几里德距离和夹角余弦距离下PCA人脸识别正确率随累计方差贡献率增大而先增大后减小;切比雪夫距离下的PCA人脸识别正确率保持不变。累计方差贡献率取0.8,以欧几里德距离作为距离测度的PCA人脸识别算法对ORL人脸库取得最高的正确识别率为96.67%,对YALE人脸库,取得的正确识别率为95.56%,验证了算法的有效性。欧几里德距离是PCA人脸识别正确率最高的距离测度。

主成分分析;人脸识别;特征提取; 距离测度

人脸识别是人们日常生活中最常用的身份确认手段,人脸识别技术作为生物特征识别领域中一种基于生理特征的识别技术,是通过计算机提取人脸特征,并根据这些人脸特征进行身份验证的一种技术[1]。同其他生物识别技术相比,人脸识别技术具有操作简单、结果直观等特点。人脸识别在信息安全、刑事案件侦破、出入口控制、网上购物支付、用户账户登录等领域具有广阔的应用前景。

人脸识别的主要方法有基于面部几何特征方法[2-3]、基于模板匹配方法[4-6]、基于子空间的分析方法[7-8]、人工神经网络[9-10]、支持向量机[11-15]等方法。在众多人脸识别算法中,基于子空间分析的PCA(Principal Component Analysis,主成分分析)方法被认为是最经典的人脸识别方法之一[16-18]。

主成分分析又称为K-L变换(Karhunen-Loeve Transform),是模式识别领域中的核心方法。本文应用PCA进行人脸识别,比较不同的距离测度及不同累计方差贡献率对PCA人脸识别结果的影响。

1 PCA人脸识别算法

1.1算法思想

PCA人脸识别算法的基本思想:通过主成分分析可以从人脸训练集中得到由特征向量组成的降维子空间,将待识别人脸图像向其投影,即得到一组坐标系数,这组坐标系数表明了该人脸图像在子空间中的位置,从而可以作为人脸识别的依据。

主成分分析的基本思想:对原变量加以改造,在不致损失原变量太多信息的条件下使其方差(或观测值的样本方差)达到最大,尽可能地降低原变量的维数。

设X=(x1,x2,…,xp)T是p维随机向量,EX=u,DX=V≥0,亦即来自某个总体X的样品有p个特征向量,其均值向量为u,协方差阵为V。我们的任务就要将这p个特征向量x1,x2,…,xp综合成尽可能少的几个综合性变量y1,y2,…,yq(q

1.2算法步骤

PCA人脸识别算法步骤如下:

(1)一张人脸图片在计算机中表示为一个像素矩阵,也就是一个二维数组。现在把这个二维数组变成一维数组,即把第一列后面的数全部添加到第一列。假设每张人脸图像的大小均为r×n像素,则每张人脸都可以用一个大小为1×L的行向量来表示,L=r×n。将训练集中的M幅人脸图像按照以上方式构成训练样本矩阵X,大小为M×L。

(2)对训练样本矩阵X进行主成分分析,X的协方差矩阵为

对协方差矩阵C进行特征值分解,求得C的特征值为λ1,λ2,…,λL,λ1≥λ2≥…≥λL。选取累计方差贡献率Fm超过0.8(取值理由见下文)的前m个特征值对应的单位特征向量构成降维子空间U。Fm定义如下式:

由于C的大小为L×L,直接对C进行特征向量计算比较困难,我们先计算BBT的特征值λi及相应的单位特征向量vi,大小为L×1,则BTB的单位特征向量为[19]

降维子空间为U=[u1,u2,…,um],大小为L×m。

(3)将训练集中的人脸图像Xi向子空间投影:

Yi即为高维人脸样本Xi在特征子空间的降维表示。将待识别人脸图像按步骤(1)中的方法做成一个1×L的行向量XT,将待识别人脸样本XT向子空间U进行投影:

YT=XTU。

(4)选择合适的距离测度,采用最近邻分类器,计算Yi与YT之间的距离di=d(YT,Yi)。取与YT距离最小的第i张训练集人脸所在类作为待识别人脸所在类。

2 距离测度

对于PCA人脸识别算法的最后一步中,降维后待识别人脸样本与训练集人脸样本的距离计算,设x和y是两个m维样本,常用的有以下几种距离:

(1)欧几里德距离

(2)曼哈顿距离

(3)夹角余弦距离

(4)闵可夫斯基距离

(5)切比雪夫距离

3 不同距离测度人脸识别实例

本次研究选取ORL人脸库作为主要研究对象,选取YALE人脸库作为算法验证对象。

3.1ORL人脸库识别

ORL人脸库是由英国剑桥大学Olivetti实验室创建的人脸数据库,共有40个不同年龄、不同性别、不同种族的人,每个人10幅,共计400幅灰度图像,每幅图像大小为92×112像素。ORL人脸库部分人脸如图1所示。

取每个人的前7幅人脸图像,40个人共计280幅人脸图像作为训练集,每个人的后3幅人脸图像,40个人共计120幅人脸图像作为测试集,进行PCA人脸识别,PCA降维后样本距离依次取欧几里德距离、曼哈顿距离、夹角余弦距离、闵可夫斯基距离、切比雪夫距离,闵可夫斯基距离中参数取值为p=0.5,训练集的主成分分析累计方差贡献率如图2所示。

图1 ORL人脸库部分人脸图像         图2 训练集累计方差贡献率曲线

为研究不同累计方差贡献率对识别结果的影响,采用联想笔记本电脑Z485(内存4 G),Windows 7旗舰版系统下,用MATLAB R2012a进行编程实现PCA人脸识别,取累计方差贡献率Fm分别为0.75,0.8,0.9,0.95进行实验。采用最近邻分类器进行判别,计算出不同距离测度下PCA人脸识别具体结果如表1—表4所示。

表1 累计方差贡献率为0.75时不同距离测度下PCA人脸识别结果

表2 累计方差贡献率为0.8时不同距离测度下PCA人脸识别结果

表3 累计方差贡献率为0.9时不同距离测度下PCA人脸识别结果

表4 累计方差贡献率为0.95时不同距离测度下PCA人脸识别结果

由表1—表4可以看出累计方差贡献率为0.8时,以欧几里德距离作为距离测度的PCA人脸识别正确率最高,为96.67%,算法执行时间均比较快,都在4 s以内,随着累计方差贡献率增大,主成分个数增加。

由图3可以看出在累计方差贡献率分别取0.75,0.8,0.9,0.95条件下,曼哈顿距离和闵可夫斯基距离下PCA人脸识别正确识别率随累计方差贡献率增大而呈减小趋势;欧几里德距离和夹角余弦距离下PCA人脸识别正确率随累计方差贡献率先增大后减小;切比雪夫距离下的PCA人脸识别正确率保持不变,为93.33%。

图3 不同累计方差贡献率不同距离测度PCA人脸识别正确率

3.2YALE人脸库识别

图4 YALE人脸库部分人脸图像

YALE人脸数据库由耶鲁大学计算视觉与控制中心创建,共有15位志愿者的165张人脸图片,包含光照、表情和姿态的变化。YALE人脸数据库部分图像如图4所示。

取累计方差贡献率为0.8,采用欧几里德距离作为距离测度,采用最近邻分类器进行YALE人脸库PCA人脸识别,取每个人的前8张人脸,15个人共计120张人脸样本作为训练集,取每个人的后3张人脸,15个人共计45张人脸样本作为测试集,人脸识别正确率为95.56%,程序执行时间为1.41 s。YALE人脸数据库含有复杂光照、表情和姿态的变化,本文算法对YALE人脸数据库取得了较高正确识别率,进一步验证了算法的有效性。

4 结 论

基于主成分分析的人脸识别方法是当今人脸识别领域中最经典也是使用最广泛的方法。本文利用PCA方法对人脸进行特征提取,对比分析了5种不同距离测度在累计方差贡献率为0.75,0.8,0.9,0.95条件下的人脸识别正确率。得出结论:综合人脸识别正确率及算法程序运行时间,以ORL人脸库为研究对象,累计方差贡献率取0.8时,欧几里德距离PCA人脸识别争取率最高,为96.67%;在累计方差贡献率超过0.8后,继续提高累计方差贡献率并增加主成分个数,PCA人脸识别正确率会呈现降低趋势。

[1]王映辉.人脸识别:原理、方法与技术[M].北京:科学出版社,2010:16.

[2]陈立生,王斌斌.基于几何特征与深度数据的三维人脸识别[J].电脑知识与技术,2013(8):1864-1868.

[3]张淑军,王高峰,石峰.基于AAM提取几何特征的人脸识别算法[J].系统仿真学报,2013,25(10):2374-2380.

[4]陆兴华,梁建铭,袁文聪,等.一种融合角点特征匹配的人脸优化识别方法[J].计算机时代,2016(3):8-11.

[5]钱玉洁,王玉德,冯玮,等.基于DPM模型的静态人脸检测[J].电子技术,2016,45(3):12-14.

[6]黎红,张昊龙.基于联合贝叶斯算法的人脸匹配算法的MATLAB实现[J].廊坊师范学院学报:自然科学版,2016,16(1):31-34.

[7]程强,陈秀宏.局部非参数子空间分析在人脸识别中的应用[J].计算机工程与应用,2014,50(3):141-144.

[8]殷飞,焦李成,杨淑媛.基于子空间类标传播和正则判别分析的单标记图像人脸识别[J].电子与信息学报,2014(3): 610-616.

[9]李文琴,曾广朴,文俊浩.基于神经网络的人脸识别系统[J].激光杂志,2015,36(3):54-57.

[10]苏光大.人脸识别在社会公共安全领域的应用[J].中国安防,2015(14):12-14.

[11]王志杨,刘金龙,毛世伟.基于特征脸和支持向量机的人脸识别技术研究[J].淮海工学院学报:自然科学版,2015,24(1):23-29.

[12]娄洹熙,王力.基于支持向量机和遗传算法的人脸识别研究[J].微型机与应用,2015,34(7):49-51.

[13]高晴,闫德勤,楚永贺,等.基于模糊聚类的LLE和SVM的人脸识别[J].微型机与应用,2015,34(6):56-58.

[14]邵新华,赵勋杰,程凯.基于改进的WLD特征的人脸识别[J].计算机应用与软件,2015(4):141-144.

[15]DEVI H S,LAISHRAM R,THOUNAOJAM D M.Face Recognition using R-KDA with Non-Linear SVM for Multi-View Database[J].Procedia Computer Science,2015,54(8):532-541.

[16]施志刚.一种基于类间类内双权重图像分块PCA的人脸识别技术[J].杭州师范大学学报:自然科学版,2014,13(1):89-93.

[17]全星慧,牟海维,吕秀丽,等.基于PCA与贝叶斯决策的人脸识别算法[J].光学仪器,2014,36(2):122-125.

[18]穆新亮,武亚静.基于双向主成分分析和压缩感知的人脸识别算法[J].电子科技,2014,27(1):45-48.

[19]孙涛,谷士文,费耀平.基于PCA算法的人脸识别方法研究比较[J].现代电子技术,2007,30(1):112-114.

[责任编辑:魏 强]

PCA face recognition study based on different distance measures

YANG Hao,ZHANG Er-xi,JIANG Zhuo-yun

(Academy of Management Science, Chengdu University of Technology, Chengdu 610059, China)

This paper extracted eigenface from the ORL face images and the YALE face images with Principal Component Analysis(PCA) method. The nearest neighbor classifier and five different distance measures are used for face recognition. The results show that, different distance measures and different cumulative variance contribution rates greatly influenced the result of the PCA face recognition. On the cumulative variance contribution rate of 0.75,0.8,0.9,0.95 conditions, in ORL face database, the correct recognition rate of Manhattan distance and Minkowski distance PCA face recognition decreases with the cumulative variance contribution rate increase. The PCA face correct recognition rate under Euclidean distance and angle cosine distance decreases with the cumulative variance contribution rate decreases after the first increases. The PCA face recognition accuracy remains the same based on Chebyshev distance. The PCA face recognition on ORL face database has the highest recognition correct rate of 96.67% based on The Euclidean distance as the distance measure and the cumulative variance contribution rate of 0.8. To YALE face images, the correct recognition rate of the algorithm is 95.56%, it has proved the effectiveness of the algorithm. The PCA face correct recognition rate based on Euclidean distance is higher than the PCA face correct recognition rate based other distances.

principal component analysis(PCA);face recognition;feature extraction;distance measures

1673-2944(2016)04-0045-06

2016-04-06

2016-05-03

杨浩(1990—),男,彝族,四川省喜德县人,成都理工大学硕士研究生,主要研究方向为模式识别;张二喜(1990—),男,甘肃省礼县人,成都理工大学硕士研究生,主要研究方向为模式识别;蒋卓芸(1992—),女,四川省合江县人,成都理工大学硕士研究生,主要研究方向为模式识别。

TP391.41

A

猜你喜欢
测度贡献率人脸识别
三个数字集生成的自相似测度的乘积谱
R1上莫朗测度关于几何平均误差的最优Vornoi分划
人脸识别 等
一种通用的装备体系贡献率评估框架
非等熵Chaplygin气体测度值解存在性
Cookie-Cutter集上的Gibbs测度
揭开人脸识别的神秘面纱
人脸识别技术的基本原理与应用
关于装备体系贡献率研究的几点思考
В первой половине 2016 года вклад потребления в рост китайской экономики достиг 73,4 процента