LBP和2DDCT相结合的单幅人脸图像识别

2015-01-29 02:57王常芳朱贤良
电子设计工程 2015年12期
关键词:子块余弦维数

王常芳,朱贤良

(江苏科技大学 计算机科学与工程学院,江苏 镇江 212003)

随着科技的发展,人脸识别在社会上的应用越来越广泛[1]。目前,人脸表情识别方法有:基于活动外观模型,基于Gabor小波、基于局部二值模式(LBP)和基于流形[2]等。其中LBP方法在人脸表情识别方面对光线就有很好的鲁棒性和识别性能好等优点[3]。LBP可以快速的从人脸图像中提取纹理信息,保留了有效的人脸信息,在人脸识别领域有很好的应用[4]。Ahonen等[5]提出了基于LBP[6]算子的人脸识别算法在人脸数据库中具有很好的识别性能。

然而,基于LBP算法的人脸识别所得到的LBP直方图向量维数过高,计算量大。识别效率不高等问题,本文提出将单幅的人脸图像规则的分成为子块,对每个子块进行LBP变换,把每个LBP变换的后的子块分别用2DDCT[7]变换到频率域,大部分信息保存在低频部分,取低频作为人脸的频率域特征,有效的降低维数,使计算量降低[8]。

1 LBP理论

局部二值模式 (LBP)是一种灰度范围内的纹理描述方式。最初有Ojala等[9]提出了LBP算子用来描述图像的局部结构。原始的LBP算子为图像的每个像素定义了一个以该像素为中心的8个像素的弧度值与其进行对比,若周围像素值大于中心点的值,则该像素位置被标记为1,否者为0。

对于窗口,LBP值的计算公式如下:

其中,gc是窗口中心像素的像素值,gi是8个邻域像素的灰度值,S(x)是一个二值化函数,其定义如下:

一个窗口的LBP算子的计算过程如图1所示。

基本的LBP算子是对中心像素的邻域进行操作的。对整个图像进行扫描后,我们得到一个LBP纹理图像,这个图像的直方图被称为LBP特征。

2 2DDCT理论

图1 基本的LBP算子的定义Fig.1 The basic definition of LBP

离散余弦变换可以去除图像中较多的冗余信息,同时对图像可以降维,在图像领域中得到广泛的应用。人脸图像经2DDCT变换后,其低频分量集中在左上角,包含了图像的主要信息,中高频分量集中在右上角,包含极少信息,可以忽略,取左上角块提取特征,从而达到压缩目的。对于一幅MN的人脸数字图像(f(x,y)),其二维离散余弦变换定义为:

其中:u=1,2,3,…,4M-1;v=0,1,…,N-1

C(u,v)称为 DCT 系数。 a(u),a(v)分别定义为:

相应的离散余弦反变换(IDCT)定义为:

离散余弦变换的的特点:当频率域变化因子u,v较大时DCT系数的值很小;而数值较大的 C(u,v)主要分布在 u,v较小的坐上区域,这也是有用信息的集中区域。基于2DDCT系数重建图像是保留少数离散余弦变换的低频分量,而舍去大部分中高频分量,利用反变换可获得与原始图像相近的回复图像。

3 LBP与2DDCT方法相结合

LBP与2DDCT相结合的人脸识别算法基本思想是:将原图像规则的分成8×8子块,对每一个子块用LBP算子生成子块LBP纹理图像,对生成后的图像进行2DDCT变换,对左上角块进行特征提取。使用2DDCT变换到频率域中,即达到降维的目的,又对光照变化和旋转比以前图像更具鲁棒性,最后利用利用最邻近分类器进行分类。基本步骤如下:

1)将训练样本人脸图像分成规则的8×8子块矩阵,如图2所示。

2)对每个子块进行LBP变换,生成纹理信息图像。

3)对每个子块的纹理信息图像进行2DDCT变换。取频率域左上角矩阵块生成特征向量 Yi=[,, …,](i=1,2,…,N)。

4)对测试样本进行上述操作,得到样本Y0特征向量Y0=[,,…,]。

图2 将图像分成规则的8×8子块矩阵Fig.2 The image is divided into 8×8 sub block matrix rules

5)利用最邻近分类器进行分类。他们之间的距离定义为:

如果 d(Y0,Yi)=min d,且 Yj∈ck,则 X0∈ck。

4 实验结果

本文分别用2DDCT、LBP和LBP+2DDCT相结合的方法在ORL库上进行实验。该人脸库包含40个人,每个人有10幅图像,图像大小维11292,灰度级为256,且人脸的表情与姿态个不一样。本文随机选择一幅图像作为训练样本,在剩余的9幅图像中随机选取一幅图像作为测试样本。

表1是3种方法识别率的平均值和识别时间的平均值。由表1可以看出LBP+2DDCT相结合的方法在3种算法中平均识别耗时最少和平均识别率最高。

表1 在ORL人脸库上平均识别率和平均识别时间Tab.1 The average recognition rate and the average recognition time on ORL face database

图3比较每个算法在ORL人脸数据库上特征维数从14到26的识别率变化情况。

图3 ORL库中3种算法识别率随特征维数的变化Fig.3 Three kinds of algorithms to identify the rate of change with characteristic dimensions

结合表1和图3可知,并非特征维数越高,识别率就越好。在取特征维数为20的时候,LBP和2DDCT相结合的方法在3种算法中识别率最好。

5 结束语

本文采用LBP与二维离散余弦变换相结合的人脸识别算法,把人脸图像变换到频率域中,取左上角块作为图像的特征向量。即有效的降低光照和旋转等因素的影响,又达到降维的目的,还除去图像中的冗余信息,缩短了识别的时间,同时又有很好的识别率。

[1]MATTHEW TURK,Alex Pentland,Eigenfaces forrecognition,Cognitive Neurosci.3(1991)71-86.

[2]李睿凡,朱强生,郭燕慧,等.鲁棒局部保持投影的表情识别[J].北京邮电大学学报,2006,29(Z2):178-182 LI Ri-fan,ZHU Qiang-sheng,GUO Yan-hui,et al.Robust locality preserving projection for facial expression recognition[J].Journal of Beijing University of Posts and Telecommunications,2006,29(Z2):178-182.

[3]孙宁,冀贞海,邹采荣,等.基于局部二元模式算子的人脸性别分类方法[J].华中科技大学学报:自然科学版,2007,35(1):177-181.SUN Ning,JI Zhen-hai,ZOU Cai-rong,et al.Face gender classification method based on Local Binary Pattern operators[J].Journal of Huazhong University of Science and Technology:Natural Science Edition,2007,35(1):177-181.

[4]张翠平,苏光大.人脸识别技术综述[J].中国图像学报,2002,5(11):885-894.ZHANG Cui-ping,SU Guang-da.Summary of the face recognition technology[J].Journal of China Image,2002,5(11):885-894.

[5]Atonen T,Hadida,Pietickainen M.Face descripti-on with local binary patterns:application to face rec-ognition[J].IEEE Trans on PAMI,2006,28(12):2037-2-14.

[6]李树娟.基于LBP特征的人脸表情分析[D].山东:中国石油大学(华东),2010.

[7]Xiaoyuan Jing,Hausan Wong,David Zhang, Face recognition based on 2D fisherface approach[J].Pattern Recgnition,2006:707-710.

[8]路冲,刘晓东,刘万泉.一种2DDCT与压缩感知结合的人脸识别[J].电子设计工程,2011,19(21):186-188.LU Chong,LIU Xiao-dong,LIU Wang-quan.A combination of 2DDCT and compressed sensing face recognition[J].Electronic Design Engineering,2011,19(21):186-188.

[9]Ojala T,Pietikainen M,Harwood D.A comparative study of texture measures with classification based on feature distributions[J].Pattern Recognition,1996,29(1):51-59.

猜你喜欢
子块余弦维数
基于八叉树的地震数据分布式存储与计算
β-变换中一致丢番图逼近问题的维数理论
基于特征值算法的图像Copy-Move篡改的被动取证方案
一类齐次Moran集的上盒维数
基于波浪式矩阵置换的稀疏度均衡分块压缩感知算法
两个含余弦函数的三角母不等式及其推论
实施正、余弦函数代换破解一类代数问题
分数阶余弦变换的卷积定理
图像压缩感知在分数阶Fourier域、分数阶余弦域的性能比较
基于分布式ICA-PCA模型的工业过程故障监测