基于距离限定优化的多姿态人脸图像智能识别

2022-03-01 01:12杨小琴朱玉全

计算机仿真 2022年1期

杨小琴，朱玉全

(1. 南京工业大学浦江学院，江苏南京 211134；2. 江苏大学计算机科学与通信工程学院，江苏镇江 212013)

1 引言

随着互联网技术的不断深入发展，人们对信息的保密性和安全性逐渐重视，信息安全成为当前人们重视的焦点问题。虹膜、声音和指纹等生物识别技术方便了人们的生活，成为当前支付等领域的重要媒介[1]。其中，指纹采集或虹膜采集过程中需要被测对象积极配合，并且更易以其它手段伪装，导致个人信息被泄露。相较之下，将人的面部特征作为识别方式更具安全性和隐蔽性，且不易被复制。但由于环境光线以及个人等因素的影响，人脸在识别过程中出现了一定困难[2]。为了提升人脸图像的识别能力，该领域研究者对其进行了很多研究，并取得了一定成果。

文献[3]提出一种基于小波变换的可变光照下人脸图像识别方法。该方法首先采用小波分解人脸图像，滤除图像中冗余信息获得低频人脸图像；随后采用Gamma校正和高斯差分改善图像亮度、降低低频人脸图像中噪声。最后使用LBP编码和小波变换提取人脸图像直方图特征，获得特征间距离，完成人脸图像近邻分类，实现可变光照条件下人脸图像识别。该方法能够有效改善图像对比度和亮度，且识别率较高，但该方法未过多考虑人脸姿态变化，存在识别结果误差较大的问题。文献[4]提出基于PCA模型的人脸图像纹理特征高精度识别方法。该方法在图像预处理阶段，通过Gabor滤波器获得训练样本图像中眼睛位置，采用卷积运算将待测人脸区域从几何模型中分割，最后利用PCA模型对待处理图像进行特征提取和降维，通过主要纹理特征相似度判别，实现人脸图像的识别。该方法能够识别部分破损图像，但是准确率仍然较低。

基于上述方法中存在的不足，本文考虑到人脸姿态变化对识别效果的影响，提出一种基于距离限定优化的多姿态人脸图像智能识别。通过边界值和阈值对特征向量距离进行限定优化，使具有相似特征人脸图像对的欧式距离缩短，具有不同特征人脸图像对间欧式距离拉长，根据特征向量生成人脸特征库，并将待测图像与特征库内图像进行对比，完成图像识别全过程。与传统方法相比，所提方法可有效提升多姿态下人脸图像的识别的准确率，具有一定可靠性。

2 多姿态人脸图像特征预处理

2.1 人脸图像特征提取

为了保证人脸图像中原有特征信息不发生改变，且不存在冗余特征，提高识别准确率和识别效率，首先提取人脸图像特征。

设T中包含N个实体，根据人脸图像特征类别对每个实体进行标号，即

(1)

(2)

式中，l表示特征类型数量，数据集中每个向量X可组成一个N×n矩阵X=[X1，X2，…XN]。

随后调整原始图像角度、亮度、尺度，加入噪声处理后，获得四种变化图像，将每幅图像的特征x进行融合获得一个特征矩阵X，即

X=[X1，X2，…XN]

(3)

式中，N表示提取的特征总数。

采用向量内积得二者之间的相似程度，将每一个相似的向量设置相应的标记，并将该标记作为向量类标签，删除不相似向量，以此获得人脸图像信息的特征矩阵X′，即

X′=[X1，X2，…XM]

(4)

(5)

2.2 人脸图像特征降维

在上述获取的人脸图像特征基础上，本文采用粗糙集近似约简法对人脸特征进行降维处理，完成人脸图像特征的预处理。

首先，求解条件属性可区分度，以删减原始数据集中权重值较小的属性，随后添加约简算法将最重要属性增加至约简子集中，直到约简条件达到要求为止。步骤如下

输入：DT=(U，C∪D，V，F)；

输出：约简ARED；

Step1 ：给定阈值τ，使P=C；

Step2 ：针对每个ci∈P，求解IND(C/ci)，若IND(C/ci)<τ，那么P=P-{ci}；

Step3 ：针对各ci∈P，求解sig(ai，R；D)；

Step5 ：输出ARED=R。

可根据实际维数确定终止条件，同时也可以根据对算法的实时性和精确度要求调整维数，使算法更适用于实际识别需求。

3 多姿态人脸图像识别

在上述多姿态人脸图像特征预处理基础上，采用ResNet(Residual Neural Network，残差神经网络)特征提取器将面部图像转化为特征向量。结合多姿态人脸识别特点，构建共有20层的ResNet结构模型，其参数如表1。

表1 ResNet结构模型参数

表1中，C为卷积层，P为池化层，RB为连接块，F为全连接层。

设定阈值τ与边界值m(τ>m)，针对正样本图像对的欧式距离满足：

(6)

式中，xa和xp分别表示正样本图像对的特征向量。针对负样本图像对的欧式距离满足：

(7)

式中，xa和xn分别表示两个负样本的特征向量。

通过特征向量的欧式距离与阈值τ之间的关系判断两幅图像间关系，即两者的欧氏距离小于τ时，该样本对为正样本；相反则该样本为负样本。此时边界值m的主要作用为在训练过程中使正负样本的划分更为清晰明显，如图1所示。

图1 边界值m对分类的影响

通过边界值m进一步缩小正样本距离，增大负样本距离，避免各图像样本距离和τ过于接近，从而导致危险样本出现[8]。

在此基础上，采用距离限定法对特征向量进行优化，优化过程中只需使样本对间距离小于既定阈值，不必使二者无限接近即可提高识别鲁棒性。根据式(6)和式(7)可以分析出二者的关系如下

(8)

当训练完成后，总结测试样本的数量，并完成其阈值的设定[9]。根据ResNet构建误差函数。

大樱桃树果实生长期短，具有需肥迅速、集中的特点。萌芽、展叶、开花、果实发育到成熟，都集中在4—6月，同时花芽分化也集中在采收后较短的时期内，越冬以前树体营养状况的好坏，直接影响树的生长发育。

设Y代表样本标签，Y=1时为正样本，Y=-1时为负样本，则误差函数如下

(9)

(10)

当特征向量欧氏距离符合既定目标时，表示没有误差，反之通过SGD(StochasticGradientDescent，随机梯度下降)优化方法[10]对模型参数进行更新。

在随后验证过程中，舍弃边界值m，将τ作为距离的度量标准，其表达式为

(11)

随后生成多种姿态人脸图像库以实现多姿态人脸图像的识别。在没有外界干扰条件下，一般同一姿态的面部图像中器官分布较为一致，因此拍摄出不同一组经典的多姿态图像，获取多姿态下，不同面部器官的真实分布情况和特点，随后以其为依据，对待测图像进行变形处理，获得多姿态人脸图像信息。

采用高次多项式对图像的变换进行拟合，当变换情况复杂程度较高时，拟合次数随之增高。拟合后，面部器官能够通过坐标(x，y)表示，若姿态1的控制点集合的表达式为

O1={(x1，y1)，(x2，y2)，…，(xi，yi)}

(12)

其变形到姿态2的控制点集合可以表示为

(13)

集合中各有i个控制点，则二元二次多项式可以表示为

f1(x，y)=a5y2+a4xy+a3x2+a2y+a1x+a0

(14)

f2(x，y)=b5y2+b4xy+b3x2+b2y+b1x+b0

(15)

从式(14)、式(15)可以看出，需要通过6个控制点对才能完成上式中12个参数的数值确定。当控制点对数量为6时，方程组存在唯一解，但此时可能发生拟合误差较大问题。因此本文采取增加控制点数量的方法，通过最小二乘拟合[11]求解方程组，降低拟合误差，即

x′=f1(x，y)+ε1=a5y2+a4xy+a3x2+a2y+a1x+a0+ε1

(16)

y′=f2(x，y)+ε2=b5y2+b4xy+b3x2+b2y+b1x+b0+ε2

(17)

式中，ε1、ε2表示拟合误差，通过最小二乘拟合求得。

由此即可获得12个方程所组成的方程组为

(18)

对式(18)进行求解可得

A=(GTG)-1GTX′

(19)

当参数确定后，通过上述多项式对待测图像进一步进行变形变换，生成人脸特征库后，将待测人脸图像与生成的人脸姿态库进行匹配，通过二者的匹配结果相似程度来判定二者是否为同一对象，完成人脸识别全过程。采用两向量内积法来判定待测图像特征是否与图像特征库中的人脸图像匹配，因此，待测图像和特征库中第i个人DSi的相似度可以表示为：

(20)

4 实验分析

4.1 实验方案

为验证所提方法的有效性，进行一次实验分析。实验在MATLAB平台上实现，操作系统为WindowsXP系统，CPU为3.6GHz，运行内存为16GB。

实验在三维人脸数据库内选择30个人脸模型作为实验样本。其中，男女比例各为50%，并且其年龄不同。随后将模型在0～90°范围内以10°为步长进行旋转，并将旋转后图像的投影作为实验测试图像。

4.2 实验结果分析

在上述实验环境基础上，实验首先采用所提方法对样本多姿态人脸图像的姿态角度和测试图像真实角度进行分析，得到的实验结果如表2 所示。

表2 所提方法人脸姿态角度识别结果

分析表2中数据可以看出，所提识别方法对人脸姿态角度识别的误差值较小，具有一定的有效性，具有一定可信度。

为进一步验证所提方法识别准确率，将样本人脸图像左右偏转，对比文献[3]方法以及文献[4]方法的识别准确率，实验结果如图2所示。

图2 不同方法人脸图像识别结果分析

从图2中可以看出，所提识别算法对于人脸姿态变化具有较好的鲁棒性，且与其它两种方法相比识别准确率较高，均在90%以上，能够较好地识别出不同角度人脸图像。这是由于所提方法在识别前获取人脸图像特征，并进行降维处理，进而提升了人脸图像的识别精度。

5 结论

本文针对人脸多姿态变化，提出了一种基于距离限定优化的多姿态人脸图像智能识别方法。为了能够使图像中原有特征信息不发生改变，采用粗糙集简化理论对人脸图像进行降维处理，并使用残差神经网络将面部特征映射为特征向量，完成待测图像的识别。与传统方法相比所提方法可准确识别多姿态下人脸图像，具有一定可信度。