人工智能理论及其在人脸识别中的应用

2014-07-09 20:08李学龙

科技视界 2014年3期

李学龙

【摘要】人工智能作为一门多种学科互相渗透而发展起来的交叉学科在各方面都有着应用。人脸识别通过知识表示、知识推理、模糊逻辑、神经网络、专家控制、遗传算法和群集智能等人工智能方法达到识别人物脸部特征的目的，进而对其进行判定。本文总结介绍了基于几何特征、基于模型、基于统计以及基于神经网络等具体识别方法。

【关键词】人工智能；人脸识别；神经网络

1 人工智能简介

人工智能（Aritificial Intelligence，AI）是一门综合了计算机科学、控制论、信息论、神经生理学、心理学、语言学、哲学等多种学科互相渗透而发展起来的一门交叉学科[1]，从诞生至今已有近60年的历史。人工智能是研究如何制造智能机器或智能系统，来模拟人类智能活动的能力，以延伸人们智能的科学[2]。人工智能不在乎计算机是依靠某种算法还是真正理解人类行为，只需要其能表现出与人相似的行为，它是计算机科学中的—个分支，涉及智能机器的研究、设计和应用。人工智能的研究目标在于怎样用计算机来模仿和执行人脑的某些功能，并开发相关的技术以及产品，建立有关的理论。人工智能可分为：基本人工智能，包括知识表示、推理；高级人工智能，如模糊逻辑、神经网络、专家控制；计算智能，如遗传算法、群集智能。人工智能研究领域的三种主要观点[3]：符号主义又称为逻辑主义或计算机学派，其认为符号是人类的认识基元，同时人认识的过程即是对符号的计算与推理的过程；联结主义又被叫做仿生学派，其主要原理是人类的智能是由人脑的生理结构和工作模式所决定；行为主义又被称作进化主义、控制论学派，其主要原理是智能取决于感知和行动，它不需要知识、也不需要知识的表示与推理[4]。

2 人脸识别

人脸识别是指对输入的人脸图像或者视频，判断其中是否存在人脸，如果存在人脸，则进一步给出每张人脸的位置、大小和各个主要面部器官的位置信息，并且依据这些信息，进一步提取每张人脸蕴含的身份特征，并将其与已知人脸库中的人脸进行对比，从而识别每张人脸的身份。人脸识别的研究起源于19世纪末，其发展大致分成三个阶段[5]：第一阶段以面部特征为主要研究对象；第二阶段称为人机交互式识别阶段，分为采用几何特征参数来表示人脸正面图像和统计识别为基础的方法；第三阶段才被称为真正的自动识别阶段，人脸识别技术进入实用阶段。

3 常用的人脸识别方法

人脸识别的技术与方法一般分为：基于几何特征的方法和基于模板匹配的方法。对于基于几何特征方法而言，首先检测出眼耳口鼻等脸部主要部件的位置和大小，然后分析这些部件的总体几何分布关系以及相互之间的参数比例来识别人脸。基于模板的方法也叫做基于表象的方法，利用模板与整个人脸图像的像素值之间的自相关性进行人脸的识别[6]。通过分析常用的人脸识别方法，本文将人脸识别的方法分为基于几何特征的方法、基于模型的方法、基于统计的方法、基于神经网络的方法。

3.1 基于几何特征的方法

最早的基于几何特征的方法由Bleclsoe提出，该方法将几何特征定义为面部特征点之间的距离和比率，通过最近邻方法来识别人脸，但必须手动定位面部特征点，因此属于半自动系统。侧影识别是另一个基于几何特征的人脸识别方法，其原理是通过提取人脸的侧影轮廓线上特征点，将侧影转化为轮廓曲线，提取其中的基准点，然后识别这些点之间的几何特征。

基于几何特征的方法非常直观，能快速识别人脸，只需要较少内存，光照对特征的提取影响不大，缺点是当人脸变化时，特征的提取不精确，并且由于对图像细节信息的忽略，导致识别率较低，因此近年来少有发展。

3.2 基于模型的方法

隐马尔可夫模型（Hidden Markov Model，HMM）是一种常用的模型，基于HMM的方法被Nefian和Hayes引入到人脸识别领域，它是一组统计模型，用于描述信号统计特性。Cootes等人提出主动形状模型（Active Shape Model，ASM），对形状和局部灰度表象建模，定位新图像中易变的物体[5]。Lanitis等用该方法解释人脸图像，其原理是使用ASM找出人脸的形状，然后对人脸进行切割并归一到统一的框架，通过亮度模型解释和识别与形状无关的人脸。

主动表象模型（Active Appearance Model，AAM）通常被看作是ASM的一种扩展，一般作为通用的非线性图像编码模式，通用的人脸模型经变形处理后与输入图像进行匹配，并将控制参数作为分类的特征向量。

3.3 基于统计的方法

基于统计的方法将人脸图像视为随机向量，采用一些统计方法对人脸进行特征分析，这类方法有较为完善的统计学理论的支持，因此发展较好，研究人员也提出了一些比较成功的统计算法。

特征脸方法由Turk和Pentland提出，该方法中人脸由各个特征脸扩展的空间表示，虽然人脸信息可以有效地表示，但不能对其进行有效鉴别和区分。为取得更好的人脸识别效果，研究者又提出使用其他的线性空间来代替特征脸空间[6]。Moghaddam等人提出了贝叶斯人脸识别方法，用基于概率的方法来度量图像相似度，将人脸图像之间的差异分为类间差异和类内差异，其中类间差异表示不同对象之间的本质差异，类内差异为同一对象的不同图像之间的差异，而实际人脸图像之间的差异为两者之和。如果类内差异大于类间差异，则认为两人脸图像属于同一对象的可能性大。

奇异值分解（Singular Value Decomposition，SVD）作为一种有效的代数特征提取方法，奇异值特征具有多种重要性质，如镜像变换不变性、位移不变性、旋转不变性以及良好的稳定性等，因此人脸识别领域也引入了奇异值分解技术。

3.4 基于神经网络的方法

神经网络用于人脸识别领域也有较长的历史，Kohoncn最早将自组织映射（Self-Organizing Map，SOM）神经网络应用于人脸识别，即使当输入人脸图像有部分丢失或者具有较大噪音干扰时，也能完整的恢复出人脸。人脸识别中最具影响的神经网络方法是动态链接结构（Dynamic Link Architecture，DLA），对网络中语法关系的表达是该方法最突出的特点。

用于人脸识别的神经网络还有：时滞神经网络（Time Delay Neural Net-works，TDNN），是MLP的一种变形，径向基函数网络（Radial Basis Function Network，RBFN）以及能有效地实现低分辨率人脸的联想与识别的Hopfield网络等[6]。

与其他人脸识别方法相比，神经网络方法具有特有的优势，人脸图像的规则和特征的隐性表示可通过对神经网络的训练获得，避免了特征抽取的复杂性，有利于硬件的实现，缺点是可解释性较弱，要求训练集中有多张人脸图像，因此只适合于小型人脸库。人工智能应用在人脸识别、模式识别方面能够提高运行效率、减小计算量小、程序的代码编写更为简洁。

【参考文献】

[1]武海丽.初识人工智能[J].科技创新导报，2009，02：196.

[2]王甲海.创新型人工智能教育改革与实践[J].计算机教育，2010（08）：136.

[3]肖斌，薛丽敏，李照顺.对人工智能发展新方向的思考[J].信息技术，2009，12：166-168.

[4]朱祝武.人工智能发展综述[J].中国西部科技，2011，10（17）：08-10.

[5]裴佳佳.基于子空间的人脸识别技术研究[D].浙江工业大学，2009.

[6]李武军，王崇骏，张炜，陈世福.人脸识别研究综述[J].模式识别与人工智能，2006，19（01）：58-66.

[责任编辑：丁艳]