现代模式识别发展的研究与探索

2012-04-07 09:37霍桂利

河北开放大学学报 2012年5期

霍桂利

（山西建筑职业技术学院，山西太原 030006）

一、模式识别的基本概念

所谓模式识别就是指对所表征事物或现象的各种形式的数据信息进行分类分析和机器处理，以及对现象或者事物进行描述、分类、辨认和解释的过程。主要组成是信息科学及人工智能科学，应用于图像分析与处理、语音识别、声音分类、通信、计算机辅助诊断、数据挖掘等学科领域。分析和研究的方向集中在两个重要方面：一是分析各类生物体如何去进行感知，为认识科学的范畴；二是在确定的任务情况下，如何利用计算机来实现用模式去识别事物。感知是属于生理学、生物学、心理学和神经生理学的研究内容，识别则是利用信息学专家、数学家和计算机科学工作者的共同努力和研究；而模式识别还可分解为抽象和具体的两种状态，抽象如人脑的意识、思想等，为概念识别研究范畴，即人工智能的研究方向。该研究方向指的模式识别是对地震波、语音波形、脑电图、文字、心电图、符号、照片、图片、生物传感器等内容及对象的模式进行识辨和分类。利用计算机对一些事件和过程进行识别和分类，识别的事物及过程可以是声音、文字、图像等具体的研究对象，当然也可以是一些程度抽象的对象。把这些对象与数字的形式信息加以对比和区别，称之为模式信息。模式识别理论及技术现在已能成功地应用于诸多领域，如指纹的识别、信件的分检、生物医学的细胞、故障的诊断、可以有视觉的机器人、汽车自动驾驭系统和语言的识别等。

二、模式识别系统

模式识别方法是利用模糊数学的概念、原理和方法解决分类识别的问题。对于一个完整的模式识别系统，在其进行模式识别之前，所应用目的不同，则分类识别方法也不尽相同，首先是特征提取，特征提取与选择的基本任务及研究如何从许多的特征中寻找出有效的特征，压缩特征空间的维数。从直观上可知，在特征空间中，如果同类模式分布比较密集，不同类模式分布比较疏散，模式识别就比较容易正确，因此，为了给后续识别工作带来方便，就要求在对实际对象提取特征或对目标的相关信息等进行预处理时，同类对象差别较小，而不同类对象差别较大。但是，通常描述的对象诸元素很多，提取的特征也没有明显的上述分布，或者得到的特征太多。这时我们就需要节约资源，节省计算机的存储空间和特征提取的各项费用，并且提高识别的正确率，即希望用最少的特征达到尽可能高的识别正确率。这就是特征的选择。同时在实现目标时，需要制定特征的提取和选择的准则，由此构造函数和判别的概率。为使机器具有分类的识别功能，对机器学习的分类就需要有学习策略和知识表示，学习策略是学习中使用的推理方法，把环境提供的信息通过识别转变成新的形式，从而产生分类识别的分析程序和规则。这种变换的性质确定了学习策略的类型。如记忆学习、传授学习、类比学习、归纳学习等。而机器进行学习这个过程一般情况下要反复多次进行，多种方法不断地进行错误的修正和改进，包括修正之后的特征提取方法，修正之后的特征方案的选择，判断规则方法和参数的选择等，结果将使系统的正确识别率的设计要求达到标准。

三、模式识别的基本方法

人类的识别活动是一项基本的活动，我们总是希望机器能够代替人类的活动来进行识别等工作，从而模式识别理论及方法将引起人们的极大兴趣，因此进行长期的探讨和研究，目前的发展是一门多学科的并且是一门交叉学科。该学科的理论与实际技术的应用相当广泛，而且也涉及多种学科，如数学理论、心理学、计算机科学、信号处理学等。从根本上讲，该学科是数学处理和信息分析，从性能上讲，也可以认为该学科是人工智能的一个子集。当前的主流技术是：统计模式识别法、句法模式识别法、神经网络法、人工智能方法等，他们之间也存在一定的联系。

统计模式识别：在统计学中，随机性试验是指对随机现象的观察。随机试验在完全相同的条件下，可能会出现不同的结果，但结果是可以估计的，即随机试验的结果具有不确定性和可预计性，依据是否具有可预计性可以分为两类：一类是确定性的，此类事物在一定条件下必然要发生或不发生；另一类是随机性的，此类事物有很多可能的结果，在实验或实现前不能预知会出现哪种结果，但是其有统计规律，这种统计规律可用概率分布（密度）函数或数字特征来刻画。实际上对于许多必然性事物，当我们对其发生、发展的一些条件不确知时，或影响它们的条件是随机的，其也表现具有随机性。

句法模式识别：句法分析要求识别构成句子成分以及它们之间的相互关系，确定每个动词的主语和宾语，以及每个修饰性的词或短语所修饰的成分。如果能把大量可能的输入结构映射为数量较少的结构，那么后续的处理语义分析就会简化。除此之外，如果在句法分析中选择的结构是恰当的话，主谓、述宾一类的关系都可以在这个分析阶段的结果中搞清楚。理论语言倾向由句法分析模块来完成关系类型，而计算机语言则完全放弃了句法结构的规范化，让语义分析模块直接去处理各式各样的句子结构。在这一类系统中，句法结构的规范化实际上被包含在语义分析过程中了。那么这样需要更复杂的语义规则，因此在自然语言处理系统中一般的做法仍然包含这样一种结构规范化的模块。在现有的系统中，首先是先句法后语义：即强调在语言分析过程中存在一个相对独立的句法分析阶段，它的输出结果是输入句子的句法结构。其次是句法和语义一体化：即这种分析策略的系统中不再单独设置一个句法分析模块，也不出现句法结构这样一种中间的分析结果。把这两种观点结合起来会得到一个更理想的分析系统，这个分析系统既可以从句法入手也可以从语义入手来进行分析，它们在分析过程中都需要得到对方的帮助。然而要实现这样一种设想的前提就是对句法分析和语义分析两方面都必需有一个扎实的认识。

人工神经网络法：神经模型途径是发展初期知识很少的通用的学习系统，这类系统通常称为神经网络，系统包括一个由互连的元件组成的网络。这些元件类似于神经元，它们实现简单的逻辑功能，这种系统的学习过程是逐步修改元件间的连接强度，一般是连续改变赋给这些连接的权值。系统的初始知识是选定输入元件、网络结构和初始连接强度。现代模式识别对复杂的信息处理方面，已经初步显示出了识别系统具有一定的智能，但与人脑还不能相比。目前在计算能力上计算机大大超过人类，而关于人类基本的智能，如视觉、听觉，计算机的处理能力还很差。那么作为另一种技术新途径，人工神经网络的技术将以崭新的思路，优秀的特性引起人们极大的研究与开发兴趣。对人工神经网络将采用可实现的器件或计算机通过硬件或软件的方式，解决机器学习、识别、控制、决策等机器智能的问题。当神经网络元模型确定之后，神经网络的特征和能力主要取决于网络拓扑结构及学习方法，如前向网络、输出向输入反馈的前向网络、层内互连前向网络、全互连反馈网络、局部互连反馈网络。在学习阶段，外界将把输入和输出信息提供给神经网络，并使网络的输入和输出神经元状态与外界信息一致，在网络运行达到稳定后，对所有的连接权进行了调整。在工作阶段，外界将把输入信息提供给神经网络，要求网络给出相应的输出信息，外界提供部分信息，网络输出全部信息。

人工智能方法：人工智能是研究怎样使计算机来模仿人脑所从事的学习、思考、推理和规划等逻辑思维活动，以便解决人类专家才能处理的一些复杂问题。主要包括计算机实现智能的原理、制造类似于人脑的智能计算机。它涉及到医疗诊断、石油测井解释、气象预报、运输调度和管理决策等课题。从实用观点看，人工智能是一门知识工程学；以知识为对象，研究知识的获取、知识的表示方法和知识的使用。从认知观点看，人工智能仅限于逻辑思维范围是不够的，须考虑形象思维、灵感思维才能促进人工智能的发展。数学常被认为是多种学科的基础科学，它在机械运动中，复杂的无组织的如分子运动中都有重要的贡献。数学还应进入语言、思维领域，人工智能学科不借用数学工具是不可想象的。人工智能的研究集中在抽象的、简单的现实世界的积木块上，而数学在人工智能中远没有发挥作用，仅限于标准的逻辑、模糊数学的使用。人工智能研究的目标就是使计算机及其系统实现人类智能，为人类的工作、学习和生活带来方便。利用知识以及知识表示就成了人工智能研究的核心。如知识工程、自然语言理解、计算机视觉等都是人工智能的主要研究方面。而专家系统及其开发工具、自动推理、机器学习已成为研究的热点。人工智能学科要有理论也要有实践，思维科学是人工智能的理论基础；可把人工智能列入认知科学内的一种工程技术学科。计算机是以程序来执行一些任务的，衡量一个程序是否是一个智能程序，常常从其自然语言的理解能力，或者是自动推理能力以及机器学习能力来分辨。如此来看，多数程序不是智能程序，少数程序可视作智能程序的雏形，根本原因是对机器学习以及自然语言理解的机理的认识还是很不够的。

［1］程民德.图像识别论［M］.上海：上海科学技术出版社，1983.

［2］王绍霖.数字模式识别［M］.长沙：国防科技大学出版社，1985.

［3］戴遗山，汪浩.概率论［M］.哈尔滨：哈尔滨军事工程学院，1983.

［4］周概容.概率论与数理统计［M］.北京：高等教育出版社，1984.

［5］赵庆建，陈森发.基于纹理分析的多源信息融合方法研究［J］.信息与控制，2007，（2）.

［6］陈艳琴，罗大庸.多信息融合技术及在无损检测中的应用［J］.电子科技大学学报，2003，（6）.

［7］韩崇昭，朱洪艳，段战胜，等.多源信息融合［M］.北京：清华大学出版社，2006.

［8］杨露菁，余华.多源信息融合理论与应用［M］.北京：北京邮电大学出版社，2006.

［9］马洪超，郭丽艳.人工神经网络信息融合及其在机场识别中的应用研究［J］.武汉大学学报（信息科学版），2005，（8）.