深度学习在图像识别中的应用

2019-01-08 03:16夏长林

电脑知识与技术 2019年33期

夏长林

摘要：随着我国高新技术的快速发展，人工智能领域也得到推动，而图像识别是人工智能领域的一个重要课题，其主要包括分类识别和特征提取两大模块;同时深度学习作为人工智能的重要研究方向，近年来取得了突飞猛进的发展，它广泛应用在图像识别、语音识别等众多领域并获得了巨大成功。该文就深度学习在图像识别中的应用进行深入分析，主要从人脸识别、遥感图像分类等诸多方面进行阐述，其目的是为相关从业人员提供帮助，以此来推动人工智能发展大潮中图像识别领域的发展。

关键词：深度学习;图像识别;应用

中图分类号：TP3 文献标识码：A

文章编号：1009-3044（2019）33-0185-02

所谓深度学习主要是指通过构建深层级别的神经网络来模拟人脑进行分析，或者是模拟人脑进行学习以及解释相关数据信息。而图像识别是指通过对图像进行处理、分析及理解，进而实现识别各种不同模式的目标和对象的目的。如今深度学习已经被广泛应用于图像识别领域中，同时也获得了令人瞩目的成绩和效果。为此笔者在本文中就深度学习的概念以及结构优势进行探讨，同时也对深度学习在图像识别中的应用做出研究，希望可以为某些从业人员提供借鉴和参考依据。

1深度学习的概述

深度学习实质上是一种机器学习的过程，也是人工智能领域中一个新的研究方向。深度学习的最终目的是学习样本的内在规律和表示层次，通过对所获得的文字、声音、图像等数据信息进行解释，可以实现机器能够像人一样具有分析学习能力，从而使机器可以对文字、声音、图像等数据信息进行识别。同时深度学习还是一个相对复杂的机器学习算法，其已经超过了先前的相关技术，尤其是在语音和图像识别等领域已经取得了不错的效果。将深度学习应用于图像识别领域，可以有效解决很多复杂模式识别的难题，可以说深度学习有力推动了图像识别技术的快速发展和进步。

2深度学习的深层结构优势

深度学习的概念其实是来源于人工智能神经网络方面的研究，它在图像识别系统中的应用十分广泛，它属于一种包含多层感知器的结构，这也是它最大的优势。相关研究表明，如果针对特定任务的模型深度不够，就会增加所需要的计算单元，因而也就需要更多的参数和训练样本。此外，深度学习是基于大数据的自主学习过程，并不是通过手工设计来获得相关数据，即是通过组合低层来获得更加直观的表示方式，从而实现机器能够代替人类学习，其最终的目的是实现模拟人脑来进行一系列的学习活动，相当于机器模仿人类的一切学习活动。由于深度学习从大数据自主学习可以获得良好的特征，因而可以起到提高图像识别系统性能的作用。

3联合深度学习

早些年，一些计算机视觉研究人员将深度学习模型视为黑盒子，显然这是不全面的观点和看法。为此，相关研究人员提出了联合深度学习的概念。首先，传统的计算机视觉系统和深度学习模型之间往往存在关联性，因此相关研究者利用二者的关联性可以进一步构建出新的深度模型。其次，深度学习模型中的各个层与视觉系统中的若干模块之间也是可以建立对应关系的，倘若现有的深度学习模型与视觉系统之间存在这种对应的缺失，则相关研究者可以在此启发下构建新的深度模型。

4深度学习在图像识别中的应用

（1）人脸识别

深度学习在图像识别中应用最多的就是人脸识别，而人脸识别最大的挑战是如何将诸多因素引发的变化区分开来。能够引发图像识别变化的因素有很多，比如，光线、表情、身份等诸多因素，由这些因素产生的变化在分布的性质上往往属于非线性，同时这些变化也存在着极为复杂且多变的特征，所以很多时候借助传统线性模型难以将其区分开来。而深度学习之所以被广泛应用于人脸识别，其最终目的就是为了实现多层非线性的变换，因为通过多层的非线性变换就能获取新的特征，进而有效区分由诸多因素引起的相关变化。

（2）遥感图像分类

遥感图像中包含着大量的数据信息，这些具有价值意义的数据被广泛应用于各行各业。遥感图像数据具有两大特征，一是由过于庞大的图像数据所导致的信息冗余，二是由较低的图像分辨率所导致的不同信息间的相互融合。因此，对遥感图像分类较为困难，传统的遥感图像分类方法难以将有价值的信息准确分离出来。如果将深度学习技术应用于遥感图像分类中，通过建立合适的深度学习模型，同时结合使用特定的优化算法，则可以取得很好的分类效果，这已成为当前遥感图像分类技术的发展趋势。

（3）ImageNet分类

深度学习在ImageNet分类中的应用也十分广泛，很多时候传统的计算机视觉方法所获得的数据往往存在较大误差，在测试集上错误率也是比较高的，而利用深度学习可以有效解决这些问题。如今ImageNet分类在深度学习中也变得越发重要，对于这种网络结构我们还可以称之为AlexNet，相比传统意义上的卷积网络，该网络结构具有以下优势：第一，AlexNet主要是采取了Dropout的训练模式来进行分类，将一些神经元归置到零以此来实现模仿人类神经元的目的，虽然这一训练的过程变得缓慢，但是可以得到更加鲁棒的网络模型L6）;第二，AlexNet在一定程度上可以实现降低计算复杂度的目的，还可以得到具有稀疏性质的神经元输出。

（4）交通图像识别

随着经济社会的快速发展，图像识别技术在交通领域中的应用也变得越来越广。交通图像识别技术通常被应用于汽车的车牌识别、车道偏离预警以及交通标识等诸多方面，为人们的日常出行提供了许多便利。同时交通图像识别技术还被大量应用于智能停车、收费管理、交通控制等方面。近年来，相关研究人员尝试将深度学习技术运用到更深层次的交通图像识别领域中，比如，将深度卷积神经网络应用于交通标志检测领域，可以得到具有较强时效性和较高精确度的交通标志检测算法。基于深度学习的交通图像识别技术，为交通图像识别领域的探索与创新提供了新的方法。

（5）字符图像识别

字符图像识别在邮政信件、电子签名和支票等诸多领域被广泛使用，也取得了较好的效果。但是早些年的字符图像识别技术弊端在于，严重依赖人工对字符的预处理，显然这样的识别可靠性和识别效率较低。深度学习技术兴起以后，一些研究人员开始利用深度学习技术来研究字符图像识别，并在MNIST数据集上获得了不错的成绩和效果，将字符图像识别的错误率明显降低，使得机器与人类观察者之间的差距越来越小。

（6）视频图像分析

虽然深度学习在视频图像分析领域中也得到一些应用，但是就目前应用的情况来看依然处于起步阶段。利用深度學习来描述视频的静态图像特征是相对容易的，相应的深度学习模型可以通过在ImageNet上学习获得。而在深度学习中如何描述视频的动态特征则是一个难点。因为在传统的视觉研究方法中，往往是通过光流估计、动态纹理等进行动态特征的描述，然而深度模型却难以体现出这些动态特征的描述信息。解决此问题有三个方向：第一个方向是将视频图像视为三维图像，并直接将其应用于卷积网络中，但是该方向的问题在于没有考虑到空间维和时间维的差异性;第二个方向是进行预处理，计算光流场或其他动态特征的空间场分布，并以之作为卷积网络的一个输入通道;第三个方向是通过长短时记忆网络捕捉长期依赖性，从而实现对视频图像中复杂动态的有效建模。

5结束语

综上所述，深度学习如今已经被广泛应用于各行各业，也取得了令人瞩目的成绩和效果，尤其是在图像识别领域中的应用更是效果显著。深度学习主要是指学习样本的内在规律以及表示层次，而它最终的目标主要是为了让机器能够像人一样具有分析和学习的能力，能够精准地对文字、图像和声音等数据进行识别，同时深度学习还是一个相对复杂的机器学习算法。因此本文就深度学习在图像识别中的应用进行研究，主要分析了它的深层结构优势以及应用范围，最终的目的是为了推动图像识别领域快速发展。