浅谈深度学习的发展及其在“图像处理”的应用

2017-10-09 05:37郝思媛周立俭赵琨
科技视界 2017年14期
关键词:隐层图像处理特征提取

郝思媛 周立俭 赵琨

【摘 要】目前,深度学习方法在图像处理、计算机视觉以及机器学习都得到了广泛的应用。然而,如何应用深度学习方法解决图像处理过程中的实际问题成为了学生们关注的焦点问题。本文以深度学习技术为主要脉络,研究如何有效提高图像处理课堂质量。希望可以为促进图像处理行业的快速发展提供一些参考和意见。

【关键词】深度学习;图像处理

在图像处理过程中,特征表达与融合技术是实现图像智能解译过程中一个非常重要的环节,直接影响到图像解译精度。然而,当前的特征提取方法往往忽略了图像的深层语义信息,解译准确度受到了极大的影响。深度学习理论的出现可以有效地解决这一问题,为图像特征学习提供可靠的技术保障,提取的特征更为抽象、鲁棒性更强且不受周围环境变化的影响。并且,完备的深度学习理论体系、丰富的网络模型、有效的在线研发工具、开放的应用案例都为深度学习引入高光谱图像处理中提供了必要的条件。

1 深度学习的技术概述

1.1 深度学习的发展

1965年,Ivakhnenko和Lapa提出多层非线性特征模型,可认为是最早的深度学习模型,但是该模型没有使用后向传播算法对网络进行训练,且层与层之间也没有关联性[1]。随后,Fukushima提出了最早的卷积神经网络,包含多个卷积层和池层,但是该算法使用不断加强的策略训练网络,需要人工分配大权重给图像中的重要特征[2]。1989年,LeCun将卷积神经网络与后向传播算法结合,利用“LeNet”网络对数字图像进行分类。随后,梯度消失问题使深度学习的发展出现了空档,直到2006年,Hinton和他的学生Salakhutdinov在顶尖学术刊物《科学》上发表了一篇文章,深度学习得到了全面的发展[3]。2015年,甚至有深度学习方面的专家预言“深度学习和机器智能”将会席卷全球,被应用于各个领域。Microsoft、IBM、Yahoo、百度等大公司争相成立了深度学习研究团队,将深度学习技术应用于语音识别、人脸识别、图像分类以及在线工具的研发中。说明深度学习发展的迅猛势头以及其对未来科技发展的重要作用[4]。

1.2 典型深度学习算法

自编码器和卷积神经网络是最为常用的深度学习方法,详细介绍如下:

1)自编码器:是基于单像元(向量)的深度学习网络,先通过线性或非线性映射将输入层的数据映射到隐层得到相应的隐层表示形式,然后输出层通过最小化重构误差来对隐层表示进行重构原数据。在此过程中,隐层表示可以理解为原像元的一种隐层特征,较传统特征提取方法(如PCA),隐层表示具有抽象性、鲁棒性、自适应性等特点。因此,自编码器已被广泛用于图像特征提取领域。

2)卷积神经网络是基于图像块的深度学习网络,输入是包含丰富空间邻域信息的图像块,因此通常利用卷积神经网络来提取图像的空间特征。此外,不同于自编码器的全连接网络,卷积神经网络采用局部连接和权值共享极大地降低了计算复杂度,成为目前应用最为广泛的深度学习网络。在考虑图像的空间纹理特征时,卷积神经网络是最为常用且有效的图像特征提取方法。

2 在“图像处理”中具体应用

在图像处理课程的学习过程中,学生所掌握的方法不能直观地体现在应用中,因此如何建立理论与应用的桥梁有助于学生更好地理解课程。笔者认为深度学习理论与方法对图像处理课程的学习至关重要。

2.1 通过实践激发学生学习兴趣

以自然图像为例,首先让学生们了解什么是自然图像。通过与灰色图像、高光谱图像进行对比,学习自然图像的基本特点,了解构成自然图像数据的特点。做到可以利用有效的视图工具将图像的不同彩色波段进行显示。这是图像处理课程的基本要求。

在了解自然图像特征之后,利用Matlab编程语言实现图像处理课程涉及的特征提取方法以及分类方法。然后,利用自编码器和卷积神经网络对该自然图像进行处理,提取图像的深层语义特征,且与传统的图像特征进行对比,有益于学生更加深刻地理解深层语义特征的概念。当然在此过程中,学生也对深度学习网络的搭建、训练以及测试形成一个较为详细的了解。

学生在处理过程中,按照“发现问题解决问题”的模式真正理解图像处理中的关键问题,同时对深度学习方法有了一个较为全面的认识。通过实践的方法解决学生在学习图像处理课程中的重点难点问题。

2.2 利用现代技术进行教学改革

随着技术的不断发展,学校对课堂基础设施的不断投入,老师们就需要利用各种先进的现代化技术提高学生的课堂质量,调动学生的兴趣。

目前,出现了许多新型手机APP平台,其非常适用于高校教师,如对分易、校园集结号等。APP平台的灵活运用可以有效地促进学生与老师之间的互动。在图像处理的学习中,也可以引入各种APP管理软件,将课堂的重点、难点展示给学生。

3 结论

通过将深度学习方法引入到图像处理的课程中,可以提高学生的学习兴趣。同时,为学生的后续深造提供了基础铺垫作用。

【参考文献】

[1]A.G.Ivakhnenko, V. G. Lapa. Cybernetic Predicting Devices[J].Transdex,1965.

[2]K.Fukushima.Neocognitron:A self-organizing neural network model for a mechanism of pattern recognition unaffected by shift in position[J].Biol.Cybern. 1980,36:193-202.

[3]Hinton,G.E.and Salakhutdinov, R. R.. Reducing the dimensionality of data with neural networks[J].Science,2006,313(5786):504-507.

[4]陳涛,牛瑞卿,李平湘,张良培.基于人工神经网络的植被覆盖遥感反演方法研究[J].遥感技术与应用,2010,25(1):24-30.

[责任编辑:朱丽娜]endprint

猜你喜欢
隐层图像处理特征提取
基于RDPSO结构优化的三隐层BP神经网络水质预测模型及应用
基于图像处理的机器人精确抓取的设计与实现
基于Daubechies(dbN)的飞行器音频特征提取
机器学习在图像处理中的应用
Bagging RCSP脑电特征提取算法
基于图像处理的定位器坡度计算
基于MED和循环域解调的多故障特征提取
基于近似结构风险的ELM隐层节点数优化
最优隐层BP神经网络的滚动轴承故障诊断
Photo Shop通道在图像处理中的应用