基于卷积神经网络Caffe框架的图像分类

2018-01-17 21:47杨晓旭高巍顾颋
电子技术与软件工程 2017年24期
关键词:图像分类卷积神经网络深度学习

杨晓旭+高巍+顾颋

摘 要

2013年贾扬清博士在Github上发布了一款深度学习框架“Caffe”,为众多研究人员和工程师们提供了一套简单易用且性能强大的深度学习开源框架。本文首先对Caffe框架简单介绍,其次阐述深度学习中应用的卷积神经网络原理,最后介绍如何利用Caffe框架进行图像分类。

【关键词】深度学习 Caffe框架 卷积神经网络 图像分类

1 Caffe框架

目前“特征提取+分类器”的框架模式仍然是在模式识别领域中最经典的框架,Caffe框架亦是如此。通过提取图像的特征,将图像的特征图像数据送入分类器中进行分类,最后实现识别分类。而作为深度学习框架的Caffe框架,与传统的机器学习相比,在对原始图像进行特征提取时,用的则是类似人类大脑的神经元组成的神经网络,不需要人工设定特征提取,机器自动学习就可获得。它的框架是将简单模块多层堆叠,大多数模块都是具有学习能力的,能计算非线性输入-输出映射,也就是激活函数。多个非线性层构成的系统可以实现非常复杂的函数,具有非常好的泛化能力和鲁棒性。

2 卷积神经网络的原理

Caffe的全称是Convolutional Architecture for Fast Feature Embedding,意思是快速特征嵌入的卷积结构,它实现了前馈卷积神经网络架构(CNN)。卷积神经网络是一种多层的监督学习神经网络,训练更简单,泛化能力比相邻层用全连接好,是目前广泛应用的深度模型。

卷积神经网络比一般神经网络多了一个结构,这个结构就是由卷积层和子采样层(pooling layer)构成的特征提取器。网络中,每个卷积层是由若干个特征图(feature map)组成的,每个特征图使用不同的卷积核连接到上一卷积层特征图的局部部分。但同个特征图是共用一个卷积核的,即权值共享。所谓权值共享,就是图像在做卷积时,如果图像某一部分的统计特性与其他部分相同,那么这部分学习到的特征就可以使用到相同特征的其他部分上,这就意味着它具有位置无关性。另外,对相似度高的图像组,由于局部像素高度相关,也更易检测出特征,提高了效率。子采样也叫池化,它的作用是将不同位置的相同或相似度高的特征聚合统计,降低计算量,通常有平均池化和最大值池化两种方法。

在Caffe中,利用卷积神经网络训练模型时,卷积层实现了权值共享,比全连接层的计算量大,参数量小,这也就实现了降低参数的目的。当然,因为卷积层计算量比例大,参量比例小,而全连接层正好相反,因此在考虑优化参数时,全连接层是更好的方向,而当要考虑优化计算量时,则把重点放在卷积层。

3 图像分类

图像分类问题看似简单,实则很深,而且应用广泛。实际上,目标检测、识别、分割等计算机视觉问题都可以看成是图像分类问题。

本文以两个实际用例对利用Caffe框架进行图像分类作简单介绍,通过现场采集的部分样本图片,用以训练卷积神经网络模型。此传输线用例的数据集由十万张图片组成,分为四类:绝缘子正常、脱落,導线正常、断股。在实际应用中,据此来判断传输线是否存在问题,在应用前,实验得到的结果验证精确度达到100%,实际应用中,识别准确率达到99.8%,这是由于在实际应用中传输线周遭环境的突然变化,如恶劣天气等。

图1是该用例系统的算法流程图。首先,输入待识别的图像到设备中,再对输入图像进行预处理,主要是修定图像大小,以方便提取特征进行下一步的检测识别。

图2所示是电力系统中线路开关闭合的监测情况实时显示,实际应用中,识别正确率达到98.5%。

4 结束语

本文简单介绍了Caffe框架,阐述了卷积神经网络的原理,并用实际用例简单说明了如何利用Caffe进行图像分类识别。从传输线系统和电力线路开关系统的实际应用情况来看,其效果是非常好的,检测精确率都很高。

参考文献

[1]郑胤,陈权崎,章毓晋.深度学习及其在目标和行为识别中的新进展[J].中国图象图形学报,2014,19(02):175-184.

[2]Jia Y,Shelhamer E,Donahue J,et al. Caffe: Convolutional ar-chitecture for fast feature embedding[C].Proceedings of the ACM International Conference on Multimedia.ACM,2014:675-678.

作者简介

杨晓旭(1972-),男,硕士学位。高级工程师。研究方向为变电站自动化。

高巍(1973-),男,大学学历。研究方向为变电站自动化。

顾颋(1979-),男,大学学历。研究方向为变电站自动化。

作者单位

国电南瑞科技股份有限公司 江苏省南京市 211106endprint

猜你喜欢
图像分类卷积神经网络深度学习
基于云计算的图像分类算法
基于深度卷积神经网络的物体识别算法
基于锚点建图的半监督分类在遥感图像中的应用
MOOC与翻转课堂融合的深度学习场域建构
大数据技术在反恐怖主义中的应用展望