基于深度特征和迁移学习的行人再识别

2018-02-28 02:31吴珊
电子技术与软件工程 2018年20期
关键词:迁移学习

吴珊

摘要

本文提出了利用卷积神经网络来学习行人的深度特征,可以保留更多有价值的信息,利用简单有效的余弦距离方法计算每个图像对的相似度。我们的方法可以应用于不同的场景,在不同的数据集上进行了实验,都能达到较好的结果。

【关键词】行人再识别 迁移学习 深度学习距离度量

1 介绍

行人再识别是指在非重叠的多摄像机监控系统中,对不同场景中的行人进行匹配的技术。

多年来,由于其在视频监控中的重要应用,受到了人们的广泛关注。行人再识别第一个关键技术是特征表示,已经提出了几种有效的方法,例如HOG、ELF、LBP和SIFT。

另外一个关键技术是相似性度量,主要的方法有包括交叉视图二次判别分析(XQDA)、歐氏距离度量和余弦距离度量。

上述行人再识别的方法大多数的前提是假定在相似的场景中获取训练和测试样本,数据分布是相同的,但是这种假设并不适用于实际的应用场景中。为了解决出现的问题,本文提出了一种基于卷积神经网络(CNN)的特征网(FN),特征网络提取的深度特征是64维,噪音少并且有价值的信息多,用于学习行人特征对交叉数据集的视觉识别,然后利用余弦距离进行相似度量的学习,减少了处理时间,同时提高了精确度。

2 深度特征表示的学习方法

方法中的框架是在已经趋于成熟的VGG-16网络的基础上进行稍加改进,根据要求对其中的参数进行微调。在深度特征表示框架中首先对这些训练的行人图像进行图像增强的操作,然后利用参数已经微调的卷积神经网络进行深度特征提取,最后选用余弦距离进行相似性度量。

特征网络FN的输入包括5个卷积层和2个全连接层,卷积层包括一个的conv、一个Batch Normalization层和一个ReLU层,使用BN策略主要是加速收敛,并且可以避免手动调整权重和偏差的初始化问题。全连接层包括一个FC、一个ReLU层和Dropout,使用Dropout策略主要是在最后的一个全连接层前去除一些神经元,使最终提取的特征维数小,并且含有的有价值的信息多,表1列出了特征网络FN的框架细节(其中N:训练数据集的数量,conv:卷积层,FC:全连接层,BN:Batch Normalization策略,ReLU:(Rectifiedlinear unit)修正线性单元)。

2.2 余弦距离方法

本文采用余弦距离作为距离度量的方法,定义A=(α1,α2,…,α64),B=(b1,b2,…,b64)分别来代表从两张图像中利用特征网络提取的特征,两张图像的相似性可以表示为(其中值越大就代表两张图像的相似性越高):

3 实验过程及结果

3.1 实验过程

深度特征表示方法在CUHK03数据集、DukeMTMC数据集、以及Market-1501数据集进行实验。实验具体的过程是在DukcMTMC数据集上进行将近60,000次的网络训练迭代,消耗的时间将近20多个小时,将训练好的模型应用到CUHK03数据集和Market-1501数据集,并且微调参数,各个数据集上的一些参数配置如表2所示。

3.2 实验结果

在行人CLJHK03数据集的实验结果和一些常用的方法进行了比较,例如KISSME、LOMO-XQDA、FPNN和RME方法,在数据集CUHK03上排名为1的匹配率达到了77.3%,在排名为5的匹配率达到了94.6%,即挑选与待测图片相似度高的前5个人取得了很高的正确率,比其他方法的精确度要高很多,从CMC曲线图中显示的实验结果证明该方法是可行的。

在行人DukcMTMC数据集的实验结果和一些常用的方法作了对比,例如KISSME、eSDC、KMFA和NLML方法。在数据集DukeMTMC上排名为I的匹配率达到了80.7%,远远高于与其相比较的方法。

在行人Market-1501数据集的实验结果和一些常用的方法作了对比,例如mFillter、LADF、KISSME、PCCA方法。在数据集Market-1501上排名为1的匹配率达到了55.17%,精确度和其他方法比较也是略高的。

4 总结

本文将迁移学习应用于行人再识别的研究中,提出了一种有效的行人特征提取方法,并利用卷积神经网络自动收集有价值的信息,提取的特征是低维的。此外,采用简单但有效的余弦距离作为测量方法,对两幅图像的相似度进行度量。在三个具有挑战性的行人再识别数据集上进行实验,实验结果证明了方法的鲁棒性。

参考文献

[1]Kostinger M,Hirzer M,Wohlhart P,etal.Large scale metric learning fromequivalence constraints[C].ComputerVision and Pattern Recognition.IEEE,2012:2288-2295.

[2]Zheng W S,Gong S,Xiang T.Personre-identification by probabilisticrelative distance comparison[C].Computer Vision and PatternRecognition.IEEE,2011:649-656.

猜你喜欢
迁移学习
《宋史·曾公亮传》传主形象论析
基于深度神经网络的人体动作识别研究
从认知角度探讨大学英语网络教学模式
奇异值分解与移移学习在电机故障诊断中的应用
大数据环境下基于迁移学习的人体检测性能提升方法