余 江
( 西安科技大学 计算机科学与技术学院,陕西 西安710119)
行人再识别是一个图像识别技术领域的研究热点[1-2]。 该任务内容是在不同地点出现的行人进行再次识别。 任务的难点在于光线、姿态、拍摄角度、背景变化等多重因素的干扰。行人再识别包括3 个步骤:特征提取、模型训练以及相似性度量。 特征表达主要针对颜色和纹理信息, 常用方法又LBP、Gablor 算子、Schmid 算子以及颜色直方图。 Yang 等人[2]利用颜色词汇作为图像的外观特征描述。 廖胜才[6]等人则结合图像的色彩特征和颜色特征,提出了局部最大值特征。 Farenzena 等人利用人体结构的对称性,提出了SDALF 特征。在度量模型方面,郑伟诗等人将行人再识别问题转化为相对距离比较问题, 建立优化模型。 杜宇宁[3]等人在此基础上,提出了一种新的统计推断模型。Liao 等人则结合了投影子空间学习方法和马氏距离学习方法两种思想提出了交叉二次判别分析模型。 齐霁[4]等人在对现有度量模型算法研究的基础上, 提出了一种基于几何间距离的度量学习算法。 Zhang[5]等人则利用Foley-Samon 变换的方法建立了NFST模型。 本文中在现有研究成果的基础上, 针对行人再识别任务中的过拟合问题提出改进算法,设计完成了一种泛化能力更强的度量学习模型。
其中,W 为度量子空间的投影矩阵。 由此,建立正负样本之间的相对距离函数,如公式(2)所示:
针对行人再识别问题, 度量学习模型的目的是使得原始样本,在度量投影空间中正样本总体尽量小,负样本总体尽量大。根据LDA 的思想,构造Fisher 判别准则函数,如公式(3)所示:
Sp,Sn分别表示正负样本对总体的散度,其等价形式如下:
利用广义拉格朗日法进行求解,计算投影矩阵W。
由于小样本问题, 从而使得上述优化模型构成一个欠定问题,训练后的度量模型存在过拟合。 本文重点研究一种半监督的度量学习方法进行改进。 模型如下:
本文采用CMC 累计精度曲线[5]作为识别准确率的评价方法。 如表1 给出了在VIPeR 数据集上的测试结果。 对比现有最先进的行人再识别算法, 本文算法的识别精度有了显著的提升。
表1 对比实验识别精度统计表( VIPeR)
此外,本文在CUHK01 数据集上进行了测试,本文算法具有十分优异的表现,rank-1 的识别精度超过MLAPG 算法5%,达到70.00%。
行人再识别图像识别技术应用的又一个研究热点。 由于场景的复杂性, 现有研究成果的精度与实际应用仍存在较大差距。针对上述问题,本文改进的半监督线性判别分析模型。通过相比实验,充分证明了本文算法的有效性、准确性以及鲁棒性。