基于深度学习的服装图像识别分析

2022-10-20 04:58韩丰泽
西部皮革 2022年19期
关键词:图像识别特征提取关键点

韩丰泽

(陕西服装工程学院,陕西 西安712046)

引言

图像识别与分类技术是现阶段计算机视觉领域的重要构成部分,而深度学习技术从人工神经网络概念提出至今经历了多次大起大落,随着基于深度学习的图像识别竞赛中超越人类识别准确率,再加上大数据的广泛普及与推广得以迅速发展[1]。在数字图像处理技术高速发展推进下,部分科技公司逐步推陈出新了以图搜图技术,现阶段百度与谷歌等公司均研发了具备一定搜图功能的软件与产品。在服装图像搜索与应用中,淘宝、唯品会等App 也推出了以图搜图功能,但是总体而言受各种因素影响,当前各式各样方式所获取的服装图像分类结果均不够理想化,特别是搜索的图像中还存在一定的遮挡和复杂背景,再加上图像质量较差,致使检索结果差强人意。

1 服装图像识别方法

服装图像识别与分类的本质在于通过图像特征与分类模型明确服装类别,常用服装图像识别方法主要有传统方法与深度学习方法[2],具体如图1 所示。

图1 服装图像识别与分类方法

2 基于传统方法的服装图像识别与分类

图像特征提取即通过计算机技术由图像内提取可表达图像特性的数据,基于处理分析生成计算机可理解的图像的非图像表示的过程。图像特征提取与分类识别算法精确度息息相关[3]。

2.1 全局特征提取

其一,颜色特征提取。图像颜色特征的显著特性为直观且稳定,对于平移与旋转等变换的感知不够灵敏。颜色特征实际上就是以像素或者区域为载体对于图像的颜色加以描述与表达,具体划分为颜色直方图、颜色矩、颜色集等等。其中颜色直方图阐述了不同颜色在图像中所占据的比例,但是不能呈现颜色间的位置关联性;颜色矩通过矩表示图像全部颜色,其一般在其他颜色特征提取前进行范围缩小。目前通过传统颜色特征,有学者提出了新型颜色特征,也就是级联颜色矩,其将图像空间信息添加于颜色特征内,级联颜色矩则基于级联各块颜色矩得以生成。此外,有学者提出了服装图像预处理程序,包含直方图均衡、前景提取、图像服装区域尺寸归一化处理。

其二,形状特征提取。图像形状特征提取时,以所提取信息范围可划分为轮廓特征与区域特征两种。在服装图像识别时,形状特征切实应用于服装款式识别,经典形状特征阐述方法主要包含边界特征法与傅里叶形状描述符法等等。其中边界特征法本质在于以边缘检测提取图像内形状的边界特征,其尽量忽视形象边界之外的相关信息,最终只保留可呈现图像内形状边界的闭合曲线。

其三,纹理特征提取。服装图像中纹理特征可真实反映服装纹路或者面料等有关信息。纹理特征提取方法主要包含统计分析法、结构分析法、信号处理法、模型法等等。其中统计分析法面向单独像素及其相邻像素的灰度属性进行分析,具体即灰度共生矩阵、灰度差分统计等等,其优势在于简单且容易实现,而不足在于难以合理利用全局信息且计算复杂、消耗时间。结构分析法即明确定义纹理构成元素为纹理基元,且主张纹理基元与纹理表现形式密切相关。信号处理法即针对纹理区域进行变换之后再提取稳定特征值以此为特征加以表示,通常基于线性变换、滤波器变换纹理,再就能量分布进行特征提取。模型法即以纹理图像预测计算模型参数,就参数作为特征分割图像,具体包含随机场模型法与分形模型法。

2.2 局部特征提取

通过全局特征可简单识别服装类别,但是服装主观风格量化难上加难,基于形状与纹理等简单特征难以精确识别。所以在完成高难度识别任务时,单纯依赖于全局特征有时候根本不能获取预期效果。相较于全局特征不同,局部特征提取是面向图像局部的,常用局部特征表达类型包含角点类型与区域类型,而特征提取方法则主要有三种。

其一,SURF 方法。SURF 方法是对于SIFT 的改进优化,对于SIFT 在构造DOG 尺度空间与求取DOG 空间局部极限值时消耗时间过多这一现象,SURF 方法选择以Hessian 矩阵变换图像,如此一来在检测极限值时只需简单方程便可求得Hessian 行列式近似值,通过盒装模糊滤波进行高斯模糊近似值求取。在高斯金字塔构建过程中,SURF 方法可确保图像尺寸不变化,只针对滤波器尺寸加以调整。而在求解关键点主方向的时候,SURF 方法选择哈尔小波转换,而非直方图统计,以此便更大程度上加快了匹配速度。

其二,SIFT 方法。SIFT 方法的关键点是一个重要概念,图像的关键点即特征表现比较稳定的点,这些点一般不会由于光照或者噪音的影响发生显著变化。SIFT 方法的具体流程为:基于构建高斯金字塔,进行尺度空间建设,此过程可确保SIFT 尺度不变性;搜索并定位关键点,所谓关键点即通过所构建的尺度空间的局部极限值点构成的,所以搜索时需寻找空间内全部局部极限值点,再去除不稳定、不可用的点,从而保留关键点,随后定位关键点,通常是针对全部离散关键点进行曲线拟合以获取关键点位置与尺度信息;方向赋值,主要是为了实现算法旋转不变性,通过图像梯度获取图像特征稳定方向,再对关键点赋值,随后明确定义关键点及其周围有点贡献值的点为关键点描述子,为促使方法稳定旋转图像,需提前将坐标轴根据关键点进行既定角度旋转,同时为确保SIFT 方法的光照变化稳定,还需针对模型进行归一化操作。据此可知,SIFT 对于旋转变化、亮度变化保持不变性、信息量丰富且多元化,与大数据发展需求高度相符,可进一步顺利匹配海量数据内数据信息,但是不足在于偶尔所提取的特征点比较少,难以切实提取边缘光滑对象的实际特征。

其三,HOG 方法。HOG 特征是基于图像局部区域梯度方向直方图加以生成的,其特征提取流程具体为:输入图像;图像标准化处理;计算梯度;计算Cell 内各像素幅度与方向;计算重叠的各Block 内HOG 描述子;串联全部Block 区域内HOG 描述子;图像HOG 特征提取。HOG 特征提取涉猎大量图像局部操作,所以HOG 特征提取方法并不受图像几何变形与光照变化影响。类似于SIFT 方法,HOG 方法也通过图像内梯度方向直方图提取特征。但是SIFT 方法会根据检测的兴趣点同步使用,所以处于复杂环境时物体特征提取时SIFT 方法的优势会更加突出。HOG特征单元较小,主要以逐层扩大方式提取特征,切实保留了像素间与空间层面的有机联系与相关性,所以HOG 方法在提取刚性物体特征方面优势更为凸显。

3 基于深度学习的服装图像识别与分类

不同于服装图像传统识别方法,基于深度学习的服装图像识别与分类方法将特征提取与分类器输入相融合,以一个模型提取并分类特征,分类器作为模型最后一层,处于全部特征提取流程后面[4]。

3.1 特征提取

传统特征提取方法为深度学习特征提取方法提供了更加完善的思路与依据,二者最大的差异体现于SIFT、HOG 等传统方法高度依赖于先验知识手工设计特征,但是深度学习整个过程无需人为设计特征,其整个过程是基于神经网络结构并模拟人类大脑学习过程,由海量数据中学习不同特征的表示。据此可见传统特征提取方法无法充分合理利用大数据优势,且依靠手工调整参数,所以特征内参数量相对偏少,但是深度学习可由海量数据内学习特征,其中包括上万参数,所以以此方法提取的特征表达效果更为显著。

3.2 服装图像识别与分类

近几年关于基于卷积神经网络的服装图像识别与分类算法逐步衍生。其中通过Res Net 与Squeeze Net 对于电商服装图像识别与分类的具体表现,检测并进一步改进了分类准确率影响因素,主要包含生成背景、扩大网络、采用集合增强数据,以此经过优化,其准确率可达80%左右;基于Google Inception 模型的区分传统服装图像与真实服装图像的方法,通过对比分析选择了以均方根方向传播法为优化器,从而区分结果于训练集与测试集中的准确率高达92%与90%。通常网络会自主裁剪或者适度缩放图像,以保障固定大小输入,如此会在一定程度上降低图像精确度,对此可通过针对微调VGG 网络配置空间金字塔池,以消除固定尺寸输入约束,提升图像输入灵活性。

商店零售商所提供的真实服装图像标签多数情况下都是错误的或者不完整的,而且图像类型之间的不均衡严重阻碍了学习有效性。对此可通过多任务深度学习架构学习有效表示形式,并构建切实应用于不平衡学习的多权重卷积神经网络,此网络拓扑结构主要包含两层,上层为任务层,下层为共享层。在此基础上,有学者设计了不同的CNN 以进行服装图像识别与分类,分别为常规CNN、涵盖起始模块CNN、囊括起始模块与残差模块CNN、迁移学习CNN,全部网络均可实现服装图像较好分类,且迁移学习CNN 拥有非常高的图像识别分类精确度。Fashion Net 作为全新服装分类模型,其中结合了传统图像特征提取与深度学习特征提取的优势。

4 基于深度学习的服装图像识别与分类系统

针对常见服装图像识别与分类系统,以及各类型消费者对于服装识别与分类系统的实际需求进行详细分析,根据模型面向服装各类型属性的标注任务,将多功能服装识别与分类系统划分为三个模块,具体如表1 所示。

首先,输入搜索功能模块。此模块想要实现的具体功能包括用户输入服装有关关键字词,页面展示与关键字词有关的图像。而关键字词主要包括三种,具体即服装类别(外套、短裤、长裤、T恤等等)、服装特点(印花、针织、纯棉等等)、服装颜色(黑色、白色、黄色等等)。系统会就用户所输入关键字词筛选出符合关键字词属性的服装类型以供用户浏览,用户只需点击选择明确具体类型,界面就会呈现用户所期望的服装图像。其次,风格分类功能模块。与服装风格分类模型相一致,将服装风格具体划分为简约风、优雅风、复古风、民族风、可爱风、职场风。再次,精细化分类功能模块。此模块实现主要从大类开始分层精细化识别与分类。明确服装第一层总体分类为三类:上装、下装、全身;第二层分类为款式:上装分为短袖、T 恤、外套等;第三层分类添加了服装属性标签:风格、特点等[5]。

表1 服装图像识别与分类系统功能模块

5 结语

综上,在深度学习高速发展趋势下,深度学习在计算机视觉领域的实际应用实现了突破性发展,其在服装图像识别中的应用流程具体即以BP 神经网络识别服装图像,由分类中提取服装质地与结构特征,输入于神经网络内,以实现整个学习过程。其中传统特征提取方式无法充分发挥大数据优势,过于依赖手工进行参数调整,所以特征内参数量偏少,但是深度学习可由海量数据内学习包括多参数的特征,因此以其提取的特征表达效果更佳,更加适合服装图像识别。据此,本文以深度学习的特征提取模型实现了服装图像识别。

猜你喜欢
图像识别特征提取关键点
同步定位与建图特征提取和匹配算法研究
支持向量机的舰船图像识别与分类技术
基于计算机视觉的图像识别技术研究
论建筑工程管理关键点
水利水电工程施工质量控制的关键点
人工智能背景下图像识别技术浅析
基于MED—MOMEDA的风电齿轮箱复合故障特征提取研究
利用定义法破解关键点
基于曲率局部二值模式的深度图像手势特征提取
图像识别交互系统