多尺度卷积特征融合的SSD目标检测算法

2019-06-19 12:34陈幻杰王琦琦杨国威韩佳林尹成娟王以忠
计算机与生活 2019年6期
关键词:低层卷积尺寸

陈幻杰,王琦琦+,杨国威,韩佳林,尹成娟,陈 隽,王以忠

1.天津科技大学 电子信息与自动化学院,天津 300222

2.麦克马斯特大学 电子与计算机工程系,加拿大 汉密尔顿 L8E、L8W

1 引言

随着计算机视觉的快速发展,目标检测技术受到了越来越广泛的关注[1-4]。深度学习[5]作为人工智能的新兴领域,在目标检测上相比于传统方法[6-7]具有更高的鲁棒性和准确性。近年来,相继出现了多种基于深度学习[8-10]的目标检测方法,如R-CNN(region-based convolutional neural network)[11]模型、Fast R-CNN[12]模型、Faster R-CNN[13]模型、SSD(single shot multibox detector)[14]模型等。其中,SSD模型是检测精确度相对更高的网络,但是由于SSD模型用于检测的低层特征层只有一层,特征细节信息较少,导致其对小占比目标检测效果较差。

很多学者在提升SSD模型小占比目标检测能力方面进行了相应的研究。Wen等[15]提出一种改进SSD算法,即通过引入Atrous[16]滤波器、SeLU[17]激活函数以及新设计的数据增广规则以提高小占比目标检测效果。Xing等[18]以SSD算法为基础,根据不同尺寸目标分布规律以优化特征层缩放因子,其在行人检测目标尺寸较小以及遮挡问题上有了一定的改善,并获得了较低的漏检率。Tang等[19]在SSD模型的基础上提出了多视窗方法,即利用多个视窗多通路的SSD模型进行同时检测以提升准确率,但该方法区域划分方式不固定,目标被拆分检测,其对于目标检测的鲁棒性和准确性将产生一定的影响。Fu等[20]提出了DSSD(deconvolutional SSD)模型,其采用特征提取能力更强的网络Residual-101,并结合反卷积模块加入上下文信息提高小占比目标检测能力,其检测精确度(mean average precision,mAP)相比SSD模型提升1.4%。但由于该模型网络层数更深,其在TITAN X显卡上检测速度为每秒9帧图像,而SSD模型检测速度为每秒46帧图像,DSSD模型检测实时性较差。Jeong等[21]提出RSSD(rainbow SSD)模型,即通过改进特征融合的方式,结合池化和反卷积操作更加充分地利用模型特征,使得检测到更多的小占比目标,其在检测精度mAP上相比于SSD模型提升1.3%,相比于DSSD模型基本持平。Li等[22]提出FSSD(feature fusion SSD)模型,通过特征融合和下采样操作重构模型多尺度特征,丰富特征细节信息,以提高在小目标上的检测效果,其检测精确度mAP相比于RSSD模型提升了0.3%,相比DSSD模型提升0.2%,相比SSD模型提升1.6%。由于该模型为轻量级特征融合模块,其检测速度更接近SSD模型,其检测性能超过了许多先进的目标检测算法。本文方法检测速度为每秒23帧图像,相比于SSD模型虽有所下降,但是依然具有一定的实时性。

本文根据SSD模型不同特征层对不同大小目标在检测上的针对性,在主要用于检测小占比目标的低层特征层和中等占比目标的高层特征层上分别进行相应的改进,并对改进后的SSD网络进行了再训练。本文选取FSSD模型做对比实验,通过比较mAP值验证本文模型对中目标和小目标的检测效果。实验结果表明再训练后的改进型SSD网络,比再训练同样次数的原有SSD网络的检测能力更强,对中目标和小目标的检测效果更佳。

2 SSD模型

2.1 SSD模型结构

SSD模型是端到端的单次卷积神经网络,在结构上,SSD模型主要是在基础网络VGG(visual geometry group network)上添加新的网络结构,并采用多尺度卷积检测的方式来进行目标检测。具体SSD模型结构如图1所示。

2.2 SSD模型多尺度特征分析

SSD模型多尺度作用体现在利用不同层级、不同尺度的特征图来进行目标框定检测,其多尺度计算过程在数学上的定义公式为[23]:

Fig.1 Structure map of SSD图1 SSD模型

其中,Tn为第n层特征图,φn为由第n-1层特征图得到第n层特征图的非线性运算,φ1(I)为由输入图像I得到第一层特征图的运算,dn(⋅)为第n层特征图上相应尺度范围的检测结果,D(⋅)为将所有中间检测结果进行集合得到的最终结果R。

由式(1)、式(2)可看出,第n层特征信息由第n-1层特征信息决定,且每层特征图只负责其对应尺度的检测。因此,对于SSD模型需假设每层特征足够复杂才能更精确地检测目标。其特征图需具有足够的分辨率以表达细节特征,由足够深的网络提取得到更抽象特征,还需包含适当的上下文信息才能更准确地检测出目标。

而在SSD模型中特征提取逐层抽象,低层特征主要对应于细节信息,高层特征主要对应于抽象的语义信息[24]。如果目标在原图中占比越小,特征信息经过层层卷积、池化等操作,在高层特征层上保留的信息越少,对于占比越小的目标检测也越不敏感。因此SSD模型主要利用低层细节特征检测小占比目标,高层抽象特征检测中等占比目标和大目标。但是SSD模型中用于小目标检测的低层卷积层仅有一层为Conv4_3,特征表达能力不够,细节信息不足。而高层卷积层虽包含5层,但其对于中目标的特征提取依然不充分,这导致SSD模型对于中目标和小目标检测效果弱于大目标。具体的SSD模型中目标和小目标检测结果如图2所示。

Fig.2 Feature detection results of each layer of SSD图2 SSD模型各层特征检测结果比较

图2 中将SSD模型用于检测的低层特征层Conv4_3、高层特征层Fc7、Conv9_2进行可视化,并对各特征层相应目标检测结果进行比较。图2表明,其输入图像中检测目标为人的概率值在0.14至0.47之间。低层特征层检测概率值偏低,只有0.14,且存在误检的情况。高层特征层检测中等占比目标的概率相比低层虽有所提高,但也只在0.22至0.47之间,且存在无法检测出目标的情况。因此,SSD模型对于中目标和小目标的检测精确度有待提升。

3 改进的多尺度方法具体实现

针对SSD模型存在对于中目标、小目标检测能力不足的问题,本文采用改进的多尺度卷积检测的方式进行目标检测,利用SSD模型多尺度特性对低层和高层特征层分别采用不同的改进策略以提高对中、小目标的检测效果。

3.1 小占比目标特征区域放大提取

为提高SSD模型低层特征层对小目标的检测能力,提出了一种特征区域放大提取的方法。对低层特征层通过特征提取、反卷积操作获得高分辨率特征图,同时针对小占比目标特征区域,采用区域映射操作在高分辨特征图上实现有针对性的特征提取,以提高对小占比目标的检测效果。具体框架如图3所示。

图3中利用反卷积操作增大特征层Conv4_3分辨率,将现有SSD模型的输出作为建议提取区域按比例映射到特征图Conv4_3中,进而提取出可能存在目标的特征,之后将建议区域特征池化为固定尺寸以便进行相应卷积检测。对特征层Conv3_3进行特征层提取,同样将现有SSD模型的输出作为建议区域按比例映射到对应特征图上,之后再通过卷积检测器进行目标检测。

Fig.3 Framework of feature region enlargement and extraction图3 特征区域放大提取框架图

反卷积操作可获得更高分辨率的特征图,特征图分辨率越高获得细节信息也就越多,但是随着特征图的增大,相应的冗余信息也会增大,同时也会降低检测速度,进而影响整体检测效果。具体如图4所示。

Fig.4 Deconvolution feature maps图4 反卷积特征图

图4 (a)为输入图像,尺寸为300×300,图4(b)为SSD模型原特征层Conv4_3可视化特征图,尺寸为38×38,图4(c)、图4(d)、图4(e)为对特征层Conv4_3进行反卷积操作获得的不同尺寸反卷积特征图。

特征层的放大程度受SSD模型特征提取能力的影响,既要能够获得丰富的细节信息,也要保证检测速度。因此,本文在保证细节信息和检测速度之间进行衡量选择,首先对低层特征层Conv4_3进行反卷积操作将其分辨率增大至300×300,一方面可获得更加充分的细节信息,另一方面由于现有SSD模型输出建议区域的位置信息针对于尺寸为300×300的输入图像,在进行建议区域映射时为更加准确地获得目标区域特征,选择将Conv4_3特征层分辨率增大为300×300。

其次,额外引入更低一层特征层Conv3_3,进一步增加用于目标检测特征层中所包含的细节信息,其特征层分辨率为75×75,相对于特征层Conv4_3较大,细节信息较为丰富,具体如图5所示。

Fig.5 Low-level feature map图5 低层特征图

图5 (a)为输入图像,尺寸为300×300,图5(b)为SSD模型原Conv4_3可视化特征图,图5(c)为SSD模型原Conv3_3可视化特征图,由图5中可看出,特征层Conv3_3所包含的细节信息相对于特征层Conv4_3更丰富。

为保证模型检测实时性,且降低反卷积操作所增加的冗余信息对检测效果的影响,本文直接对Conv3_3进行特征层提取,再将现有SSD模型的输出作为建议区域映射到特征层Conv3_3获得目标区域特征层即可。

3.2 改进低层特征区域映射

低层特征层包含的细节信息相对较多,丰富其特征细节信息可以更准确地检测目标。本文采用反卷积[25-28]操作,通过参数调整将低层低分辨特征图映射为高分辨率特征图,利用更大分辨率的特征图以提高特征表达能力。反卷积操作过程与卷积操作相反,即反卷积的正向传播过程对应于卷积的反向传播,卷积的正向传播过程对应于反卷积的反向传播。具体传播过程如图6所示。

Fig.6 Sketch of convolution and deconvolution operations图6 卷积和反卷积操作示意图

图6 (a)为卷积正向传播过程,其为将3×3卷积核作用在4×4特征图中,经过卷积得到2×2特征图。图6(b)为反卷积正向传播过程,其与卷积操作相反,输入为2×2特征图,通过填充补零,并与3×3反卷积核作用得到4×4特征图。

反卷积操作特征图尺寸计算公式为:

其中,s代表步长,k代表卷积核尺寸,d为反卷积图尺寸,i为对应卷积图尺寸。本文在改进低层特征层Conv4_3时,设定步长s=8、k=4,对尺寸为38×38的特征层Conv4_3进行反卷积得到尺寸为300×300反卷积图。

在低层特征层上进行区域映射放大时,根据特征图与输入图像之间的尺寸比例关系,将建议区域映射到特征图目标对应位置处,其区域映射公式为:

其中,rw、rh代表建议区域在待映射特征图上宽度和高度,dw、dh代表输出建议区域宽度和高度,fw、fh代表待映射特征图宽度和高度,imgw、imgh代表输入图像宽度和高度。

图7即为反卷积操作区域映射可视化特征图。

图7(b)为尺寸38×38 的卷积层Conv4_3可视化特征图,图7(c)为反卷积得到的300×300高分辨率特征图,图7(d)为将建议区域映射到300×300反卷积特征图上后并池化得到的38×38区域特征图。由图7可看出,图7(d)与图7(b)的特征图尺寸相同,但是图7(d)的特征信息相比于图7(b)有所增大。

Fig.7 Feature maps of region mapping图7 区域映射特征图

3.3 中等占比目标检测方法改进

SSD模型中高层特征图包含的特征相对抽象,本文利用其抽象信息,额外提取SSD模型中的多个高层特征层,在现有SSD模型基础上增加网络深度,通过参数再训练以提高中等占比目标的检测效果。具体框架如图8所示。

Fig.8 Improved high level feature extraction framework图8 改进高层特征提取框架图

图8 中通过特征层提取的方法,分别提取出现有SSD模型中Fc7层、Conv8_2层、Conv9_2层、Conv10_2层、Conv11_2层对应的卷积特征图,并在现有SSD模型的特征参数基础上进行特征提取,通过多次迭代参数再训练以得到最优模型,其中现有SSD模型是已训练好的原SSD模型。

3.4 新型多特征层检测结果融合结构设计

针对前文中提出的策略,本文进行了新的网络结构设计。具体结构如图9所示。

图9中虚线框1对应于低层改进方法,采用区域放大提取的方法,结合反卷积操作以保证小占比目标的检测精确度。虚线框2对应于高层改进方法,利用特征层提取,通过加深网络层数改善中等占比目标检测效果。虚线框3是本文根据改进的低层和高层特征添加的位置和类别检测器,以融合多特征层检测结果。

Fig.9 Sketch of model in this paper图9 本文方法结构图

整体流程为:首先对于低层改进小占比目标检测,将图像(300×300)输入到现有SSD模型中,利用现有SSD模型的输出作为特征图的建议区域,将其映射到低层改进高分辨率特征层Conv*3_3、Deconv4_3上,实现区域特征放大提取。同时进行区域特征池化,以便采用位置和类别卷积检测器对其进行检测。其次,对于高层改进中等占比目标检测,挑选用于目标检测的高层特征层,在现有特征层上进行提取,并经过卷积检测器以实现高层特征层检测。最后使用卷积检测器将多层特征目标检测结果进行融合筛选并输出。

模型训练时直接提取现有SSD模型中相应的特征参数,从输入端开始对整体结构进行训练调参,多次训练迭代以得到最终模型。

3.5 位置和类别卷积检测

利用SSD模型多尺度卷积检测的方式,通过默认框映射机制在改进的不同分辨率特征层上生成多尺寸的默认框,并使用一组位置和类别卷积滤波器在特征图上进行卷积滑窗来检测默认框位置和类别信息。对于尺寸为m×n、通道数为t的卷积特征图,分别采用3×3×t的位置和类别卷积滤波器来进行检测,位置和类别卷积滤波器的个数Ln、Cn计算公式分别为:

其中,k为默认框个数,4为边界框坐标个数,c为检测类别数。由于在卷积特征图的每个位置处需要(c+4)×k个输出,相应的卷积检测时需要滤波器的总个数为Ln+Cn个,而对于尺寸为m×n的特征图共需要(c+4)×k×m×n个输出,而其输出值即为每个默认框的类别信息和位置偏移检测值。

3.6 默认框映射处理

在SSD模型低层和高层改进特征图上产生映射默认框时,对应的默认框映射机制也需进行相应调整,以重新建立原图目标与其对应特征之间的映射关系,之后再根据调整的默认框映射机制重新产生不同尺度默认框,并利用卷积检测器进行重新目标检测。

3.6.1 默认框映射机制调整原理

默认框映射用于建立起图像目标位置和其特征之间的对应关系,将用于检测的特征图中每个单元格位置映射到原图中相应的位置处,并在原图相应位置处产生不同尺寸的默认框以实现默认框映射。其原理如图10。

Fig.10 Sketch of default boxes mapping图10 默认框映射原理

图10 (a)是尺寸为300×300的输入图像,图10(b)是尺寸为5×5用于产生默认框的特征图,图10(a)中红色、蓝色和绿色的框代表不同尺度的默认框。假设选择位置为(1,0)处的特征图单元格进行默认框映射,根据输入图像尺寸和特征图尺寸之间的比例关系,得到映射间隔为300/5=60,相应地在输入图像的(60,0)处产生对应的默认框,根据这个原理即可依次将特征图的每个单元格映射到输入图像对应位置处,并在对应位置处生成不同的默认框,其默认框是在输入图像的整个区域上进行映射。本文方法中用于检测的高层特征图是通过提取现有SSD模型中对应特征图得到的,未做区域映射。根据图10默认框映射原理,改进高层特征层默认框映射也是针对输入图像的整个区域。

改进低层特征层利用区域放大提取的方法,将现有SSD模型的输出作为建议区域映射到低层特征层上,区域映射后得到目标区域特征图,并非输入图像对应的整张特征图,原SSD模型在进行默认框映射时,默认框针对输入图像整个区域进行映射,而对应于低层目标区域特征图,默认框需针对输入图像的目标区域进行映射。具体如图11所示。

Fig.11 Sketch of area mapping principle图11 区域映射原理示意图

通过比较图11(b)中本文模型低层Conv4_3对应区域特征图和图11(a)中SSD模型低层Conv4_3对应的原特征图,可看出区域映射后的特征图对应于输入图像中的目标区域而非整张输入图像。

根据本文方法的区域映射原理,默认框映射机制需要作出相应的调整,调整机制原理如图12所示。

Fig.12 Sketch of adjusted mapping mechanism图12 默认映射机制调整

图12 (a)为输入图像,图12(b)为产生默认框的区域映射特征图,尺寸为5×5,图12(a)中黑色框代表现有SSD模型输出的建议区域,其位置信息为左上角和右下角的坐标值,假设为(170,90,270,290),其X轴方向上的映射间隔为(270-170)/5=20,Y轴方向上的映射间隔为(290-90)/5=40,若选择(0,0)位置处特征单元格进行默认框映射,则对应在输入图像黑色建议框起始位置(170,90)处产生默认框,若选择(1,0)位置处特征单元格,根据X轴方向上的映射间隔,则在输入图像(190,90)处产生默认框,若选择(0,1)位置处特征单元格,根据Y轴方向上的映射间隔,则在输入图像(170,130)处产生默认框。根据此原理,可将区域特征图每个单元格按比例映射到输入图像建议区域对应位置处,并产生不同尺寸的默认框。

3.6.2 默认框映射公式

根据改进低层和高层的默认框映射原理,相应的默认框映射公式应进行调整,其用于检测的高层特征层默认框映射公式为:

其中,fw、fh分别代表用于产生默认框的特征图宽度和高度,imgw、imgh分别代表输入图像的宽度和高度,(cx,cy)为默认框在特征图上的中心坐标,(imgcx,imgcy)为默认框映射到输入图像的中心坐标,wk、hk分别代表默认框映射到输入图像上的宽度和高度,(xmin,ymin,xmax,ymax)为默认框映射到输入图像上的边界框坐标,分别对于左上角和右下角。

用于检测的低层特征层上结合了区域映射方法,其建议区域特征图的默认框应映射到输入图像中建议区域对应的位置处,其默认框映射公式为:

其中,fw、fh分别代表用于产生默认框的区域特征图宽度和高度,fcenterx、fcentery代表默认框在输入图像对应位置的中心点坐标,cx、cy代表默认框在区域特征图上的中心坐标,(dxmin,dymin,dxmax,dymax)为建议框左上角和右下角的坐标。

4 实验结果与分析

4.1 实验准备

实验的软硬件环境为深度学习框架Caffe[29]、ubuntu16.04系统,GPU显卡型号为NVIDIA TITAN Xp。模型算法训练和测试在PASCALVOC2007(http://host.robots.ox.ac.uk/pascal/VOC/)、PASCAL VOC2012以及 MS COCO(http://cocodataset.org/)公开数据集上进行比较,其中在VOC2007和VOC2012数据集上进行训练,针对MS COCO数据集上的中目标和小目标分别进行测试,其MS COCO官网将图像目标区域分割掩码中像素数量小于1 024为小占比目标,图像目标区域分割掩码中像素数量大于1 024且小于9 216为中等占比目标。本文目标检测的类别为自行车、公交车、汽车、猫、狗、摩托车、人7类。

模型训练与测试过程分为两步:第一步采用原SSD模型方法,针对目标检测中的7类,利用VOC数据集训练得到现有SSD模型。第二步采用本文方法,首先在VOC2007数据集中挑选出3 376张同样7类图像作为训练集,由于MS COCO数据集中的中目标和小目标相对较多,在MS COCO数据集中挑选600张图像作为测试集,其中不同尺度中等占比目标图像为355张、小占比目标图像245张。在第一步训练得到的现有SSD模型参数基础上,将训练集输入到本文改进的SSD模型中,采用随机梯度下降算法进行参数再训练调参,共迭代47 600次以得到最优模型,并对MS COCO数据集中目标和小目标测试集进行测试比较。

最后,使用训练本文模型相同的训练集和测试集对第一步得到的现有SSD模型进行训练测试,采用原SSD模型方法调参,在与训练本文模型相同的参数调节下得到最优的现有SSD再训练模型,并对中目标和小目标测试集进行测试比较。

4.2 改进多尺度特征层检测结果比较

本文方法中低层特征层主要用于检测小占比目标,高层特征层主要用于检测中等占比目标,为验证各层特征层的作用,将现有SSD再训练模型和本文模型中用于检测的低层和高层特征层分别单独抽取出来进行目标检测,并比较各检测效果。图13为不同算法模型中低层特征层对小占比目标的检测结果。

Fig.13 Detection results of low level feature layer图13 低层特征层检测结果

图13 (a)为现有SSD再训练模型中低层特征层对小占比目标的检测结果,图13(b)为本文模型中低层特征层对小占比目标的检测结果。由图13表明,本文方法检测出目标为人的概率是0.13,相比于SSD模型方法检测概率提升了10%。

图14为对现有SSD再训练模型中不同的高层特征层对于中等占比目标的检测结果。

Fig.14 Detection results of high level feature layers of SSD model图14 SSD模型高层特征层检测结果

从图14中可看出,卷积层Fc7层、Conv8_2层、Conv9_2层分别用于检测中等占比目标,但是目标检测结果并不理想,其存在人、自行车目标未被检测出的情况,检测效果仍存在提高的余地。

图15为本文模型中高层特征层对于中等占比目标的检测结果。

Fig.15 Results of high level feature layers detection of model in this paper图15 本文模型高层特征层检测结果

图15 中人、自行车已被检测出,且整体检测值相比图14更高。通过比较图14和图15中不同层目标检测结果,文本方法相比于原SSD模型方法检测出的目标更多且对应的概率值更高,其在整体上的检测效果提升明显。

4.3 改进方法测试结果比较

在相同的训练集和测试集条件下对本文模型和现有SSD再训练模型检测结果进行比较,其检测结果使用精确度mAP[30]评价指标来衡量模型检测效果。具体如表1所示,在置信度阈值为0.3的条件下,分别对比不同类别下两种模型对于中等占比目标的检测精确度。

Table1 Comparison of mAP of different categories of medium objects表1 中等占比目标不同类别mAP对比 %

从表1可以看出,本文模型针对中等占比目标的mAP值为75.1%,相较于现有SSD再训练模型有16.3%的提升。

表2列出了本文模型和现有SSD再训练模型在置信度阈值为0.1的条件下,不同类别的小占比目标测试结果对比。

Table2 Comparison of mAP of different categories of small objects表2 小占比目标不同类别mAP对比 %

对比表2结果,针对小占比目标,本文模型在不同类别下相比现有SSD再训练模型均有明显的提升,其mAP值为40.5%,相比SSD模型方法提高了23.1%。

图16为本文模型和现有SSD再训练模型对MS COCO测试集图像中不同类别在相同置信度阈值下的目标检测结果,其验证了本文方法相比于SSD模型方法目标检测精确度有较好的提升。

图16中绿色框代表现有SSD再训练模型相比于本文模型漏检的目标,黄色框代表现有SSD再训练模型误检的目标,紫色框代表本文模型相比于现有SSD再训练模型检测概率值高的目标。通过比较图16中不同算法模型检测结果,原SSD模型方法出现误检、漏检目标,而本文方法对于误检、漏检的情况有较好的改善,且检测出的中目标和小目标更多,检测概率值更高,整体的检测效果优于原SSD模型方法。

本文选取了基于SSD模型改进的FSSD模型做对比实验,FSSD模型在目前流行的改进型SSD模型中检测性相对更好,在相同的实验条件下,对FSSD模型进行复现,并对现有SSD再训练模型、FSSD模型、本文模型分别做训练与测试。表3对比了不同算法模型针对中等占比目标测试集的检测结果。

Fig.16 Comparison of detection results图16 检测结果对比

Table3 Comparison of medium object mAP between different models表3 中等占比目标不同检测算法mAP对比 %

比较表3的结果可看出,FSSD模型在中等占比目标上的检测精确度mAP值相比于现有SSD再训练模型有7.3%的提升,本文模型的检测精确度相比于FSSD模型提升了9.0%,相比现有SSD再训练模型提升16.3%。针对小占比目标测试集进行相应的测试比较,表4给出了不同模型在小占比目标上的检测结果。

Table4 Comparison of small object mAP between different models表4 小占比目标不同检测算法mAP对比 %

表4中本文模型检测效果最好,其mAP值为40.5%,相较于FSSD模型提升了16.4%,而FSSD模型相较于现有SSD再训练模型提升了6.7%。本文方法在中目标和小目标检测效果上相较于其他模型方法有较好的改善。

另外,针对类别人,本文在MS COCO数据集中挑选中目标和小目标共1 072个,并通过检测率衡量其目标检测效果[31]:

其中,P为检测率,C为对应类别样本被正确分类的个数,S为对应类别样本总数。检测率结果对比如表5所示。

表5中本文模型检测率相比于FSSD模型提升了9.0%,相比于现有SSD再训练模型提升了9.7%,FSSD模型检测率相比于现有SSD再训练模型只有0.7%的提升,由上述表5中对比结果可看出,本文方法对于中目标和小目标实现了更准确的定位和分类。

Table5 Comparison of detection rates between different models表5 不同算法检测率对比 %

在本文实验环境下,表6对比了基于SSD模型改进的不同算法在显卡TITAN Xp上的检测速度。

Table6 Comparison of detection speed between different models表6 不同算法检测速度对比 (frame/s)

表6中,SSD模型每秒检测53帧图像,FSSD模型每秒检测47帧图像,其与SSD模型相差不大,本文模型检测速度为每秒23帧图像,检测单张图像耗时均为SSD模型和FSSD模型的近2倍,检测速度相比于SSD模型、FSSD模型有所下降。

模型检测速度之所以下降,是由于本文方法在低层特征层上采用反卷积操作,其在提高特征图分辨率的同时亦使计算量有所增加,而在多个高层特征层进行特征提取时,加深了网络深度,但是也增加了模型运行时间,从而最终影响了模型检测速度。

但是本文模型在检测精确度上相比于SSD模型、FSSD模型有较为明显的提升,其在中等占比目标测试集上的检测精确度为75.1%,分别比SSD模型、FSSD模型提高了16.3%、9.0%,在小占比目标测试集上的检测精确度为40.5%,分别比SSD模型、FSSD模型提升了23.1%、16.4%。而FSSD模型在检测速度上虽与SSD模型基本持平,但其在中等占比目标测试集上的检测精确度比SSD模型提高了7.3%,在小占比目标测试集上的检测精确度比SSD模型提升了6.7%,本文模型的精确度提升效果优于FSSD模型。一般视频流为每秒25帧图像,因此,本文模型在提高目标检测精确度的同时,可以满足实时性的要求。

5 结束语

针对中目标和小目标检测任务,本文在SSD模型中的低层特征层上结合反卷积、特征层提取和区域映射方法以提高小占比目标检测精确度。在高层特征层进行特征层提取,利用更深的网络结构改善中等占比目标检测效果,并使用相对少量的训练样本在已学习到的参数基础上再训练。实验结果表明本文方法检测精确度优于原SSD模型方法。在未来的研究工作中,将继续研究改进网络模型,既可以尝试将文中方法与其他深度学习模型相结合,也可以调整相应模型参数,进一步提高中目标和小目标检测性能。

猜你喜欢
低层卷积尺寸
基于全卷积神经网络的猪背膘厚快速准确测定
CIIE Shows Positive Energy of Chinese Economy
一种基于卷积神经网络的地磁基准图构建方法
基于3D-Winograd的快速卷积算法设计及FPGA实现
一种并行不对称空洞卷积模块①
更换一只更大尺寸的低音炮和再买一只相同尺寸的低音炮 哪种方法比较合适?
关于低层房屋建筑工程造价的要点及控制措施探讨探索
住宅楼层影响寿命
低层高密度住宅设计探讨
佳石选赏