基于深度学习的军事目标识别算法综述

2022-09-29 10:26宋晓茹刘康高嵩陈超波
科学技术与工程 2022年22期
关键词:准确率卷积军事

宋晓茹, 刘康, 高嵩, 陈超波

(西安工业大学电子信息工程学院, 西安 710021)

当前科学技术不断发展,在新形势下,现代化战争逐渐转变为军事科技实力的较量,网络化联合作战通过多平台途径,包括传感器、视频等获得大量在不同时间空间下的各种类型不同分辨率的图像,从中获取军事目标类别信息、位置信息,帮助指战员在战时复杂情况下做出正确的战场决定。军事目标的智能化识别因为其利用人工智能对采集到的海量图像进行准确快速的分析,使人工资源与物质资源的消耗得到减少,而且随着国防水平的不断提高与科技能力的不断增强,即处理器运算速度的提升与识别算法的不断优化,对于目标的识别速度与准确率也远远高于人的肉眼。新形势下,迎合信息化联合作战与智能化武器装备,会在未来无人战争的发展中,对掌握战场态势、获取最终胜利起到至关重要的作用。如何能够在复杂环境中快速精准的识别军事目标是目前军事领域的研究热点与趋势,而基于深度学习的目标识别技术则是当今军事技术研究领域的前言课题之一。

从20世纪50年代开始,美国是最先开展军事目标识别技术研究的国家[1]。从国外的整个军事目标研究的发展来看,整个过程大致可以分为6个阶段:经典的统计模式识别方法[2]、基于知识的自动目标识别方法[3]、基于模型的自动目标识别方法[4]、基于多传感器信息融合的自动目标识别方法[5]、基于人工神经网络和专家系统混合应用的自动目标识别方法[6]、基于人工智能和深度学习的自动目标识别方法[7]。这其中,基于前5个军事目标识别方法的发展,其结果难以超越人的识别水平;而对于最后一个发展阶段,近年来,由于大规模集成电路、神经网络、多传感器集成技术、人工智能技术、深度学习、大数据技术等的飞速发展,国外军事目标识别已经从理论研究逐渐发展到实际应用。中国基于深度学习的军事目标识别研究主要处于理论探索和实验室仿真阶段,有待逐渐突破并走向实际应用。

基于深度学习的目标识别算法大体分为两类:一类是基于候选区域,包括R-CNN[8]、SPP-NET[9]、Fast R-CNN[10]、Faster R-CNN[11]、R-FCN[12]、Mask R-CNN[13]等,这些算法有一个共同的缺点,那就是这些算法的网络实时性较差,难以满足军事目标识别的实时性需求;另一类是基于回归,包括YOLO系列各种识别算法[14-17]、SSD[18]、FPN[19]、RetinaNet[20]等。基于回归的目标识别算法不仅在识别的实时性方面优于基于候选区域的识别算法,而且在识别准确度方面也优于基于候选区域的识别算法;不仅如此,基于回归的识别算法更加关注小目标物体的检测,所以,基于回归的目标识别算法在军事目标识别领域应用甚广。

基于此,现按照网络模型在军事目标中的应用顺序介绍近年来主流的几种军事目标识别算法,前3种是基于候选区域的军事目标识别算法,后3种是基于回归的军事目标识别算法,对每种模型进行介绍和分析其优劣,并做出总结和展望。

1 基于Mask R-CNN网络的军事目标识别

1.1 Mask R-CNN相关理论

Mask R-CNN是由He等[13]提出的双步检测框架,框架提出后被整合在了Detectron项目中。陈程[21]利用Mask R-CNN网络实现对军事目标的识别,其网络的主要结构由主干网络(Backbone),区域建议网络(RPN)与头结构(Head)三部分组成。其中Backbone由ResNet-101[22]构成,用于对图像进行特征提取;RPN用于生成矩形候选区域;头结构包含Fast R-CNN检测器和Mask分支,用于输出检测框、分类和二元掩码。具体结构如图1所示。

图1 Mask R-CNN网络结构图[13]Fig.1 Network structure diagram of Mask R-CNN[13]

1.2 Mask R-CNN的改进应用

黄航[23]通过提出新的目标生成框,使Mask R-CNN网络的检测鲁棒性得到提升;马啸等[24]通过在Mask R-CNN中加入判别模块、类别预测分支和语义分割分支提高识别准确率;孔英会等[25]通过引入特征金字塔与多尺度变换提升网络的检测准确率;李景文等[26]通过在网络中加入RoIAlign算法与卡尔曼滤波提升了Mask R-CNN在干扰背景下的鲁棒性。对自然图像的目标识别Mask R-CNN已经取得了不错的效果,但对于精度要求更高的军事目标识别,陈程[21]在Anchor尺度优化与目标区域阈值优化两部分进行改进。首先,在Anchor尺度优化部分,军事目标中可能会出现士兵、飞机出现在同一张图像中,而这两个目标的大小不一样,原始框架中的大尺度核就不适用于此种情况的目标识别,很难识别到较小的士兵目标,所以在RPN网络中增加了两个小的尺度核用来增强网络对于小目标的识别能力。其次,对于目标区域阈值优化部分,采用非极大值抑制(non-maximum suppression,NMS)[27]消除冗余项,在最后测试阶段也会使用NMS,用于获得更加准确的结果。通过设置置信度阈值,在军事目标识别时对输出检测框的置信度进行判断,若检测框的置信度高于设置的置信度阈值,则属于该类军事目标,反之则不属于。但是置信度阈值如果设置不合适,会增加目标的误检漏检率,在原始的Mask R-CNN网络中置信度阈值设置为0.7,而考虑到军事目标的图像常常存在伪装目标的情况,所以陈程在改进的Mask R-CNN网络中将置信度阈值修改为0.65,以减少漏检率。

由于在实际应用中军事目标的数据集相对较少,而使用训练的小样本数据集会使网络发生严重的过拟合现象,导致最终识别的准确率低,所以为了解决改进的Mask R-CNN网络在训练时发生这种现象,引入迁移学习[28]。迁移学习包括数据集大但数据集相似度低、数据集大且数据集相似度高、数据集小但数据集相似度高和数据集小且数据集相似度低这4种预训练方法,而由于在军事目标识别中没有公开数据集,所以数据集有限,因此选择第4种预训练方法,通过冻结部分预训练模型权重来弥补数据集小的问题。考虑到主干网络提取图像特征,如果直接预训练会使模型的特征提取能力受到影响,所以冻结除Head部分之外的所有层,保证主干网络的特征提取能力,再对整个网络模型进行微调使其适用于目标数据集。最后以COCO(common objects in context)数据集为数据源建立军事目标数据集进行测试,将识别结果与未引入迁移学习模型的结果进行对比,得出未引入迁移学习的模型误检漏检率高,而使用迁移学习的模型能够正确的检测出所有目标,并正确分割,准确率到达了92.3%,F1得与达到了81.1%。经过多目标的识别效果对比,虽然对于大部分目标具有较好的检测效果,但是当目标受遮挡时,检测效果不是能够令人满意,这可能是由于训练集中受遮挡目标较少,使网络学习到此特征的机会较少而导致的;最后,该模型虽然在检测精度上表现效果较好,但是并没有考虑到实时性的要求。

2 基于GAN与深度森林相结合的军事目标识别

在基于深度学习的军事目标识别的研究中,用于训练的数据集样本量少,这导致普通的目标识别算法在训练模型时难以达到令人满意的效果。直到Goodfellow等[29]提出生成对抗网络(GAN),通过在GAN网络中输入一组图像进而生成能够保留原图像主要内容,但具有新的形状和特征的新图像[30],这个功能解决了依赖于大量数据集训练的模型,使网络在小样本条件下也可以有效构建模型,再通过深度森林[31]对军事目标进行分类识别。

2.1 GAN与深度森林相关理论

GAN的提出对于数据集少,但网络模型要求效果好的研究人员来说具有十分重要的意义。GAN由生成器和判别器两部分构成,生成器拟合真样本的数据分布,生成与其类似的样本;判别器对生成器的结果进行分类,并将其作为生成器的输入不断迭代,当判别器无法判断时迭代终止,具体结构如图2所示。GAN在近年来根据不同的情况也有许多创新型的改变:①基于改变模型的CGAN[32],即条件约束的GAN;②DCGAN[33]改善了GAN训练不稳定的问题;③WGAN[34]彻底解决了GAN训练不稳定的问题;④LSGAN[35]与BEGAN[36]使传统GAN生成图片质量不高和训练不稳定这两个缺陷得以改善。

图2 GAN扩展样本数据结构图[29]Fig.2 Extended sample data structure diagram of GAN[29]

Zhou等[31]提出了深度森林(deep forest,DF)模型,打破了深度学习仅依赖于神经网络的局限,为深度学习提供了新的方向。深度森林模型是基于不可微构件的深度学习模型,其训练过程不需反向传播(back propagation,BP)[37],不依赖梯度计算,其基本组成单位便是传统机器学习方法之一的决策树[38]。深度森林模型stack分为两个部分,一部分由多粒度扫描显现输入数据的差异性,另一部分通过级联森林提高输入数据的分类能力。多粒度扫描即利用多个大小不同的滑窗在原始数据上进行滑窗取值,由多粒度扫描的stack森林接收上一步的结果作为输入,其标签对应原始数据的标签。级联森林部分是分类任务的核心,即使没有多粒度扫描也可以直接用级联森林进行分类。多粒度扫描得到的转换特征将用于级联森林的特征提取,输入为不同维度的转换特征,输出为类别概率;多级森林是由前一级的输出与多粒度扫描得到的转换特征循环构建,最终输出不同类别概率的均值。

2.2 GAN与深度森林的结合应用

陈龙等[39]提出了小样本条件下基于深度森林学习模型的典型军事目标识别方法,该方法即利用GAN与深度森林相结合,GAN对军事目标数据集进行样本扩展,采用主动学习中基于后验概率的启发式主动学习算法对样本进行优化,基于扩展优化后的样本采用深度森林方法,使模型具有鲁棒性,提升识别准确率。该方法在其自建数据集上进行测试,分别与KNN[40]、SVM[41]、CNN[42]、DF等相关算法进行对比,结果表明典型军事目标识别平均正确率高于70%,使数据库中的75%类别的平均识别准确率都高于对比算法。

林洋等[43]提出了一种基于CGAN和GcForest的军事目标识别方法,即基于改进GAN与深度森林的军事目标识别方法,通过CGAN对军事目标样本进行扩展和质量提升,再通过启发式学习进行抽样迭代进而构建样本数据集,最后利用GcForest进行监督学习构建出军事目标识别模型。最后在自建的军事目标数据集上进行测试,并与CNN、KNN、SVM等相关算法识别效果进行对比,得出提出的算法在小样本情况下整体高出29.21%~67.50%。这两种模型对比结果如表1所示。

表1 两种方法对比与总结Table 1 Comparison and summary of the two methods

3 基于DRFCN网络的军事目标识别

用于军事目标识别的密集连通区域快速分类网络(dense connected region fast classification network,DRFCN)算法由潘浩[44]提出,他通过对卷积神经网络特征结构的研究发现,目标识别算法的高准确率大多由大量卷积层的堆叠与算法模型的加深得到;引入共享卷积层特征到目标识别的算法中,以提高识别分类的准确率。DRFCN算法主要由两部分组成:基于稠密卷积神经网络的区域采样算法(DRPN)和基于稠密卷积神经网络的快速区域分类算法(DFCN)。

3.1 DRFCN相关原理

高质量的区域采样图片是将可见光图片或红外图片通过DRPN算法生成,每张区域采样图片中目标区域称为前景,反之则为背景。而算法通过批量随机梯度下降算法(mini-batch stochastic gradient descent,MSGD)[45]训练之后进行分类,提取高质量目标采样区域后,同样采用MSGD算法,最后对已分类的前景采样区域通过基于深度学习的坐标回归预测算法进行坐标修正。DRFCN算法结构框图如图3所示。

DRPN算法是基于卷积神经网络的区域采样算法RPN[11]提出的,得益于卷积神经网络的泛化能力与特征表达能力强、能够获取高质量的采样区域、采样时间少的特点,所以从RPN算法模型结构着手,在前人的工作基础上改进后提出DRPN算法。在训练DRPN网络时,采用NMS提炼锚框,采用联合代价函数,使稠密卷积网络的计算量和储存空间得以共享,最后考虑正负样本会存在不均匀的情况,所以采用MSGD算法对DRPN进行训练。

Dense Block为密集模块;conv为卷积操作;Classifier为分类器图3 DRFCN网络结构图[44]Fig.3 Network structure diagram of DRFCN[44]

3.2 DRFCN算法的改进应用

DFCN算法是在共享卷积层特征图的分类算法模型DenseNet[46]下做出的改进,DenseNet模型易于实现轻量化网络,解决了梯度弥散问题。而在其基础上,DFCN算法对于军事目标识别任务又做出了两点改进,一个是DFCN算法是在深层次的特征图上提取特征进行分类,DenseNet只是在三通道的原图上进行分类,另一个是在输出时同时得到军事目标的类别和位置信息,原有的DenseNet是输出类别信息。DFCN算法在特征转换时采用批归一化(batch normalization,BN)方法[47]加快算法模型训练速度,类比He等[22]提出的用残差算法模型解决梯度弥散膨胀的问题,采用稠密连接卷积层的方式即在模型中反向传递并加强了算法的特征表达能力,解决了梯度弥散膨胀的问题。训练时与DRPN一样,采用联合代价函数与MSGD的方法对算法模型进行训练。

DRFCN算法为了使DRPN算法与DFCN算法共享稠密卷积层,使DRPN与DFCN联合分布参数,采用MSGD进行训练,在前向传递中,DFCN利用DRPN输出的采样区域直接训练,在反向传递中,DRPN与DFCN梯度依次反转,直至收敛。

潘浩[44]使用DRFCN算法在VOC2007与V0C2012数据集上同时训练,最后结果与当时最前沿的VGG16[48]和DFCN算法进行对比,提出的算法在VOC2007与VOC2012上的准确率分别达到了75.3%和80.7%,明显高于VGG16,而在保证与RFCN算法准确率相持的情况下,模型的大小小于RFCN。最后仿照VOC数据集格式,收集并建立10 000张军事目标图片。在军事目标识别任务中,该算法在准确率和实时性均能够得以满足。

4 基于E-MobileNet网络的军事目标识别

E-MobileNet网络是在Sandler等[49]提出的MobileNet-V2深度学习检测框架的基础上做出改进而提出的网络模型;乔梦雨等[50]考虑到在实际战场环境中,作战人员无法随身携带具有高算力的设备使具有大参数量的目标识别网络实时工作,提出了面向陆战场目标识别的轻量级卷积神经网络。

Conv为卷积操作;AVG POOL 为平均池化;ELU为激活函数;Global Average Pool为全局平均池化;Softmas为分类器图4 E-MobileNet网络结构图[49]Fig.4 Network structure diagram of E-MobileNet[49]

4.1 E-MobileNet模型相关理论

E-MobileNet网络结构如图4所示,首先在卷积层前输入图像,再将图像特征放入改进的残差模块中进行学习,最后通过Softmax分类函数对图像进行分类。其结构在原始的MobileNet-V2上做出了以下改进:①在可分离卷积层部分添加AVG Pool层使残差块对元素进行相加;②在可分离卷积层部分采用扩张再压缩的方法使通道信息与位置信息解耦,减少计算量;③改变激活函数来规避梯度消失,不仅使网络的收敛速度得到提升,而且提高了识别的准确率;④在于运用全局池化方式,使特征映射传递至下一层网络。

4.2 E-MobileNet测试及应用

在测试部分,乔梦雨等[50]为了进一步体现所设计的网络是否能够在保证准确率的前提下满足实时性的要求,将网络模型与当下流行的MobileNet v2、ShuffleNet[51]、SSD、YOLOv3等目标检测算法进行对比,通过仿照PASCAL VOC数据集的格式自建军事目标数据集,其中包括坦克、炮塔、装甲车、人、枪5类目标。在验证实时性之前,为了验证网络改进的方法是否较原始网络有了提高,首先将改进的ELU激活函数与PReLU、ReLU两个激活函数应用到网络中进行比对,发现使用改进激活函数的网络模型在模型迭代损失函数值与准确率这两个方面均优于其他两者;其次将E-MobileNet和全局池化结合后的网络模型与E-MobileNet和全连接网络结合后的网络模型二者在准确率方面进行对比,发现后者在准确率方面更占优势。最后为了体现出改进算法在轻量级与移动检测端的实时性,将改进后的网络与上述4种网络模型进行对比得出,在网络的平均精度均值(mean average precision,mAP)方面,提出的算法排名第二,达到了84.6%,与最高的SSD仅差了0.003,但是每秒传输帧数(frames per second,FPS)值其改进算法最高,证明了在综合识别准确率与检测速度下,所提出的算法目标识别的效果最好。但是,没有考虑损失函数对目标识别准确率和实时性的影响。

5 基于SSD300网络的军事目标识别

单发多目标检测器(single shot multiBox detector,SSD)是Liu等[18]在ECCV2016的基础上提出的新型目标识别算法,是目前为止目标识别框架的主流算法之一。此算法在实时性方面比Faster RCNN算法更具优势,而在mAP值方面强于YOLO算法(不过在YOLO更新的后续算法中已经将其超越)。由于其既有速度优势,又能够满足精度要求,所以杨朝红等[52]提出了基于优化SSD300的小尺度典型军事目标识别方法。

5.1 SSD300网络相关理论

SSD300算法是因为SSD算法的输入图片尺寸大小是300×300,所以别称SSD300,其结构如图5所示,该网络虽然在精度和速度的效果上十分可观,但是其网络模型对于小尺度目标识别效果并不是十分理想,例如,将一个目标十分小的导弹识别为导弹和装甲车,出现两个结果,导致这一现象的原因有很多,如模型在训练过程中对于小目标特征的学习不够充分,即小目标数据集的数据量过少,又或者是SSD300的网络结构对于小目标特征的提取能力有限,造成拟合的效果不好。对于第一种原因,解决的方法就是增加小目标数据集,使网络能够充分学习小目标特征;而第二种原因解决则需要优化网络模型,提高网络对于小目标特征的提取能力。

5.2 SSD300网络的改进应用

胡习之等[53]通过将SSD300主干网络改为ResNet-50改善梯度消失的问题;马原东等[54]通过改进SSD300网络的Multibox层和引入ARConv抗旋转卷积在网络结构统一的基础上降低了误检率;对于军事领域的小目标识别而言,特征图中的default box数量与能否准确标定目标的概率息息相关,default box数量越多,尺度越小,准确识别目标的概率就越大。杨红朝等[52]将SSD300的Conv4_3层特征图default box种类数量增加到5个,同时将6个特征图上的default box尺度均作缩小处理,并且对于Conv4_3层的卷积核也做了更改处理以增加卷积核输出图像大小使其更加有利于小目标识别。

图5 SSD300网络结构图[18]Fig.5 Network structure diagram of SSD300[18]

实验部分为了验证优化后的网络模型具有更好的效果,采用原始SSD300与优化后的SSD300进行对比试验,两个网络模型的训练部分采用相同的自建军事目标数据集,平台为中国科学院计算技术研究所的SeeTaas,完成模型的训练与测试。结果表明,所优化的模型在识别速度上虽然有小幅度下降,但与原始网络模型的识别速度相差不大,而且在识别精度上要比原始的网络模型好,达到了72.96%,最后利用优化后的网络对前面提到的识别错误的小目标导弹进行重新测试识别,发现能够准确地进行识别,证明了优化算法的鲁棒性。所以,在对密集小目标的识别上,进一步优化SSD300网络模型对于军事目标的识别任务十分有帮助。

6 基于YOLO系列的军事目标识别

6.1 YOLO网络相关理论

YOLO(you only look once)系列算法的开山之作是YOLOv1,由Redmon等[14]提出,该算法一经提出就十分受欢迎,其最大的优势就是检测速度快,它将候选区与检测两个阶段合二为一,能够实现端到端的目标识别,只需看一眼就能够识别出图像中的物体及其位置,相比于Faster R-CNN能够更好地区分目标和背景。但是其缺点也十分明显,单个单元格功能单一导致预测的数量被限制,而输入图像的分辨率需与训练图像保持一致;基于上述缺点,Redmon等[15]提出对YOLOv1更新后的YOLOv2,在原来的基础上提出了新的网络Darknet-19,同时使用联合训练方法来提升网络模型的性能,使其检测出的物体种类大于9 000,故又称YOLO9000,但是其对于衣物或设备的识别效果并不是十分令人满意;所以,Redmon等[16]在此基础上又进行改进,提出了YOLOv3。YOLOv3也是one-stage中经典的算法,Joseph Redmon通过将残差块加入Darknet-19,使得网络结构得到进一步深化,并且使用特征金字塔网络(feature pyramid network, FPN)架构实现多尺度检测,并且提高了检测的速度和准确度。由于YOLO前三个版本的作者Joseph Redmon退出CV领域,所以YOLO系列的更新停止了两年,在2020年由AlexeyAB[17]继承YOLO前面系列的思想,提出了YOLOv4,并得到了原作者Joseph Redmon的认可,在AP和FPS方面分别提升了10%和12%,能够得到实时与高精度的检测结果,YOLO系列的网络模型在近几年军事目标识别中的应用也逐渐增多。

6.2 YOLO系列在军事目标识别中的应用与对比

曾国钊[55]将YOLO与Faster R-CNN相结合应用于军事目标识别中,考虑到Faster R-CNN精度虽然比YOLO高,却由于网络结构复杂使得实时性难以满足,而YOLO识别速度快,但是其精度有所损失,并且对多物体和小目标识别效果不够理想,所以将二者结合,并且在使用回归思想的基础上增加先验框,既能够保证精度要求,又能够满足实时性。最后在自建的军事目标数据集上进行测试,为了增强模型识别能力,提高多物体目标的识别准确率,在构建数据集时尽量增加多的多目标图像数量,为了使其适应不同环境需求,图像的分辨率与清晰度也不同,在参数量方面比YOLO少了10倍以上,降低了对设备的要求,使其能够更好地应用于实际环境。通过测试证明了检测效果良好,准确率在90%以上,而且检测速率能够达到275FPS,最终将该网络应用于嵌入式设备,实现移动军事目标的识别。

李鑫等[56]提出了基于非监督网络的军事目标识别算法,利用YOLOv3与DCGAN相结合,有效解决了由于数据集不足而导致的识别精度低的问题。由于YOLO算法在手工标注好的大规模数据集上进行训练才会取得好的识别效果,而军事目标并没有统一的大规模数据集,需要自己进行手动收集和标注,所以这也致使网络的鲁棒性较差,而利用生成对抗网络可以将随机信号与真实图像进行博弈生成特征类似的图像,从而扩充数据集并进行自动标注达到非监督学习的目的。在实验测试部分,通过自建军事目标数据集训练,并将训练好的模型与其他相关主流算法,如Faster R-CNN、Faster R-CNN相关改进算法、YOLOv2、YOLOv3、SSD513、DSSD513、RetinaNet进行对比,得出YOLOv3+DCGAN在AP、AP75、Aps、APM、APL、FPS等指标方面均优于其他网络,表明该网络能够有效解决数据集不足而导致的精度不足问题。

符惠桐等[57]提出了面向移动目标识别的轻量化网络模型,即基于Ghost模块[58]的YOLO目标识别模型。主要是针对现有设备算力有限,而无法在保证识别速度的同时满足精度要求的问题而提出,通过Ghost模块重构目标识别网络,通过减少模型参数而提升识别速度,然后加入空间金字塔模型提升识别精度,最后通过通道剪枝剔除冗余参数压缩模型体积从而使其成为轻量化模型,满足现有设备的目标识别需求。在其自建军事目标数据集上进行训练,在GTX1060与嵌入式计算平台TX2上进行测试,通过与YOLOv4及YOLOv4相关改进算法进行对比试验,表明了相较于传统的YOLOv4模型,改进后的模型将原模型体积压缩96%,浮点计算量减少91.2%,预测速度提升2.9倍,识别精度达到87.63%,精度仅损失2.43%,即满足了更小的模型、高的精度、更快的预测速度。

刘茹茹等[59]提出了复杂场景下军事目标的轻量级检测方法,即轻量化Light-YOLOv3网络的军事目标识别。在深层特征网络的构建中,骨干网络采用轻量级网络单元,以提升网络的特征提取能力并降低其计算量;预测网络部分将MSCA(multi-scale context aggregation)模块[60]加入预测网络中,完成浅层到深层特征复用和融合,对远距离目标识别问题提供了有效的帮助,并改善了复杂环境中军事目标被遮挡的情况。通过自建数据集对Light-YOLOv3网络进行验证,并与主流的Faster R-CNN、R-FCN、Mask R-CNN、SSD、YOLO系列相关算法进行对比,得出该方法明显优于其他方法,在与代表性目标识别算法YOLOv4的对比中,体积是YOLOv4的1/5,FPS是YOLOv4的3.8倍,而且识别准确率也为最高的97.8%。将模型在非数据集的军事视频中进行测试,能够精准地对军事目标进行识别,证明了该模型具有很好的鲁棒性,能够适应多种实际场景下的军事目标识别。

7 主流算法对比分析

首先回顾深度学习在军事目标识别领域的发展,介绍了深度学习的目标识别相关算法,并对适用条件进行分析,如表2所示;而后重点介绍了目前主流的目标识别算法在军事目标识别中的应用。通过介绍其原始网络结构,相关原理,以及针对军事目标识别而做出的改进及应用,整个军事目标识别算法的对比如表3所示。

(1)Mask R-CNN网络通过对Anchor尺度的优化以及引入迁移学习来解决原网络的漏检率和优于军事目标数据集少而导致的精度低问题。

(2)GAN与深度森林结合、CGAN与深度深林结合这两种模型首先利用GAN及其改进之后CGAN的特性对小样本数据集进行扩充,而后通过深度森林的对军事目标进行分类识别。

(3)DRFCN算法是DRPN算法与DFCN算法的结合,前者用来生成高质量的采样图片,后者在深层次的特征图上提取特征进行分类识别,二者共享稠密卷积层联合训练,最后应用在军事目标识别上。

表2 目标识别算法对比分析Table 2 Comparative analysis of target recognition algorithms

表3 军事目标识别算法对比Table 3 Comparison of military target recognition algorithms

(4)E-MobileNet网络通过改进原始Mobile-Net-V2网络的可分离卷积层与激活函数,在减少计算量、加快收敛速度的同时提高了模型的识别准确率。

(5)SSD300网络通过增加default box种类数量来提高密集小目标的识别能力,从而使网络更加适用于小目标军事目标识别。

(6)YOLO与Faster R-CNN网络的结合,在保证识别效率的同时保证了识别的准确率,并将其应用于嵌入式设备实现了移动军事目标的识别。

(7)YOLOv3与DCGAN的结合有效地解决了由于数据集不足导致的识别准确率低的问题。

(8)基于Ghost模块的YOLO算法以YOLOv4为基础,通过减少模型参数、压缩模型体积提升识别速度,实现轻量化高准确率,使其能够更加容易部署在移动平台实现移动军事目标的识别。

(9)轻量化Light-YOLOv3网络通过在预测网络中使用MSCA模块解决实际战场环境中军事目标遮挡的问题并实现远距离目标识别。

8 展望

军事目标具有数据集少,远距离军事目标小,实际战场环境中易受遮挡等特点,对于深度学习的目标识别算法要求就比较高,要求其网络能够克服数据集少,在此基础上能够实现高准确率的识别;而且由于其特殊性,在未来战场中需要部署在相关设备中进行实时的军事目标识别,所以需要能够解决算力问题的更多高实时性高准确率的轻量化模型,实现对敌方目标的快速精准识别,为实现精准打击打下基础。

猜你喜欢
准确率卷积军事
基于全卷积神经网络的猪背膘厚快速准确测定
一种基于卷积神经网络的地磁基准图构建方法
基于3D-Winograd的快速卷积算法设计及FPGA实现
一种并行不对称空洞卷积模块①
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
多层螺旋CT技术诊断急性阑尾炎的效果及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
军事幽默:局
军事