全连接残差网络武器站决策方法

2024-01-04 03:33健,李
兵器装备工程学报 2023年12期
关键词:高炮残差武器

张 健,李 强

(中北大学 机电工程学院, 太原 030051)

0 引言

随着高新技术的日益发展,当今战争已经进入了大数据时代,战场态势中隐藏着多种不确定信息和复杂因素,大规模电子侦察手段的应用提高了武器系统对战场态势的感知能力,但同时造成了战场态势大数据难以有效处理的问题[1-2]。面对复杂多变的战场态势,提高武器系统的快速反应能力以及复杂数据处理能力已经成为了未来无人装备发展的重要方向[3-4]。目前,国外无人平台上智能武器站已经初现雏形,国内虽然开展了相关研究工作,但至今没有成型产品列装部队。因此,开展面向复杂战场态势与多种不确定因素的武器系统作战决策技术研究,不仅对分析当前战场态势有益,还对今后提高武器系统自主作战能力以及智能化水平具有重要意义[5]。

目前,使用防空武器站作战大多依赖指挥员根据作战经验进行武器决策,其智能化水平不足,过度依赖人工经验,缺乏对数据的深度挖掘,面对大样本数据无法有效处理。而深度神经网络模型则具有非线性处理能力和自学能力,可以充分逼近任意复杂的非线性关系,为突破复杂战场形势,实现武器站智能化决策创造了宝贵的契机。深度神经网络中神经元的权值与偏置是从数据集中学习获得的,军事指挥员和专家的决策研究也能够应用于样本的标签中,并完全嵌入神经网络的学习中。

针对上述问题,提出了一种基于全连接残差网络的武器站自主决策方法。深入研究了弹炮结合武器站的特点及影响武器站决策的主要因素,分析了全连接网络、丢弃层、残差网络的结构,以全连接神经网络为基础,结合批量归一化算法加快了网络的收敛速度,加入丢弃层增强了模型的泛化能力,避免了过拟合的出现,运用残差网络结构提高了模型的自学能力,构建了基于全连接残差网络的武器站决策模型。最后,利用深度学习框架Tensorflow验证了该方法的可行性。

1 网络结构基础

1.1 全连接神经网络

全连接神经网络结构如图1所示,由输入层、隐藏层和输出层组成。上一层的输出即为下一层的输入。

(1)

式(1)中括号内部分表示了不同层之间的线性关系,激活函数f又为2层之间添加了非线性关系,在网络训练过程中,层与层之间的参数不断调整,进而实现从数据中学习样本的非线性分布[6]。

图1 全连接神经网络结构

1.2 批量标准化算法(BatchNormalization)

对于包含很多隐藏层的复杂网络,梯度下降会导致所有参数不断发生变化,所以每个隐藏层都会面临协变量移位(Covariate Shift)的问题:神经元参数的变化导致输出的不稳定[7]。为解决这一问题,模型训练中可以将数据批量标准化然后再训练,批量标准化算法就是对每一层的输入进行归一化操作,使其输入形成均值为0、方差为1的正态分布。但是,在加快模型收敛速度的同时,该算法也会衰减网络的表达能力,所以加入了式(3),给每个神经元加入2个参数γ(k)和β(k),在模型训练的同时,这2个参数也在不断调整,以此来提高网络的表达能力。批量标准化算法加快了模型的收敛速度,可以以较大的学习率开始模型训练,简化了调参过程[8-10]。

(2)

(3)

1.3 丢弃层(Dropout)

在神经网络训练中,如果参数过多,而训练样本又太少,模型很容易发生过拟合现象。过拟合具体表现在:模型在训练数据上损失函数较小,预测准确率较高;而在测试数据上损失函数较大,预测准确率较低。丢弃层原理如图2所示,在前向传播过程中,让某个神经元以一定的概率P(伯努利分布)停止工作,使模型的泛化性更强,不过分依赖某些局部特征,缓解过拟合的发生,可以达到正则化效果[11]。

图2 丢弃层原理

1.4 残差网络(Resnet)

深度学习实质上是通过多层神经网络的非线性层堆叠,无限接近需要拟合的映射关系F(x),但直接拟合很困难,当网络不断叠加的同时,超深层网络可能发生梯度消失甚至梯度爆炸的问题,网络难以继续优化,甚至发生退化。残差网络是一种跳跃结构,先学习残差H(x),再计算F(x)=H(x)+x,普通网络结构和残差网络结构如图3所示。残差网络避免了梯度消失和梯度爆炸的问题,可以提升模型的学习能力[12-15]。

图3 普通网络结构和残差网络结构

2 武器站决策模型

武器站决策模型的构建包括输入特征的选择以及网络模型的构建。假设一弹炮结合防空武器站装备有30 mm高射炮以及小型防空导弹,依次将其量化为0、1,其射程分别为5、15 km,最大作战高度分别为3、10 km。针对该武器站进行决策模型构建。

2.1 弹炮结合武器站作战特点

弹炮结合武器站是将分置的导弹和高炮2种火力有机地集成在一套平台上,实现目标探测、跟踪、指挥和控制系统的资源共享,是近程、低空、超低空防御的有效武器,具有防御空域广、毁伤概率高、独立作战、快速机动能力强等特点[16]。

1) 作战空域大,可实施多次拦截。一般来说,导弹的最大作战距离比高炮远。当目标距离较远时,首先使用导弹进行拦截;当目标距离临近进入高炮作战空域时,还可用高炮进行攻击。实施多次火力拦截,有助于提高全空域杀伤概率;对不具备全向攻击的红外寻的导弹来说,由于有高炮的配合,弥补了攻击空域的盲区,提高了武器的总体作战效能。

2) 高炮和导弹取长补短,提高作战效果。高炮射击准备时间短、反应快、弹丸初速大、射速高、能连续射击,临界杀伤概率高,其缺点是射程近、杀伤概率随射程增加而下降;而防空导弹射程远,单发命中概率高,杀伤概率随射程变化小。其缺点是临界死区大、系统较复杂、成本高、反应时间通常比高炮长。因此弹炮结合可以取长补短,充分发挥各自的优势。

3) 导弹与多型高炮弹药相互配合,能抗击多种目标。能够适应未来战争中空袭兵器多样化和作战任务多元化的需求。例如:在掩护机械化部队时,因防空导弹扩大了防空区域,能够有效抗击固定翼飞机和武装直升机;高炮配备的多束定向预制破片弹可有效抗击巡航导弹和无人机等小目标;多用途榴弹对武装直升机有很好的作战效能;在拦截战术无人机等低成本的空中小目标,使用高炮作战有更好的效费比。

4) 机动性能好,对阵地要求低。由于现代防空作战纵深大、范围广、突然性强,没有明显的前后方界限,被掩护目标多、战场节奏加快、流动性增大、任务变换频繁,因此,以机动求生存、求主动、求战机的“动态防空”将是今后陆军防空作战的必然选择,符合我军机械化、信息化复合发展方向,适应未来陆军由“区域防卫型”向“全域机动型”转变的发展要求。

5) 作战指挥与后勤保障相对容易。未来防空作战既需要导弹,也需要高炮。弹炮结合武器站内置程序自动选择使用导弹或高炮作战,其作战准备、指挥和操作简洁;与导弹部队和高炮部队混编相比,独立作战能力更强,后勤保障方便。

6) 导弹和高炮公用平台资源,作战使用效益高。一般来说,弹炮结合武器站的导弹和高炮的共用设备的成本约占总费用的80%以上。其对空探测设备既适用于防空导弹攻击距离较远、雷达反射截面(RCS)较大的空袭兵器平台,也适用于高炮拦截距离较近、RCS较小的空袭小目标,因此使用效益高。

2.2 武器站决策影响因素

武器决策是在明确打击目标后,作战人员根据长期战场经验,对应使用何种武器做出决策。武器的选用是指挥员长期的战场经验总结,其影响因素通常考虑为作战任务、目标特性、天气条件、打击费用等。考虑指挥员在决策时所关注的主要因素,对于弹炮结合防空武器站,其作战任务为低空防御,而使用高炮进行一次点射以及使用小型防空导弹进行一次攻击的打击费用是确定的,不作为变量输入。因此将目标特征与天气条件作为影响武器作战效能的主要因素,选取以下6个特征,由武器站的观瞄探测单元(雷达、电视图像、红外图像、激光测距等)及环境感知器件获得各影响因素的特征值[17-18]。

1) 目标距离。目标距离反应了目标的威胁程度,需要与不同武器的射程进行比较,基本可以确定是否使用该武器进行打击。当目标距离超越高炮射程时,此时武器站使用防空导弹进行攻击。

2) 目标高度。目标高度越高,攻击难度越大。目标高度需要与武器作战高度进行对比,当目标高度超越高炮作战高度时,此时武器站使用防空导弹进行攻击。

3) 目标速度。目标速度越快意味着到达我方的时间越短,同时会提升武器攻击难度。当目标速度较慢时,高炮可以对目标实现跟踪,此时使用高炮进行攻击。而当目标速度过快,进入火炮跟踪死界,则必须使用导弹进行攻击。将该指标按照较慢、慢、快、较快依次量化为2、4、6、8。

4) 目标类型。目标类型是目标的整体特征,体现了目标的价值、防护程度、机动性,可作为数武器决策的关键参数。当目标为固定翼飞机等大型目标时,防空导弹可以有效抗击;而高炮发射预制破片弹可有效抗击巡航导弹和无人机等小目标;不同目标配置不同武器,以最大化武器站作战效费比。将目标类型按照无人机、小型目标(导弹等)、中型目标(战斗机等)、大型目标(运输机等)依次量化为2、4、6、8。

5) 目标防护能力。目标的防护程度越高,武器攻击效果越差,应选择杀伤能力更强的武器实施打击。将按照无防护、轻型装甲防护、中型装甲防护、重型装甲防护将目标防护能力依次量化为2、4、6、8。

6) 天气条件。天气条件是作战环境中的一项动态变化因素,会直接或间接影响武器装备的性能。在夜间射击或白天能见度不高时高炮等直瞄武器的命中精度必然下降,而对于导弹,即使可以使用红外引导,其作用效果也会显著下降。因此天气条件也是影响武器决策的一项关键因素。将天气条件按照天气状况良好、天气状况恶劣依次量化为0、1。

针对上述影响因素,结合专家及指挥员经验得到训练数据和测试数据,最终选取了100组数据,其中70组数据作为训练样本,30组数据作为测试样本,部分样本数据如表1所示。

表1 部分样本数据

续表(表1)

2.3 全连接残差网络模型构建

本文中提出的全连接残差网络模型融合了批量归一化算法、丢弃层和残差网络模块。其核心思想为:将样本数据信息映射到多维空间中,通过优化器(Adam)训练网络确定参数,由所有参数共同拟合出数据的非线性分布规律。全连接网络作为基础结构,将样本数据空间映射到样本标签空间,在整个模型中发挥着分类器的作用,丢弃层(神经元以20%的概率随机失活)可以有效防止过拟合的发生,提高了模型的泛化能力,批量标准化算法提高了模型的收敛速度,而残差网络可以在全连接层趋于饱和时,进一步提升模型性能,避免了网络退化的问题。网络模型结构如表2所示,网络模型共有8个全连接层,4个残差模块,6个丢弃层,使用批量标准化优化算法处理所有全连接层的输出。

将影响武器站决策的6个关键因素作为模型的输入,经过模型处理,输出使用相应武器的概率预测。由于ReLu激活函数计算简便,在模型优化时更有效,可避免梯度消失和梯度爆炸等问题,因此,使用ReLU激活函数作为全连接层的激活函数(不含输出层)。输出层通过激活函数Softmax(指数函数),将模型的输出对应相应武器的使用概率,更直观的显示武器决策结果。将模型的输出和样本标签的交叉熵作为损失函数,如式(4)所示,训练过程中以最小化损失函数为目标运用反向传播算法计算梯度[19],通过反复调整各个神经元处参数,实现模型优化。武器站决策模型算法流程如图4所示,基于武器站决策数据,在模型训练和测试中,通过分析模型精度判断网络的性能,对与网络相关的超参数进行完善。

(4)

图4 武器站决策模型算法流程框图

3 模型验证与仿真

使用Anaconda3编译器,利用深度学习框架Tensorflow 2.10 GPU版进行模型验证与仿真,将数据随机分配为训练样本和测试样本,训练样本共有70组,测试样本共有30组。将一批次数据(Batch size)设置为10组进行模型训练,每次训练将相应的准确率和损失率记录下来,表3为部分测试结果。

表3 部分测试数据

模型训练完成后得出训练结果,图5、图6展示了训练样本为70组时,模型训练的准确率和损失的变化情况,图7、图8展示了以70组数据为训练样本时模型测试的准确率和损失变化情况。可见,当训练样本为70组时,模型可以达到很高的准确率,且损失相对较少,表明了模型所拟合出的非线性规律与数据样本之间的规律非常近似。

图5 训练过程准确率变化(70组样本)

图6 训练过程损失变化(70组样本)

图7 测试过程准确率变化(70组样本)

图8 测试过程损失变化(70组样本)

减少训练样本,分别使用30组、50组数据训练模型。训练准确率和损失变化情况如图9—图12所示,当模型训练样本为小数据集时,训练初期的准确率和损失率波动很大,说明了模型的收敛速度非常快。图13、图14表示了训练样本为30组、50组、70组3种训练条件下的模型在同一测试集上的准确率和损失变化情况的对比结果,经计算,3种不同训练条件下的模型测试平均准确率分别为89.51%、91.82%、92.28%。当模型训练样本只有30组时,模型的测试平均准确率仍高达89.51%。

图9 训练过程准确率变化(50组样本)

图10 训练过程损失变化(50组样本)

图11 训练过程准确率变化(30组样本)

图12 训练过程损失变化(30组样本)

图13 测试过程准确率变化对比

图14 测试过程损失变化对比

由表3的测试数据可得,目标1类型为无人机,其速度较慢,防护等级较低,距离与高度均在高炮作战范围内,在天气条件良好时,使用高炮作战效能最大;目标2类型为大型目标(运输机等),其速度较快,防护等级较高,且距离与高度均超出了高炮作战范围,在天气条件较差时,使用导弹进行攻击作战效能最大;目标3类型为小型目标(导弹等),其速度较快,防护等级较低,且距离与高度均在高炮作战范围内,在天气状况良好时,应当使用高炮武器使得作战效能最大化。而模型所给出的武器决策结果依次为高炮、导弹、高炮,符合真实作战逻辑。使用模型进行1 000次决策并计算其平均决策时间为0.022 8 s,对于300 m/s的目标来说,在一次决策时间内所飞行的距离为6.84 m,对于整个防空作战大背景来说,基本可以忽略不记。

仿真结果表明:本文中所提出的模型具备非常快的收敛速度,证明了其具有很强的自学能力,可以迅速从各类规模的数据中拟合出非线性规律,同时在测试集上的精度表明该模型避免了过拟合的发生。而随着训练样本的增加,模型在测试集上的精度逐步增高,说明模型面对大样本态势数据依然具备良好的处理能力。武器决策结果说明模型的决策符合真实作战逻辑,同时决策时间也满足实时性要求。

4 结论

本文中分析了全连接神经网络的结构以及批量标准化算法、丢弃层、残差网络3种优化算法的原理,总结了弹炮结合武器站作战特点以及影响武器站决策的主要因素,构建了全连接残差网络武器站决策模型,得出以下结论:

1) 本文中所提出的全连接残差网络模型具备快速收敛能力以及很强的自学能力;模型具备对数据的深入挖掘和处理能力,面对大样本数据依然可以有效处理;其决策结果符合真实作战逻辑并满足实时性要求。为武器站自主决策提供了新的方法。

2) 本文中的方法只适用于弹炮结合防空武器站决策,输入特征只考虑了目标特性、天气状况的变化对武器作战效能的影响,具有一定的局限性。真实作战环境更加复杂多变,需要进一步分析战场态势,增加输入特征,扩展数据库,增强模型对复杂战场环境的适用性。

3) 武器站自主决策是武器站迈向智能化的重要一步,其面临诸多困难,例如敌方来袭目标作战意图和行为的不确定性;环境感知技术的不足;目标检测、跟踪识别技术不完善性;抗干扰信息传输技术的不足等,自主决策不仅是技术层面的问题,更是军事思想,战略战术等更深层次的问题,而实现自主决策需要从基础开始研究,从静默期开始探索,这是一个艰巨的系统工程,需要作出不懈努力。

猜你喜欢
高炮残差武器
基于双向GRU与残差拟合的车辆跟驰建模
黑龙江省人工影响天气所用37mm高炮秋冬季保养技术
基于残差学习的自适应无人机目标跟踪算法
德国猎豹35毫米双管自行高炮
基于递归残差网络的图像超分辨率重建
一张图看懂武器发展史
SA2型76毫米车载高炮多视图
请放下你的武器
退役武器去哪儿了?
平稳自相关过程的残差累积和控制图