基于HPSO-TPFENN的目标机轨迹预测

2019-07-03 06:46王新杨任农左家亮徐西蒙岳龙飞

西北工业大学学报 2019年3期

王新, 杨任农, 左家亮, 徐西蒙, 岳龙飞

(空军工程大学空管领航学院, 陕西西安 710051)

轨迹预测是根据目标以往的运动轨迹，学习和推断其运动规律，进而对未来的运动做出判断的过程[1]。在航空作战领域中，对机动目标进行航迹预测有着十分重要的意义。一方面对自身的未来轨迹做出正确判断，可以事先采取相应的措施，规避障碍，保证自身及友机的飞行安全，提升运行效率[2]；另一方面，在日益复杂的空战环境中，对敌机未来时刻的位置进行快速、准确地预测，能够使我机提前占领优势地位，提高获胜机率[3]。

近几年对运动目标的轨迹预测主要有两大类方法。一种是基于卡尔曼滤波算法、α/β滤波算法以及线性回归模型和质点运动模型的传统方法。例如文献[4]提出了利用基本飞行模型对航迹进行预测的方法；文献[5]结合目标加速度和轨迹偏转角的预测模型以及历史轨迹，对移动目标进行了轨迹预测；文献[6]基于卡尔曼滤波的动态轨迹预测算法，实现了对轨迹位置的连续预测；文献[7]针对民航飞机的轨迹预测问题，提出了基于改进的自适应粒子滤波算法。文献[8]针对单一模型估计和多模型估计的不足，提出交互式多模型算法，在一定程度上解决了单一模型预测精度差，多模型算法复杂度高的问题。上述方法针对运动过程相对简单的目标有较高的轨迹预测精度，但是航空器的运动是复杂多变的非线性时序过程，受到多种因素的综合影响。传统的预测模型不仅难以描述其全部信息，而且模型复杂度高，对目标运动多样性和不确定性的适应度较差，提高轨迹预测的精度相对较难[9]。

另一种是以各类神经网络为主的机器学习方法。例如文献[10]利用目标群航迹对BP神经网络进行训练，建立航迹预测模型，实现对飞行轨迹的提前预测。但BP神经网络对初始值的依赖程度较高且不具备全局搜索能力[11]。针对这类问题，文献[2]和文献[12]分别利用具有全局搜索能力的遗传算法和粒子群算法优化神经网络权值提高预测精度。此外，轨迹预测的本质是动态数据的时间序列预测，具有高度的非线性和时变性[13]。而传统的BP神经网络为前馈静态神经网络，只能实现静态非线性映射关系[9]，往往导致轨迹预测精度相对较低。为解决传统神经网络动态性能不足的问题，文献[14]针对飞行性能模型预测中的航迹预测，提出了基于NARX神经网络的预测方法；文献[15]利用进食粒子群算法，优化具有局部动态递归能力的Elman神经网络的权值，进而实现对飞行轨迹的预测。这类方法无需建立运动模型，预测耗时较短，具有较高的实时性，但是神经网络在训练过程中容易陷入局部最优，且训练数据较少，预测结果说服力不强。综上，寻找一种能对目标机轨迹进行快速准确预测的方法是急需解决的问题。

Elman神经网络是一种具有多层动态递归结构的循环神经网络，其结构特点和BPTT[16](backpropagation through time)网络训练算法使其对历史数据具有高度敏感性和动态记忆能力，更适合处理时间序列问题[17]。本文将时间收益因子引入到Elman网络的目标函数中，提出了一种改进的Elman神经模型——TPFENN(time profit elman neural network)。为了进一步提高模型的训练速度和预测精度，本文利用杂交粒子群算法对TPFENN网络的初始权值和阈值进行优化，构建了HPSO-TPFENN模型。创新预测方法，将三维坐标进行独立的预测，并利用空战训练测量仪(air combat maneuvering instrument,ACMI)中记录的实测空战轨迹数据构造包括目标航向角和俯仰角在内的数据样本，保证了数据的真实性与可靠性。通过训练HPSO-TPFENN，使模型对战斗机在一定空战态势下的运动规律进行学习，进而对目标机的空战轨迹进行预测。仿真结果表明该模型方法可以对目标机的轨迹进行准确、快速地预测，为解决轨迹预测问题提供了新途径。

1 杂交粒子群算法

粒子群算法(particle swarm optimization,PSO)是由Eberhart等基于鸟群觅食行为提出的群智能优化算法[18]。由于其算法简单且具有良好的全局搜索能力，在神经网络初始化领域得到了广泛应用。但已有研究表明，原始粒子群算法在搜索初期，种群会过早向当前最优粒子聚集，使算法陷入局部最优。基于以上特点，本文借鉴遗传算法[19](genetic algorithm,GA)中的杂交概念，在迭代过程中，根据杂交率随机抽取一定数目的粒子放入杂交池中，使其两两杂交，进而产生相同数量的子代粒子。通过上述方式可以增加粒子多样性，优化算法收敛性并避免其陷入局部最优[20]。

子代位置通过父代位置进行交叉得到

nx=i*mx(1)+(1-i)*mx(2)

(1)

式中,nx为子代粒子的位置;i为0到1之间的随机数,mx为父代粒子的位置。

子代速度根据父代速度间的向量关系,由(2)式求得

(2)

式中,mv为父代粒子速度,nv为子代粒子速度。其速度关系如图1所示。

基于杂交的混合粒子群流程如图2所示。

图2 HPSO算法流程

算法的具体流程描述如下:

Step1 初始化粒子群,包括粒子群体规模N、各个粒子的位置xi和速度vi。

Step2 计算评价每个粒子的适应度

Step3 对于每个粒子,用它的适应度值Fit(i)和个体极值pbest(i)比较,如果Fit(i)≻pbest(i),则用Fit(i)代替pbest(i)。

Step 4 对于每个粒子,用它的适应度值Fit(i)和全局极值gbest(i)比较,如果Fit(i)≻gbest(i),则用Fit(i)代替gbest(i)

Step 5 更新粒子位移和速度

(3)

式中,c1,c2为学习因子,也称加速常数;r1,r2为[0,1]范围内的均匀随机数,j=1,2,…,d。

Step 6 根据杂交概率选取指定数量的粒子放入杂交池中,池中的粒子随机两两杂交产生相同数目的子代粒子,子代位置和速度为

(4)

Step 7 当算法达到停止条件时,停止搜索并输出结果,否则返回到第(2)步,继续搜索。

2 HPSO-TPFENN预测模型

2.1 传统Elman网络

Elman神经网络是在Hopfield网络[21]基础之上发展而来的模型,具有内部反馈结构,能够更好地处理时间序列问题。该网络一般由输入层、隐含层、输出层及承接层组成,网络模型如图3所示。

图3 Elman神经网络模型

其中承接层又称上下文节点层,它的激活函数一般为恒等函数,用于存储记忆隐含层单元上一时刻的输出,可以当作一步延时算子。

假设在时刻t,网络输入为U(t),隐含层输出为X(t),网络输出为y(t),w1～w3分别为输入层与隐含层、承接层与隐含层、隐含层与输出层之间的连接权值,a和b分别代表隐含层与输出层的偏置。则Elman神经网络的计算过程可以表示为:

X(t)=f(w1U(t)+a),t=0

X(t)=f(w1(U(t))+w2X(t-1)+a),t>0

y(t)=g(w3X(t)+b)

(5)

Elman采用BPTT算法进行学习和训练,其目标函数为

(6)

式中，yd(t)为期望输出。

2.2 TPFENN网络及训练

当网络的输入为时间序列数据时,数据距离当前预测时刻越近,它对预测值的影响就越大。Refenes在打折最小二乘法(discounted least square function)中介绍了时间收益因素fTP(t)[22]。时间收益因素可以增强较近时刻样本数据对预测结果的作用,而减小较远时刻数据的影响。由于Elman神经网络的输入为具有时间序列的历史数据,本文考虑在神经网络的目标函数中引入时间收益因素fTP(t),提出基于时间收益因素的TPFENN模型。时间收益因素和改进后的目标函数由下式表示

(7)

(8)

式中，a为打折率,k为样本数量,t为迭代次数。

根据BPTT算法分别令ETP(t)对各权值的偏导为0,可得各类权值的修正量如下所示：

(9)

式中,η1,η2,η3为w1,w2,w3的学习步长,i=1,2,…,m;j=1,2,…n;q=1,2,…,r;l=1,2,…n。

2.3 HPSO-TPFENN预测模型

TPFENN神经网络的训练方式与传统神经网络一致,都是基于权值和阈值的修正过程,它们的训练结果对网络初始化的依赖度很强。如果网络初始化不当,就容易造成收敛速度慢、训练时间长,或陷入局部最优,无法满足精度要求[23]。

基于此,本文引入HPSO对TPFENN网络的初始权值、阈值进行优化,提高其训练速度和学习能力。HPSO-TPFENN算法流程如图4所示。

图4 HPSO-TPFENN算法流程

3 基于HPSO-TPFENN的轨迹预测建模

3.1 轨迹预测原理

在一段时间内,战斗机的运动状态具有一定的连续性,其运动轨迹不会发生跳变,这就说明其在某一时刻的位置与过去时刻的位置具有一定的相关性。在目标机轨迹上按照一定的时间间隔选取n个位置点,而tn+1时刻目标机的位置未知。根据轨迹连续性的性质,就可以利用前n个时刻的位置,对tn+1时刻的位置进行预测。

根据上述原因,本文将轨迹预测问题转化为时间序列的预测问题,利用HPSO-TPFENN网络挖掘轨迹数据的内部相关性,解决轨迹预测问题。

3.2 轨迹预测样本数据的构建

在惯性坐标系中,飞机位置用x,y,z三维坐标表示。传统的预测方法是将三维坐标视为整体作为神经网络的输入和输出,而本文考虑到x,y坐标的变化与航向角直接相关,而俯仰角影响z坐标的变化,因此对目标机轨迹预测时,对x,y,z坐标分别进行独立预测,其中对x,y坐标进行预测时,结合航向角的数据;对z坐标进行预测时,结合俯仰角的变化。在下文中,将传统预测方法称为整体法,将本文所提方法称为独立法。

本文利用从ACMI中截取的时间连续的1 500组飞行数据,数据记录的时间间隔为0.25 s,每个数据包包含该时刻目标机的x,y,z三维坐标及其航向角和俯仰角数据。该段数据记录的飞行轨迹如图5所示。

图5 目标机飞行轨迹

以对x坐标进行预测为例,假设利用前n个时刻的轨迹数据,预测tn+1时刻x坐标。其函数映射关系为

Xn+1=f(L1,L2,…,Ln)

(10)

式中，Li=(xi,αi)T,i∈[1,n+1]为目标机在ti时刻的x坐标和航向角,Xn+1为飞机在tn+1时刻的x坐标值。

选取L1-Ln为第一组输入数据,输出数据为xn+1;以L2-Ln+1为第二组输入数据,输出数据为xn+2。依次类推,形成如下式所示的训练样本输入数据和训练样本输出数据。测试数据的构建方法与训练样本数据一致。

(11)

(12)

样本数据构建完成之后,为防止各数据取值范围较大对预测误差带来的不利影响,对所有数据进行归一化处理。

3.3 轨迹预测模型

样本数据构建完成之后,确定TPFENN网络的结构,并利用杂交粒子群算法优化网络的初始值,进而利用样本数据训练神经网络,进行目标机三维轨迹的预测。模型流程如图6所示。

图6 轨迹预测模型流程图

4 仿真实验

4.1 实验设置

为对比3.2节中提到的整体预测方法与本文所提独立法的预测效果,同时为验证HPSO-TPFENN模型的优势,本文将针对上述2种预测方法分别采用BP、Elman、TPFENN和HPSO-TPFENN 4种神经网络模型进行轨迹预测。

以往利用神经网络算法进行轨迹预测的大部分研究,一般均输入过去5个时刻的位置信息,输出预测后的下一时刻坐标位置[2,24]。本文主要验证算法的可行性,故也将采用上述的神经网络输入输出方式。

采用将三维坐标分别进行独立预测方法时,以对x坐标进行预测为例,每组输入样本数据为10×1的列向量,每组输出样本数据为1×1的列向量。此时神经网络的输入节点数为10,输出节点数为1。

采用将三维坐标视为整体作为网络输入和输出的传统预测方法时,每组输入样本数据为15×1的列向量,每组输出样本数据为3×1的列向量。此时神经网络的输入节点数为15,输出节点数为3。

由3.2节可知,原始飞行数据为15 00组时序数据。输入样本数据和输出样本数据均为1 495组,其中训练样本为前900组,测试样本数据为后595组。图5中虚线为训练样本轨迹,实线为测试样本轨迹。

其中图7为测试样本的详细轨迹。

图7 测试样本轨迹

根据神经网络结构,利用本文提出的预测方法进行轨迹预测时,Elman神经网络及TPFENN网络的输入层至隐含层权值为10×25的矩阵,隐含层至输出层权值为1×25的矩阵,承接层至隐含层权值为25×25的矩阵,加上隐含层和输出层的阈值个数,则杂交粒子群中每个粒子维度为926。粒子群其余参数分别为:粒子个数10,学习因子1.2和1,惯性权重0.8,杂交概率0.7,杂交池的大小比例0.2,最大迭代次数20次。此外,时间收益函数打折率设为0.1。以此类推,采用整体法进行预测时,每个粒子维度为1 103,其余参数不变。

仿真实验运行环境为:Intel(R) Core(TM) i5-3470 3.2 GHz处理器,4 GB内存,Win7 32位操作系统,运行平台为MATLAB2014a。为了使实验更具说服力,仿真结果为20次运行的平均值。

4.2 轨迹预测精度分析

确定实验参数后,按照图6所示流程进行仿真实验。利用900组训练样本分别根据2种预测方法对HPSO-TPFENN、TPFENN、Elman和BP进行训练,而后对595组测试样本进行预测。实验结果如图8～10所示。图8为2种预测方法分别结合4种网络在x,y,z坐标上的预测结果;图9为预测结果的相对误差;图10为采用独立预测方法时,4种算法的三维预测结果。

图8 各坐标预测结果

图9 各坐标预测结果相对误差

图10 测试样本预测结果

由仿真结果可以看出,利用4种神经网络模型进行轨迹预测时,将三维坐标独立进行预测的相对误差比将它们视为整体进行预测的相对误差小,验证了本文所提独立预测方法的可行性;HPSO-TPFENN取得了最好的预测效果,预测相对误差普遍不超过1%;Elman网络取得了较好的预测效果,但其误差明显高于HPSO-TPFENN,说明利用杂交粒子群进行参数寻优并加入时间收益因子可以提高网络的预测精度;而BP网络的预测误差相对较大,说明传统的前馈神经网络不适合处理时间序列的预测问题。

4.3 轨迹预测实时性分析

为分析2种预测方法结合4种算法进行轨迹预测的实时性,本文比较了8种预测模型对900组样本数据的训练效率和对595组测试数据的预测时间,实验结果如图11和表1所示。图11为模型训练过程中的误差收敛曲线;表1为模型训练后,对测试样本的预测时间。

由图11可以看出,采用某一固定预测方法时,HPSO-TPFENN的迭代次数比TPFENN和Elman的迭代次数少;采用独立预测方法后,4种模型的迭代次数都明显下降。这说明独立的预测方法、时间收益因子的引入和HPSO的优化都有利于提高模型的训练效率。

图11 训练误差收敛曲线

表1 预测时间对比 s

由表1可以看出，采用某一固定预测方法时，BP、Elman、TPFENN和HPSO-TPFENN的预测时间逐渐减小；采用独立预测方法后，四种神经网络的预测时间都进一步减少。实验结果表明，将三维坐标结合航向角、俯仰角数据，运用HPSO-TPFENN进行595次独立预测耗时最少，大约需要42 ms左右，说明模型具有良好的预测效率。

5 结论

1) 与传统的BP、Elman以及TPFENN神经网络相比，本文提出的HPSO-TPFENN方法在进行轨迹预测时，可以获得更快的收敛速度，更小的预测时间和更高的预测精度。

2) 将三维坐标分别结合航向角或俯仰角数据进行独立预测的轨迹预测方法，与传统将三维坐标视为整体进行预测的方法相比，该方法取得了更快的收敛速度和更高的预测精度。

3) 利用ACMI记录的实际空战数据构建神经网络数据样本，解决了以往样本数据量较小，且不真实的问题。

4) 本文提出的预测方法和预测模型具有良好的准确性。在实际运用时，可以采用滑动训练、在线使用的方式，在一定的时间间隔内使用一个训练好的模型，之后再利用更新训练后的新模型进行实时预测。这样既可以节约训练成本又解决了完全离线训练的缺点。