采用双向LSTM模型的雷达HRRP目标识别

2019-04-22 07:53刘家麒王鹏辉刘宏伟
西安电子科技大学学报 2019年2期
关键词:短时记忆时序双向

徐 彬,陈 渤,刘家麒,王鹏辉,刘宏伟

(1.西安电子科技大学 雷达信号处理国家重点实验室,陕西 西安 710071; 2.西安电子科技大学 信息感知技术协同创新中心, 陕西 西安 710071)

雷达高分辨距离像(High Resolution Range Profile, HRRP)是雷达宽带信号获取的目标散射点子回波在雷达射线投影的向量和幅度波形,它包含了目标的尺寸、散射点分布、物体结构等重要信息,易于获取和处理,因此被广泛地应用于雷达自动目标识别(Radar Automatic Target Recognition, RATR)领域[1-7]。在目标识别中,如何提取有效的特征是核心问题。有效的特征不仅可以充分地表达数据,并且能够区分不同类别的差异性,从而提高识别的精度。

针对这一问题,很多学者对特征提取进行了广泛的研究。文献[1]从数据的包络信息中提取了平移稳健的双谱特征来减少噪声的影响。文献[2]进一步提取了高阶谱特征,并利用模板匹配方法对该特征进行识别。这些方法均得到了不错的性能。然而这些特征均为人工设计的特征,依赖于研究人员对于数据的认知和经验的积累,在缺乏先验知识的情况下难以保证性能。近年来,神经网络方法被应用于雷达目标识别中。文献[3]提出了一种多层稳健自动编码器(Stacked Corrective AutoEncoders, SCAE),该方法在多层编码器的基础上加入分类器联合地提取样本的特征,使得所提取的特征不仅可以保留数据的原始信息,而且具有可分性。为了解决小样本问题,文献[4]将样本根据雷达方位角进行分帧,然后采用深度置信网络(Deep Belief Network, DBN)提取帧间共享的特征,输出类别。这些模型通过构造目标函数,能够自动地提取样本的可分性特征,都取得了不错的效果。但是,前面的这些方法仅仅考虑了样本的包络信息,而没有考虑高分辨距离像样本距离单元之间的相关性。文献[5]将高分辨距离像样本转化为序列的形式,然后采用隐马尔科夫模型(Hidden Markov Model, HMM)对序列进行建模来提取样本内部的时序关系。为了同时考虑样本间的变化和样本内部的时序相关性,文献[6]根据相邻高分辨距离像样本服从同一分布的假设,采用隐马尔科夫结构对样本内部的结构进行建模的同时,加入了状态转移概率的时序变化来描述样本间的变化。

相比于隐马尔科夫模型,循环神经网络模型(Recurrent Neural Network, RNN)的非线性和分布式状态使得其表达能力更强。长短时记忆网络模型(Long-Short Term Memory, LSTM)作为循环神经网络模型中的一种,其通过构造3个门来控制信息的传递,从而解决了传统循环神经网络模型中存在的梯度消失问题,因此它被广泛地应用在序列识别领域,并取得了不错的效果[8-9]。

为了提取高分辨距离像的时序特征,笔者提出了一种双向长短时记忆(Bidirectional Long Short Term Memory, BLSTM)模型来进行高分辨距离像目标识别。该模型首先根据样本的目标区域提取高分辨距离像数据的平移稳健的序列特征;为了考虑高分辨距离像数据双向时序相关性,将特征转化为双向序列数据,采用双向的长短时记忆网络模型对序列数据进行处理;最后采用一种投票的策略将双向信息进行融合,输出样本类别。在实测数据上的实验结果表明,该方法不仅提高了识别性能,并且对于平移敏感性非常稳健。

1 采用BLSTM模型进行HRRP目标识别

传统的高分辨距离像识别方法,如自适应高斯分类器(Automatic Gaussian Classifier, AGC),最大相关系数法(Maximum Correlation Coefficient, MCC)等,在建模时假设高分辨距离像样本的各距离单元回波是相互独立的。事实上,根据散射点模型,高分辨距离像的各距离单元的散射点在目标转动时的转动形式完全相同,这必然造成高分辨距离像样本的距离单元的回波幅度具有一定的相关性。为了去噪,在得到高分辨距离像样本之前会对雷达回波加窗处理,使得距离分辨率下降,相邻的距离单元是肯定相关的;而且实测数据存在多次散射现象,某距离单元内的散射点子回波会散射到其他距离单元内,使得两个距离单元回波相关。因此,各距离单元之间存在一定的时序相关性[10]。为了充分考虑各距离单元间的前向相关性和后向相关性,笔者采用双向长短时记忆模型对数据进行建模。

图1展示了双向长短时记忆模型处理高分辨距离像样本的过程,主要包括3部分:将原始数据转化为稳健的序列数据,采用BLSTM模型提取样本特征以及通过投票策略融合双向信息输出样本类别。下面详细地介绍具体的识别过程。

对于输入样本x∈RD×1,首先根据高分辨距离像样本的能量选取出样本的目标区域xs1∶s2,其中s1代表目标区域的起始点,s2表示目标区域的终止点。由于高分辨距离像样本存在平移敏感性,即高分辨距离像样本的目标区域在实际数据处理中会存在一定的平移,传统的解决平移敏感性的方法会提取平移不变特征,将时域数据转化为其他域空间,改变了数据的结构,失去了时域高分辨距离像数据的时序特性[2]。笔者选取xs1∶D和x1∶s2作为特征来进行处理,保留了其时序相关特性。但是,不同的样本对应的目标区域不同,这就意味着xs1∶D和x1∶s2的维度也会随着样本的变化而发生变化。为了解决这一问题,模型采用滑窗的方式将样本转化为序列的形式,同时采用长短时记忆模型来处理这种序列特征。由于长短时记忆模型的所有时刻的参数均是共享的,可以对任意长度的序列进行处理,因此,长短时记忆模型可以对当前的不同维度的输入特征进行建模。

图1 双向长短时记忆模型进行高分辨距离像识别过程

(1)

(2)

图2 长短时记忆神经网络模块结构

将长短时记忆模型应用到高分辨距离像序列,则输入门、忘记门、输出门和记忆单元分别计算如下:

it=σ(W(i)xt+U(i)ht-1+b(i)) ,

(3)

ft=σ(W(f)xt+U(f)ht-1+b(f)) ,

(4)

ot=σ(W(o)xt+U(o)ht-1+b(o)) ,

(5)

ct=it·tanh(W(c)xt+U(c)ht-1+b(c))+ft·ct-1,

(6)

其中,σ(x)=1/(1+exp(-x)),tanh(x)=(exp(x)-exp(-x))/(exp(x)+exp(-x)),为非线性映射函数,其作用在每一个元素上。xt∈Rd×1,为第t个时刻的输入;W(·)∈Rm×d和U(·)∈Rm×m,为模型的权值矩阵;b(·)∈Rm×1,为模型的偏置。如式(3)~式(6)所示,该模型在提取t时刻的特征时不仅考虑当前的高分辨距离像输入xt,也考虑了前面时刻的信息ht-1,使得该模型可以充分利用高分辨距离像时序特性,提取更具有可分性的特征。

接下来,通过长短时记忆模型提取高分辨距离像隐层序列特征h1:

ht=ot·tanh(ct) 。

(7)

在得到隐层序列特征ht后,采用分类器输出样本的类别:

(8)

不同于传统的序列识别在每一个时刻输出一个类别,高分辨距离像目标识别是每一个样本序列对应于一个类别。因此,模型采用了一种投票的策略来融合双向的信息,输出样本x对应的类别:

(9)

(10)

(11)

2 实验结果与分析

实验所用的数据是雷达实测飞机数据。该雷达的中心频率约为5.5 GHz,信号带宽为400 MHz。安-26、奖状、雅克-42型飞机的航迹在地面的投影如图3所示,图中雷达位于坐标原点处。从图3中可以看出,飞行航迹被划分为不同数据段。为了验证模型的普适性,在选取训练数据和测试数据时有两个准则:(1)训练数据基本上可以覆盖测试数据的方位角信息;(2)训练数据和测试数据从不同的飞行数据段中选取。因此,笔者选取安-26的5及6段,奖状的6及7段,雅克-42的2及5段数据作为训练数据,其余段作为测试数据。其中训练样本个数为7 800,测试样本个数为5 124,样本维度为256。将样本转化为序列数据,每一个时刻输入数据的长度d=32,重叠长度b=16。

图3 飞行轨迹在地面的投影

为了验证笔者提出的算法(BLSTM模型)的有效性,将该模型同多个模型进行了比较:最大相关系数法[5],自适应高斯分类器[3],隐马尔科夫模型[6],全连接神经网络(Fully-connected Neural Network, FNN),深度置信网络(Deep Belief Network, DBN)[3]。除此之外,还展示了长短时记忆模型分别只考虑前向序列或后向序列时的性能。对于长短时记忆模型,所有的参数均通过标准差为0.1的高斯分布进行初始化。笔者采用随机梯度下降法(Stochastic Gradient Descent, SGD)对参数进行更新,学习率为0.1/(1+i),其中i为循环的次数。长短时记忆模型仅仅考虑前向序列和后向序列的方法,被称为LSTM-for和LSTM-back。

图4 识别性能随参数的变化曲线

为了分析模型中的参数对于识别性能的影响,图4展示了BLSTM,LSTM-for和LSTM-back的识别性能随隐层维度m和序列窗长d的变化情况。从图4(a)中可以看出,BLSTM和LSTM-for在隐层维度为30时性能最优。这是因为当隐层维度较低时,模型参数较少,难以较好地表达数据;而隐层维度过高容易出现过拟合。因此,固定隐层维度为30,然后分析不同的窗长对于长短时记忆模型性能的影响。从图4(b)中可以看出,识别性能随着窗长的增大而逐渐上升,在窗长达到32单元时性能开始逐渐下降。这是由于窗长过小会使得序列的长度变长,对模型的表达能力要求较高;而窗长过长则会降低相邻输入之间的相关性,使得识别性能下降。在接下来的实验中,固定隐层维度为30,窗长为32单元。

表1 双向长短时记忆模型同传统方法的识别结果对比

表1展示了笔者提出的高分辨距离像算法同对比方法的实验结果。从表1中可以看出,相比于传统的神经网络模型,LSTM-for模型通过考虑高分辨距离像的时序相关性,性能要比传统神经网络DBN模型和时序模型隐马尔科夫高大约2个百分点。而通过结合了前向和后向的信息,双向长短时记忆模型比LSTM-for和LSTM-back的识别率更高。这也说明了考虑双向时序相关性的有效性。

图5 原始数据和双向长短时记忆模型提取特征的主成分分析法二维投影

图5展示了原始数据和双向长短时记忆模型提取的特征的主成分分析(Principal Component Analysis, PCA)二维投影图。从图5中可以看出,原始数据的3类样本投影点重叠在一起,而双向长短时记忆模型提取的特征的投影点重叠部分明显较少。这说明了当前模型提取的特征比原始数据更具有可分性。

图6 测试样本平移的识别结果和目标区域

为了进一步验证笔者提出的算法对于平移敏感性的鲁棒性,本实验中对训练样本进行了平移对齐,对测试数据在对齐之后进行平移。图6展示了DBN,FNN,LSTM-for,LSTM-back和双向长短时记忆模型方法对于平移测试样本的识别性能,其中横坐标负值代表向左平移,正值对应于向右平移。从图6中可以看出,DBN和FNN模型在测试数据平移情况下下降得比较严重。通过提取平移相对稳健的序列特征,并且采用可以传递信息的长短时记忆模型来处理序列特征,BLSTM,LSTM-for和LSTM-back的识别性能在目标区域平移时基本保持不变。这说明笔者提出的算法对于平移敏感性是鲁棒的。

3 总 结

为了充分考虑高分辨距离像样本距离单元间的时序相关特性,笔者提出了采用双向长短时记忆模型(BLSTM)的高分辨距离像目标识别算法。该算法首先根据高分辨距离像样本中的目标区域提取平移稳健的序列特征,然后采用双向长短时记忆模型处理序列特征来考虑前向和后向的时序相关性,最后结合softmax分类器和投票策略融合双向信息,输出样本的类别。采用实测数据的实验结果验证了该算法不仅提高了高分辨距离像识别性能,而且对于平移敏感性是鲁棒的。值得注意的是,笔者提出算法处理的数据录取环境良好,因此,在复杂或者恶劣环境下的目标识别将会在后续进一步地研究。

猜你喜欢
短时记忆时序双向
双向度的成长与自我实现
基于非稳态调和分析和长短时记忆神经网络的河口潮位短期预报混合模型
基于长短时记忆神经网络的动力电池剩余容量预测方法
清明
降低寄递成本需双向发力
用“双向宫排除法”解四宫数独
基于不同建设时序的地铁互联互通方案分析
基于FPGA 的时序信号光纤传输系统
基于模体演化的时序链路预测方法
一种软开关的交错并联Buck/Boost双向DC/DC变换器