徐涛,刘章孟,熊坤来,郭福成
(国防科技大学电子科学学院,湖南 长沙 410073)
随着雷达技术的飞速发展和雷达新系统的不断投入使用,雷达信号的密度和复杂度大大提高,快速准确地识别雷达辐射源变得越来越困难[1]。
特征匹配法[2]是最直观的方法,利用常规特征参数或其变换参数构造特征矢量,将获得的数据与数据库已有的数据进行查询比较,通过一定方法,包括属性测度、距离函数、灰关联、模糊隶属度等进行匹配,对雷达属性进行判断。这种技术难以处理雷达参数相似或存在交叠的情况,无法满足复杂战场环境中日益增长的识别需求。
Ford等提出利用具备推理机制的专家系统来进行分类器设计,从而实现雷达的分类与识别,取得了大大优于匹配方法的结果[3]。神经网络方法也运用于雷达分类识别问题,如文献[2]使用了一个带有反向传播的多层感知机神经网络来解决雷达类型识别问题。文献[4]对数据预处理得到的由脉宽、载频和脉冲重复间隔产生的三维图像特征空间,利用卷积神经网络进行快速精确的识别。由于支持向量机(SVM)基于二次凸优化来求取最佳的模型参数,克服了神经网络的不足,在解决小样本、非线性识别问题中表现出了结构简单、全局最优、泛化能力强等许多特有的优势,国内学者张葛祥首次将SVM引入到雷达信号分类识别中[5]。但在雷达参数存在交叠等复杂场景下,这些算法单靠分类器无法提升识别性能,需要从特征提取方面提升性能。
目前已有的方法,如文献[6],主要利用雷达脉冲列的载频、脉宽和脉冲重复间隔(相邻脉冲的到达时间的差值)的统计特征进行雷达分类识别,再通过优化分类器来达到提高识别性能的目的。随着雷达的发展,重频模式越来越复杂,仅通过优化分类器,识别性能无法得到较大的提升。雷达的脉冲到达时间包含丰富的信息,体现了脉冲与其前后脉冲的联系。本文从雷达脉冲列中提取脉冲到达时间的二阶差分特征,用以增强不同雷达信号之间的可分性,并将该特征与传统的载频、脉宽等统计参数联合,作为特征向量。本文利用已知类别标签的雷达脉冲列作为训练样本,通过SVM学习,得到识别模型,对未知类别的雷达脉冲列进行识别。
雷达信号分类识别是由辐射源参数向辐射源情报的转换过程[1],关键要素是特征参数提取、雷达识别库和分类识别,基本过程如图1所示。
图1 雷达分类识别基本过程
雷达侦察系统接收的脉冲信号经过测量装置处理后,形成按时间顺序输出的脉冲数据序列,这些序列包含脉冲的载频(RF)、脉宽(PW)和到达时间(TOA)等特征。脉冲的到达时间无法直接作为特征使用,衍生出脉冲重复周期(PRI)这一特征,它表示脉冲与其前一个脉冲到达时间的差值,不区分脉冲与噪声。通过运用PRI描述脉冲间的关系,脉冲列可以转化为离散形式,以方便机器处理。
图2表示接收到的属于一部雷达的一串脉冲,脉冲到达时间表示为脉冲上升沿到达的时间。为方便描述,舍弃第一个脉冲,连续脉冲的顺序模式可表示为{PRIi,PWi,RFi},i=1,2,…,m,m表示脉冲数目。每个参数组合不仅包括有关脉冲本身的信息,还包含与它接近的前一脉冲的关系。
图2 雷达脉冲列示意图
传统方法提取参数的均值和方差等统计特征作为雷达脉冲列的描述特征。xi表示第i个脉冲的参数,m表示脉冲数目,均值和方差由下式确定:
随着雷达的重频模式越来越复杂,利用PRI无法对雷达进行有效区分。以下列情况为例,假设有两型雷达,雷达1的PRI模式为(100,300)(单位μs),雷达2的PRI模式为(100,100,300,300)(单位μs),其余信号参数相同,脉冲列示意图如图3所示。
图3 两型雷达的脉冲列示意图
在干扰脉冲条件下,这两型雷达在以PRI均值和方差为特征的特征空间中的分布如图4所示,可以看到,特征混叠在一起,无法有效区分。雷达1中相邻PRI的 和 有{PRI1+PRI2},而 雷 达2中 相 邻PRI的 和有{PRI1+PRI2,2PRI1,2PRI2},两者特征可区分,因此考虑将该特征用于识别。
图4 两型雷达的特征空间分布图
将一个脉冲前后相邻脉冲的到达时间差作为该脉冲的一个特征,本文称为二阶脉冲到达时差,提取雷达脉冲列的二阶脉冲到达时差作为雷达的描述特征。第i个脉冲的二阶脉冲到达时差可通过下式获得:
式中,TOAi表示接收到的第i个脉冲的到达时间。
将二阶脉冲到达时差作为雷达的新特征,舍弃第一个和最后一个脉冲,将连续脉冲的顺序模式表示为{PRIi,DTOA2i,PWi,RFi},i=1,2,…,m,m为 脉 冲数目。更高阶脉冲到达时差以同样方法提取,这里仅提取二阶脉冲到达时差。
图4已经表明利用PRI的统计特征无法区分两型重频模式相似的雷达。本节提取脉冲列的二阶脉冲到达时差,利用式(1)和(2)计算均值和方差,得到脉冲列的特征。第1节的两型雷达在特征空间的分布如图5所示,图中脉冲列的特征差异较为明显,表明这两型雷达得到了很好的区分,证明了二阶脉冲到达时差作为雷达新特征的有效性。
图5 两型雷达的特征空间分布图
本文提取雷达脉冲列的载频、脉宽、PRI和二阶脉冲到达时差,将其均值和方差共八种特征作为雷达的描述特征,输入分类器进行后续的分类和识别,分析识别性能。
SVM基于统计学习理论,利用有限的样本信息,在模型复杂度和学习能力之间找到最佳平衡点,具有很好的泛化能力[5]。SVM属于二分类器,是结构风险最小化准则的具体体现,它构造的最优超平面不但能将2类样本正确分开,而且能使2类样本的分类间隔达到最大。当样本点可分时,采用下列决策函数对样本点进行分类:
式中,x=[PRI,DTOA2,PW,RF]为输入的特征向量,ϕ(·)表示将x映射后的特征向量;w为法向量,决定超平面的方向;b为位移项,决定超平面与原点之间的距离。当样本点不可分时,采用的决策函数为:
式中,Κ(xi,xj)为核函数,xi和xj分别表示第i和第j个样本向量,αi和yi分别为第i个样本点的模式嵌入长度和类别标号。
本文利用SVM作为分类器对雷达特征进行处理。针对漏脉冲和干扰脉冲等条件下训练样本在特征空间线性不可分的情况,本文构造“软间隔支持向量机”,允许支持向量机在一些样本上出错,如图6所示。
图6 软间隔支持向量机示意图
针对实际雷达类别不止两类的特点,本文利用多个二分类SVM组合的模式解决多分类问题。已有一些实验证实,用多个SVM构成组合分类器是解决多分类问题的有效而实用的方法。对于k分类问题,通常有3种组合方法[7-10]:一对多(OAA)法、一对一(OAO)法和二叉树结构(BTA)法。本文采用OAA法,当有k个类时,需要构造k个SVM,每个SVM负责区分本类样本和非本类样本。第i(i=1,2,…,k)个SVM将第i类作为正样本,标号为+1,将其他类作为负 样 本,标 号 为-1。若 有N个 训 练 样 本(x1,y1),(x2,y2),…,(xN,yN),则 第i个SVM需 要 求解如下优化问题:
式中,C为惩罚参数,ξ为松弛变量,ϕ(·)为将x映射后的特征向量。
在训练阶段,求解k个式(6)的优化问题;在测试阶段,k个SVM对应的决策函数为:
最终的决策函数为max(f1(x),…,fk(x))。为避免最终的决策函数输出不止一类,本文考虑去掉决策函数中的符号函数,第i类的决策函数采用下式表示:
式中,L为第i类训练的SVM的支持向量数目。因此最终的决策函数为:
为了验证本文方法的识别性能,在载频、脉宽及脉冲到达时间的观测值中加入高斯分布偏差(STD)来模拟测量噪声,SVM使用高斯核函数。仿真的雷达样本特征如表1所示。对比实验使用载频、脉宽和脉冲重复间隔的统计特征[6]。考虑脉冲列的长度、漏脉冲率、干扰脉冲率以及每类训练样本数,共设置四组仿真实验。
表1 雷达样本特征表
本组实验各脉冲随机独立丢失,漏脉冲率为20%,干扰脉冲率为20%,每类雷达的训练样本数为500,每类测试样本数为100,脉冲列中脉冲数目分别为100、200、500、1 000、1 500、2 000。通过100次仿真统计得到平均识别正确率,如图7所示。
图7 脉冲列长度的影响
从图7可以看出,随着脉冲列长度的增加,2种方法的识别正确率都有较大提高,但本文方法高于传统方法。当脉冲长度为500时,本文方法的识别率达到
98%。
本组实验每个脉冲列长度为100,各脉冲随机独立丢失,漏脉冲率为10%,每类训练样本数为500,每类测试样本数为100,干扰脉冲率由0到100%递增,增长幅度为20%。通过100次仿真统计得到平均识别正确率,如图8所示。
图8 干扰脉冲率的影响
从图8可以看出,随着干扰脉冲率的增加,2种方法的识别正确率都缓慢下降,但本文方法仍高于传统方法。在干扰脉冲率为40%时,本文方法的识别正确率约为90%,而传统方法降至约80%。这主要是由于二阶脉冲到达时差特征更具区分性,对干扰脉冲的适应性更强。
本组实验每个脉冲列长度为100,各脉冲随机独立丢失,漏脉冲率为10%,干扰脉冲率为20%,每类测试样本数均为100,进行了6个场景的实验,每个场景中每类训练样本数目为100、200、400、600、800、1 000。通过100次仿真统计得到平均识别正确率,如图9所示。
图9 每类训练样本数目的影响
从图9可以看出,本文方法识别正确率远高于传统方法。在训练样本多于300后,本文方法的识别正确率基本稳定。这主要是由SVM特性决定的,即SVM不需要大量样本训练仍具有较好的识别性能。
本组实验每个脉冲列长度为100,干扰脉冲率为20%,每类训练样本数为500,每类测试样本数为100,各脉冲随机独立丢失,漏脉冲率由0到60%,增幅为10%。通过100次仿真统计得到平均识别正确率,如图10所示。
图10 漏脉冲率的影响
从图10可以看出,本文方法相较于对比方法有着较好的识别率。这是由于二阶差分特征隐含重频模式的时序特征,对脉冲列的描述更准确。
本文针对雷达信号分类识别问题,通过挖掘脉冲列的二阶脉冲到达时差特征,实现了复杂重频模式雷达的准确识别。仿真实验结果表明,该方法在不同漏脉冲率、干扰脉冲率条件下识别效果优于传统方法,同时具有所需训练样本数目较小的优点。■