基于EMD和SVD特征提取的通信辐射源个体识别方法

2021-09-23 12:48刘家豪齐子森李红光
空军工程大学学报 2021年4期
关键词:暂态辐射源分类器

刘家豪, 郭 英, 孟 涛, 齐子森, 李红光

(空军工程大学信息与导航学院, 西安, 710077)

基于传统信号参数估计手段获取信号常规波形参数实现通信辐射源识别的方法,难以对于相同波形参数类型的多个辐射源完成可靠的个体识别。例如同步组网的跳频网台[1]中,网内每个跳频辐射源发出的信号都具有相同的频率集、跳频速率、码元速率、调制样式等参数特征,仅仅依靠常规的参数化稳态特征分析无法实现网内辐射源的个体识别,特别是在复杂的电磁环境中,提取常规稳态参数的准确性都难以保证。对于通信对抗支援而言,通信辐射源个体识别的可靠性和可信度下降,将直接导致不能提供有效的干扰引导,显然无法满足战场的电磁对抗需求。

对于辐射源个体来说,由于元器件制造工艺带来的个体误差不可避免,整机装配更存在着细微差别,因此尽管是来自于同一生产线上的同一型号电台,仍然存在着不影响信息传递的可检测、可重现的细微特征差异,我们将这些因为电台辐射源器件之间细微差别而造成的电台辐射源信号的细微特征称之为辐射源的指纹特征[2-4]。针对辐射源的指纹特征研究表明,具有代表性的指纹特征反映在辐射源波形的暂态特征上,暂态特征[5]相比于稳态特征,包含着更加丰富的个体特征,因此近年国内外学者针对辐射源的暂态特征进行了广泛的研究。信号暂态特征提取是实现通信辐射源识别的重要一步,常用的信号暂态特征研究主要集中在幅度、频率和相位3个层面,特征处理的数学方法针对性明显,但也存在相应的弊端,其中针对幅度方面,分型特征是进行非平稳信号分析的有力工具,但是基于幅度提取的信号暂态特征,区分度较小,尤其是在低信噪比条件下,识别效果不佳;针对频率方面,传统方法是对非平稳信号进行时频分析,包括不仅限于快速傅里叶变换(fast Fourier transform,FFT)、短时傅里叶变换(short-time Fourier transform,STFT)[6]、小波变换(wavelet transform,WT)和希尔伯特-黄变换(Hilbert-Huang transform,HHT)[7-8]等等,其中小波变换应用较为广泛,但是在低信噪比情况下,该方法表现较差,存在小波基的选择问题;针对相位特征方面,常用的方法是把信号暂态部分变换为复信号,之后再提取其相位特征,但是仅仅利用其相位特征来进行个体识别的效果并不理想,需要与信号暂态部分的其他特征相结合进行联合特征分析;此外,文献[9]中提出了一中基于时频分析方法的辐射源调制识别方法,通过时频分布将信号转换到时间-频率二维图像,通过计算复杂度和特征维数实现特征提取,但这类方法存在最佳核函数的确定以及交叉项干扰等问题,比较复杂。近年来,经验模态分解(EMD)[10-12]发展比较迅速,通过EMD分解实现将原信号分解为各个信号分量,有效规避了核函数的选择问题,另外,信号的双谱特性还能有效的抑制高斯噪声,在处理非平稳信号中具有独特优势,可以动态描述信号的时频分布,放大不同辐射源的暂态特征差异,提供了信号暂态部分细微特征分析的新思路,文献[13]中提出了基于EMD的Hilbert谱对称性参数估计算法,取得了较好的分类效果,但在抗噪声干扰的效果上还有所不足。

综合几类典型暂态个体特征定义及提取特点,本文采用EMD分解和HHT变换提取信号暂态特征,再运用奇异值分解选取重要程度高的部分特征[14]作为输入数据,并结合机器学习等分类器设计理论,训练支持向量机(SVM)分类器,实现辐射源的个体识别。为了验证本文提出的个体识别方法的有效性,以识别准确率作为评判标准,选取了4类辐射源信号进行特征分析实验,验证了本设计获得了更好的识别效果。

1 特征提取

1.1 信号预处理

本文使用的实验数据是采集到有噪声的4个通信辐射源信号,信号采样率为1.01 MHz,最终获得到的每个信号的长度为10 240帧。首先我们将每类信号依照一段数据为512帧划分,获得20个数据,从而得到4类信号共80个数据。

经验模态分解可以将任何一个复杂的序列分解为若干个本征模函数(intrinsic mode function,IMF)[15]分量之和。采用EMD作为非平稳信号的处理手段,可以依据数据本身特征来进行信号分解,生成有限个IMF,各IMF分量代表了原信号不同的频率分量。通过EMD分解后,得到的IMF分量需满足以下2个条件:①经过分解得到的时间序列,极值点数量与过零点的数量差值不超过1;②在分析时间序列内,经过插值方式拟合的极值包络线的均值为0。

输入一个长度为512帧的通信辐射源信号是s(t),进行EMD处理的基本流程如下:

步骤1找到原始信号s(t)所有的局部极大值点和局部极小值点;

步骤2用3次样条曲线拟合出上下极值点的包络emax(t)和emin(t);

步骤3求上下包络的平均值;

(1)

步骤4原始信号与上下包络均值相减计算差值;

d(t)=s(t)-m(t)

(2)

步骤5判断得到的差值d(t)是否满足IMF的2个条件,若不满足,则用d(t)重复前面4个步骤,直到dk(t)满足条件为止,此时得到的dk(t)就是第一阶IMF分量:imf1(t);

(3)

步骤6每得到一个IMF分量,就从原始信号s(t)中减去,得到剩余分量r1(t),再对剩余分量r1(t)重复前5个步骤,直到最后得到的剩余分量ri(t)就只是单调序列或者常值序列,此时便得到了信号的各阶模态分量。

(4)

经过EMD分解后,信号s(t)最终分解为7个IMF分量和1个残余分量,如图1所示。

图1 EMD分解示意图

本实验共80个数据,需要对每个数据都进行EMD分解,得到每个数据的各阶IMF分量和一个残余分量。残余分量是单调序列或者常值序列,对信号特征提取没有实质影响,因此,舍去残余分量,用7个IMF分量:imfi(t),(i=1,2,…,7)进行特征提取。

1.2 HHT变换提取暂态特征

对非平稳信号而言,比较常用的时频分析方法主要包括FFT、STFT、WT和HHT等。其中FFT对非平稳信号处理效果差,STFT存在窗函数选择窗长问题直接影响时域和频域的分析不够准确,WT不存在加窗函数的问题却存在小波基的选择问题,本文选取HHT变换作为信号暂态部分的时频分析手段,从而实现辐射源的指纹特征提取,该方法是以前文所提到的经验模态分解方法为基础的一种非线性分析的新方法,可以自适应地利用信号的局部信息,从而获得信号某一时刻的瞬时状态,既可以很好地体现信号的时频变化,又克服了小波变换中需要选择小波基的困难。

对EMD分解后的7个IMF分量:imfi(t),(i=1,2,…,7)进行HHT变换,即对每一个IMF分量进行Hilbert变换:

(5)

再求相应IMF分量的瞬时频率ωi(t):

θi(t)=arctan (di(t)/imfi(t))

(6)

(7)

根据ωi(t)和t就可以得到时频图。

本节选择了4类辐射源信号进行实验,对信号进行EMD分解后,通过HHT实现信号的特征提取,4类信号的HHT谱如图2所示。

图2 4类信号的HHT谱

通过4类信号的HHT谱可以清晰地看出4类辐射源信号的差异所在,由此可以推测,可以通过HHT变换提取信号的指纹特征来实现辐射源的个体识别。

1.3 基于SVD进行特征选择

因为进行经验模态分解之后的信号中,通常少量的数据就包含了信号的主要信息,因此,本文采用奇异值分解(singular value decomposition, SVD)[16]的方法来进行特征选取。

SVD奇异值分解的原理是:假设一个m×n阶的矩阵M,那么必定存在一个m×n阶的对角矩阵Σ,一个m×m阶的酉矩阵U满足UTU=I,一个n×n阶的酉矩阵V满足VTV=I,使得矩阵M满足分解:

M=UΣVT

(8)

满足式(8)就称为M的奇异值分解,奇异值就是分布在Σ对角线上的数值,为Σi,且按大小进行排列。

在很多情况下,前10%甚至更少的奇异值所包含的信息就能够达到90%以上,所以,我们只需要用最大的k个奇异值就能够对矩阵进行描述,即:

(9)

因此,通过奇异值分解,我们就可以得到较少的包含了大部分特征信息的数据。

2 信号分类算法-SVM算法

对辐射源进行个体识别的算法通常有聚类算法和分类算法,两类算法是完全不同的。聚类算法所研究的数据是没有标签的,无法通过标签实现数据的分类,其分类依据是通过算法判断各个数据之间的相似程度,通过对比相似程度,相似程度高的数据归为一类,实现了数据的分类,最终归为一类的数据相似程度高,而不同类别之间相似程度低。常见的分类算法如支持向量机(SVM)[17-18]、神经网络、最邻近分类器都是通过对输入的数据进行训练,按照一定的标准将数据贴上标签,这个标签就是代表着数据的类别,最终通过标签实现对测试集数据的分类。本文选取SVM算法对奇异值分解提取的暂态特征进行分类,实现辐射源的识别。

SVM算法最初是为了二分类问题设计的,通过寻找一个最优的分类器将具有多个属性的数据正确地分为两类,为了达到最大的泛化能力,要求距离分类器最近的不同数据集之间的间隔最大[19]。分类器的类型取决于数据属性的维数,二维的分类器是直线,三维的分类器是平面,多维的分类器是超平面。使用线性函数构造这个分类器:

f(x)=w·x+b

(10)

式中:w是权重;x=(x1,x2,…,xn)为训练数组;n为特征个数;xi表示每个x在属性i上对应的值;b是偏置;w·x表示w和x的内积。对数据进行分类,就需要将数据带入这个函数,通过计算f(x)的值来确定所属的类别。当f(x)>0就判定为类1,当f(x)<0就判定为类2。

将数据拓展至任意维,求最优分类器就是求最优超平面。当超平面:

w·x+b=0

(11)

满足:①对所有数据分类正确;②分类间隔最大,即‖w‖最小,则该超平面为最优超平面。假设分类数据有m个(x1,y1)(x2,y2)…(xm,ym),xi∈Rn,yi∈{-1,+1}表示类别号,实现SVM算法等同于求解一个带有不等式约束的非线性规划问题:

(12)

SVM是一个二分类器,但可以通过训练多个分类器实现多分类,常见的有以下两种方式:

一对一(one-vs-one):假设有n类数据,其中每2个类就需要训练1个分类器,总共需要训练n(n-1)/2个分类器。例如有4类数据:1,2,3,4,就需要训练6个分类器,分别是:1类和2类,1类和3类,1类和4类,2类和3类,2类和4类,3类和4类。输入数据经过训练的所有分类器的预测,最后由投票的方式来决定它最终的类属性。

一对多(one-vs-rest):假设有n类数据,需要训练n个分类器。例如有3类数据:a,b,c,要分出a就将a类数据设为正集,其它2类同设为负集,同样操作区分b类和c类,一需要训练3个分类器。输入数据经过训练的所有分类器的预测,再通过比较置信度的大小,选择置信度最大的类别标记为最终的分类结果。

本文运用一对多的方式训练多个分类器,对奇异值分解后得到辐射源特征进行分类。

3 实验验证

将辐射源信号进行EMD分解以及HHT变换提取暂态特征,并通过SVD奇异值分解得到的数据量少、包含了主要信息的信号特征作为SVM分类器的输入。我们把数据随机划分为训练集和测试集,其中训练集划分50个数据,测试集划分30个数据。运用训练集的数据训练4个分类器,再用测试集对训练好的分类器进行测试,观察识别准确率,实验结果如下所示:

当奇异值个数分别为5、10、50、100、200、240时,测试集与预测结果对比图见图3。

图3 奇异值个数取不同值时的对比图

通过表格能够更加直观地显示分类结果及识别率,如表1~6所示。

表1 奇异值个数=5时的分类结果

表2 奇异值个数=10时的分类结果

表3 奇异值个数=50时的分类结果

表4 奇异值个数=100时的分类结果

表5 奇异值个数=200时的分类结果

表6 奇异值个数=240时的分类结果

因为本实验中训练集和测试集是随机分配,所以每一次实验,测试集中每一类信号的个数是不固定的。

从表格中可以看出,当奇异值个数较少时,识别准确率较低,识别效果不佳;当奇异值个数较多时,随着个数的增加,识别准确率不断上升,当奇异值个数达到240个时,识别率为100%。此时,作为信号特征参与信号识别的奇异值个数240占信号总奇异值个数510的47.1%,占比较大,运算速度略有下降,以较小的代价获得了更高的识别率。实验结果表明,本文所设计的分类器能够较好地对辐射源个体进行识别,识别率高。其优点在于处理较大数据时可以保证较高的效率。

4 对比验证

通过小波变换WT提取暂态特征[20-21],并结合支持向量机进行分类,得到的识别准确率与本文方法得到的识别准确率对比如表7所示。

表7 不同特征提取方法的分类识别结果

从分类识别结果的表格中可以看出,本文提出的通信辐射源识别方法效果更好。

5 结语

通过实验验证,本文采用的EMD算法和SVM算法,通过不断调整提高奇异值分解个数来增加指纹特征的数据量,最终实现了对四类辐射源数据的个体识别,在增加奇异值分解个数的同时,运算速度并没有因此而大幅降低,保证了较高的运算效率。通过EMD分解克服了以往对信号进行特征提取的经典时频分析方法的抗噪性能差的弊端,对辐射源信号的特征提取手段进行了一定的优化,最终通过SVM算法也获得了较好的分类结果。

猜你喜欢
暂态辐射源分类器
基于单站干涉仪测向法的未知辐射源定位技术*
少样本条件下基于K-最近邻及多分类器协同的样本扩增分类
同步发电机转子电磁暂态的准确表达
学贯中西(6):阐述ML分类器的工作流程
基于全纯函数嵌入的暂态稳定网络方程算法
基于朴素Bayes组合的简易集成分类器①
直流线路诊断中雷击暂态全响应监测实践
基于博弈论的GRA-TOPSIS辐射源威胁评估方法
基于多参数联合模糊处理的雷达辐射源威胁等级判定
基于AdaBoost算法的在线连续极限学习机集成算法