基于支持向量机的典型宽带电磁干扰源识别

2021-08-24 01:27蒋倩倩
系统工程与电子技术 2021年9期
关键词:干扰源降维干扰信号

朱 峰,蒋倩倩,林 川,杨 啸

(西南交通大学电气工程学院,四川 成都 611756)

0 引 言

随着轨道交通和无线电通信的快速发展,民航周围电磁环境变得更加复杂,有限的频率资源越来越拥挤,电磁干扰现象也越来越严重,对民航甚高频通信产生重大影响[1-2]。

根据干扰信号的频谱特性,一般可分为窄带干扰和宽带干扰两类。窄带干扰的频谱具有稳定的峰值特性,易于识别,目前对其排查的技术已经很成熟,如黑广播[3]。然而,排查中最主要的问题是宽带干扰,其出现没有任何规律,且随机性较强,这给排查带来了盲目性,如高速列车通过电分相或由于长时间工作的老化灯泡[4-7]。此外,由于通信技术的发展,全球定位系统(global positioning system,GPS)干扰器的广泛使用也构成了潜在的威胁[8-9]。由于设备的缺乏和数据不完备,这类干扰一旦出现,通过定位技术并不能得到干扰源的具体位置,而是某个确定的区域内,此时若想要消除干扰信号,就需要结合人工排查,对该区域内所有可能造成干扰的电气设备逐一进行排查,效率很低。因此,为保障民航机场的安全运行及通信,及时发现干扰机场通导设备的电磁干扰源并采取相应的措施,以便在排查干扰信号时有针对性地对限定区域内的某类电气设备进行快速查找,提高民航机场的运行安全。基于这一问题,利用数据库对各种干扰源的频谱数据进行存储和管理,通过对干扰源的特征提取进行宽带电磁干扰源的识别分析。

目前,针对民航机场附近的干扰源而言,由于不明确其干扰特性,使得排查效率低且具有盲目性。在现有文献中,对机场附近的干扰源识别研究较少,只有某些高校和研究所开展了一定的研究,其中西安电子科技大学的黄孟龙和刘君华[10-11]采用相似度来判别电磁兼容系统中的干扰源类型。然而,在大数据时代,这种方法较为局限,找到一种便捷的干扰识别方法再加以排查就显得尤为重要,这就需要提到机器学习。近年来,高效便捷的机器学习在识别领域得到了广泛应用,尤其是语音识别和故障诊断,其中支持向量机(support vector machine,SVM)对小样本系统具有独特的优势。文献[12]研究了机器学习中的随机森林法和SVM。通过对Sentinel-2时间序列数据提取特征进行农作物的识别,将机器学习算法和传统的分类方法进行比较分析,明确机器学习算法在多分类问题中,识别性能明显优于传统分类方法,且样本的不均匀分布也不会影响其识别精度。文献[13]基于民航使用飞机通信寻址和报告系统(aircraft communication addressing and reporting system,ACARS)生成的数据具有简单实时的优点,对该数据分析,利用粒子群优化的SVM对飞机危险性识别,有较高的识别速度和精度。文献[14]结合模糊C均值聚类方法获得的训练集,用SVM对航天器电气特性进行识别,结果表明该方法与传统方法相比有更高的精度。SVM在航空中也用于故障识别和雷达信号识别[15-16]。虽然SVM在这些方面具有良好的可靠性和鲁棒性,但在民航电磁干扰识别中较罕见。

为保持机组人员与地面管制人员之间的通信畅通,本文提出一种基于SVM的典型宽带干扰识别方法。结合干扰源的频谱数据分析信号特性,提取宽带干扰的特征向量需通过主成分分析(principal component analysis,PCA)法对其进行数据降维处理,然后利用SVM识别文中展示的6种典型宽带干扰。

1 干扰源数据采集

在民航电磁干扰相关问题的测试和分析,以及大多数标准中涉及到设备的技术指标时,基本都是在频域中规定的,如标准无线电干扰和抗扰度测量装置和方法规范。

1.1 测试对象

如GB6364所述,航空业务中的干扰难题主要是非航源,其来源多且分布广泛,如广播业务、电气化铁路、家用电子设备老化等。由于民航机场处于运营阶段,受测试条件的局限性,本文只针对小部分干扰源进行了分析研究,包括列车电分相、GPS干扰器和老化灯泡,其中列车电分相在四川省成都市成南线进行测量,其余干扰源均在学校实验室中进行频谱测量。老化灯泡包括多种民用照明灯泡、机场照明灯泡和机场跑道灯泡,经过多次测试发现少数老化灯泡确实存在干扰现象。根据实测结果,从3类老化灯泡中各选择一个存在干扰现象的灯泡,同列车电分相和两类干扰器共同组成6类最终的识别干扰源。列车电分相的测试场景及其余干扰源的实物如图1所示,老化灯泡的参数如表1所示。

图1 电磁干扰源测试场景及对象Fig.1 Test scene and object of electromagnetic interference source

表1 老化灯泡的参数指标Table 1 Parameter indexes of aging bulb

根据测试要求,采用频谱仪对上述干扰源进行扫频测试,已知民航无线电频率的分布很广,若将频谱仪的扫描宽度覆盖整个频带,不仅造成扫描时间过长,同时也不利于分析干扰信号的特性。基于该问题,考虑到机场无线电导航台的工作频率和通信问题的影响,频谱仪的起始频率和终止频率分别设为108 MHz、350 MHz,选用峰值检波,分辨率带宽设为120 kHz。测试仪器及技术指标如表2所示。

表2 测试设备及技术指标Table 2 Testing equipment and technical index

1.2 频谱测试

测试数据为测试频段内对应的电压幅值,频谱图由峰值保持(蓝线)和实时刷新值(黑线)共同组成。电分相处是在外场进行干扰测试,周围存在许多不确定性因素,引起周围电磁环境改变,从而造成各个时刻下的背景信号不一致,其背景测试如图2所示。

图2 不同时刻电分相的背景测试Fig.2 Background test of neutral section at different time

除电分相外,其余5类干扰源是在实验室里进行测试,周围电磁环境变化相对较小,背景信号基本一致,存在较小的涌动性,背景测试如图3所示。根据测试数据分析,电分相处的干扰测试具有很强的随机性,且列车经过电分相时电磁辐射强度大,其频谱测试如图4所示。与背景测试图2相比,可以明显看出当列车经过电分相时,干扰信号的电平整体抬升,且随着频率的升高,辐射强度逐渐降低。

图3 实验室的背景测试Fig.3 Laboratory background test

图4 电分相典型频谱测试Fig.4 Typical spectrum test for neutral section

干扰器只能在规定区域内使用,并且使用前需上报有关部门,经允许后才能使用,但是由于干扰器体积小、便于携带,很容易将其带入机场或者放于机场附近,这些都是较难被发现的,一旦干扰器的信号落入通导设备的工作频段内,将会阻断通信设备与外界基站的联系,从而影响机场的正常通信。干扰器主要表现为同频干扰,其辐射强度较大,具有一定涌动性,两类不同GPS干扰器的频谱测试如图5所示。

图5 干扰器的频谱测试Fig.5 Spectrum test for jammer

相较电分相和干扰器而言,老化灯泡的辐射强度相对较小。对于所选的3种存在干扰的老化灯泡,其频谱特征主要表现在两个方面:一方面是干扰信号连续存在,且随着频率的升高,辐射强度逐渐降低;另一方面干扰信号连续存在,且明显观察到在某个频段存在包络特征。民用照明、机场跑道和机场照明3类老化灯泡的频谱测试分别如图6(a)~图6(c)所示。

图6 老化灯泡的典型频谱测试Fig.6 Typical spectrum test for aging bulb

2 特征提取

干扰特征的提取往往决定着识别效果的好坏。特征提取的越好,特征向量中包含的有用信息越多,分类效果也越好。因此,特征提取在识别中有着重要作用。频谱测试中,由于测试场地的限制,每类干扰源测试20组样本,每组测试数据点为1 001,为了避免在特征提取时发生频率偏移,保证特征数量的统一,将频谱数据进行分段处理,依次进行干扰源的特征提取[17]。

2.1 包络特征

包络特征指测试频率段内,频谱信号在一个或若干个小的频率段内连续存在,且在该频段内的中心频率点处辐射强度最大,左、右两侧的辐射强度呈现为单调递增和单调递减,则将其认为是包络信号[18]。列车电分相、干扰器以及各类老化灯泡并非都存在包络信号,再者不同干扰源类型即使存在包络信号,其信号的频率段和辐射强度均不同;并且包络特征的提取是一个或者若干个小范围的频率段,其特征数量庞大,编程困难,导致识别特征向量的维数不一致,不利于干扰源的识别。基于上述原因,先对干扰信号进行包络处理,再对划分的每个频段计算包络因子[11],用包络因子来表征干扰源的包络特征,有利于简化编程,保障特征向量维数的统一,计算公式如下:

(1)

2.2 能量特征

为分析信号的波动情况,提取各频段干扰信号的能量特征[19]。通常情况下,更多的可能是针对时域来描述能量特征,由于能量守恒,所以信号通过时域和频域计算得到的能量是相同的。针对频谱测试,在频域中直接采用相对能量来表征电磁干扰的能量特征,即每个频段的能量占干扰信号总能量的百分数比。

某段信号的能量常用其幅值的平方或包络面积等参数来表示,则第k段的能量为

(2)

信号的总能量为

E=E1+E2+…+Ek

(3)

相对能量为

(4)

2.3 峰值特征和统计特征

峰值信号是判断电磁干扰类别的重要信号。由于频谱仪测试的干扰信号中含有一定的白噪声,其在一定范围内随机波动,与背景信号有关,所以峰值特征并不能简单地由单调性确定。目前,峰值特征的提取方法很多[20-21],其中比较典型的一种是搜索背景信号中的最大值,再加上一固定值作为峰值特征的阈值,大于该值则提取为峰值信号,该方法提取的特征数量越大,有用信号越多。由于进行了分段处理,用该方法提取峰值特征会增加计算量,同时不同干扰源之间的峰值特征差异也较大,不利于后续识别,从而选择每个频段的最大值作为干扰源的峰值特征。峰值特征的表达式为

F3(k)=max{xk(n)},n=1,2,…,N

(5)

由于采用了信号分段处理,若仅提取包络、能量和峰值特征,特征数量少,干扰特征的代表性较弱。为了更准确地识别再提取均值和方差两个统计特征[22],均值和方差的计算公式分别如下:

(6)

(7)

特征向量间要求有相同的度量,需对每一特征向量进行归一化处理。设任意特征向量为Fj=[f1,f2,…,fk],对其进行归一化处理,计算公式如下:

(8)

式中:Fjk表示第j类特征向量中第k个特征进行归一化处理;fk为原始特征;fmax和fmin分别为该组特征向量中的最大值和最小值。则经归一化后的某一类初始特征向量为

(9)

3 SVM识别

3.1 PCA数据降维

PCA是一种简化数据集技术,常用于数据集的降维处理,同时保持数据集中方差贡献最大的特征[23-27]。原始特征的矩阵维度越高,不同特征之间的相关性可能也越强,就会存在特征冗余的问题。若直接输入到SVM中进行识别,不仅会增加训练时间,降低分类效果,而且当数据维度大于样本数目时,易造成过度拟合的问题,进而影响识别精度。基于该问题,对初始特征向量进行降维处理,不仅降低了数据间的冗余程度,也提高了系统的运行效率,从而提高干扰源的识别正确率。设原始特征为Fa×b,降维后的特征向量为Fa×c(c

步骤 1计算数据中心化F′。

(10)

步骤 2计算协方差矩阵Cx。

(11)

步骤 3计算协方差的特征值λi和特征向量vi。

(12)

式中:Λ为vi对应下标特征向量的特征值组成的对角阵。

Λ=[λ1,λ2,…,λn]

步骤 4将特征向量按照特征值降序排列,选择前c个主要特征向量构成特征矩阵P。

步骤 5计算降维后的数据Z。

Z=F′×P

(13)

在PCA降维处理过程中,特征向量的个数有两种选定方法:一是人工直接选择特征向量的个数;二是由主成分的贡献率来确定特征向量的个数。由于不确定到底应该选多少个特征才能有更好的识别效果,所以选择后者来确定特征向量的个数,文中选择主成分的总贡献率达90%的特征向量组成识别特征向量。仿真结果如图7所示。

图7 PCA贡献率Fig.7 PCA contribution rate

针对文中所选的6类宽带干扰源,首先将测试的频谱数据进行分段处理,为保证干扰源的特性,此处将整个测试频段分成10个频率段;再依次提取干扰源的包络、能量、峰值、均值和方差5类干扰特征,经过特征提取后形成了一个50维的初始特征向量。结合图7可以看出,初始特征向量经PCA数据降维处理后,前8个主成分的总贡献率就已经达到了90%。因此,选择贡献率最大的前8个主成分对应的向量组成最终的识别特征向量,用较少数量的特征最大限度地保留了干扰源更多的有用信息,既提高了系统的运行速度,也提升了识别的准确率。

干扰源经各个干扰特征提取后,形成了一个高维的初始特征向量,从图7可以看出,PCA数据降维处理后,前8个主成分的总贡献率达到了90%,用较少数量的特征最大限度地保留了更多的有用信息。因此,选择贡献率最大的前8个主成分对应的向量组成识别特征向量,提高了系统的运行速度和识别准确率。

3.2 仿真结果分析

SVM是20世纪90年代提出的一种基于统计学理论的机器学习方法,以结构风险最小化原则为理论基础,对解决小样本、高维数、非线性等问题都有明显的优势。该方法最初是针对线性二分类问题提出的,但实际情况中,更多的是对非线性、多分类问题的研究,其构造多分类器的方法主要有两种,一是直接修改目标函数,将多个分类面的参数求解综合到一个最优化问题中进行求解,计算复杂不易实现;二是通过多个二分类器的组合来实现目标的多分类[28-32]。SVM在识别领域的应用已经相对比较成熟,其基本原理是利用非线性变换将线性不可分空间映射到高维线性可分空间,并建立一个VC(Vapnik-Chervonenkis)维的分类器,该分类器仅由样本中少量的支持向量确定,具有最大的分类间隔。

本次仿真实验在Matlab R2018b软件平台上,利用工具箱Libsvm构建多个二分类器,实现民航机场周围典型的6类宽带干扰源识别。SVM进行识别时,核函数选择为径向基函数,采用交叉验证法进行网格搜索,寻找最优的惩罚因子系数和参数系数。针对6类典型宽带干扰进行数据采集,每类干扰源均采集20组样本数据,任选10组样本组成训练集,剩余10组构成测试集。经包络因子、频谱峰值、频谱能量、均值和方差5种干扰特征的提取后,产生初始特征向量矩阵(120×50),PCA降维后形成识别特征向量(120×8)。利用两种情况来进行SVM识别分析,第一种情况:初始特征向量直接作为SVM的输入向量,主要存在特征冗余的问题,造成识别准确率低,识别结果如图8(a)所示;第二种情况:PCA降维后的识别特征向量作为SVM的输入向量,与前者相比,表明PCA降维处理有助于提高干扰源的识别率,仿真结果如图8(b)所示。图8干扰源的SVM仿真识别中,类别编号1~6依次代表民用照明灯泡、机场照明灯泡、机场跑道灯泡、GPS干扰器(2线和6线)和电分相。

图8 SVM的仿真结果Fig.8 Simulation result of SVM

从图8可以看出,当初始特征向量直接作为SVM的输入向量时,干扰源的识别率为95%,而SVM的输入是PCA降维后的识别特征向量时,识别的准确率达到了98.33%,与不降维处理相比,识别率明显增加。图8(b)中可以明显看到,6类民航典型宽带干扰中有5类干扰源的识别率达到了100%,只有类别2被错误地识别为类别6,主要原因可能是类别6在采集数据时,其背景信号波动大,干扰信号随机性强。

4 结 论

本文针对民航电磁干扰提出了一种基于SVM的宽带干扰识别方法。利用采集到的频谱数据,分析信号的特性并提取干扰特征,分析特征向量是否经过PCA降维处理的识别率差异。实验结果表明,SVM能有效识别6类典型宽带干扰,并且经PCA处理后的识别效果更好。因此,当民航机场存在干扰时,可以先直接通过计算机系统实现干扰源的判别,再带有目的性地去排查,这样既经济又高效。同时,本文也存在测试样本少、特征提取泛化等问题,这将是下一步的研究工作。

猜你喜欢
干扰源降维干扰信号
混动成为降维打击的实力 东风风神皓极
正弦采样信号中单一脉冲干扰信号的快速剔除实践方法
基于粒子群算法的光纤通信干扰信号定位方法
降维打击
三电平H桥逆变器差模干扰源研究
基于可移点波束天线的干扰源单星定位方法
一种基于“主动加扰”技术的通信区域精准控制干扰源设计
发射机房控制电路干扰源分析
浅析监控干扰信号的优化处置措施
一种改进的稀疏保持投影算法在高光谱数据降维中的应用