基于EMD及主成分分析的缺陷超声信号特征提取研究

2018-05-14 20:26李茂杨录张艳花
中国测试 2018年2期
关键词:特征提取主成分分析

李茂 杨录 张艳花

摘要:针对非线性、非平稳超声缺陷信号的特征提取问题,提出一种经验模态分解(EMD)和主成分分析(PCA)相结合的缺陷信号特征提取方法。对缺陷信号进行EMD分解得到本征模态函数(IMF),根据能量比率累积选取IMF,平均截取傅里叶变换后的各模态频谱得到能表征原信号的特征向量集;构建PCA模型,特征向量集降维得到低维特征向量,该过程可降低缺陷信号分析数据的复杂度和冗余度,以BP神经网络为缺陷分类器对缺陷特征进行识别与分类。实验结果表明该方法具有可靠的识别与分类效果。

关键词:超声缺陷信号;经验模态分解;主成分分析;特征提取

文献标志码:A

文章编号:1674-5124(2018)02-0118-04

0引言

超声无损检测因其检测灵敏度高、设备成本低廉等优点广泛应用于工业无损检测。超声缺陷信号的特征提取主要通过分析回波信号中包含的特征信息判定和识别被测试件的缺陷类型,过程中最为关键的是回波信号的识别和分析。对回波信号进行分析能够在信号时域图中观察到信号幅值的大小,从而判断缺陷的存在,然而仅仅依靠信号时域图获得的缺陷信息是有限的。为了从缺陷回波信号中提取出更加真实的特征信息,需要对缺陷信号进行频谱分析,这是因为信号频谱中能得到相比于时域中更多的信号特征信息。

超声缺陷信号是一类典型的非线性、非平稳信号,以傅里叶变换为代表的分析法在频域上任意点的频谱值是整个时间轴上积分的平均,因而不能很好地描述非平稳信号的时变特征。小波分析虽然可以同时反映信号的时域和频域局部变化信息,但是小波基的选取没有明确的标准,缺乏自适应性,因此也难以对信号进行精确的时频域分析。针对非线性、非平稳信号的特征提取,相关学者做了大量的研究。提出了一种基于独立分量分析和经验模态分解(empiricalmodedecomposkion,EMD)的特征提取方法,将独立分量自相关分析处理后进行EMD分解,最终提取到故障机组的本征模态特征函数;结合经验模态分解与BP神经网络提出了一种新的超声缺陷信号的分类方法,实验证明该方法能够对缺陷信号进行有效分类;以独立分量分析为基础,与瞬间态特征提取的特点相结合来进行信号特征提取,并取得了较好的效果。

本文提出结合EMD及主成分分析(principal component analysis,PCA)的方法来对超声缺陷信号进行检测与识别分类。原信号EMD分解得到相应的本征模态函数分量,能量比率累积选取IMF进行时频分析得到能表征原信号的特征向量集:运用PCA法对特征向量集进行降维,以计算得到的特征值累积贡献率来选取主成分个数,选取主成分可以提高数据分析效率,同时降低缺陷信号数据的冗余度和计算复杂度:以降维后的信号特征数据为BP神经网络的学习和训练数据,可以得到一个可靠的缺陷类型识别分类器。

1EMD与PCA理论

1.1EMD理论

Huang于1998年提出了一种新的信号分析的方法——希尔伯特黄变换,其中引出了本征模态函数的概念。EMD基本思想是:将原信号分解为一系列的本征模态函数。原信号可分解为若干个本征信号函数fi(t)和一个残差rn(t):

每个IMF必须满足两个条件:对信号的每一点而言,函数极大值拟合成的上包络线与极小值拟合成的下包络线的平均值必须为零:对整段信号函数而言,极值的点数与过零值的点数应该相等或者最多相差。

对信号EMD分解的一般步骤如下:

1)首先找到原信号的全部极大值点、极小值点,采用3次样条拟合得到信号的极大、极小值包络线,计算出信号的平均包络线。

2)原信号减去平均包络线得到第1个去掉低频的新信号,将得到的新信号作为原信号重复上述过程,直到满足固有模态函数的条件为止。

1.2PCA理论

PCA是数学上对数据进行降维处理的方法,通过构造原数据的线性组合方式,得到一组相互独立、互不相关的综合指标,选取少量的新指标让这些指标尽可能地包含原数据信息,最后达到用少数指标表征原数据的目的。

在实际应用中,各主成分包含信息量的多少用方差的大小来衡量,因此第1主成分是所有线性组合中方差最大的。当第1主成分包含的信息量不足以表征整个原数据的信息量时,则应选取第2主成分来联合代表原数据。为防止数据冗余,第2主成分不需要再出现第1主成分中存在的数据信息,所以需要保证各主成分间相互独立、互不相关。以此类推构造出原变量指标的第1、第2、…、第m个主成分。

2信号特征提取方案与EMD-PCA建模

2.1信号特征提取方案

把采回的超声缺陷检信号作为原信号,先对其进行EMD分解得到若干阶的IMF分量:然后对各阶IMF分量进行傅里叶变换得到各模态的频谱图,按照不同频率的能量分布把频谱均分成若干段,这些频谱段作为特征值对该类缺陷信号进行表征,统一起来得到缺陷信号的—个高维特征向量:当特征值过多时,构成的特征向量维度过高导致数据复杂度过大、信息冗余过高,此时利用PCA法对其降维得到精简的低维特征向量,主成分的选取是以特征值的累积贡献率来决定的,本文特征值的计算采用的是奇异值分解:最后构建BP神经网络模型对缺陷特征信号进行识别和分类处理。

2.2EMD-PCA建模

缺陷信号通过EMD分解后得到各阶IMF分量h(t),把信号能量在各频点的分布定义为单位频率内各信号的能量密度函数,记为G(ω),则信号h(t)的总能量为

当累积的贡献率>85%時,可认为选取的主成分能够反映原来变量的信息,对应的P就是抽取的前p个主成分。

3实验过程与分析

本次实验的试件是一块50mm×25mm×3mm的不锈钢板。在板材表面人为地制造3类缺陷:4mm×0.5mm的划痕、直径为1.2mm的孔洞及直径为0.8mm的孔洞。探伤仪采用双探头工作,探头间距为20cm,超声发射探头为5mHz,接收探头为2.5mHz,采样频率为20MHz,采样点2000个,探伤方式采用机油耦合接触法。在此对存在1.2mm孔洞的缺陷信号进行EMD分解,得到其8阶IMF分量及残差,如图1所示。对各阶IMF分量进行傅里叶变换得到图2所示的频谱图,计算前8个IMF分量的能量值及其能量比率系数,其中前6个IMF分量,结果如表1所示。

根据表中的数据可以看出,前6阶IMF分量的能量比率累积达到了95.4%,因此认为EMD分解得到的前6阶分量能够表征原信号的缺陷信息。

缺陷信号EMD分解后各阶IMF分量的频谱图如图2所示,回波信号各IMF分量的能量分布反映在频率轴上时是在0-25MHz之间,按照0-0.5,0.5-1.0,1.0~1.5,1.5-2.0,2.0-2.5mHz把一个样本分成5段,根据PCA法每一组特征值样本便可得到代表本组IMF分量的n(n≤100)个特征值,前6阶IMF分量便可得到n×6的特征值矩阵,累积贡献率超过85%的可表征本组特征值。表2列出了IMF1前10个特征值、特征值贡献率以及特征值贡献累积率的情况。

由表可知,前7个特征值的累积贡献率达87.92%,余下的4段情况如下:在0.5-1.0MHz段前8个特征值累积贡献率为85.09%:在1.0-1.5mHz段前9个特征值累积贡献率为85.89%;在1.5~2.0mHz段前6个特征值累积贡献率为85.07%;在2.0~2.5mHz段在前6个特征值累积贡献率达到85.2%。这样IMF1便可得到36个特征值,利用同样的方法来处理余下的5阶IMF分量,最后得到一个36×6的特征值矩阵。

将无损信号、划痕回波信号、0.8mm孔径回波信号及1.2mm孔径回波信号处理得到的特征数据进行缺陷类型编码,4类信号分别对应0001,0010,0100,1000。4种信号可以得到144组数据,随机选取132组数据作为BP神经网络训练数据,余下作为BP神经网络测试数据。本文构建的BP神经网络的具体结构为:输入层、隐含层及输出层包括的神经元个数分别为20,10,4,采用双曲正切s型函数为传递函数,训练误差值为0.001。计算预期输出和实际输出的误差值率,结果如表3所示,输出最小误差率和最大误差率分别为0.2370%和2.1656%,实际平均输出误差率为1.4996%。

采用方法分析本文中的各类缺陷信号,对缺陷超声信号进行EMD分解后提取各IMF分量特征值,在其時域内分析提取到过零点数、信号面积及最大幅值作为时域特征,在其频域内分析提取最大幅值、中心频率及信号能量作为频域特征,仍以BP神经网络作为分类器,取8组测试数据误差值率输出情况如表4所示,输出最小误差率和最大误差率分别为0.6982%、3.3039%,平均输出误差率为1.8400%。对比人工提取6组特征值作为分类样本集,本文采用的方法在实际输出误差控制方面有更好的表现,因此说明本文方法更加可靠。

4结束语

对不锈钢板的缺陷信号进行EMD及PEA的联合分析,结果表明特征值矩阵能够用于缺陷信号的识别与分类,且输出误差值率最大仅为2.1656%,有很好的可靠性。因此该特征提取方法具有较广的应用前景和一定的实际工程意义。

猜你喜欢
特征提取主成分分析
基于MED—MOMEDA的风电齿轮箱复合故障特征提取研究
基于曲率局部二值模式的深度图像手势特征提取
一种针对特定无线电信号的识别方法
基于模糊K近邻的语音情感识别
基于NAR模型的上海市房产税规模预测
主成分分析法在大学英语写作评价中的应用
江苏省客源市场影响因素研究
SPSS在环境地球化学中的应用
服务贸易结构优化路径研究