基于PSO-SVM的地震信号分类识别研究∗

2021-06-29 08:41施佳朋黄汉明薛思敏黎炳君
计算机与数字工程 2021年6期
关键词:波形分量矩阵

施佳朋 黄汉明 薛思敏 黎炳君

(广西师范大学计算机科学与信息工程学院 桂林 541004)

1 引言

完整的地震目录对强震预测和地震学的研究有着重要的意义,快速准确地对天然地震和人工爆破也是地震速报中的一项重要工作,人工爆破所产生的地震信号,如果不能及时剔除,会影响往后地震学的研究[1]。故对天然地震与人工爆破的分类识别的研究是很有必要的。

多年来,在对天然地震信号的分类识别领域中,国内外许多学者对地震信号进行了广泛的研究工作,如基于小波特征研究和经验模态分解的研究[2~3],基于集成算法和广义S变换的研究[4~5],运用BP神经网络研究[6~7],首都圈地区爆破、矿塌和天然地震的识别研究[8],使用各种机器学习方法对地震信号处理[9~10],利用深度学习对地震信号研究[11~15]等工作,均取得了不错的效果,这些研究者们都提供了许多研究方向启示。本文尝试以小波包分解的奇异值熵分量为特征,基于PSO-SVM模型,来对天然地震信号分类识别进行研究。

支持向量机在各个领域都有着广泛的应用,地震信号领域的学者们也尝试使用基于支持向量机方法来研究地震[16~17],但是SVM分类性能受到惩罚参数c和核函数参数g的选择影响,故本文使用引入寻优算法来对参数进行优化以获得最优参数值,避免对参数的盲目选择,经过实验,构建的PSO-SVM模型,表现出了良好的效果。

2 地震信号的特征提取方法

2.1 小波包分解

小波包分解是小波变换的扩展,与传统方法相比,小波包分解能提高信号的时频分辨率,尽可能保留有效信号不丢失,实现对非平稳信号更加精细的分析[18]。就识别的角度来看待,小波包分解得到的有效信息具有很好的一致性,小波包分解得到的小波包树中,最顶层的信号时间分辨率比较高,但是频率分辨率较低,小波包分解树从上往下的节点,频率分辨率越来越低,时间分辨率也相对变低,其中的每个小波包系数向量对应了特定的信号和特定的小波基。

小波包分解的实质是每次分解时,可以用一系列低通和高通滤波器来表示,将待分解的信号通过高、低组合滤波器组,分解到高频和低频两个通道上,可以简单有如式(1)定义:

式(1)中的h0和h1为长度2N的低通和高通滤波器。分解时候,得到了一颗类似树形结构,图1为6层分解的小波包树结构展示。本文实验使用了6层分解,得到的是6层小波包树,每个节点都有一个波形系数,其中图2为一个地震波形信号分解得到的[6,2]节点。

图1 小波包分解树

图2 [6,2]波形节点系数

得到小波包树后,对要重构的层,有如下重构公式:

为第G层小波包分解的第i个节点;i=2m,…,0;和为小波包重构滤波器组系数。

可以得到若假设地震信号经过G层小波包分解后,令m=2G,原始地震信号长度为n,则利用了m个节点,按照根节点顺序依次排列,按照式(2),可以构建出式(3)m*n阶的小波包系数矩阵A。

文中矩阵,每一行代表了由一个节点重构得到的信号,里面的aij中表示第i个节点上的第j个采样点。

2.2 奇异值

奇异值分解(Singular Value Decomposition,SVD)是线性代数中一种重要的矩阵分解,通过一系列线性变换,将矩阵转到一个新的坐标,在信号去噪和信号特征提取方面有重要的应用[19]。对于m*n阶的小波包系数矩阵A,其奇异值分解为

公式中:U为m*m阶正交矩;V为n*n阶正交矩阵;D为Dm*n=diag(σ1,σ2,…,σk)(k=min(n,m))的矩阵A的奇异值构成的对角阵。分解时候得到的奇异值越大,对应的特征向量在重构的信号矩阵A中所占的份量越大。

2.3 熵分量

Shannon信息熵理论在数学上指出,对于任意一个随机变量X,它的熵定义如下:

信号奇异值的每个熵值,能够表现出奇异值大小的分布情况,地震信号奇异值熵越大,奇异值熵能量分布越不均匀,而相反,奇异值熵越小,则越均匀,而熵是由每个熵分量求和所得,熵分量包含了有用信息,受此启发,选取了求奇异值熵分量来作为识别特征。其中计算每个奇异值的熵分量值的计算公式为

由上述式(6),就可以得到每个奇异值熵分量值,其中公式中,σi和M分别为奇异值和奇异值的个数,本文实验中,只选取了前20个较大的奇异值熵分量。

3 粒子群优化算法和支持向量机

粒子群优化算法(Particle Swarm Optimization,PSO),是一种基于群体智能演变并行搜索计算技术,其思想源于鸟群捕食行为的研究,通过群体中个体之间协作和信息共享来寻找最优解[20]。在相关文献中也有学者基于了PSO算法基础上来对地震信号进行研究[21],得到了不错的实验结果。

支持向量机(Support Vector Machine,SVM)是建立在统计学习理论和结构风险最小原理基础上,具有较强的高纬样本处理能力,SVM的分类结果受惩罚参数c和核函数参数g影响,实验中使用粒子群优化算法来寻找最优的影响参数,构成PSO-SVM模型。

图3 寻优适应度图

本文使用粒子群优化算法对SVM进行优化时候,根据输入奇异值熵分量特征向量数据来寻优选择参数,不同的数据量,就有不同的寻优值。在实验测试中,在实验中画出寻优过程的适应度变化曲线,得到如图3所示的寻优适应度图,可以直观看出粒子群优化算法对SVM优化。

4 仿真实验与结果

4.1 数据来源

本文所使用的数据来源于国家地震科学数据共享中心(http://data.earthquake.cn/),天然地震事件来源于中心首都圈数据,人工爆破事件为门头沟地区数据,这些事件发生时间于2010年~2016年间,共使用了255个事件做实验,天然地震共120个,人工爆破共135个。其中的65个记录的震动信号波形数据事件用来做以波形为分类单元实验,包含了天然地震事件30个,人工爆破事件40个,每个事件经过程序选择后,有几份至几十份不等的有效波形。而在以事件为分类单元的实验中,另外取了不同于波形分类单元实验的185个震动事件,包含了天然地震90个,人工爆破95个。

表1 以波形为分类单元的实验数据

事件中有许多个台站记录了波形数据,每个台站观测到的信号波形有垂直向、水平东西向、水平南北向三个分量的波形,一个地震信号记录的事件中有多个台站记录了下来的波形数据会存在差异,而且其中有的台站会记录了一些如等值线、趋势线、纯噪声的地震波形数据,本文研究只使用了其中的垂直分量方向的信号波形,去除了很明显是无效信号的波形数据。

4.2 实验步骤

本文以波形为分类单元实验流程图如图4所示。

输入地震信号后,先对波形进行选择处理,在程序中设置滑动窗口长度和滑动步长,对波形一段一段的滑动检测处理。首先从整个地震信号波形的最大波峰处向两边进行窗口滑动,并且把滑动过程中的每个窗口的波形信号最大波峰值记录下来,若如果存在多个窗口波形中的最大波峰值大于预先设置的阈值,则判定认为该波形被噪声淹没,视为无效波形数据,对其舍弃;反之,若不存在则判定归为有效波形数据。

对波形数据进行选择后,下一步是对振幅的归一化和滤波消噪处理,天然地震信号和人工爆破信号能量大小不同,在数字波形记录中会有较大差异性,另外还受到了外界物理条件的影响,一些台站记录下来的波形数据有漂移现象,记录的波形信号偏离了零点,这时候需要对其进行归一化处理,以消除这些影响。而去噪可以得到了一个相对原始信号更清晰的波形信号,减少干扰。

图4 以波形为分类单元框架流程图

然后接着对波形信号进行小波包分解,构建出小波包系数矩阵,使用SVD对系数矩阵分解,基于小波包系数矩阵SVD分解的地震信号特征向量提取具体步骤如下。

1)对输入的地震信号进行6层小波包分解,得到了64个频带上的小波包系数,利用各个频带上的小波包系数,重新构式(3)所示的小波包系数矩阵A。

2)对小波包系数矩阵A进行奇异值分解,得到矩阵A的奇异值,实验中得到了64个奇异值,由这些个奇异值来求它们的奇异值熵分量,并且只取了前20个最大的奇异值熵分量作为特征向量。

对上述求得的奇异值熵分量作为特征向量,一共有1941*20的特征向量矩阵数据,分别设置天然地震事件的标签为0,爆破事件的标签为1,将训练集和测试集按4:1划分实验。1552份波形求得的组合特征向量作为训练样本输入到粒子群优化算法优化SVM中,构建出了对这些波形数据较好分类识别的PSO-SVM,利用了粒子群优化算法的寻优特性,找到合适的SVM惩罚参数c和核函数参数g,剩下358份特征向量作为测试集,最后得出分类识别的结果,结果如表2所示。

表2 以波形为分类单元实验结果

实验中还以相同流程步骤,但是以事件为单元进行分类识别,另取185个地震事件,其中天然地震事件90个,爆破事件95个,训练集和测试集按3∶1划分,每个事件中都有许多个波形数据,对每个波形数据进行上述波形实验流程求出组合特征向量后,假设如果一个事件中的所有波形数据假设为天然地震,依次对每一条波形数据进行波形分类识别判断,若总的分类识别率达到了一半以上时候,则判定该事件为天然地震事件,否则判定为爆破事件,实验中,得到了表3所示的结果。

表3 以事件为分类单元的实验结果

5 结语

地震信号的分类识别研究在地震信号处理领域有着重要的意义,本文为了实现对地震信号的分类识别目的,由熵值得到启发,利用更为细致的有用信息熵分量作为特征,基于粒子群优化算法的寻优能力,可以根据输入的地震信号波形数据样本量进行调整参数,解决了SVM人工选择惩罚因子c和核函数参数g的困难,有着更好的适应性。最终构建出的PSO-SVM模型,经过仿真实验测试分析,以小波包分解得到的小波包系数矩阵,经过求出的奇异值熵分量作为特征输入模型,能够快速准确地对天然地震与人工爆破进行分类识别。

猜你喜欢
波形分量矩阵
正面碰撞车身加速度对乘员腿部损伤的影响
基于时域波形掩护的间歇采样干扰对抗研究
画里有话
通用6T系列变速器离合器鼓失效的解决方案
一斤生漆的“分量”——“漆农”刘照元的平常生活
一物千斤
论《哈姆雷特》中良心的分量
多项式理论在矩阵求逆中的应用
矩阵
矩阵