一维卷积神经网络特征提取下微震能级时序预测

2021-06-28 03:30裴艳宇杨小彬传金平吴学松程虹铭吕祥锋

工程科学学报 2021年7期

裴艳宇，杨小彬✉，传金平，吴学松，程虹铭，吕祥锋

1) 中国矿业大学（北京）应急管理与安全工程学院，北京 100083 2) 华亭煤业公司砚北煤矿，华亭 744105 3) 北京科技大学土木与资源工程学院，北京 100083

我国煤矿开采逐渐转入深部开采，深部开采过程中冲击地压事件发生的数量和强度逐渐增加[1]，研究冲击地压前兆信号的变化对预测冲击地压有重要意义[2].

微震信号监测作为一种重要技术手段对冲击地压预测有重要作用[3-6]，高能级微震事件与冲击地压的发生有良好的对应关系[7].陆菜平等[8]从分析微震信号的功率谱和幅频特性入手，对冲击地压的预测预报进行研究；蔡武等[9]综合考虑微震的“时、空、强”特征，从时间、空间角度分别对冲击危险状态和冲击危险区域及危险等级进行预测；郭来功等[10]则通过微震成像和微震云图等方式发掘微震事件时空规律，为冲击地压预测提供判据；田向辉等[11]通过对微震能量、频次的分析来预测冲击地压的危险等级.以上研究结果对冲击地压判识提供了手段支持，但在微震能级随时间变化规律及基于现有的微震能级如何对后期的微震能级进行预测等方面还需要进一步的研究，尤其对高能级的微震事件进行预测尤为重要.对微震信号的变化进行预测，将微震事件时间节点前移，以实现对冲击地压的提前预测，为冲击地压防控提供更多时间保障.

机器学习相关技术和模型的发展为井下序列数据的预测提供了更广阔的视野.乔美英等[12]应用遗传算法优化的支持向量机模型对矿井涌水量进行短期预测，预测最大相对误差为2.62%；赵毅鑫等[13]利用长短时记忆模型对矿压进行预测并在其他矿井应用，预测结果较佳；李树刚等[14]利用循环神经网络对煤矿工作面的瓦斯浓度进行预测，瓦斯体积分数预测结果误差为0.006%.以上学者应用机器学习模型对时序数据进行预测，在各自研究方面取得了较大进展，但这些传统机器学习模型存在一点不足，即特征提取和分类分开难以得到最优解[15]，而卷积神经网络（Convolutional neural networks，CNN）作为一种深度学习模型，同时具备特征提取和分类输出的能力.卷积神经网络特征提取能力出色，在故障诊断[16-18]、地质遥感检测[19-20]等方面应用广泛且效果较佳，一些学者应用卷积神经网络对一维数据进行处理，并展现了其优势.赵康宁等[21]利用一维卷积神经网络的时序数据特征提取能力，将其与贝叶斯神经网络结合，对光伏出力进行时序预测；金列俊等[22]建立一维卷积神经网络的钻杆故障诊断模型，根据钻杆的加速度信号对钻杆工作状态进行识别；高佳豪等[23]使用一维卷积神经网络对包含轴承故障特征的随机信号成分进行特征提取以对齿轮箱轴承故障进行辨识.一维卷积神经网络在时序数据特征提取和预测方面都展示了良好的能力.

为此，本文为了实现微震能级时序预测，利用一维卷积神经网络建立微震能级时序预测模型，以前若干次微震的能量级别作为输入来预测下一次微震事件的能量级别；分析微震数据时序特征，对模型进行优化改进，对比现场微震监测数据，验证建立的一维卷积神经网络微震能级时序预测模型的可行性.

1 微震能级序列预测原理

某一区域的能量与微震之间存在地震震级-频度关系，即G-R关系式[24]：

其中，N为微震累积次数；M为区域性震级的最小值；a，b为与区域有关的经验常数，b值刻画了震源区的介质与应力情况.

文献研究已表明微震能级随时间存在一定的变化规律，那么，未来微震事件的能量与前几次微震事件的能量存在关联.基于此假设，一定存在一个映射g，使得可通过前若干次的微震事件能量Ei、Ei+1、···、EN得到第N+1次的微震事件能量EN+1，如式（2）式所示.

式中，i+1＜N.

由于微震事件的能量量级差别较大，为了便于模型输入及特征提取，对微震事件的能量值取对数，所得结果四舍五入取整后，记为微震事件能量级别，如式（3）所示：

其中，Ki表示第i次微震的能量级别.

基于以上内容构造模型，以前若干次的微震事件能量级别为输入预测下一次微震事件能量级别.

2 基于一维卷积神经网络的微震能级时序预测模型

2.1 模型构建

为有效提取微震能量数据特征，预测微震能量级别的时序变化规律，现构建基于一维卷积神经网络的微震能级时序预测模型，具体步骤如下：

（1）模型输入、输出.

模型输入时直接输入前若干次的微震能量值，本文中模型输出值代表微震能量级别，由于相邻的两个能量级别差异较大，若输出按十进制标量形式表示能量级别，模型训练结果会出现较大偏差.因此，采用一维有效编码方法（One-hot encode）将标量转化为一维向量，即将预测的对应微震能级表示为1，其他级别均为0.

（2）模型特征提取.

检测信号对某种特定模式的响应是卷积的本质.卷积核通过遍历整段输入向量，对能量序列中某些发生突变的点或阶段等细微特征进行检测.而池化层将卷积层输出的特征数据进行缩减以降低模型计算负担.由于微震能量序列是广义一维时间数据，相比于图像、视频等多维数据其包含信息量较少，为减少特征提取过程中数据信息的丢失，模型使用卷积层进行特征提取而删去池化层[25].模型先通过多个卷积层对微震数据提取特征，激活函数采用Relu函数，最后由全连接层对最后一层卷积层的输出加权平均.卷积层对上一层输出在第j个卷积核处的值，按以下公式进行处理：

其中，I为卷积层的一维输入向量；O为卷积层的一维输出向量；f则为该层的激活函数；Hj为长度为m的一维向量，又称为卷积核.同时，同一卷积层内可有多个卷积核同时对输入值进行运算.

（3）模型分类与优化.

为方便现场人员更好地了解预测类别的概率值，模型输出层选择Softmax分类器进行最终分类.

为优化人工神经网络模型，寻找一组神经网络的权值参数θ，并采用特定算法使损失函数Loss(θ)显著降低.考虑到学习率对模型训练效果影响较大，人工确定最佳参数具有较大难度，故选用一种学习率自适应算法Adam作为模型优化算法[26].

若设卷积神经网络模型为f(θ;·)，则CN+1与前N次微震能量关系如式（5）所示：

其中，Loss(·)为人为指定的损失函数，用于衡量模型预测的微震能量数量级与真实值之间的误差.

其中，Li为第i个样本的误差；n为样本数；m为类别数；im为第i个样本属于第m类的预测概率；yim为第i个样本属于第m类的真实概率.

2.2 模型训练及测试结果

考虑到采掘活动、地应力条件、地质条件等因素对微震事件的发生有一定影响，在选择输入数据维度时，经大量预试验，发现以前十次微震能级作为输入来预测下一次微震能级时正确率较高，相应的模型结构如图1所示，模型超参数经多次试验迭代所得，如表1所示.

表 1 各卷积层超参数Table 1 Hyperparametric table of each convolution layer

图 1 一维卷积神经网络微震能级时序预测模型结构Fig.1 Structure of the prediction model of the microseismic energy level time series based on the one-dimensional convolution neural network

利用砚北煤矿250202工作面2017年1月1日至2018年9月30日记录的10343次微震数据对一维卷积神经网络微震能级序列预测模型进行训练和测试.选取9次106级别微震中前6次微震，105级别微震中前66%的微震和其他级别前90%的微震事件，混合、打乱组成训练集；其余的微震事件混合、打乱组成测试集，模型测试结果如表2所示.

表 2 250202工作面微震能量级别测试结果Table 2 Test results of the microseismic energy level of the 250202 working face%

由表2可知，模型对102、103、104低能级的微震事件预测正确率和对105级别的高能级微震事件的预测正确率均超过了98%，并且总体正确率也达到了97.9%，说明基于一维卷积神经网络建立模型对微震能级进行时序数据进行预测是可行的.

但需要注意的是，模型预测结果中对106级别的高能级微震事件的预测正确率为0，有必要进一步对模型进行讨论、研究以提高对该级别微震事件的预测正确率.

3 改进的基于一维卷积神经网络的微震能级时序预测模型

虽然模型在测试集中预测正确率较高，但对106级别微震的预测正确率为0，通过分析发现模型将106级别微震全部预测为105级别的微震.砚北煤矿250202工作面记录的2017年1月至2018年10月的10343次微震中，105级别的微震353次，冲击地压引起或伴随的微震只有11次，而106级别的微震有9次，但全部是冲击地压引起或伴随发生的，因而有必要提高模型对106能级微震事件的预测准确率.

3.1 微震数据类间不平衡特征及解决方法

通过分析发现，模型对106能级微震事件预测正确率低的原因是微震事件各个能量级别的数量不平衡，其他能级事件数量远远多于106能级微震事件数量.本次用于模型训练和测试的数据中，102、103、104级别的微震上千次，106级别微震 9次，如图2所示.

图 2 微震各能量级别数量Fig.2 Number of each microseismic energy level

因此，解决模型对106能级微震事件预测准确率低的问题，需从微震事件各能级数据的不平衡特征入手.在机器学习领域的分类问题中，样本量较多的类别称为负样本，样本量较少的类别称为正样本.用存在正、负样本的数据集训练的模型会倾向于将正样本分类为负样本，导致正样本事件分类正确率降低.

目前处理正负样本类间不平衡问题的主要方法有欠采样、过采样和混合采样[27].欠采样会丢弃有价值的样本点，导致人工神经网络无法学习到有效的特征；过采样会放大正样本中噪声的影响，容易造成过拟合.考虑前二者的缺点和混合采样优势，采用一种混合采样方法[28]对模型进行训练，即随机将负样本分成若干份并分别和仅有的一份正样本组合，得到若干训练集后分别训练若干个子模型，最后再将每一个子模型的结果集成得到最终结果.混合采样的训练集建立过程如图3所示.

图 3 混合采样训练集建立过程Fig.3 Building process of the hybrid sampling training set

3.2 改进模型的构建

由于微震能级各类别数据的极端不平衡特征，在前文模型的基础上，前置一个预判模型，该模型对高、低能级微震事件进行预测，当预测结果为低能级事件，直接输出预测结果；当预测为高能级事件，送入后续的若干个续判模型群进一步预测，各个续判模型的预测结果加权平均作为最终输出结果.预判模型的训练集分为高能级、低能级两种类别，105、106级别微震划分为高能级微震事件；102、103、104级别微震划分为低能级微震事件.续判模型的训练集采用混合采样方法建立且训练集仅包括105、106两种级别的微震事件.改进的一维卷积神经网络微震能级时序预测模型框架如图4所示.

图 4 改进的基于一维卷积神经网络的微震能级时序预测模型总体框架Fig.4 General framework of improved prediction model of microseismic energy level time series based on the one-dimensional convolution neural network

预判模型与续判模型的内部结构与前文已经建立的基于一维卷积神经网络的微震能级时序预测模型结构一致，不再赘述.

3.3 改进模型的训练及测试结果

根据前期测试，针对砚北煤矿微震数据集所建模型的续判模型最佳数量为20个.对续判模型群，将105级别微震中的前240次微震随机分成20份，106级别微震中的前6次复制20份，二者随机组合得到20个子训练集.105级别的微震中后113次和106级别的微震中的后3次组合作为测试集.

对预判模型的训练集、测试集划分，与前文基于一维卷积神经网络的微震能级时序预测模型的训练集、测试集划分方法相同，但105、106级别微震分类时记为同一个类，即具有相同的分类标签.最后，对改进的预测模型进行测试，测试结果如表3所示.

表 3 250202工作面微震能量级别测试结果Table 3 Test results of the microseismic energy level of the 250202 working face %

改进后的模型对106微震能量级别事件的预测正确率由原来的0提升至99.0%，而105级别微震仅下降了5%，总体预测正确率较之前增加了0.5%，为98.4%.可以认为，改进后的模型一定程度上解决了样本数据间不平衡导致的模型对106微震能量级别预测正确率低的问题.

3.4 改进模型的实际应用

为进一步验证本文改进后的基于一维卷积神经网络的微震能级时序预测模型在微震能量级别预测方面的准确性，将其应用于砚北煤矿250202工作面进行微震能级预测，以前10次微震能级作为输入时，预测下一次微震能级.

250202工作面属于2502采区，处于砚北煤矿最东侧，北接1504采区，南与2502采区运输大巷、轨道大巷及行人通道相连，西临250203工作面上部采空区，东部为采区的保护煤柱区域.该工作面地质条件较为复杂，受区域向斜轴影响严重，向斜轴线发生大范围斜交，走向整体呈现北高南低走势，走向落差为50～280 m.煤厚为10.8～15.2 m，其平均煤厚为12.9 m，工作面长度在200～220 m之间，工作面走向长度约为1600 m，由北向南推进，采煤方法采用走向长壁放顶煤采煤法，全部垮落法管理顶板，回采速率为3 m·d-1，煤岩冲击倾向鉴定为具有强冲击倾向性.自2018年10月1日至10月10日，该工作面共监测到112次微震，改进后的基于一维卷积神经网络的微震能级时序预测模型对112次微震事件能级的预测准确率为93.5%，对高能级微震的预测正确率为100%.实测能级与预测能级比对结果如图5所示.

图 5 微震能量预测值与实测值对比Fig.5 Comparison between the predicted and measured microseismic energy

4 结论

（1）设计了一种基于一维卷积神经网络的微震能级时序预测模型，以前十次微震事件的能量级别作为输入，预测下一次微震事件能量级别.训练后模型在测试集上的正确率达到97.9%.

（2）由于微震事件各个能级样本数量不平衡导致模型对106级别微震预测正确率过低，为解决该问题对模型进行改进.改进后模型对106级别微震事件的预测正确率由0提升至99.0%，同时总体预测正确率提升为98.4%.

（3）使用砚北煤矿250202工作面10月1日～10月10日的112次微震事件对改进的模型进行验证，模型对微震事件能级的预测正确率达到了93.5%，证明本文模型可以为现场微震事件能级预测提供一定参考.