基于IWOA—SVM的煤矿突水预测模型

2022-01-25 02:52秋兴国李靖
工矿自动化 2022年1期
关键词:突水鲸鱼准确率

秋兴国, 李靖

(西安科技大学 计算机科学与技术学院, 陕西 西安 710600)

0 引言

矿井突水作为严重威胁煤矿生产安全的主要矿井灾害之一,一旦发生会给矿区造成严重的经济损失和人员伤亡[1]。对煤层突水进行预测,可在突水事故发生之前及时采取措施,从而减少突水事故,更有效地保障煤矿生产安全。传统的突水预测方法主要包括突水系数法、阻水系数法及脆弱性指数法等[2-3]。这些方法已被广泛应用于突水预测中,但仍存在缺陷,如突水系数法和阻水系数法考虑的因素都较少且计算精度低,脆弱性指数法需要多种属性的支持且对原始数据的要求较高。

近年来,机器学习方法被越来越多地用于解决煤矿突水预测问题。潘辉等[4]针对底板突水非线性特征,利用粒子群优化(Particle Swarm Optimization,PSO) 算法优化BP神经网络,建立了底板突水预测模型,但BP神经网络训练依赖大量数据,对小样本突水事件的预测精度偏低。宋国娟[5]将PSO算法与极限学习机结合进行突水预测,Wang Ge等[6]利用PSO算法和蚁群优化算法分别对极限学习机进行优化,建立突水预测模型,但这2种算法在寻优时收敛速度都较慢。师煜等[7]利用遗传算法和PSO算法优化随机森林回归模型,提高了突水预测精度。李颖[8]针对非线性、小样本的底板突水问题,首次将支持向量机(Support Vecor Machine,SVM)模型用于底板突水预测,通过实验验证了该模型的有效性。张风达等[9]采用PSO算法优化SVM参数,提高了突水预测精度。智能群体算法一定程度上改善了机器学习模型参数选择盲目的问题,但常用的智能优化算法如PSO算法、蚁群算法、果蝇优化算法[10]、遗传算法等仍存在参数设置较多、收敛速度较慢或容易落入局部最优的缺陷。

鲸鱼优化算法(Whale Optimization Algorithm,WOA)是依据鲸鱼围捕猎物的行为提出的一种智能优化算法[11]。WOA需设置的参数较少、结构简单,适用于SVM模型的参数优化,但收敛速度较慢,且优化结果容易陷入局部最优。因此,为提高WOA的收敛速度,避免WOA在寻优过程中过早地陷入局部最优,提出了一种改进鲸鱼优化算法(Improved Whale Optimization Algorithm,IWOA),从鲸鱼种群初始化、调节因子非线性化及随机差分进化(Differential Evolution, DE)3个方面入手对WOA进行改进。在此基础上,提出了一种基于IWOA-SVM的煤矿突水预测模型,基于IWOA结构简单、易实现、寻优能力强的优点[11],结合DE算法和混沌映射方法的特性改善WOA的全局搜索能力,对SVM的惩罚因子和核函数宽度进行寻优,从而提高突水预测的准确率和效率。

1 基本原理

1.1 鲸鱼优化算法基本原理

在WOA中,每头鲸鱼的位置代表问题的1个解,猎物的位置则指代问题的最优解。WOA分为开发阶段和搜索阶段:在开发阶段,每只鲸鱼都可以随机选择包围猎物行为或螺旋泡沫网攻击行为,螺旋状上升游动并喷出气泡来包围搜捕猎物;探索阶段的鲸鱼则游走觅食,远离当前最优参考位置,使算法具有一定的探索能力。

1.1.1 开发阶段

(1) 包围猎物。捕捉猎物时,鲸鱼首先确定猎物的位置,然后包围猎物。包围猎物的行为可描述为

X(t+1)=X*(t)-A|CX*(t)-X(t)|

(1)

式中:X*(t),X(t)分别为迭代第t次时的最优位置向量和个体位置向量;A,C为系数向量,计算公式为

(2)

(2) 螺旋泡沫网攻击。鲸鱼沿着螺旋状的轨迹运动,缩小包围猎物的圆圈,最后捕捉猎物。该过程主要通过收缩包围机制和螺旋更新位置2种行为描述,由于这2种行为是同时发生的,所以每只鲸鱼在该过程中随机选择一种方式更新自己的位置。位置更新公式为

(3)

式中:D为迭代第t次时个体鲸鱼到目标的距离,D=|X*(t)-X(t)|;b为常数;l为[-1,1]的随机数;p为策略选择阈值,取值范围为[0,1]。

1.1.2 搜索阶段

在搜索阶段,WOA会随机选取一头鲸鱼,以该鲸鱼位置作为参考,迫使鲸鱼远离当前最优解的位置,寻找更好的猎物,其数学模型为

X(t+1)=Xrand(t)-A|CXrand(t)-X(t)|

(4)

式中Xrand(t)为迭代第t次时鲸鱼种群中任意选择的一个鲸鱼的位置向量。

1.2 SVM基本原理

SVM模型可以较好地解决如煤矿突水预测这类具备高维数、小样本、非线性特征的分类问题[8-9,12]。SVM的核心思想:对于一个在原始低维空间中难以处理的非线性问题,在核函数的作用下,将其转变成一个更高维特征空间中的线性可分问题;在高维空间中找到一个分割样本的超平面,使得分布在其两边的两类样本中,距离它最近的样本对象之间的距离最大。对于给定的训练样本M={(x1,y1),(x2,y2),…,(xm,ym)}(m为训练样本总数),输出向量yI∈{-1,1}(I=1,2,…,m),基于结构风险最小化原则建立的分类函数为

0<αI

(5)

式中:xI,xJ为输入特征向量;αI为拉格朗日乘子;k(xI,xJ)为核函数;c为惩罚因子;d为阈值。

核函数是SVM解决非线性分类问题的核心。目前应用最广泛的核函数主要包括线性核函数、多项式核函数、Sigmoid核函数及高斯径向基核函数(Radial Basis Function, RBF)4种。本文选用其中泛化能力较好的RBF核函数作为SVM的核函数,其具体表达式为

(6)

式中σ为核函数的宽度。

2 基于IWOA-SVM的煤矿突水预测模型

2.1 参数优化

构建煤矿突水预测模型时,为了获取更加精确的预测结果,需要优化SVM模型的惩罚因子c和核函数宽度σ。本文从鲸鱼种群初始化、调节因子非线性化及随机DE 3个方面入手对WOA进行改进,并将改进后的算法IWOA用于SVM参数寻优。

2.1.1 种群初始化

传统WOA使用随机初始化方法来确定初代鲸鱼种群的位置,随后每一个鲸鱼都会在不断迭代中向着最优位置靠近,直到算法收敛或达到最大迭代次数。如果鲸鱼个体的初始位置与最优位置很近,那么该鲸鱼很快就会到达最优位置,算法的收敛速度就会很快。但是随机初始化方法在大多数情况下很难保证鲸鱼初始位置距离最优位置很近。

针对这一缺陷,本文基于混沌映射的随机性、遍历性等特点丰富鲸鱼种群的多样性,提高鲸鱼种群寻找到最优猎物的可能性。大量研究表明[13-15],将混沌映射应用在优化领域代替伪随机数生产器生成混沌数,常常能取得比伪随机数更好的效果。常用的混沌映射主要包括Logistic映射、Gussian 映射、Sine映射、Tent映射等。其中Tent映射在分布上更加均匀,能使算法的搜索效率更高,因此,本文使用Tent映射初始化鲸鱼种群,初始化公式为

(7)

式中Xi为第i个鲸鱼个体的初始位置向量。

2.1.2 调节因子非线性化

WOA通过调节因子a控制全局搜索能力,a越大,则算法在全局搜索上的表现力越强,在局部搜索上的表现力则相对较弱。原始调节因子a在迭代过程中线性地从2减小到0,这种线性变化难以应对复杂问题,在优化时易陷入局部最优。针对该问题,本文提出一种非线性变化策略,使调节因子a在整个迭代过程中从2到0先慢后快地减小,提升算法在迭代前期的全局搜索能力及迭代后期的局部搜索能力,从而加快收敛速度。优化后a的计算公式为

a=2-2(t/tmax)2

(8)

2.1.3 DE算法

WOA在寻优时所有鲸鱼会朝着当前最优位置的鲸鱼个体靠近,因此,若当前最优位置不是全局最优解,则整个种群就会错误地向局部最优聚拢,算法会陷入局部最优。针对这一缺点,本文引入DE算法的变异、交叉、选择操作,以增强WOA的全局搜索能力。

(1) 变异。从鲸鱼种群中随机选择2个鲸鱼个体并生成差分向量,然后选择另外一个鲸鱼个体与加权差分向量求和,生成变异个体。变异个体计算公式为

hi(t)=X1(t)+F(X2(t)-X3(t))

(9)

式中F为缩放因子,F∈[0,2]。

(2) 交叉。将选定的目标鲸鱼Xi(t)={Xi,1(t),Xi,2(t),…,Xi,n(t)}(n为鲸鱼个体维数)与变异产生的新鲸鱼hi(t)={hi,1(t),hi,2(t),…,hi,n(t)}进行交叉操作,从而生成新的子代鲸鱼个体ui(t)={ui,1(t),ui,2(t),…,ui,n(t)},增加鲸鱼种群的多样性。交叉操作的表达式为

(10)

式中:j=1,2,…,n;q为交叉概率,q∈[0,1]。

(3) 选择。在目标鲸鱼和子代鲸鱼之间进行选择操作,将表现更好的鲸鱼个体保留到下一代鲸群中,选择公式为

(11)

式中S()为适应度函数。

2.2 预测流程

煤矿突水受到多种因素的影响,本文将影响煤矿突水的多种因素作为模型的输入特征向量,突水与安全2种突水结果作为数据的类别信息构成模型的输出向量。

构建IWOA-SVM突水预测模型时,首先要实现IWOA。每个鲸鱼个体由SVM的核函数宽度和惩罚因子2个参数构成,以突水预测结果与实际结果间的误差最小化为目标建立目标函数,根据IWOA得到SVM模型的最优参数值。采用SVM模型对样本数据进行预测,得出最终的突水预测结果。基于IWOA-SVM的煤矿突水预测流程如图1所示。

3 实验分析

3.1 模型输入特征与数据处理

矿井突水是指在采掘过程中带压水通过裂隙等突水通道涌入巷道的现象,一般指底板承压含水层水突出。本文从突水水源、突水通道、影响突水指标3个角度出发分析突水机理,从而确定作为预测模型输入特征的相关影响因素。

研究表明[16-19],煤层底板下的承压含水层是煤矿突水的物质基础,含水层的富水性对矿井突水量大小起决定性作用。水压是导致底板突水的力源,而底板隔水层则对底板突水起抑制作用,隔水层越厚,抑制突水的能力越强。断层与裂隙是底板突水的主要充水通道,断层落差越大的地点越容易发生煤层底板突水,而陷落柱等地质构造与裂隙发育都有可能形成突水通道,加大突水概率。采高和煤层倾角均会影响矿井的充水强度,当煤层倾角和采高较大时会增加地下地层的压力,减小隔水层厚度,增大突水概率,此外煤层开采后的垮落高度也会较大,塌陷及裂隙可能沟通含水层,从而造成突水。因此,在构建突水预测模型时,可以针对不同矿井的实际情况进行分析,选择合适的影响因素,对模型的输入特征进行调整。

图1 基于IWOA-SVM的煤矿突水预测流程Fig.1 Water inrush prediction flow based on IWOA-SVM

本文收集整理了华北典型矿区的实测突水资料,根据华北典型矿区水文地质特征,将水压z1、隔水层厚度z2、煤层倾角z3、断层落差z4、断层距工作面距离z5、采高z6共6个影响因素作为预测模型的输入特征。从突水资料中选取55条数据构建数据样本集,其中43个样本作为训练样本,其余12个样本作为测试样本。

原始数据还存在各属性参数的量纲和数量级不同的问题,如水压的单位为帕(Pa),煤矿底板隔水层厚度的单位为米(m),不同的量纲和数量级都会影响预测结果的准确性。为了消除量纲和数量级不同的影响,在进行预测之前,先对数据集进行归一化处理,将样本的特征值转换到[0,1]区间中,具体公式为

(12)

式中:z*为归一化后的参数;z为原始参数;zmax,zmin为样本数据中的最大值和最小值。

归一化处理后的部分突水数据见表1,其中突水状态中1表示突水,0表示不突水。

表1 归一化处理后的部分突水数据Table 1 Partial water inrush data after normalization

3.2 参数确定

使用Python实现IWOA对SVM模型的参数寻优。将标准误差作为模型的评价指标,同时,通过对比PSO算法、DE算法、WOA、IWOA的寻优结果,评估IWOA的整体性能。

基于公平性原则,设置算法的种群大小均为35,最大迭代次数均为100,每个种群个体均是由SVM的参数c和σ构成的二维向量,参数范围均为[0.01,100]。4种算法的寻优结果见表2,收敛曲线如图2所示。

表2 4种算法的寻优结果Table 2 Optimizing results of four algorithms

分析表2结果可知,IWOA对训练集的预测准确率为88.37%,PSO算法的准确率为60.47%,DE算法的准确率为83.72%,WOA的预测准确率为81.39%。相比于PSO,DE,WOA,本文提出的IWOA的预测准确率最高,标准误差也最小,说明其收敛精度高,并且稳定性更强,鲁棒性好。由图2可以直观地看出,IWOA在寻优过程中迭代到第8次时标准误差已经收敛到最小值,PSO算法在迭代到100次时仍未收敛到最小值,而DE算法、WOA分别迭代到29次及43次时才收敛到最小值,说明IWOA的寻优能力更强且收敛速度更快。

图2 4种算法的收敛曲线Fig.2 Convergence curves of four algorithms

使用IWOA对SVM模型的参数进行寻优,最终确定基于IWOA-SVM的煤矿突水预测模型的2个参数分别为c=6.517,σ=0.418。

3.3 突水预测结果

煤矿突水预测是一个二分类问题,本文使用预测准确率作为评价指标,预测准确率越接近1,表明突水预测模型的预测结果越准确。

使用IWOA计算出的最优惩罚因子和核函数宽度参数构建SVM模型,对测试样本进行预测,模型预测结果与实际结果如图3所示。可以看出,基于IWOA-SVM的模型对12个测试样本的预测结果与实际突水结果均重叠。

图3 IWOA-SVM预测结果Fig.3 IWOA-SVM prediction results

为了验证本文所提算法应用于煤矿突水预测时的准确性,在相同的数据集和实验条件下,使用传统的突水系数法、SVM、WOA-SVM及IWOA-SVM分别进行煤矿突水预测,并对预测结果进行比较,见表3。

从表3可以看出,传统突水系数法、SVM及WOA-SVM在突水测试集上的预测准确率分别为75%、83.33%和91.67%,而本文提出的IWOA-SVM在是否突水这一分类问题上的预测准确率达到100%,预测结果与实际结果相符。

分析IWOA-SVM算法的特性,IWOA在寻优前期的全局搜索能力强、在迭代后期的局部搜索能力强这一特质能够加快IWOA在搜索SVM模型最优参数时的收敛速度,每个鲸鱼拥有的交叉、变异、选择能力增强了IWOA的全局搜索能力,避免了其在寻优过程中过早陷入局部最优,这是WOA-SVM无法做到的。因此,IWOA-SVM模型在煤矿突水预测中表现出更高的准确率和稳定性。

4 结论

(1) IWOA引入非线性思想优化调节因子,利用混沌映射和差分进化的思想优化鲸鱼种群,从而提高传统WOA的全局搜索能力及收敛速度。

(2) 根据煤矿突水数据小样本、非线性的特征,选取SVM模型进行突水预测。为了确定SVM的最优参数,有效提高预测精度和速度,基于IWOA对其进行参数寻优。

(3) 实验结果表明:与PSO算法、DE算法、WOA相比,IWOA的预测准确率最高,标准误差最小,且收敛速度快,鲁棒性好;IWOA-SVM的预测准确率达到100%,与传统的突水系数法、SVM、WOA-SVM相比,IWOA-SVM表现出更高的准确率和稳定性。

猜你喜欢
突水鲸鱼准确率
小鲸鱼
基于多变量的太灰含水层突水风险性分类判别研究
深部开采底板突水危险评价的应用研究
矿井突水水源的判别方法
峰峰矿区突水类型划分及突水模式
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
迷途鲸鱼