基于PCA-Logistic 回归模型的矿井底板突水危险性研究

2023-10-26 07:49熊欣标谢雄刚杨培君杨枝城梁海彬
煤矿安全 2023年10期
关键词:隔水层突水矿井

熊欣标 ,谢雄刚 ,杨培君 ,杨 进 ,杨枝城 ,梁海彬

(贵州大学 矿业学院,贵州 贵阳 550025)

矿井突水属于煤矿5 大灾害之一,是煤矿安全生产中必须解决的问题。众多国内外学者对底板突水进行了大量研究,并取得许多优秀成果[1]。随着科学技术的不断提高,煤矿逐渐实现综合机械化开采,其开釆深度也不断加深,随之而来的底板突水问题也愈加明显,给煤矿安全生产带来更加严重的威胁[2]。苏联学者SLESAREV 将煤层底板抽象为受均载荷作用且两端固定的梁,基于静力学原理进一步得出煤层底板突水的安全水压公式[1];DUSAN Kuscer[3]通过分析大量煤矿底板突水事故,阐明了煤矿突水前后水文地质及地下水的变化特征;潘元伯[4]对斯列萨列夫公式进行了理论推导,证明了其为理论公式而非经验公式;靳德武等[5]分析了底板突水机理,认为矿井突水是底板岩石的裂隙在经过一段时间的发展进而引起其地质环境发生的随机性突变;高延法等[6]采用统计法探讨了底板破坏的微观机理,从而更好地研究突水的宏观规律;尹会永等[7]在流变理论基础上,适当考虑了时间效应和蠕变机理,分析了煤层底板裂隙发展的断裂力学;刘伟韬等[8]将主成分分析法与熵权法相结合,以GIS 地理信息处理技术为基础,建立新的突水危险性评价模型;王进尚等[9]利用突水系数法和底板破坏与递进导升协同突水法验证了新安煤矿发生突水后底板突水危险性,证实了底板破坏与递进导升协同突水危险性预测方法的可靠性;韦韬等[10]将基于突变模型的煤层底板突水危险性评价结果与传统突水系数法的评价结果进行对比,结果表明突变模型的评价结果更加准确;廖志恒[11]将云模型与D-S 理论相结合,构建了煤矿突水危险性综合评价指标体系,并将其运用到南山煤矿突水危险评价中,得到了较为精确的评价结果;王心义等[12]将改进层次分析法与模糊可变集理论相融合,为矿井底板突水危险性可靠评价提供了理论支持。综上,以隔水层厚度、承压水水压、断层落差、断层距工作面距离、煤层采高、煤层倾角6 个条件作为研究矿井底板突水的初始影响指标,引入PCA-Logistic 回归模型来评估矿井底板突水危险性,研究成果对制定煤矿底板突水的防治措施具有一定的指导意义。

1 研究方法

1.1 主成分分析法

主成分分析法(PCA)的主要是使用降维的思想将多个指标简化成几个不相关的综合指标[13]。PCA 的基本原理为:假设有1 组数据包含N个样本,而每个样本中又有P个指标,之后将其构成N×P阶 的数据矩阵X如式(1):

式中:Xnp为第n个样本中的第p个指标,0

倘若某一问题有P个指标, 分别用X1、X2、···、XP表示,这些指标构成P维随机向量,即X=(X1,X2,···,XP), 随机变量X的均值为 µ,协方差矩阵为 Σ。对X进行线性变换得到新变量F=(F1,F2,···,FP)如式(2):

式中:Fi为 主成分表达式;F1为第1 主成分;F2为 第2 主成分;Fp为 第P主成分;aij为各指标的系数;0

经上述分析可知:确定主成分就是找到原来变量Xj(j=1,2,···,P)在 各个主成分Yi(i=1,2,···,m)上的载荷,容易发现它们分别是X1、X2、···、XP的相关矩阵的m个较大的特征值所对应的特征向量。

煤层底板影响因素:N个样本数据,P个变量包含各种影响因素指标X1、X2、···、XP(N>P),进而形成一个矩阵如式(3):

在正常情况下,不同影响因子之间存在不同维度,有些指标数的幅度差异较大,在用PCA 进行研究分析时,量纲及数量级的不同会造成结果出现新的问题。为了消除它们带来的不利的影响,在分析之前,数据首先应当无量纲化。

各个变量之间的关系应满足PCA 基本原理介绍中提到的基本条件。

1.2 Logistic 回归方法

Logistic 回归可以看作1 种广义线性回归,其模型形式是 (w×x+b) , 其中:w、b为待求参数;通过函数L使(w×x+b)对 应1 个隐函数S,其中S=L(w×x+b), 然后根据S与( 1-S)的大小来确定因变量的值。如果函数L是Logistic 函数,在进行Logistic 回归分析时因变量既可以看作2 类,也可以看作多个类别。根据研究内容及目的,只需建立二元Logistic 回归模型即可。

矿井底板突水是1 种二分类变量,故取1 或0 这2 个值。其中1 为矿井底板发生了突水,0 为矿井底板未发生突水,采用Logistic 回归模型对该二元变量进行回归分析。

式中:m(m>0)为影响地板突水的因素数量;β0为与诸因素xi无 关的常数项; β1、 β2、···、βm为回归系数,是诸因素Xi(1

如果Q=1-S,则:

2 底板突水影响因素

2.1 隔水层厚度和承压水水压

匈牙利韦格弗伦斯曾指出:煤层底板突水不仅与隔水层厚度有关,而且还与水压力有关[14-15]。由“下三带”的理论分析可知,底板隔水层的厚度不包括底板采动断裂带的厚度,其主要是指采动断裂带之下能够抵抗突水的完整岩层带[16]。隔水层是底板突水的抑制条件,主要起到防止底板水突出进入工作面的作用,是阻碍底板突水的最基本条件之一,其抑制能力与隔水层厚度及其强度的组合关系成正相关[17];承压含水层是突水的物质条件基础,水压是底板的突水动力来源[14];在其他条件一定时,承压含水层水压作为影响矿井突水危险性的重要因素,与矿井底板突水危险性存在着正相关的关系。

2.2 煤层采高和煤层倾角

煤层采高是指工作面在实际开采过程中采煤机的实际开采高度,其一般由煤层厚度、采煤工艺等方面因素决定。煤层倾角指的是煤层与水平面的水平夹角,决定了采掘空间与含水层、隔水层、地质构造的空间位置关系[18];煤层采高和煤层倾角都属于煤矿工作面煤层地质信息,当采煤方法一定时,开采空间本身的基本特征决定底板是否会发生突水[19-20]。因此,煤层采高与煤层倾角都是开采空间自身特征的体现,在一定程度上能影响底板发生突水的可能性。

2.3 断层落差和断层距工作面距离

断层是指在地质构造力作用下地质中岩层受到力的作用超过岩石的承受能力时,岩层发生破裂并沿着破裂面发生明显位移的情况。有关研究表明:当水压、矿压和隔水层的稳定性处于相对平衡状态时,断层起一定的控制作用[17];其控制作用主要表现在断层与含水层、隔水层、地质构造及矿山压力等几个方面的相互影响[16]。断层落差是指断层两盘2 个点之间的铅直距离,断层落差又可称为铅直滑距。断层附近地质情况极其复杂,断层落差又能体现出工作面的地质情况,故断层落差和断层距工作面距离与采煤工艺的选择及矿井底板突水存在一定联系。

3 模型应用

3.1 数据来源

通过对矿井底板突水影响因素分析及相关文献[18]为数据依托,选取隔水层厚度、承压水水压、断层落差、断层距工作面距离、煤层采高、煤层倾角6 个指标来分析矿井底板突水。矿井底板突水样本数据见表1,待检验样本数据见表2。

表1 矿井底板突水样本数据Table 1 Mine floor water inrush samples data

表2 待测样本数据Table 2 Samples data to be tested

3.2 主成分分析

令X1为水压、X2为采高、X3为隔水层厚度、X4为断层落差、X5为煤层倾角、X6为断层距工作面距离,利用SPSS 软件对矿山突水数据样本的6个初始影响指标进行主成分分析。相关矩阵表见表3,总方差解释表见表4。

表3 相关矩阵表Table 3 Correlation matrix table

表4 总方差解释表Table 4 Total variance explained table

由表3 可知:输出原始变量的相关矩阵,水压和隔水层厚度(0.651)、断层落差和断层距工作面距离(0.562)的相关系数较大,可以明显看出这些变量的相关系数有着统计学意义。

由表4 可知:6 个主成分的解释方差贡献率分别 为 30.791%、 28.372%、 20.034%、 11.316%、6.709%、2.118%;前4 个主成分的方差累计贡献率为90.512,超过了85%,因此,只需考虑提取前4 个公因子,即水压、采高、隔水层厚度与断层落差。

3.3 运用SPSS 软件进行Logistic 回归分析

对于样本数据中各个煤矿发生突水的情况,“1”为煤矿发生突水,“0”为煤矿未发生突水,其他的几个变量将由主成分分析后的数据来表示。用SPSS 软件对新的主成分数据样本的4 个初始影响指标进行Logistic 回归分析,模型摘要见表5。

表5 模型摘要Table 5 Model summary

由 表5 可 知:Cox&SnellR2为0.544,NagelkerkeR2为0.728。Cox&SnellR2和NagelkerkeR2是用来检验回归方程拟合度的,其数值大小体现方程对被解释变量变异解释的程度。这2 个统计量中R2越大则说明模型的效果越好。

二元Logistic 回归模型是以0.5 作为切割值的,如果S值大于0.5 则认为发生突水;如果S值小于0.5 则认为未发生突水。分类表见表6。

表6 分类表Table 6 Classification table

由表6 可知:对于9 例未发生突水的数据样本该模型成功预测出8 例,只有1 处出现了误判,正确率达到88.9%;对于11 例发生突水的数据样本该模型成功预测出10 例,只有1 处出现误判,其正确率为90.9%。根据以上分析,可以得出结论,该模型对突水样本的综合预判正确率为90%。因此,可以明确得出该模型可以用来预判矿井底板是否发生突水。

3.4 模型验证

将表2 中待测数据样本进行分析验证,对于华 泰31503 工 作 面,F1、F2、F3、F4为8.707、6.584、1.035、1.727,之后将F1、F2、F3、F4的值进行Logistic 回归计算,计算后可得:S=0.601。

由于0.601 大于0.5,则判断该工作面发生突水;同理,将良庄51302 工作面、潘庄6194 工作面、白庄6902 工作面、华恒61106 工作面代入进行计算分析,分别得出结果为0.942(发生突水)、0.008 9(未发生突水)、0.146(未发生突水)、0.025(未发生突水)。将以上结果汇总,测试结果对比见表7。

表7 测试结果对比Table 7 Comparison of test results

根据对5 组待测样本数据的对比可知:上述5 组预测中只出现了1 组错误,其预测准确率为80%,从而证明了该模型的准确性、可靠性,为矿井突水的判别预测提供了新的思路,具有实际意义。

4 结 语

1)运用主成分分析降维方法,将矿井底板突水危险性的影响因素归纳为水压、采高、隔水层厚度与断层落差。该方法不仅保留了数据的完整性,而且使原先的因素变成了更加清晰的变量。

2)在主成分分析法降维分析的基础上,对数据进行Logistic 回归分析并建立了新的模型。利用新模型对两组样本数据进行分析预判,认为该模型的综合预判准确率达到90%。

3)利用Logistic 回归模型对5 组待测数据进行回判预测准确率达到80%,说明一方法科学可靠,为科学、客观预测煤矿底板突水提供新方法、新思路。

猜你喜欢
隔水层突水矿井
矿井突水水源的判别方法
矿井滞后突水机理探讨
建立三大长效机制 保障矿井长治久安
煤矿矿井技术改造探讨
李雅庄矿滞后突水主控因素分析
西藏阿里结则茶卡湖西隔水层的赋存状态及渗透性研究
大相岭隧道高压突水机理与预测分析
底板隔水层破坏的力学模型及破坏判据
矿井提升自动化改造
临时主要通风机在基建矿井中的研究与应用