安全生产统计分析需要注意的问题

2018-09-12 01:33崔伟杰
安全 2018年9期
关键词:回归方程死亡率重点

崔伟杰

国家安全生产监督管理总局研究中心

安全生产统计分析是安全科学的重要研究内容之一,安全生产统计分析在揭示安全生产规律和指导安全生产实践中发挥重要的作用[1]。目前,各种统计分析方法在安全统计分析工作中得到广泛应用[2],但在实际安全生产统计分析工作中发现,还有一些问题容易被疏忽。因此,本文借助于SPSS软件,通过一些实例来共同探讨安全生产统计分析中的问题。

1 安全生产主要影响因素的选择

以煤矿为例,影响煤矿安全生产的因素有煤炭开采条件、煤炭产量、煤矿机械化程度、煤矿从业人员素质、政府安全监管力度等[3],但这些因素之间往往存在一定相关性,各因素之间的相关性会影响煤矿安全生产主要影响因素的筛选。

问题1:在研究煤矿百万吨死亡率的影响因素时,需要将煤矿百万吨死亡率与各影响因素进行相关性分析,但大多数情况下都是采用一般相关性分析法,只将煤矿百万吨死亡率与各影响因素逐个分析,而忽视各影响因素之间的相关性对结果的影响。

案例1:利用1987~2006年国有重点煤矿的统计数据,见表1,对煤矿百万吨死亡率与煤炭产量分别进行一般相关性和偏相关分析,判断两者之间的关系。

表1 1987~2006年国有重点煤矿部分统计数据

SPSS软件计算得出国有重点煤矿采煤机械化程度与国有重点煤矿煤炭产量的相关系数为0.761,两者之间显著相关。因此,在研究国有重点煤矿百万吨死亡率与国有重点煤矿煤炭产量的关系时,应考虑国有重点煤矿采煤机械化程度对结果的影响。

从国有重点煤矿百万吨死亡率与国有重点煤矿煤炭产量的一般相关分析结果看,两者的相关系数为-0.51,相关性是显著的。但是,把国有重点煤矿采煤机械化程度作为控制变量后,从偏相关分析结果看,两者的相关系数为0.284,其相关性是不显著的。

结论1:在国有重点煤矿采煤机械化程度与煤炭产量显著相关的情况下,通过偏相关分析发现,国有重点煤矿百万吨死亡率与国有重点煤矿煤炭产量之间相关性不显著,因此,国有重点煤矿煤炭产量不是影响国有重点煤矿百万吨死亡率的主要因素。

当安全生产各影响因素之间存在一定的相关性时,采用一般相关分析和偏相关分析可能会得出截然相反的结论[4]。因此,在选择影响安全生产的主要因素时,首先要考虑各因素(自变量)之间的相关性,若各因素之间相关性较强,应采用偏相关分析法研究两者之间的关系。

2 安全生产预测模型建立

建立安全生产预测模型通常需进行以下三个步骤的操作:第一步数据是否满足所选模型的使用条件。第二步建立模型。第三步模型的统计检验。

但在安全生产统计分析工作中,第1和第3个步骤容易被忽视。

2.1 模型的适用性检验

问题2:以煤矿为例,建立ARIMA模型预测煤矿百万吨死亡率时,原始序列经预处理后,可能会变成纯随机性(白噪声)序列[5],不能满足模型使用。

案例2:以2001~2016年全国煤矿百万吨死亡率统计数据(见表2)作为原始序列,检验其进行一阶差分后的序列是否为纯随机性序列。

从图1、2可见,一阶差分序列的自相关和偏自相关图全部都在置信区间内,因此,该序列为纯随机性序列,没有可提取的信息和继续分析的必要,一阶差分后的序列不能满足ARIMA模型的使用条件,一阶差分后的数据不能用来建立模型。

结论2:在建立安全生产预测模型时,一定要对

表2 2001~2016年全国煤矿百万吨死亡率

原始数据或预处理后的数据进行检验,判断选用的数据是否满足所选模型的使用条件,若数据不符合使用条件,就不能用该模型进行数据分析。

图1 一阶差分序列的自相关图

图2 一阶差分序列的偏自相关图

2.2 模型的统计检验

问题3:建立数学模型后,在没有对模型和参数进行统计检验的情况下,直接利用模型进行数据分析和预测,造成结果的不准确。

案例3:利用2001~2016年全国煤矿百万吨死亡率统计数据(见表2),分别借助EXCEL和SPSS软件建立回归方程,并进行对比分析。

表3是借助EXCEL软件得出的三次曲线回归方程基本数据,模型的拟合优度为0.9911,拟合的效果非常好,但是没有使用EXCEL软件对所建模型进行相关统计检验。

表3 煤矿百万吨死亡率三次曲线回归方程基本数据(EXCEL)

表4是借助SPSS软件得出的三次曲线回归方程基本数据,模型的拟合优度、各项系数的结果与使用EXCEL软件得出的结果完全一致,但是使用SPSS软件对所建模型进行相关统计检验后发现,虽然模型通过检验,但是X2和X3的系数未通过检验(Sig.取值>0.05)。因此,即使模型的拟合效果非常好,但是该模型不具有显著的统计学意义,也就不能使用该模型进行数据分析和预测。

表4 煤矿百万吨死亡率三次曲线回归方程基本数据(SPSS)

结论3:建立安全生产预测模型后,一定要对模型进行必要的统计检验(方程和系数的显著性检验、残差检验等),确保所建模型具有统计学意义,保证安全生产数据分析和预测结果的准确性。

3 结束语

安全生产统计分析是综合运用安全科学、系统科学和统计学的原理和方法,对大量安全生产有关的信息资料进行收集、整理、分析、研究,来揭示安全生产的特征和变化规律。统计分析方法的选择和应用是否科学对结论产生至关重要的影响,因此,在今后的安全生产统计分析工作中,应更加注重安全生产统计分析方法选择的科学性和方法应用的严谨性,确保安全生产统计分析的结论能够准确的反映出安全生产问题的本质和一般规律。

猜你喜欢
回归方程死亡率重点
全面的健康生活方式显著降低糖尿病死亡率
走路可以降低死亡率
春季养鸡这样降低死亡率
采用直线回归方程预测桑瘿蚊防治适期
线性回归方程的求解与应用
线性回归方程要点导学
新冠肺炎的死亡率为何难确定?
重点推荐
线性回归方程知识点剖析
这些是今年要重点做的事