船舶工业轻微事故的主成分分析

2014-06-20 05:59冒刘燕
船舶标准化工程师 2014年2期
关键词:特征值贡献率标准化

蔡 平,冒刘燕

(1.江苏海事职业技术学院,南京 211170;2.东南大学交通学院,南京 210096)

0 引言

随着我国船舶工业技术的不断发展,安全管理工作倍受重视,船舶生产中伤亡事故的统计分析工作已成为安全管理的一项基础工作[1]。根据海因里希事故致因理论,事故规律的挖掘是建立在轻微事故的统计分析基础之上的。由于轻微事故的发生具有因果性、随机性和普遍性等特点,事故与事故之间不可避免地会具有某些关联,统计的指标也会存在信息的重叠[2]。如果运用一般的统计方法,这种信息重叠会阻碍我们对事故特征与内在规律的准确认识。主成分分析正是研究如何通过原来变量的少数几个线性组合来解释原来变量绝大多数信息的一种多元统计方法[3]。为了消除信息重叠的影响,本文引入主成分分析法,对船舶生产企业中的轻微事故进行分析,揭示事故之间的内在联系,得到事故特征及其发展规律,为企业的安全生产提供有意义的决策参考。

1 主成分分析法

主成分分析也称主分量分析,是由霍特林(Hoteling)于1933年首先提出的。主成分分析是利用降维的思想,在损失很少信息的前提下,把多个指标转化为几个综合指标的多元统计方法[4]。通常把转化生成的综合指标称为主成分,其中每个主成分都是原始变量的线性组合,并且各个主成分之间互不相关,使得主成分比原始变量具有某些更优越的性能。主成分分析的计算步骤如下:

1)对原始数据进行标准化处理。对于一个样本资料,观测p个变量x1,x2,…,xn,n个样品的数据资料阵为:

为了消除变量之间在数量级或量纲上的不同,对数据进行标准化变换:

2)计算样本相关系数矩阵。

经标准化处理后的数据的相关系数为:

3)求相关系数矩阵特征值和特征向量。由特征方程|λg-R|=0,求出 p 个特征根 λ1,λ2,…,λp,并将其按照从大到小的顺序排列为 λ1≥λ2≥…≥λp≥0。λ是主成分的方差,其大小描述了各个主成分在被评价对象上所起作用的大小[5,6]。

4)选择重要的主成分,并写出主成分表达式。主成分分析可以得到p个主成分,根据各个主成分贡献率ei的大小选取前k个主成分。

贡献率越大,说明该主成分所包含的原始变量的信息越强。k的选取,一般要求累计贡献率达到85%以上。

5)计算主成分。然后对k个主成分进行综合评价,可先求每一个主成分的线性加权,再对k个主成分进行加权求和,得最终评价值。

2 实例分析

2.1 数据收集

收集到某船舶生产企业2012年轻微事故记录,得出事故类型的统计资料,原始数据如表1所示。

2.2 确定主成分

由于事故类型较多,将原始数据中的各类事故分别表示为x1车辆伤害、x2触电、x3高处坠落、x4火灾、x5机械伤害、x6其他爆炸、x7其他伤害、x8起重伤害、x9物体打击、x10中毒和窒息、x11灼烫、x12淹溺。

首先对原始数据做标准化处理,得出标准化后的数据如表2所示。

运用SPSS软件进行主成分分析,计算出相关系数矩阵及特征值如表3和表4所示。

表4中列出了计算之后所有主成分的特征值主成分贡献率及累计贡献率,所有主成分的特征值按照从大到小的顺序排列,可见第一个主成分的特征值为9.285,它解释了总变量的77.373%;第二个主成分的特征值为1.095,它解释了总变量的9.127%。第一主成分和第二主成分的累计贡献率达到86.500,超过了主成分分析法中规定的85%,所以选取第一主成分和第二主成分,并认为它们基本包含了以上12个指标的所有信息。其中,第一个主成分又是最重要的,包含的信息最多,对事故分析影响最大。据此可提取的主成分矩阵如表5所示。

根据主成分计算步骤可得出第一、第二主成分表达式分别如下:表示对原始变量标准化后的变量。

其中,

表1 2012年某高危企业轻微事故统计

表2 标准化数据

表3 相关系数矩阵

表4 特征值与主成分贡献率以及累计贡献率

表5 成份矩阵

2.3 得分计算

将表2中的标准化数据代入主成分表达式中,可以得出12个月的主成分得分,如表6所示。并将这12个月的得分在平面直角坐标系中绘制出来,得到主成分得分二维图,如图1所示。

2.4 事故规律分析

1)从时间上来看。从图1中可以看出,分布在第一象限的是4、5、7三个月,分布在第四象限的是6月份,这四个月的安全事故发生情况在全年来说是最多的,安全状况最差。这跟第一、第四象限的主要特征是第一主成分、占信息总量的比重最大有关。并且5、6、7月份的第一主成分得分最高,说明安全状况最差,建议该企业将这三个月份作为重点安全生产月份来抓。

表6 主成分得分

图1 主成分得分二维图

处于第三象限的2月份,由于其第一主成分得分y1最低,安全情况最好。处于y2轴附近共有9、10、11、12四个月份,这四个月份得分非常接近,说明这四个月安全状况基本一致,并且可以只用第一主成分就可以解释它们的安全状况。

2)从事故类型来看。根据第一主成分表达式,高处坠落、机械伤害、起重伤害和物体打击事故所占权重比例最大,对企业安全影响最为严重。另外,这四类事故之间存在较强的相关性。说明这几类事故的致因之间是有联系的,引发一类事故的原因,在某种情况下也有可能造成另一类事故,因此在制定预防措施时必须综合考虑这种联系。对企业而言,可以将这几类事故的隐患作为重点检查和整治对象,以减少事故发生率,促进安全生产。

3 结论

船舶生产企业轻微事故多,类型复杂,如果只利用简单的数学统计,就会忽略各类事故间的联系和相关性,无法充分认识到事故致因之间的联系,因而无法运用系统的观念对这些数据进行处理。主成分分析在研究复杂问题时就可以只考虑少数几个主成分而不至于损失太多信息,从而更容易抓住主要矛盾,揭示事物内部变量之间的联系和规律性,同时使问题得到简化,提高分析效率。

[1]周明顺. 船舶建造安全概论[M]. 北京: 人民交通出版社, 2011.

[2]李慧敏, 庞奇志, 邹伟霞. 主成分分析法在煤矿事故统计分析中的应用[J]. 安全与环境工程, 2012, 19(3):77-79.

[3]何晓群. 多元统计分析[M]. 北京: 中国人民大学出版社, 2004.

[4]张文彤. SPSS统计分析高级教程[M]. 北京: 高等教育出版社, 2004.

[5]Bilodeau M, Duchesne P. Principal component analysis from the multivariate familial correlation matrix[J].Journal of Multivariate Analysis, 2002, 82(2): 457-470.

[6]王家远, 叶银川. 主成分分析法评价地区建筑业竞争力[J]. 深圳: 深圳大学学报理工版, 2009, 26(1):92-97.

猜你喜欢
特征值贡献率标准化
《大众标准化》2022年征稿启事
利用LMedS算法与特征值法的点云平面拟合方法
标准化简述
单圈图关联矩阵的特征值
一种通用的装备体系贡献率评估框架
迭代方法计算矩阵特征值
党支部基本组织制度标准化“三字诀”工作法
关于装备体系贡献率研究的几点思考
求矩阵特征值的一个简单方法
论汽车维修诊断标准化(上)