中国火灾损失的聚类分析

2008-01-22 08:34
总裁 2008年8期
关键词:聚类分析

臧 鹏

摘要:采用聚类的方法将中国31个省和地区的火灾数据按火灾损失聚成了3类,得出结论:同一类地区的火灾内部特性相对接近,不同类的地区之间差异较大。通过研究客观发生的、大量的火灾现象的数量,以及与火灾损失相关的因素分析来揭示出火灾产生、发展、和变化规律及其本质特征,进而正确地认识火灾规律,提出各地区对火灾预防与管理的建议,制定消防法律和对策,进行科学的消防管理。

关键词:聚类分析;火灾损失;K均值

聚类分析是人们用多元统计分析的技术进行分类的一种方法,是将一批样品或变量,按照他们在性质上的亲疏程度进行分类。火灾的发生造成了国民的重大生命财产损失。如何防止火灾,减少生命损失和财产损失受到全国的关注。针对此种情况,笔者通过对中国3l省(市、自治区)2005年由火灾造成的生命、财产损失进行聚类,提出合理的建议以指导宏观的火灾防治。

1参数选择及数据处理方法

1.1参数选取及数据来源

根据参数选择考虑5个方面的属性:火灾起数,死人数,伤人数,经济损失,火灾发生率,本文采用2005年的数据。研究地区为我国大陆31个省(市、自治区)。原始数据来源为《2006中国社会》统计年鉴——各地区存在事故情况(2005年)(国家统计局社会和科技统计司编)。

1.2数据处理方法

采用聚类分析的K均值法。K均值法是麦克奎因(Macqueen)于1967年提出,其思想是把每个样品聚集到其最近形心(均值)类中去。其基本步骤为:

(1)选择k个样品作为初始凝聚点,或者将所有样品分成k个初始类,然后将这k个类的重心作为初始凝聚点。

(2)对除凝聚点之外的所有样品逐个归类,将每个样品归人到凝聚点离它最近的那个类(通常采用欧氏距离),该类的凝聚点更新为这一类目前的均值,直至所有样品都归了类。

(3)重复步骤(2),直至所有的样品都不能再分配为止。

2分析结果

2.1火灾损失聚类

在SPSS软件中选择Analyze—Classify—K-MeansCluster命令,进入K-均值聚类对话框。通过聚类分析,聚为3类。

2.2输出结果分析

通过以上数据可知,火灾区可分为这样三类:(1)辽宁省,吉林省,黑龙江省,江苏省,山东省,广东省);(2)天津市,山西省,内蒙古,广西省,海南省,贵州省,云南省,西藏区,甘肃省,青海省,宁夏区);(3)北京市,河北省,上海市,浙江省,安徽省,福建省,江西省,河南省,湖北省,湖南省,重庆市,四川省,陕西省,新疆区)。

对聚类结果从经济情况、人口数量、消防投入、地理位置四个方面分析可知:

一类省市:此类区域是火灾发生数量、死亡人数、经济损失最高的区域。这些地区都是人口大省,经济相对发达。其中,广东省工业发达,虽然消防的投入较高,但外来务工人员较多,管理难度大,发生火灾概率高,火灾损失必然较大;东北三省处于林区,北方干旱,易发生火灾;

二类省市:此类区域是火灾发生数量、死亡人数、经济损失最小的区域。这些区域经济发展水平相对低,人口相对少,易于管理。

三类省市:此类区域人口较多,经济发达,火灾发生数量、死亡人数、经济损失相对较小。这些地区中大多省份处于雨水充足的南方地区,所以火灾发生的概率较低。其中北京、上海等地区是因为经济发展水平高,有较大的消防投入。

3建议

通过火灾损失和经济发展水平、消防投入以及自然因素等方面的分析,量化了不同地区的火灾损失水平,揭示了三者之间的内在联系。由此建议相关部门:

(1)对人口多的地区加强相关防火教育和火灾处理知识的宣传,林区、干旱系数大的区域应加大预防力度,加强火灾隐患的检查和排除;

(2)进一步研究地区经济发展和消防投入的关系,使生产总值会和火灾损失成为负相关;使火灾风险和投入匹配最合理;

(3)促进各地区火灾控制经验的交流,提出有各地方特色的火灾预防、处理措施。

猜你喜欢
聚类分析
基于谱聚类算法的音频聚类研究
基于Weka的江苏13个地级市温度聚类分析
我国中部地区农村居民消费行为阶段特征分析
基于聚类分析的无须人工干预的中文碎纸片自动拼接
浅析聚类分析在郫县烟草卷烟营销方面的应用
农村居民家庭人均生活消费支出分析
基于省会城市经济发展程度的实证分析
基于聚类分析的互联网广告投放研究
“县级供电企业生产经营统计一套”表辅助决策模式研究