应用多指标体系构建城乡分级公里格网模型

2015-02-18 07:55于德龙孙柏涛闫培雷
哈尔滨工程大学学报 2015年12期
关键词:聚类分析

于德龙 , 孙柏涛 , 闫培雷

(1.哈尔滨工程大学 航天与建筑工程学院 黑龙江 哈尔滨 150001; 2.中国地震局工程力学研究所 中国地震局地震工程与工程震动重点实验室, 黑龙江 哈尔滨 150080)

应用多指标体系构建城乡分级公里格网模型

于德龙1, 孙柏涛2, 闫培雷2

(1.哈尔滨工程大学 航天与建筑工程学院 黑龙江 哈尔滨 150001; 2.中国地震局工程力学研究所 中国地震局地震工程与工程震动重点实验室, 黑龙江 哈尔滨 150080)

摘要:为了反应城乡承灾体在自然灾害发生过程中的级别与空间的差异,本文构建了城乡分级公里格网模型。基于影响承灾体的多种因素,构建了服务于城乡分级模型的多指标体系。基于多指标体系,利用聚类分析的方法,划定城乡不同级别之间的界线,实现城乡分级的公里格网空间化。针对黑龙江省城乡分级结果进行了相应的统计学分析,验证了其合理性。与此同时,将遥感地图与分级结果对比分析,进一步保证了结果的精确性。本文所得到的城乡分级模型,有助于快速准确地实现灾前的预测评估、灾时的快速救援和灾后的损失评估。

关键词:城乡分级模型;多指标体系;聚类分析;公里格网;遥感地图

网络出版地址:http://www.cnki.net/kcms/detail/23.1390.u.20151116.1558.004.html

孙柏涛(1961-),男,研究员.

我国是世界上自然灾害最严重的少数国家之一,气象灾害、地震灾害、地质灾害、海洋灾害来临都会造成大量的人员伤亡和巨大的财产损失。随着近年来我国经济的高速发展,城镇化进程的加快,导致了不同区域承灾体的发展程度的不平衡,使得政府和科研人员在制定防灾减灾规划、预测区域灾害损失和灾区现场调查过程中不得不将城镇和乡村分级别精细化对待。与此同时,自然灾害的发生必然伴有空间分布的特性,需要在城乡内部进行公里格网空间化研究。国内外近几十年非常重视自然灾害等突发事件的应急和处理机制,并对灾害前后的土木工程破坏、人员伤亡和经济损失评估开展了大量研究。从20世纪90年代开始,美国联邦应急管理署(FEMA)基于GIS技术软件,先后研发了HAZUS-MH系统[1],为各级政府应对灾情提供依据。中国台湾在HAZUS的基础上,研发了地震损失评估系统HAZ-Taiwan,用于地震灾害相关方面的评估[2]。孙柏涛等开发了HAZ-China地震灾害损失评估系统,为中国城市震灾防御、地震应急救和建筑物损失评估等工作提供了重要的工具[3]。

由于地震灾害的发生具有空间性,造成的人员伤亡、经济损失随着区域社会属性的变化而变化。但到目前为止,各国学者并未开展灾害区域的城乡分级方面的研究。本文基于GIS技术,综合考虑区域的不同指标以实现灾害区域的城乡分级。

1构思框架

1)基于已获得的数据源,构建多指标体系。在ArcGIS 10.2中将人口分布数据、GDP分布数据、土地利用类型数据统一到WGS-84坐标系下,并通过空间数据连接,得到同时含有上述属性的基本数据。

2)选取控制指标,以合理区分城区与非城区,将基本数据划分成2类,分别为城镇城区和非城镇城区。

3)基于多指标体系,采用K-均值聚类分析的方法,分别对2组数据进行分类。

4)基于海量数据样本,通过统计学分析方法,筛选合理数据范围,去除异常数据。同时,利用遥感地图进一步验证分级模型的精度。整体研究思路如图1所示。

图1 整体构思框架Fig.1 The whole research thought

2建立城乡分级模型

由于我国幅员辽阔,导致公里格网数据量庞大。以黑龙江省为例,处理后用于研究的数据就有78万条之多。基于海量数据的分析存在一定的难度,需要针对不同数据进行相应的预处理,统一其坐标系,为后续研究提供便利。

2.1 数据源及预处理

研究所采用的数据主要包括:1)2000年全国人口数量分布公里网格数据;2)2000年全国GDP产值分布公里格网数据;3)2000年1∶10万土地利用公里格网数据,采用其中城镇建设用地及农村建设用地数据。

对数据源进行预处理,以便基于海量数据建立城乡分级模型。以黑龙江省为例,统一到WGS-84坐标系,并通过空间连接处理后的数据,如表1所示。

表1 预处理后基本数据Table 1 The basic data after pretreatment

2.2 多指标体系下城乡分级方法

根据城乡承灾体的差异,在进行城乡分级时,主要考虑社会经济因素和土地利用因素。选取了人口数量、GDP产值和土地利用类型3个指标,构建城乡分级的多指标评价体系。其中,土地利用类型直接反映了城镇城区和非城镇城区的不同,将其作为控制指标,对基础数据进行初始分类。初始分类后的数据为I类-城镇城区、II类-非城镇城区。在初始分类的基础上,基于人口数量、GDP产值、城镇建设用地面积以及农村建设用地面积,分别针对I类和II类进行K-均值聚类分析,建立城乡分级模型。具体分级结果如图2所示。

图2 黑龙江省城乡分级结果Fig.2 Classification results between urban and rural areas in Heilongjiang

基于上述分级方法,针对黑龙江省的具体情况以及分级过程中得出的结果,将黑龙江省分为9级。其中,由于大庆市城区与其产油地区相重叠,导致其GDP产值较高,所以本文单独将其作为一个级别列出。具体分级情况如表2所示。

表2 黑龙江省具体分级情况Table 2 Specific classification in Heilongjiang province

3结果分析及精度验证

根据上述城乡分级模型,对已分级数据进行提取,利用统计学方法进行分析。确定不同级别中相应指标的合理区间,以剔除异常数据点以及间接验证分级模型的合理性。

3.1 分级数据统计学分析

采用描述性统计学分析的方法,提取能够反映不同分级结果中集中趋势、离散趋势和分布情况的统计量,来分别对同一级别和不同级别进行横向分析和纵向比较,保证数据的合理可靠。具体分析过程如下:1)对同一级别内数据进行横向分析时,以副省级市城区(哈尔滨市城区)为例,计算相应的统计学指标,如表3所示。再分别对不同参考因素绘制对应的频率分布直方图,以便于直观的观察(如图3~6所示)。按照上述方法,分别对所有级别内数据进行分析。2)根据横向分析结果,判断不同级别的集中趋势,以进行纵向比较,如表4所示。其中,频率分布直方图是将数据连续取值作为横坐标,按照数据的最小值和最大值进行分组,并确定组距以确定落在各组中的频数,频数除以样本总数为频率,纵坐标表示频率除以组距。

图3 人口数量频率分布直方图Fig.3 Histogram frequency distribution diagram of population

图4 GDP产值频率分布直方图Fig.4 Histogram frequency distribution diagram of GDP

图5 城镇建设用地面积频率分布直方图Fig.5 Histogram frequency distribution diagram of the area of urban construction

图6 农村建设用地面积频率分布直方图Fig.6 Histogram frequency distribution diagram of the area of rural construction

表3 副省级市城区(哈尔滨市城区)统计指标Table 3 Statistical indicators of vice-provincial city urban area (city zone of Harbin)

表4 不同分级各指标均值纵向比较Table 4 Different grading index average each longitudinal comparison

基于横向分析,剔除分级结果中的数据异常点。根据纵向比较结果,说明不同级别之间,各指标变化趋势基本符合实际情况,间接证明了城乡分级模型的合理性。

3.2 基于遥感地图的模型精度验证

通过对海量数据的统计学分析,初步验证了城乡分级模型的合理性。为了使模型更具有现实意义,还需要将分级结果与实际遥感地图(如图7所示)相对应,已验证不同级别所包含区域的合理性。本文分别对哈尔滨市周边地区、大庆市周边地区、部分地级市以及部分县(县级市)等所属级别包含区域进行了验证(如图8~10所示)。

图7 黑龙江省遥感地图Fig.7 Remote sensing maps of Heilongjiang province

图8 黑龙江省城乡分级与遥感地图对比图Fig.8 Urban and rural areas in Heilongjiang province classification with remote sensing map

图9 哈尔滨市周边地区Fig.9 Surrounding area in Harbin

图10 大庆市周边地区Fig.10 Surrounding area in Daqing

4结论

为得到具有一定合理性及精度的城乡分级模型,在已有公里格网数据的基础上,基于多指标体系,采用K-均值聚类分析的方法,建立了黑龙江省城乡分级模型。主要结论:

1)综合考虑在自然灾害发生过程中,影响承载体的多种因素,构建多指标体系。采用K-均值聚类分析方法,对多指标体系下的海量数据进行分级,建立城乡分级模型的方法是可行的。

2)基于城乡分级模型,采用统计学分析方法,对数据进行横向分析与纵向比较,筛选合理数据及剔除异常数据,为下一步确定城乡分级标准提供数据基础。

3)通过统计学分析以及遥感地图,对模型做了进一步的验证。说明模型的精度是有保证的,并且与实际情况基本吻合,可以服务于自然灾害过程中的经济损失评估等民生科研工程。

在研究过程中考虑了多种因素,如人口数量、土地利用情况、GDP产值等多源数据,但由于影响城乡差异和承载体差异的因素复杂。因此,城乡分级模型的精度有待进一步提升,以更符合实际情况。

参考文献:

[1]FEMA. Multi-hazard loss estimation methodology-earthquake model HAZUS-MH MR4 technical manual[R]. Washington, DC: Federal Emergency Management Agency, 2003.

[2]YEH C H, LOH C H, TSAI K C. Overview of Taiwan earthquake loss estimation system[J]. Natural Hazards, 2006, 37(1/2): 23-37.

[3]陈洪富, 孙柏涛, 陈相兆, 等. HAZ-China地震灾害损失评估系统研究[J]. 土木工程学报, 2013, 46(S2): 294-300.CHEN Hongfu, SUN Baitao, CHEN Xiangzhao, et al. HAZ-China earthquake disaster loss estimation system[J]. China Civil Engineering Journal, 2013, 46(S2): 294-300.

[4]齐文华, 苏桂武, 张素灵, 等. 城市化过程中房屋地震灾害脆弱性和损失风险变化研究——以唐山市区及城乡过渡乡镇为例[J]. 地震地质, 2012, 34(4): 820-834.QI Wenhua, SU Guiwu, ZHANG Suling, et al. Study on the changes of vulnerability and loss risk of buildings from seismic disaster in the process of urbanization——a case study of Tangshan area[J]. Seismology and Geology, 2012, 34(4): 820-834.

[5]NESBIT S, STANO J, ATWATER J W, et al. Cascading water: combining GIS and system analysis to maximize water reuse[J]. Canadian Journal of Civil Engineering, 2012, 39(12): 1321-1327.

[6]KANCHANABHAN T E, MOHAIDEEN J A. Using GIS in solid waste management planning for tambaram municipality in Southhennai[J]. Journal of the Institution of Engineers, 2010, 3: 37-44.

[7]张新秀, 程耀东, 张志华. 基于GIS的城区急救中心空间分布合理性评价研究[J]. 应用科技, 2014, 41(1): 43-47.ZHANG Xinxiu, CHENG Yaodong, ZHANG Zhihua. GIS-based spatial distribution rationality evaluation of city emergency centers[J]. Applied Science and Technology, 2014, 41(1): 43-47.

[8]ALEXANDER J, MERCKEL J, UPTHEGROVE K, et al. Mobile GIS technologies[C]//Computing in Civil Engineering. New York, USA, 1994: 1623-1630.

[9]熊俊楠, 韦方强, 苏鹏程, 等. 基于多源数据的四川省GDP公里格网化研究[J]. 应用基础与工程科学学报, 2013, 21(2): 317-327.XIONG Junnan, WEI Fangqiang, SU Chengpeng, et al. Research on GDP spatialization approach of Sichuan province supported by multi-source data[J]. Journal of Basic Science and Engineering, 2013, 21(2): 317-327.

[10]KOZAKO M, OHTSUKA S, KANEKO S, et al. Development of identification system for location of a free metallic particle in GIS based on analysis of lamb waves[J]. IEEJ Transactions on Power and Energy, 2007, 127(2): 389-396.

[11]CAMP C V, BROWN M C. GIS procedure for developing three-dimensional subsurface profile[J]. Journal of Computing in Civil Engineering, 1993, 7(3): 296-309.

[12]杨晓峰, 李伟, 孙明明, 等. 基于文本聚类的网络攻击检测方法[J]. 智能系统学报, 2014, 9(1): 40-46.YANG Xiaofeng, LI Wei, SUN Mingming, et al. Web attack detection method on the basis of text clustering[J]. CAAI Transactions on Intelligent Systems, 2014, 9(1): 40-46.

Use of a multi-indicator system to construct

kilometer grid-based urban and rural classification model

YU Delong1, SUN Baitao2, YAN Peilei2

(1.College of Aerospace and Civil Engineering, Harbin Engineering University, Harbin 150001, China; 2. Key Laboratory of

Earthquake Engineering and Engineering Vibration, Institute of Engineering Mechanics, China Earthquake Administration, Harbin 150080, China)

Abstract:In order to reflect the difference in level and space of hazard affected body in urban and rural zones during the occurring of natural disaster, this paper constructs a urban and rural classification kilometer grid model. Based on various factors influencing the hazard affected body, a multi-index system forming a hierarchical model of urban and rural zones was built. Using the method of cluster analysis based on index system, boundary lines between different levels of urban and rural areas were drawn and a kilometer grid-based urban and rural classification was implemented. Using the classification results for Heilongjiang Province, a statistical analysis was conducted for verification. At the same time, a remote sensing map and the classification results were compared to further ensure accuracy of the results. The urban and rural classification model given in this paper helps to accurately implement predictive evaluation before disasters, rapid rescue during disasters, and loss evaluation after disasters.

Keywords:urban and rural classification model; multi-indicator system; clustering analysis; kilometer grid; remote sensing maps

通信作者:于德龙,E-mail:yudelong99@hotmail.com.

作者简介:于德龙(1988-), 男, 博士研究生;

基金项目:国家科技支撑计划课题资助项目(2015BAK17B06);地震行业科研专项基金资助项目(201508026) .

收稿日期:2015-07-22.网络出版日期:2015-11-16.

中图分类号:X43; P954;P208

文献标志码:A

文章编号:1006-7043(2015)12-1584-07

doi:10.11990/jheu.201507070

猜你喜欢
聚类分析
基于谱聚类算法的音频聚类研究
基于Weka的江苏13个地级市温度聚类分析
我国中部地区农村居民消费行为阶段特征分析
基于聚类分析的无须人工干预的中文碎纸片自动拼接
浅析聚类分析在郫县烟草卷烟营销方面的应用
农村居民家庭人均生活消费支出分析
基于省会城市经济发展程度的实证分析
基于聚类分析的互联网广告投放研究
“县级供电企业生产经营统计一套”表辅助决策模式研究