基于面向对象的资源3号遥感影像森林分类研究

2016-10-26 08:26董心玉范文义
浙江农林大学学报 2016年5期
关键词:面向对象决策树尺度

董心玉,范文义,田 甜

(东北林业大学 林学院,黑龙江 哈尔滨150040)

基于面向对象的资源3号遥感影像森林分类研究

董心玉,范文义,田甜

(东北林业大学林学院,黑龙江 哈尔滨150040)

森林类型识别技术是遥感分类中的重点和难点,采用面向对象的遥感影像分类方法是实现森林类型分类的新方法。资源3号遥感影像可为森林类型提取提供新方向。以资源3号遥感影像作为基础研究数据,采用面向对象的分类方法,选择分形网络演化法进行多尺度分层分割,并结合典型地物的光谱特征、纹理特征、几何特征以及植被指数,构建了适用于森林类型提取的决策树模型,并与分割尺度不同的支持向量机分类方法进行比较分析。结果表明:多层分割的决策树分类方法分类精度高于单层分割的支持向量机分类方法,分类精度分别提高了6.1% 和12.5%。说明建立多层分割的决策树分类方法适用于森林类型的分类研究。图13表5参15

森林测计学;面向对象;分型网络演化算法;信息提取;决策树模型

森林资源是世界上最重要的资源之一,对生态功能具有不可替代的作用,且在经济、社会和环境的可持续发展中起着重要的调节作用[1]。随着遥感影像空间分辨率的不断提高以及分类方法的不断完善,使高精度的森林类型识别逐渐成为可能。面向对象的分类方法能够充分利用高分辨率遥感影像丰富的形状和纹理信息等多种特征,提高分类精度,从而为遥感图像分类提供了一个新的方向。随着面向对象分类方法的广泛应用,已有学者针对面向对象的方法进行了研究,由于面向对象的方法改变了传统的分类方式,使面向对象的分类方法成为遥感技术创新的热门话题[2]。FROHN等[3]采用面向对象的模糊分类的方法,对美国陆地卫星4~5号专题制图仪(thematic mapper,TM)影像进行分类处理,区分出较大范围的落叶森林覆盖范围。孙晓艳等[4-5]以法国SPOT卫星第5颗卫星获取的遥感影像(SPOT5)数据为基础,结合图像的光谱纹理信息,采用面向对象的方法构建多尺度多层次结构,对毛竹Phyllostachys edulis林信息进行提取,结果证明其方法优于基于像元的分类方法。随后,对SPOT5遥感影像和TM遥感影像进行多源遥感数据整合,采用面向对象的分割方法,找出并确定最佳分割尺度,结果表明分类精度高于其他森林类型分类精度。都金康等[6]采用面向对象的信息提取方法,把SPOT影像中的水体进行剔除,有效地解决了水体和阴影容易混淆的问题,使整体分类精度达到96.4%。温兴平等[7]利用美国陆地探测卫星系统装备的Enhanced Thematic Mapper Plus设备获取遥感影像(ETM+遥感影像)的波段组合数据进行信息提取,并结合决策树分类算法,结果证明分类精度得到了提高。近年来,面向对象的分类方法,主要是采用分形网络演化算法(fractal net evolution approach-FNEA)进行分割,该算法分割稳定,在德国专业软件eCognition上得到了广泛的应用。分形网络演化算法结合地物的光谱特征、形状特征、紧致度、光滑度,将地物分割成不同对象进行分类研究,避免了分类过程中的“椒盐现象”。对于大数据量的影像进行分割时,分割速度较慢,影像整体分割效率低。目前,采用资源3号遥感影像进行面向对象的多尺度分层分割研究较少,且分类方法多采用传统基于像元的分类方法,对于利用信息提取技术构建决策树模型研究森林类型较少[8]。本研究以2012年10月的资源3号卫星遥感数据作为基础,在专业软件eCognition平台上利用分形网络演化算法对图像进行多层分割,结合遥感影像的纹理信息、光谱信息、几何信息等特征,建立多层次结构,并结合决策树的分类方法进行逐级分层分类,希望提高森林类型信息提取的精度。

1 研究区域以及数据预处理

1.1研究区域

本研究以黑龙江省大兴安岭地区塔河县为研究区域。塔河县境内地形复杂,植被类型多,分布着不同植被。塔河县属寒温带大陆性气候。该区域的地理条件和气候条件,使境内林木茂密、树种丰富,森林覆盖率为81%,主要树种有落叶松Larix gmelinii,白桦Betula platyphylla,杨树Populus spp.等10余种。

1.2遥感数据预处理

本研究采用的遥感影像数据为资源3号卫星多光谱影像,分辨率为5.8 m,成像时间为2012年10 月7日。首先,对原始影像数据进行FLAASH大气校正。大气校正的目的是消除大气折射、散射等现象对地物反射的影像,提高地物提取精度。其次,以塔河地区1∶1万地形图为参考,均匀选取20个控制点,采用二次多项式纠正方法,并根据资源3号卫星的特点,结合RPC(rational polynomial coeffi cients,变换系数矩阵)参数,进行正射校正,总RMSE为0.43,投影为WGS84/UTM。最后,将正射校正后的数据与二类数据进行叠加处理,并截取该影像的一部分进行分类处理。

1.3分类系统的制定

本研究区为黑龙江省塔河地区的一部分,研究重点是森林类型的分类。根据黑龙江省森林资源规划设计调查分类系统的技术标准,将塔河地区地物类型分为建设用地、水体、裸地、耕地、灌草地、有林地等六大类别。由于本研究重点为森林类型的识别,根据该区域的树种组成中分析得到,该区域的有林地为落叶松林(落叶松占蓄积65%以上的林分),白桦林(白桦占蓄积65%以上的林分),杨桦林(杨树和桦树Betula sp.共同占蓄积65%以上的林分),阔叶混交林(主要有柳树Salix babylonica,杨树,柞树Xylosma racemosum等),针阔混交林(主要有落叶松、白桦等),针叶混交林(主要有落叶松、樟子松Pinus sylvestris var.mongolica,云杉Picea asperata等)。

2 研究方法

2.1多尺度的分层分割

2.1.1影像分割本研究是基于影像的多尺度分层分割,以得到不同层次上的影像对象。在面向对象的专业软件eCognition平台上进行分形网络演化法分割。该算法是根据影像对象的感兴趣区域,在分割的尺度内,影像分割后的大尺度和小尺度对象可同时存在并形成一个有层次的多尺度影像对象等级网络。在分割中,同时要考虑影像的光谱特征、形状特征和空间特征,并遵循异质性最小的原则[9]。其中,异质性度量准则的计算公式为:

式(1)和式(2)中:F代表异质性准则,ω1表示颜色和形状的权重,h1和h2分别代表颜色差异性度量和形状差异性度量,其中h2形状差异性度量又分为平滑度h3和紧致度h4,ω2表示平滑度和紧致度的权重值,平滑度表示的是合并后区域边界的光滑程度,而紧致度是为了保证合并后区域更加紧凑,它们各占有一个权值构成了形状差异性度量。由此可见,多层多尺度的分割不但可以针对不同地物进行不同尺度的分割,而且还可以结合地物的空间特征和形状特征进行更加准确地分割。同时,结合分类时上下层的关系,上一层为下一层的 “父层”,利用 “父”与 “子”的对象关系特征,在 “父层”的条件下,对“子层”进行更深层次地分割。

2.1.2分割规则在分割的过程中,分割参数选择一般包括尺度、层数的选择、颜色因子、形状因子、光滑度、紧致度等[4]。在本研究中,分割规则的确定主要考虑了以下几个方面:①多层次分割,根据地物的光谱特点、几何形状、拓扑特征来确定设置的每层的规则。②根据 “父层”与 “子层”的关系,由“子层”继承 “父层”,并且增加 “子层”自己的特征。根据以上分割规则,经过多次试验,对影像进行实用性的分割。层1进行水体分割,分割尺度不宜过大,以免造成地物破碎,故分割尺度为90;层2主要区分建设用地、裸地、耕地、灌草地、林地,因建设用地、耕地有一定的形状特征,故结合地物的形状特征,有效地将地物分开;层3主要区分林地,根据各个树种所呈现的光谱特征、形状特征、紧致度、平滑度,并与现有地面数据进行比较,有效提取地物。表1为各个层次分割的具体参数。

表1 多层分割尺度参数Table 1 Multilayer segmentation scale parameter

2.2对象的特征选取

分层分割后,利用分割后的对象选取训练样地进行统计分析,根据每个类型的各个特征的差异确定分类特征,为分类做准备。

式(4)中:M(S)表示像素的亮度值,ωkB表示第k个波段所占的权重,即在假彩色合成影像上各个波段所占的比率,ωB表示总权重之和。在加入光谱信息的同时,在第2层分类时,由于考虑到耕地与林地、建设用地与裸地的光谱相似性,故加入形状信息进行区分,分别选取基于形状特征中的面积(area)和不对称性(asymmetry)[10]等信息。

2.2.2植被指数在植被遥感中,归一化植被指数(INDVI)应用最为广泛,是植被生长状态以及植被覆盖的最佳指示因子[11]。其计算公式如下:

式(5)中:ρnir表示近红外光波段反射率;ρred表示红光波段反射率。

2.2.3纹理信息在分类时,由于灌草地、耕地与林地光谱信息比较相似,存在一定程度上的误分现象,故在光谱信息的基础上加入纹理信息。灰度共生矩阵(grey level co-occurrence matrix,GLCM)反映出图像灰度变化的综合信息,以及分析图像的排列规律和局部模式。其中,Homogeneity是GLCM的主要特征之一,表示该区域的同质性,同质性越高,其值越大[12]。根据以上统计分析方法得出所用的分类指标如表2。

表2 分类指标Table 2 Classification index

2.3分类方法

决策树分类算法作为一种新型的分类算法,具有灵活、清晰、高效的运算效率等优点,从而获得广泛的应用[13]。

决策树的分类方法主要可以分为决策树学习和决策树分类这2个方面。决策树的学习过程是利用训练样本进行归纳学习(inductive learning),生成以决策树形式表示的分类规则[14]。决策树分类就是在训练样本进行决策树学习并生成决策树基础上,根据属性的取值对一个未知的样本进行分类[15]。

图1归纳了本研究采用面向对象的方法,包括图像多尺度分层分割、信息提取、决策树分类。

3 结果与分析

3.1图像的分割结果

首先对水体分割,在满足精细的条件下,分割尺度为90,分割出的水体整体性好,且边缘轮廓明显,经过多次试验证明,分割尺度为200的大尺度分割,会造成水体与非水体的混淆;分割尺度为40的小尺度分割,造成地物对象破碎,后续分类结果差,如图2分割尺度分别为200,90,40。其次,对建设用地、裸地、耕地、灌草地、林地进行分割,充分考虑形状特征,在相同分割尺度下,形状特征分别为0.1,0.5(图3);最后,对林地进行单独分割,考虑到树种之间不同的光谱亮度,经过多次分割、分类试验,分割尺度为20时,林地分类效果最好,如图4所示。

3.2对象特征的统计分析

图5为图像分割对象的波段均值,图6为不同对象的亮度值。从图5和图6中可以看出:①虽然不同对象的波段均值不同,但是植被之间的波段均值却较为接近,要进一步对植被进行分类,就要加入更多的特征信息。②不同对象的亮度均值呈现出不同的变化规律,能够区分不同地物。

图7为不同地物对象的INDVI提取值。由图7可知:水体的INDVI值不同于其他地物对象,在进行分类时,引用INDVI值进行区分第1层水体与非水体。在对第2层、第3层地物对象进行分类时,结合其他特征,亦可更好地区分不同地物。

3.3决策树模型的建立

本研究利用专业软件eCognition,根据不同层次的光谱信息、纹理信息、形状信息以及植被指数,采用决策树自动分类方法,得到分类规则,如图8。

3.4分类结果及精度评定

3.4.1分类结果本研究采用面向对象的多尺度多层次分割方法,充分利用地物对象的光谱信息、纹理信息、植被指数等特征,结合地物多层分割(表1)以及决策树分类规则(图8),得到研究区域的分类结果。为了更好地验证本研究方法以及分类精度,把多尺度分层分割的决策树分类方法定为方案1(图9);采用单层分割,分割尺度为40的支持向量机分类方法定义为方案2(图10),分割尺度为20的支持向量机分类方法定义为方案3(图11)。对3种方法进行对比分析。

图1 技术流程图Figure 1 Flow chart of research

图2 分割尺度分别为200,90,40Figure 2 Segmentation sca1e on 200,90,40

3.4.2精度评价本研究采用混淆矩阵的方法对最终分类结果进行精度评价,以二类数据调查(图12)以及外业调查所获得的60个固定样地点建立混淆矩阵,固定样地面积为0.06 hm2·块-1,调查内容主要包括树种组成、林分类型、优势树种组等(图13),通过目视判读,以对象为统计对象,均匀选取459个试验对象样本,用混淆矩阵以及总体精度表示精度评定结果。对方案1和方案2的分类结果进行分析。如表3~4。

图3 分割尺度为40,形状特征分别为0.1和0.5Figure 3 Segmentation scale on 40,shape characteristic on 0.1 and 0.5

图4 分割尺度为20Figure 4 Segmentation scale on 20

图5 波段均值Figure 5 Band average

图6 地物亮度统计Figure 6 Object brightness statistics

表3 方案1分类精度及混淆矩阵Table 3 Classification accuracy and confusion matrix of solution 1

方案1的分类精度达到85.3%,Kappa系数为0.812(表3),方案2的分类精度达到79.2%,Kappa系数为0.766(表4),方案3的分类精度达到72.8%,Kappa系数为0.705(表5),说明采用多层分形网络演化算法进行分割,对光谱特征、纹理特征、几何特征进行计算、统计分析并最终确定分类特征,建立决策树模型进行分类,分类结果高于单层分割的支持向量机分类方法。方案1分类精度高于方案2和方案3的分类精度,说明多层次分割以及对象的植被指数、纹理信息、光谱信息在分类中起着重要的作用。方案1中,第1层分类水体,分类精度比方案2和方案3高,原因是由于方案2和方案3进行单层次分割,分割较为破碎,造成部分水体误分的现象,且在方案1中,根据提取INDVI信息,单独提取水体,能够有效将水体与非水体分开。在第2层处理时,由于充分考虑到分割时的形状特征,并且加入几何信息,所以方案1比方案2分类精度更高,且方案3中,耕地误分现象明显,是由于单层分割尺度不适合耕地分割,而耕地的光谱信息与林地较为接近,所以误分现象高于方案1和方案2。在3层处理中,在方案1中,白桦林和杨桦林存在误分现象,是由于杨桦林所含树种与白桦林相似,且边缘交界不明显,故存在一定的误分现象,但方案1中采用分层分割,剔除了其他地物对林地的影响,且加入光谱、纹理、植被指数等信息,故分类精度高于方案2和方案3。在方案2中,有部分杨桦林、针阔混交林被误分为白桦林,原因可能是3种森林类型光谱信息比较相近,没有纹理信息、植被指数等进行区分,分类效果较差。在方案3中,白桦林精度明显低于其他森林类型,是由于单层分割,分割尺度不适合所有地物,且分割尺度小,亦容易造成林地与非林地之间的混分现象,故分类精度较差。总体来说,方案1的分类精度优于方案2和方案3的分类精度。

图7 归一化植被指数(NDVI)提取值Figure 7 NDVI extracting values

图8 决策树模型Figure 8 Decision tree model

图9 方案1分类结果图Figure 9 Classification results of solution 1

图10 方案2分类结果图Figure 10 Classification results of solution 2

图11 方案3分类结果图Figure 11 Classification results of solution 3

图12 塔河矢量图及小班属性信息Figure 12 Vector map of Tahe and the corresponding attribute table of sub-compartment

图13 精度评价采样点Figure 13 Sampling point for accuracy assessment

表4 方案2分类分类精度及混淆矩阵Table 4 Classification accuracy and confusion matrix of solution 2

表5 方案3分类精度及混淆矩阵Table 5 Classification accuracy and confusion matrix of solution 3

4 结论与讨论

本研究通过对资源3号遥感影像多次分割、分类对比分析,找出最优的分割尺度,并且提取地物对象的光谱信息、植被指数等,结合纹理信息、几何信息,最终构建适合于信息提取的决策树模型。分类结果表明:采用多层次分割的决策树分类方法比单层次分割的支持向量机分类方法精度要高,能够有效区分森林类型,适用于森林类型的提取。

虽然采用面向对象的分类方法,可以大大提高分类精度,但是由于阔叶林间有很大的相似性,分类结果还存在一定的误分现象。若能进一步结合资源3号的立体像对信息,提取数字高程模型(DEM),有可能在一定程度上进一步提高分类精度。

[1]NELSO R,KRABILL W,MacLEAN G,et al.Determining forest canopy characteristics using airborne laster data[J]. Remote Sens Environ,1984,15(3):201-212.

[2]BAATZ M,SCHPE A.Object-oriented and multi-scale image analysis in semantic networks[C]//International Trade Center.Operationalization of Remote Sensing:2nd International Symposium.Netherlands:International Trade Center,1999:16-20.

[3]FROHN R C,CHAUDHARY N.Multi-scale image segmentation and object-oriented processing for land cover classification[J].GISci Remote Sens,2008,45(4):377-391.

[4]孙晓艳,杜华强,韩凝,等.面向对象多尺度分割的SPOT5影像毛竹林专题信息提取[J].林业科学,2013,49(10):80-87. SUN Xiaoyan,DU Huaqiang,HAN Ning,et al.Multi-scale segmentation,object-based extraction of moso bamboo forest from SPOT5 imagery[J].Sci Silv Sin,2013,49(10):80-87.

[5]SUN Xiaoyan,DU Huaqiang,HAN Ning,et al.Synergistic use of Landsat TM and SPOT5 imagery for object-based forest classification[J].J Appl Remote Sens,2014,8(1):83550-83564.

[6]都金康,黄永胜,冯学智,等.SPOT卫星影像的水体提取方法及分类研究[J].遥感学报,2001,5(3):214-219. DU Jinkang,HUANG Yongsheng,FENG Xuezhi,et al.Study on water bodies extraction and classification from SPOT image[J].J Remote Sens,2001,5(3):214-219.

[7]温兴平,胡光道,杨晓峰.基于C5.0决策树分类算法的 ETM+影像信息提取[J].地理与地理信息科学,2007,23(6):26-29. WEN Xingping,HU Guangdao,YANG Xiaofeng.Extracting information from ETM+image using C5.0 decision tree algorithm[J].Geogr Geo-Inf Sci,2007,23(6):26-29.

[8]刘充.基于资源3号卫星遥感影像的城市绿地信息提取方法研究[D].太原:太原理工大学,2014. LIU Chong.The Method of Urban Greenland Information Extraction Based on ZY-3 Remote Sensing Imagery[D]. Taiyuan:Taiyuan University of Technology,2014.

[9]BLASCHKE T,HAY G J.Object-oriented image analysis and scale-space:theory and methods for modeling and evaluating multi-scale landscape structure[J].Int Arch Photogr Remote Sens,2001,34(4):22-29.

[10]FUKUSHIMA S.Division-based analysis of symmetry and its application[J].IEEE Trans Patt Anal Mach Intell,1997,19(2):144-147.

[11]PUREVDORJ T S,TATEISHI R,INHIYARNA T,et al.Relationship between percent vegetation cover and vegetation indices[J].Int J Remote Sens,1998,19(18):3519-3535.

[12]KOSAKA N,AKIYAMA T,TSAI B,et al.Forest type classification using data fusion of multispectral and panchromatic high-resolution satellite imageries[J].Int Geosci Remote Sens Symp,2005,4(5):2980-2983.

[13]陈利,林辉,孙华,等.基于决策树分类的森林信息提取研究[J].中南林业科技大学学报,2013,33(1):46 -51. CHEN Li,LIN Hui,SUN Hua,et al.Studies on information extraction of forest based on decision tree classification [J].J Cent South Univ For Technol,2013,33(1):46-51.

[14]李德仁,王树良,李德毅,等.论空间数据挖掘和知识发现的理论与方法[J].武汉大学学报:信息科学版,2002,27(3):221-233. LI Deren,WANG Shuliang,LI Deyi,et al.Theories and technologies of spatial data mining and knowledge discovery[J].Geom Inf Sci Wuhan Univ,2002,27(3):221-233.

[15]HANSEN M,DUBAYAH R,DeFRIES R,et al.Classification trees:an alternative to traditional land cover classifiers [J].Intl J Remote Sens,1996,17(5):1075-1081.

Object-based forest type classification with ZY-3 remote sensing data

DONG Xinyu,FAN Wenyi,TIAN Tian
(School of Forestry,Northeast Forestry University,Harbin 150040,Heilongjiang,China)

A new method of identification technology for forest types,an important and difficult part of remote sensing classification,uses object-oriented remote sensing image classification.It provides a new direction for forest type to extract which is based on ZY-3 remote sensing data.This study applied ZY-3 remote sensing data to the object-oriented classification method,chose hierarchical segmentation of a fractal network as an evolution method,and combined typical ground objects including spectrum features,texture features,geometrical characteristics,and vegetation indexes,to build a decision tree model which is applicable to forest types.Then,the different segmentation scale compared from the support vector machine(SVM)classification method.Results showed that classification accuracy of the decision tree classification method with multi-level segmentation (which increased 6.1%and 12.5%)was higher than the support vector machine(SVM)classification method with the different single segmentations.Thus,it would be suitable to build a decision tree classification with multi-level segmentation to the classification of forest type.[Ch,13 fig.5 tab.15 ref.]

forest mensuration;object-oriented;fractal net evolution approach;information extractioni;decision tree model

S758.4

A

2095-0756(2016)05-0816-10

10.11833/j.issn.2095-0756.2016.05.013

2015-11-30;

2016-01-03

国家高技术研究发展计划(“863”计划)资助项目(2012AA102001)

董心玉,从事遥感与地理信息系统研究。E-mail:794356637@qq.com。通信作者:范文义,教授,博士,从事定量遥感研究。E-mail:fanwy@163.com

浙 江 农 林 大 学 学 报,2016,33(5):816-825

Journal of Zhejiang A&F University

猜你喜欢
面向对象决策树尺度
GEE平台下利用物候特征进行面向对象的水稻种植分布提取
财产的五大尺度和五重应对
面向对象方法在水蓄冷PLC编程中应用分析
决策树和随机森林方法在管理决策中的应用
决策树多元分类模型预测森林植被覆盖
宇宙的尺度
基于决策树的出租车乘客出行目的识别
基于肺癌CT的决策树模型在肺癌诊断中的应用
9
面向对象的SoS体系结构建模方法及应用