基于多源遥感数据的海南岛天然林分类数据集

2019-11-18 08:10史建康宫晨李新武万祥星孙中昶
关键词:海南岛天然林热带

史建康,宫晨,李新武,万祥星,孙中昶

1.海南省环境科学研究院,海南海口 571126

2.中国科学院遥感与数字地球研究所,北京 100094

数据库(集)基本信息简介

数据库(集)名称 基于多源遥感数据的海南岛天然林分类数据集数据作者 史建康、宫晨、李新武、万祥星、孙中昶数据通信作者 宫晨(gongchen@radi.ac.cn)数据时间范围 2015年地理区域 北纬18°10′-20°10′,东经108°37′-111°03′空间分辨率 30 m数据量 1.20 GB数据格式 *.bat, *.tif, *.shp, *.xml数据服务系统网址 http://www.sciencedb.cn/dataSet/handle/711基金项目 海南省重大科技计划项目(ZDKJ2016021);海南省自然科学基金面上基金项目(20164177)。

数据库(集)组成数据集由2个压缩包组成,文件以产品名命名:(1)Classification_of_Hainan_Island _Land_cover.zip是海南岛土地初级利用分类产品数据,数据量约1.20 GB;(2)Classification_of_Hainan_Island _Natural_Forest.zip是海南岛天然林分类产品数据,数据量约15.5 MB。

引 言

森林是全球生态系统的重要组成部分,也是国家可持续发展的重要物质基础和人类社会赖以生存的宝贵资源,随着人类活动的破坏及全球气候的变化,使得森林资源遭到了不同程度的破坏,并且面临着越来越多的威胁[1-2]。目前,传统的森林资源调查手段在森林资源的调查和监测中依然占据着重要地位。但是随着遥感技术的进步,利用其对森林资源进行调查正逐渐成为林业调查的一种重要技术手段。相比于传统林业调查,遥感技术可以快速、宏观、准确地完成对森林地区信息的收集,通过遥感图像的处理、解译和分析等手段可以对目标区域的森林资源进行定性或者定量的调查。遥感图像分类是遥感技术在林业领域应用的一个重要内容,针对不同来源、不同形式的遥感图像进行分类不仅为森林资源调查和监测提供了有力支持,而且在森林制图、林业规划、森林火灾及病虫害的监测等方面都发挥着重要作用[3-4]。当前,针对海南岛人工林的遥感监测研究已经取得了很大进展[5-6]。从分类精度上看,中尺度的橡胶林遥感识别精度较高,而大尺度的橡胶林分类精度较低,小尺度的油棕榈、柚木林、桉树林等遥感分类精度则达90%左右。对于海南岛热带天然林分类研究而言,当前采用的主要还是野外调查、实地勘测等方法,采用遥感手段对其进行分类和类型识别的研究和探讨较少。

对于热带地区的气候来说,多云多雨是影响光学遥感数据的最主要因素,海南地区亦是如此。而微波遥感由于波长较长,穿透能力强,能够有效穿透云雾,减少云雾对观测效果的影响,因此微波遥感对于热带地区进行遥感森林监测来说是一个有力的补充[7]。光学遥感中,主要利用数据中的红外、近红外波段对植被疏密程度的敏感性,以及影像中的色彩、纹理等特征来进行森林资源的调查和监测。而微波遥感中,利用短波段(C波段和X波段)对于森林顶部冠层中不同叶片形状的后向散射特性的不同来进行识别。利用光学遥感数据和微波遥感数据结合,利用两者的优势开展热带森林资源的调查和监测正逐渐发展成为一种趋势。在热带森林多云多雨的气候条件下,选择合适的遥感数据源,并利用野外实地采集数据以及其他林业调查资料,研究适用于我国热带地区森林分类的方法,使其更好地服务于当地林业部门森林资源调查、林业规划以及合理开发,是当前的研究热点之一。

海南岛热带森林主要分布于中部的山区,主要有尖峰岭、霸王岭、黎母山、五指山和吊罗山5大热带森林分布区。其中尖峰岭是海南岛面积最大的热带森林分布区,由于地形和气候影响,尖峰岭热带森林类型丰富,植被种类繁多,具有垂直分布结构,植被类型的优势种并不明显。尖峰岭地区主要森林类型有典型热带雨林、热带季雨林、常绿苔藓林以及常绿落叶阔叶混交林。尖峰岭地区的植被种类多达2800多种,主要植被科目有芸香科、蝶形花科、菊科、乔本科、桑科、樟科、龙脑香科、棕榈科、桃金娘科、杜英科以及灰木科等。其他4个主要的森林分布区由于地势、气候以及土壤类型等因素的影响,造成了森林类型分布的一些差异,但总体上的森林类型以及植被种类分布情况基本相似。

因此,本数据集以海南岛为研究区,利用光学遥感数据和多时相SAR数据提取海南岛天然林主要林型的空间分布。本文研究可以为其他地区的热带天然林分类研究提供一定的参考,同时也为海南岛天然林的保护和规划提供决策支持和依据。

1 数据采集和处理方法

1.1 数据源

1.1.1 遥感数据

考虑到数据分辨率的可分性与大区域应用的经济适用性之间的协同问题,本研究选取中高空间分辨率的遥感数据作为数据源,包括Landsat-8卫星的OLI数据和Sentinel-1A卫星提供的干涉宽幅地距多视产品(IW-GRD),既保证了能有效提取热带森林中的天然林类型,也节约了数据收集的成本。采用的投影均为基于WGS84的UTM投影。具体情况如下:2015年11月至2016年2月期间的Landsat-8卫星 OLI数据共 4景(云量较少,获取时间相近),2015年6月至2016年 4月期间的Sentinel-1A卫星SAR数据10期共计20景数据(成像模式为干涉宽幅地距多视产品,GRD)。数据详细信息见下表1。

表1 光学遥感与SAR数据参数

1.1.2 森林调查数据

除遥感数据外,为了保证研究工作的准确性和可靠性,还在海南岛进行了林业调查,得到了天然林类型采样数据集。在海南岛热带森林野外数据采集中,针对海南岛热带森林典型热带雨林、热带季雨林、常绿苔藓林、常绿落叶阔叶混交林等天然林类型和橡胶林、桉树林、槟榔等人工林类型进行实地数据采集。数据采集实验主要测量参数有:森林类型、地理坐标和森林类型特征(森林冠层特征、代表性树种)。

野外数据采集在考虑到样本典型性以及采样地点可达性行原则的基础上,选取了儋州、屯昌、乐东附近的人工林分布密集区,以及尖峰岭、百花岭、东寨港等天然林分布较为典型的区域。其中,人工林种植区多分布于人类活动易干扰区,为便于样本快速采集,人工林样本点基本沿国道或乡村道路采集;天然林多分布于山区,车辆不易通行,需要徒步进入采集,因此采样区域有限,此次天然林样本点采集主要集中在尖峰岭、百花岭等地区。本次数据采集样点分布及样本信息如图1所示。

图1 野外数据采集样本实例

野外实地数据共包含了300个样本点,数据采集后根据数据记录对采集的森林样本进行总结,海南岛热带森林类型具体特征如下。

(1)人工林:主要分布在海拔较低的平原和丘陵地区,基本为大面积连续的单一树种,种植分布具有明显的规律,绝大多数为经济林种植区。

(2)典型热带雨林:植被茂盛,树种类型丰富,基本没有受到人为影响,空间结构分层比较明显,一般分层达到5-7层,主要为草本层、灌木层、幼小乔木层、一般乔木层以及高大乔木层。

(3)常绿落叶阔叶混交林:遭受到的人为影响很大,喜阳植物较多、分层不明显,一般只有1-2层,主要为灌木层和乔木层。其中落叶树种主要为楹树、枫香、海南菜豆树等。

(4)热带季雨林:受到一定的人为影响,分层一般有3-4层,有一定的季相变化,其中变化树种主要为蒲桃、榕树等。

(5)常绿针叶林:叶片形状为针形,树种主要为加勒比松、南亚松等松树,分布单块面积较小且零星分散,基本没有大面积连续的针叶林树种。

(6)常绿苔藓林:主要分布海拔1200 m以上的山顶,树木矮小,整个冠层高度较矮,且分布面积很小。

1.2 数据处理方法

由于光学遥感和微波遥感成像机理不同,影响影像数据质量的因素也不同。所以本研究将数据预处理分成2个部分:SAR数据预处理和光学遥感数据预处理。SAR数据预处理包括雷达辐射定标、图像滤波和地形辐射校正;Landsat-8卫星的OLI数据预处理包括辐射定标和大气校正。在完成数据预处理后,考虑到不同空间分辨率数据的图像配准问题,将SAR数据重采样到Landsat-8多光谱数据一样的 30 m空间分辨率。在此基础上再进行分类特征提取,并利用支持向量机(Support Vector Machine,SVM)分类算法对天然林进行提取和分类,并结合野外实地采集数据以及林业调查资料,对天然林分类的精度进行分析,得到海南岛天然林分类图。具体流程如图2所示。

1.2.1 分类特征提取

在进行分类特征选取时,除了要考虑分类地物的典型光谱特征外,还要考虑波段提供的信息量以及不同波段在分类中作用的重复程度[8-9]。本研究分别对OLI数据的单波段光谱特征、多波段光谱特征以及SAR数据的VV、VH极化后向散射系数进行统计分析,提取适合分类特征。

(1)光谱特征选取

经过对Landsat-8卫星数据的单波段统计特征和多波段统计特征的分析得知:

1)中近红外波段(Band5)的标准差最大,2个短波红外波段(Band6和Band7)的标准差同样较大,蓝光波段(Band4)标准差最小(表2)。说明蓝光波段能够反映的地表遥感信息较少,近红外或短波红外包含的信息量更多;

2)近红外波段和前4个波段之间的协方差最大(表3),表明深蓝波段、蓝光波段、短波红外2波段与其他波段之间的同向性比较弱;

图2 海南天然林分类流程图

表3 Landsat-8卫星OLI数据各波段间的协方差

3)通过表4各个波段的相关系数,可以看出蓝光波段、短波红外2波段与其他波段相关性更强,其独立性相对较弱。

表4 Landsat-8卫星OLI数据各波段间的相关系数

由于深蓝波段比较适合海岸带观测,本研究又要对海岸林进行观测,所以深蓝波段也是分类需要考虑的波段。最终将 Landsat-8卫星数据中除蓝光波段和短波红外 2波段的其他波段作为优选波段,进行分类。

(2)SAR后向散射强度特征选取

通过对多时期双极化方式的SAR数据进行统计特征的分析(表5和表6),可以知道:

1)从6月份到10月份的雨季到11月至来年2月份的旱季标准差整体趋势是增加的,从侧面说明在旱季对地表进行的探测,往往比雨季得到的地表信息更丰富;

2)VH极化SAR数据的标准差普遍高于VV极化的,说明交叉极化模式的SAR数据在进行观测时,比同极化SAR数据得到的信息更多;

3)2种极化SAR数据都是在2月份达到标准差最大值,说明如果考虑分类数据量的大小,只选择一期SAR数据进行分类时优先考虑,即在旱季成像的SAR数据。

经过光学数据和SAR数据的统计特征分析后,综合考虑数据量大小,波段的有效性和季相变化等因素,最终发现 OLI数据的1、3、4、5、6波段,归一化植被指数以及2015年8月12日和2016年2月8日的双极化SAR数据是下一步分类研究需要优先考虑的分类数据组合。

表5 多时期VH极化后向散射系数统计特征

表6 多时期VV极化后向散射系数统计特征

1.2.2 分类算法选择

本研究基于SVM算法进行天然林范围提取和天然林分类。SVM的基础是统计学习理论的VC维理论和结构风险最小化原理,主要是利用有限的样本所提供的信息对模型的学习能力和复杂性进行最优的选择,以便得到最好的泛化能力[10]。SVM 的基本原理是将训练样本数据通过一定的变换,映射到高维特征空间,并在高维特征空间内寻找平面即最优超平面,然后利用该平面使得不同类别的数据区分开来[11]。SVM模型遥感领域中得到了较为广泛的应用。

本研究中的SVM分类主要是通过ENVI软件中的支持向量机模块进行的,其中对于SVM分类建模中主要涉及的参数有核函数选择和最优参数选择。在ENVI支持向量机分类模块中包含的主要核函数有线性核函数(Linear)、多项式核函数(Polynomial)、Sigmoid核函数和高斯径向基核函数(Radial Basic Function, RBF)。

以上几种核函数中,使用最为普遍的是RBF核函数。该核函数具有较好学习能力,是一种采用较多,且分类结果较为理想的分类核函数[12]。因此本研究分别选择RBF核函数进行建模,在ENVI软件中的SVM模块中需要选择分类器参数,经过多次试验最终确定SVM分类参数。提取天然林范围时,SVM的参数设置是RBF核函数的γ值为0.083,惩罚系数为100;但是在进行天然林分类时,SVM的参数设置为RBF核函数的γ值为0.077,惩罚系数为100。

1.2.3 海南热带天然林分类体系

由于海南岛热带天然林分布十分复杂,为避免其他地物类型对天然林分类的影响,本研究的分类方法采用分层分类的策略,首先对天然林范围进行提取,然后在天然林范围提取的基础上对其内部林型进行分类。

(1)海南岛土地初级分类体系

对于海南岛土地进行初级分类主要目的是对天然林的范围进行提取,因此只进行基本地物分类。参照遥感数据情况、海南岛的实际情况以及初级分类的用途,制定了海南岛土地初级分类体系。同时,对于初级分类中的地物类型,通过对Landsat-8卫星遥感影像进行解译,同时参考了野外实地采样数据,建立了影像解译标志。表7为海南岛土地初级分类体系及解译标志。图3为主要地物类型的解译标志示意图。

本研究利用这些遥感影像解译标志,进行了样本的选取和训练,为接下来利用SVM分类模型进行海南岛初级分类奠定了基础。

表7 海南岛土地初级分类体系及解译标志

图3 海南岛土地初级分类解译标志示意图

(2)海南热带天然林分类体系

海南岛地处热带,是我国热带森林植被的重要分布区,特别是海南岛中南部地区被普遍认为是具有国际意义的包括植被多样性在内的生物多样性最丰富的区域之一。对于海南岛热带森林的分类体系还存在一定的分歧。在国家2010年发布的森林资源规划设计调查技术规程[13]中,将森林类别按照用途或树种进行划分,树种类别较多,遥感解译尚存在较大困难。宋永昌[14]在2011年提出的植被分类系统中,森林被划分为一个独立的植被型纲,这样的划分更有利于森林系统性的识别。因此,在宋永昌分类系统的基础上,利用所选取的多源遥感数据,选择海南岛常见林型进行天然林内部类型的分类研究。

本研究在宋永昌2011年提出的植被分类系统(表8)的基础上[14-15],结合海南岛野外调查的实际经验和遥感机理的分析,将海南岛热带天然林分为典型热带雨林、热带季雨林、针叶林、海岸林以及常绿阔叶林。由于海南地区的常绿落叶林只是零散的分布于常绿阔叶林之中,两者之间并没有明显的区别,所以在这里将常绿阔叶林和常绿落叶阔叶混交林分成一类,统一归类为常绿阔叶林。

表8 宋永昌提出的森林分类系统

2 数据样本描述

2.1 海南岛土地初级分类

首先利用SVM分类算法进行海南岛的土地初级分类,参照制定的土地初级分类体系,将海南岛分为水体、其他植被、人工林、天然林、人工地表、裸地以及海岸林7种地类。海南岛土地初级分类结果显示如图4所示。

图4 基于SVM的海南岛土地初级分类结果

2.2 海南岛天然林范围

在海南岛土地初级分类的基础上,基于 SVM 方法对海南岛土地初级分类中天然林的范围进行提取。并以此为基础,依据野外实地调查数据、海南林业部门提供的森林抽样统计调查数据以及对高空间分辨率影像的目视解译,对 SVM 分类结果中的天然林零碎图斑进行识别,剔除非天然林斑块,最终得到天然林的总体范围(图5)。

图5 海南岛天然林范围(红色区域)

2.3 基于SVM的天然林分类结果

为了避免其他地类信息干扰天然林分类,本研究在进行天然林范围提取后,对分类所用的遥感数据进行了裁剪,使得在天然林范围内只包含天然林林型,没有其他地类。由于各种天然林林型在遥感影像上的区别较小,仅凭肉眼很难识别。因此,对于天然林分类的样本选取主要依靠野外实地采样点和海南林业部门提供的森林抽样调查资料进行选择。结合2种资料最终选取了各类天然林样本280块,随机抽取70%进行样本的训练和分类,其余30%用于精度验证。

同时,本研究利用ENVI软件中提供的计算ROI可分离性(Separability)工具来确定2个类别间的差异程度。类别间的差异主要通过计算 Jeffries-Matusita距离和转换分离度(Transformed Divergence)来确定任意类别间的统计距离,从而衡量训练样本(ROI)的可分离性。表9为海南岛天然林类型样本可分离性统计。

表9 海南岛天然林类型样本可分离性统计

训练样本的可分离性值在0-2.0之间,大于1.9说明样本之间可分离性好,属于合格样本;小于1.8,需要编辑样本或者重新选择样本;小于1,考虑将2类样本合成一类样本。从表9中可以看出任意天然林类型之间的可分离性均大于1.9,证明了5种天然林类型在此类遥感特征中的可分离性较好。

基于SVM模型的分类结果如图6和图7所示。其中图7中有一条黄色线状条带,这是因为原始Sentinel-1A极化SAR数据缺失导致,在拼接过程中线状条带为数据缺失部分。

图6 基于SVM的天然林分类结果

图7 基于SVM的天然林分类结果细部图(尖峰岭)

3 数据质量控制和评估

3.1 海南岛土地初级分类精度分析

本研究分类结果评价均采用混淆矩阵作为分类精度的评价方法。对于精度评价的指标主要利用了生产者精度、用户精度、总体精度以及Kappa系数4个精度评价指标[16]。表10为海南岛土地初级分类精度评价。

表10 基于SVM的海南岛土地初级分类精度评价

通过利用混淆矩阵对于SVM模型分类结果的精度评价可以看出,基于SVM模型的分类方法在海南土地初级分类中得到了很好的效果,总体精度达到了95.15%,Kappa系数为0.943。

3.2 海南岛天然林分类精度分析

同样采用混淆矩阵作为天然林分类精度的评价方法,从生产者精度、用户精度、总体精度以及Kappa系数4个方面进行评价。表11为天然林分类精度评价。

表11 基于SVM的天然林分类精度评价

海岸林 3 0 2 0 0 1 080 99.54%总计 1500 1400 168 1625 1075 5768生产者精度 92.60% 96.71% 53.37% 83.20% 100%总体精度:91.19% Kappa系数:0.883 7

通过表11可以看出SVM分类模型在天然林分类中取得了较好的精度。对于天然林分类而言,分类结果的总体精度虽然很高,但是主要由于海岸林等较为容易区分的林型拉升了总体精度,将海岸林等林型排除后,天然林分类中有些林型的分类精度还是比较低,例如常绿针叶林。

对于常绿针叶林而言,基于SVM算法的分类,生产者精度只有53.57%。经过分析,常绿针叶林分类精度不高的原因有2点:(1)在野外实地调查中,可以发现常绿针叶林的分布极为零散,有的甚至以棵的形式存在,即使有成片的常绿针叶林,其面积也很小,根本不足一个像元的面积,这样就造成了混合像元,在进行样本的训练和分类时会造成误差,从而影响分类精度。(2)本文研究用的是C波段雷达数据,C波段雷达虽然无法穿透茂盛的树木冠层,但是对于稀疏分布的常绿针叶林来说,则就有一定的穿透性。并且在热带天然林中常绿针叶林冠层以下均有阔叶类型的灌木丛分布,这也从一定程度上增加了常绿针叶林和常绿阔叶林的区分难度。因此,利用C波段雷达对于常绿针叶林的叶片形状并不敏感,这也降低了分类精度。

4 数据价值

本研究以海南岛为研究区域,利用多源遥感数据,进行了多源遥感的数据预处理并对数据特征进行了分析,在此基础上对海南岛的热带天然林进行了提取,并对天然林进行分类研究。利用信息量较大的光学数据波段、旱季雨季的SAR数据和归一化植被指数组成的数据组合对海南岛进行土地初级分类和天然林分类,SVM的总体分类精度分别达到了95%和91.2%,结果表明本文的分类方法在天然林分类中具有很好的效果。天然林的分类结果对进行森林调查和监测具有重要的意义,在生态层面和经济层面也都有重要的价值。

猜你喜欢
海南岛天然林热带
浙江省首个市级天然林保护修复实施方案通过评审
中国游客的海岛旅游需求时空特征分析——以济州岛和海南岛为例
基于气候季节划分的海南岛气候康养特征探析
天津:全面停止天然林商业性采伐
热带风情
海南人为什么说福建话
天保工程:把天然林都保护起来
天然林保护任重而道远
热带的鸟儿
“早春茶”开采