基于高分遥感数据的森林郁闭度估测方法研究

2019-05-16 01:39杨妍婷
智能计算机与应用 2019年2期
关键词:郁闭度反演波段

杨妍婷

(浙江农林大学信息工程学院,浙江临安311300)

0 引 言

森林郁闭度就是研究森林资源环境的重要参数之一,即等于垂直方向上林冠的投影面积和林地面积之间比值[1-2]。过去测度此指标最常用的方法主要有:目测法[3]、样线法[4]、样点法[5]、树冠投影法[6]、观测管法[7]、照片法[8]等。 传统方法都需要耗费较长时间,并且只能得到小范围内典型数据,所以很难满足大区域范围测度需求。

最近数十年内,遥感技术急速发展,而且已逐步应用到林业领域。利用遥感技术计算森林郁闭度的基础数据就是遥感光学影像、实测地表样地数据[9-11]。常用遥感反演方法分别是辐射传输模型法和统计模型法,前者模型结构复杂、所需要的参数多并且大都难以准确获取,进而影响到森林郁闭度的提取精度;对于后者而言,较为成熟的方法包括回归模型、以植被指数为基础的混合像元分解法。

为了实现对森林区域的基于高分辨率遥感图像的郁闭度反演,本研究采用小块区域精度较高的回归模型法进行试验,并比较不同回归模型的反演效果,再对其进行分析评估。

1 研究区概况及数据介绍

1.1 研究区概况

滦平县地属河北省承德市,植被覆盖率高。本文选取的研究区域为滦平县南部地区两镇,包括巴克什营镇和长山峪镇。全县有58%的森林覆盖率。其中,南部的巴克什营和长山峪镇的林地占全县植被的一大部分,经纬度范围为:117°3′E~117°28′E,40°35′N~40°55′N。 研究区域的地理位置及其真彩色图像如图1所示。

图1 研究区域地理位置图Fig.1 Study of regional geographic location maps

1.2 数据介绍

GF-1是国内首个对地进行高分辨率观测的卫星,主要优势是综合使用了分辨率较高的光学遥感、多载荷图像融合拼接等先进技术。本实验采用GF-1中PMS传感器数据。4个可见光近红外波段和1个全色波段。结合实测采样日期,本研究采用2018年9月16日的数据,该数据云量少,质量较高。

SRTM提供了比较完整的高分辨率DEM。本研究运用的主要数据是SRTM DEM数据,90 m空间分辨率。将DEM数据采用克里金法空间插值到2 m,采用ARCGIS软件对其进行计算,得到坡度和坡向。然后将其与可见光近红外数据进行几何配准。

外业森林郁闭度数据于2018年9月河北省承德市滦平县南部两镇实测得到,数据表格包括经纬度、郁闭度等。本次实验采用照片法估测研究区域的郁闭度,大约每隔1 Km采样一个点,最终采样308个点的郁闭度数据。

2 数据处理

2.1 GF-1 数据预处理

本实验采用ENVI软件相关功能对多波段和全色波段数据进行辐射定标、大气校正和正射校正,消除传感器和地形因素等引起的几何误差。图像的预处理结果如图2所示。

图2 研究区多波段数据预处理结果Fig.2 Preprocessing results of multi-band data in the study area

2.2 图像融合

为了得到精度更高的多波段图像,考虑将8 m的多波段和2 m的全色波段进行图像融合,采用常见的图像融合算法进行试验[12]。本研究对比了4种融合算法的结果,即:PC融合、Brovey融合、NNDiffuse Pan Sharpening融合和Gram-Schmidt融合。相比之下NNDiffuse Pan Sharpening融合结果色彩精确,纹理清晰。不同算法的融合效果如图3所示。

图3 不同算法图像融合结果Fig.3 Image fusion results of different algorithms

灰度值均值能够体现人眼视觉观察到的图像平均亮度;标准差能够体现这一数值的离散情况。本文主要选取均值、方差和均方根误差来评价。选取植被敏感的绿波段进行定量评价,见表1。

表1 不同融合算法评价指标对比Tab.1 Comparison of evaluation indicators of different fusion algorithms

结合目视和定量评价结果,本文选取NNDiffuse Pan Sharpening融合处理数据并进行接下来的研究。

2.3 监督分类提取林分信息

对于融合后的图像,采用滦平县南部地区巴克什营和长山峪两镇矢量边界对其进行裁剪,然后采用随机森林监督分类方法提取植被。使用ENVI软件对待研究区进行分类,将研究区分为水体(蓝)、植被(绿)、不透水面(红)、裸土(黄),主要提取植被区域进行森林郁闭度估算。分类结果如图4所示。

图4 随机森林监督分类结果Fig.4 Random forest supervised classification results

2.4 影响因子计算

2.4.1 植被指数

由于GF-1数据波段有限,本研究采用常见的4种植被指数,即NDVI、DVI、RVI和SAVI进行分析。上述植被指数的计算公式如下:

其中,b3和b4分别是GF-1数据的第3、4波段反射率,即红波段和近红外波段,L为调节系数,本研究取L=0.5。不同的植被指数计算结果如图5所示。

图5 植被指数计算结果Fig.5 Calculation results of vegetation index

2.4.2 缨帽变换因子

缨帽变换(K-T变换)是一种经验线性正交变换,本研究采用亮度、绿度、黄度三个分量参与分析, 其计算结果如图6所示。

图6 缨帽变换分量计算结果Fig.6 Computational results of transformation components of reel cap

2.4.3 地形因子

高坡处的地面回波会与部分林分冠层回波杂糅,并且海拔也会影响植被的生长状态,诸如此类地形因子均会影响森林郁闭度的计算[13]。根据已有的DEM数据,将高程、坡度和坡向作为影响因子纳入回归模型,地形因子计算结果如图7所示。

图7 地形因子计算结果Fig.7 Calculation results of topographic factors

3 森林郁闭度反演

根据上述计算的10个影响因子,加上原始数据的4个波段,通过相关分析从中找出存在显著相关的因子,再运用多种回归方法,分析获得郁闭度与各因子之间回归关系,并建模。

由于本研究采用的回归算法涉及传统的最小二乘回归和基于机器学习的回归,对于测试集和训练集的划分,需要统一的标准。本文采用传统的划分方法,即70%的样本用于训练集,30%的样本用于测试集。采用python的sklearn进行样本划分,最终得到215个样本用作训练集,83个样本用于验证。

3.1 自变量的选择

自变量是建立回归模型的基础。通常来讲,筛选剔除的变量主要有3种,对此分述如下。

(1)能够被其它变量代替的变量,如果都被导入模型,会导致回归反演过于复杂,却不能显著提高精度水平。

(2)变量和因变量的相关性不高,甚至完全没有相关性,此类变量对于建模分析没有任何证明影响,还会导致运算工作量的增加。

(3)整体样本因变量和自变量都没有显著相关性,部分规律较强的自变量出现的规律模型将主导建模结果,甚至导致固有规律直接影响模型。

3.2 回归建模

3.2.1 多元逐步回归

在利用SPSS进行多元逐步回归中,参数设置包括置信水平为 95%,使用f的概率,进入为 0.05,删除为0.1,对基于14种遥感因子共同引入模型进行自变量选择,最终选择了2种自变量参与模型构建,得到最优模型。可将其解析为如下数学公式:

由式(5)可知,逐步回归后留下来的自变量只SAVI和b3两个,自变量数量较少。

3.2.2 随机森林回归

此方法的过程如下:

Step1进行bootstrap抽样从训练原始集内选出样本集(内有样本k个),各样本集的样本容量都和训练原始集相同。

Step2对样本集(k个)构建各自的决策树模型(k个),同时根据各树模型预测记录,得到预测值(k组)。

Step3对所得全部预测值求均值,得到预测最终结果[14]。

3.2.3 Cubist回归

此方法通常可用于连续值预测问题中。模型树代表的是某个分段线性函数,模型树内部各节点测定某些自变量,各叶节点将分析得到模型,并且所有模型均为以前期测试节点所得为自变量[15]。此过程主要通过递归处理得到模型树,起点是全部完整训练样本集。在各层都需要选取辨别度最高的自变量为子树根,抵达此处样本都需要结合其自变量数值大小,被进一步划分为多个子集。分割节点的标准在于能够促使样本标准差下降,同时不影响平方误差。主要运用Variance、也就是诱导来实现启发,叶节点内都必须有常数填充建立模型。

3.3 结果讨论

3.3.1 模型评价

本研究采用决定系数R2、估计值的标准差SEE、总相对误差TRE和平均系统误差MSE进行模型评价。研究中将用到的数学公式可表示如下:

其中,yi和分别是样地i的郁闭度实测值和预测值;是所有实测值的平均数;p为模型参数个数;n为样本数量。

3.3.2 结果分析

将剩余的验证样本数据(83个)导入3种估算分析模型,估测郁闭度结果,并评价结果的精度水平。

表2 回归模型的比较Tab.2 Comparison of regression models

由表2可见,3种模型对郁闭度的反演精度验证结果,综合建模精度来看,从多元逐步回归(MSR)模型、随机森林(RF)模型到 Cubist模型精度中,Cubist模型比较稳定,精度最高,为该研究区域郁闭度反演的最优模型,其预测能力最强,反演效果最好,模型验证精度R2=0.824,SEE=0.256 ,TRE(%)=2.98,MSE(%)=3.07, 相对比较稳定。不过,不同模型进行分析统计所得指标之间对比并没有发现特别明显的差异。从4项指标分析,随机森林回归略逊于Cubist回归。

在森调尤其是遥感分析研究森林资源过程中,建模预估郁闭度是非常重要的工作步骤。因为遥感数据多而且非常复杂,所以无法明确获知可能对预测结果造成关键影响的变量集合,如果选取太多变量又必然会对建模计算带来困难,不但会导致模型不够稳定,还可能导致模型无法用于实际。故而,研究选择出最佳模型是对郁闭度进行精准预测的核心所在。

3.4 制图输出

对于以上不同模型的精度评价和结果讨论,本研究采用精度最高的Cubist回归模型反演的森林郁闭度结果进行制图输出,如图8所示。

图8 2018年研究区域森林郁闭度分布图Fig.8 Distribution map of forest canopy density in the study area in 2018

从图8中可以看出,在不透水面和水体周围,森林郁闭度很低;东、西部有较大高程的山区内这一指标数值较大,这一现象与实际情况相符。

4 结束语

与传统郁闭度测定方法相比,利用遥感估算模型能够更有效、更准确地获取大范围或区域的森林郁闭度,有利于降低森林资源调查成本,并提高管理工作水平。森林郁闭度的遥感估算精度与模型的好坏有关,同时也与参与建模反演的影响因子密不可分。此处将给出研究结论,具体阐述如下。

(1)以河北省滦平县南部两镇为研究区域,采用高分一号(GF-1)遥感数据融合SRTM DEM数据,并整合实测数据,对该地区的森林郁闭度进行反演,取得了较好的效果。

(2)采用4种常用的融合算法,包括PC融合、Brovey融合、NNDiffuse Pan Sharpening融合和Gram-Schmidt融合,对预处理之后的多波段和全色波段进行融合,从目视和定量两个角度比较不同方法的融合效果,结果表明NNDiffuse Pan Sharpening融合效果最好。

(3)采用3种统计回归模型对森林郁闭度进行估算,包括:逐步回归、随机森林回归和Cubist回归。结果表明,基于机器学习的随机森林和Cubist算法结果要优于传统的回归算法,各项评价指标总体显示Cubist回归算法在该研究区的拟合效果最好。

(4)最终的反演制图结果表明基于Cubist算法的郁闭度遥感反演整体精度较高,但也存在低值高估和高值低估的现象。

猜你喜欢
郁闭度反演波段
反演对称变换在解决平面几何问题中的应用
Ku波段高隔离度双极化微带阵列天线的设计
最佳波段组合的典型地物信息提取
新型X波段多功能EPR谱仪的设计与性能
最佳波段选择的迁西县土地利用信息提取研究
城镇周边马尾松林分套种任豆技术研究
八角林不同郁闭度对金花茶和山茶生长及光合特性的影响
不同郁闭度马尾松林下种植射干的生长效果分析
浅谈郁闭度在森林经营中的科学应用