基于landset8遥感影像数据的森林蓄积量反演

2020-03-31 02:17刘昌华彭词清
矿山测量 2020年1期
关键词:蓄积量反演校正

冯 凯,刘昌华,彭词清

(1.河南理工大学 测绘工程学院,河南 焦作 454150;2.广东省岭南综合勘察设计院,广东 广州 510000)

森林作为林业产业基础与生态系统主体,是地球上最大、最重要的陆地生态系统。它是地球上的碳储库、能源库、蓄水库和基因库,在全球生态系统平衡中发挥着重要作用,是人类和多种物种赖以生存和发展的基础,其数量与质量是决定森林经济效益与生态系统服务功能的关键[1]。为了及时准确地掌握国家森林资源状况,我国通过系统抽样方法进行了每5年一次的森林资源连续清查(一类调查)、每10年1次的森林资源规划设计调查(二类调查)以及作业设计调查(三类调查)等获取森林资源数量现状。[2]森林资源检测不管是从生态角度考虑还是从林产品的角度看,传统的检测周期过长已经无法满足实际需求,为此,许多国家如美国,奥地利、芬兰、法国、瑞典等从二十世纪90年代开始实施森林资源年度监测(annual forest invenotyr)项目[3]。国外对于森林蓄积量的研究更倾向于应用雷达数据进行反演建模,这种方法很有针对性,但是反演回归的普适性不高[4]。随着遥感技术的发展,基于遥感影像与少量样地数据的森林蓄积量估测方法得到国内外学者的广泛研究如何提高森林蓄积量估测模型的准确度已经成为林业遥感新的研究热点[5]。在神经网络模型中,阈值和权值对于网络的的准确性有重要的影响,基于此,选择POS算法与神经网络结合的模型,粒子群算法(简称POS)主要是通过粒子的不断迭代来找到粒子的最优速度和位置,从而最后找到粒子的最优解[6]。在POS算法中,每一个粒子代表神经网络的权值和阈值,通过粒子寻优找到网络最佳的权值和阈值。POS算法和神经网络相结合可以实现对一个复杂问题的拟合,得到更加精确的模型。经过POS算法优化的BP神经网络优化初始权值和阈值,使神经网络得到的模型更加精确,通过神经网络得出的网络参数,为研究区的蓄积量调查提供参考,倘若拟合度达到要求精度则可以减少外业调查工作量。经过查阅相关资料,选择landset8系列数据进行神经网络反演的相关内容相对较少,因此,通过将光谱指数和立地因子作为特征变量,一优化的神经网络模型为建模方式,建立特征变量和森林蓄积量的反演模型,对南雄市森林蓄积量的研究提供帮助,为林区经营活动提供理论依据。

1 数据来源与研究区概况

1.1 数据来源

数据来源于第四次森林资源二类调查数据,研究区为广东省韶关市南雄市,调查内容涉及面积,公顷蓄积,胸径等。因为二类调查持续时间长,因此本研究选择的遥感数据是在地理空间数据云下载的2016年的landset 8 OLI数据。landset 8 OLI共有11个波段,1~7、9波段为多光谱波段(30 m分辨率),8为全色波段(15 m分辨率),10和11为热红外传感器波段(30 m分辨率)。30 m×30 m的DEM用于提取高程,坡度等信息。

1.2 研究区概况

南雄市位于广东省东部,1996年撤县设市,市境位于东经113°55′3″~114°44′38″,北纬24°56′59″~25°25′20″,南北两面群山连绵,中部丘陵沿浈江伸展,形成一狭长盆地,全省面积2 361.4 km2,17个镇,1个街道,24个居委会,208个村委会,人口46万。亚热带季风湿润气候,森林覆盖率达63.4%,活立木蓄积量580万m3。

2 数据处理

2.1 图像预处理

选取2016年12月份的Landset 8 OLI影像数据,选取Landset 8 OLI的原因有两方面:其一landset系列卫星的所有数据都可以非常方便地免费从网上获取,对于可用经费较少的林业调查而言非常合适;其二是光谱分辨率较高,特别是在植被探测的红外波段具有大量的数据,非常适合森林的各种分析[7]。为了避免因为云量过多造成不必要的影响,在数据下载中筛选出云量低于0.5的影像,从中筛选出连续的覆盖研究区的影像,影像由四幅组成,得到的原始图像经过辐射定标,大气校正,几何校正。

辐射定标:是用户需要计算地物的光谱反射率或光谱辐射亮度时,或者需要对不同时间、不同传感器获取的图像进行比较时,都必须将图像的亮度灰度值转换为绝对的辐射亮度,这个过程就是辐射定标。国际地球观测卫星委员会将定标定义为:定量的确定系统对已知的、可控制的信号输入响应的过程[8]。遥感系统需要定标的主要内容是对其电磁辐射的响应与光谱响应,辐射响应等的函数关系。对Landsat OLI 的辐射定标可以通过 ENVI 5.2 中辐射定标功能完成。

大气校正:为了消除或减弱大气中气溶胶,云层及其阴影等的影响得到精确的地表反射率,需要进行大气校正。

几何校正由行政矢量边界为矫正依据。

表1是大气校正基本参数。

表1 大气校正基本参数

下面为矫正前后植物波谱的变化以及校正后影像全貌:

图1 大气校正前后植被波谱曲线

从图中可看出,校正后在1.5 μm处的走向更加符合植物波谱曲线的走势,且总体走势也符合植物波普曲线的走势,因此可以认为,校正后的影像是正确的。最终得到的南雄市的影像如图2所示。

图2 南雄市遥感影像

2.2 立地因子预处理

林业二类调查将调查区分为若干个小的区域,区域划分一般按相同树种,同一行政区,同一类地貌等原则划分,因此划分的区域都有相同的地类地貌,相同的优势树种便于调查记录,划分的区域称为小班,小班为调查的基本单位。

2.2.1 要素处理

基于预处理得到的影像,需要提取其中所需的变量因子用于模型建立,提取的依据是森林二类调查得到的小班shape文件,小班数据布设满足受干扰少,远离林缘等原则,分别用GPS记录样地点的样本点,样本点满足具有代表性原则。蓄积量分布图如图3所示。

图3 蓄积量分布图

2.2.2 数据规范化

因为数量级的关系,影响模型的拟合效果和结果分析。因此对特征变量和蓄积量进行规范化处理,规范化在matlab2016年中进行,归一化用mapminmax函数。

2.2.3 数据完整性

外业调查中,有些幼林以及某些地类由森林用地变为其它地类,所以蓄积量为空或者0,为了满足数据的完整性要求,应用excel中对数据的筛选操作,对于一些数据缺失的值进行筛选淘汰。

3 特征变量选取及分析处理

3.1 光谱指数是通过特定的波段进行线性或非线性组合得到的一种光谱参数,建立时考虑了部分植物内部的理化机制[9]。对于图像的处理在Arcgis和ENVI中进行,获得了校正后的南雄遥感图像,对应小班的NDVI,以及波段信息等,同时经过计算,得到比值指数以及差值指数。从调查表获得坡度,坡向,海拔,树龄,郁闭度,地貌,A层土壤层厚度(当有AB层时应为(A+AB)/2),腐殖质厚度,影响因分为立地因子,遥感因子。对于数据的分析相关性分析在SPSS中实现,POS算法优化的BP神经网络模型在Matlab2016a中实现。DEM如图4所示。

图4 DEM图

为充分模拟地表情况,可在DEM的表面覆盖上遥感影像[10]。通过将得到的数据的高程信息叠加在landset8影像上进行皮肤覆盖,将波段组合设置为真彩色,为了处理单位的影响,设置拉伸比例系数,最终得到原始影像的3D表现形式。下图为得到的DEM影像的高程通过ArcSense处理与原始遥感影像结合并且三维显示的图像如图5所示。

图5 研究区三维显示

3.2 首先通过相关性分析各因子与蓄积量关系的置信程度,选取置信度为‘*’及以上的因子参与建模:通过双变量相关性皮尔森双尾检验,变量因子与公顷蓄积之间线性相关关系不强说明自变量与因变量之间具有强非线性关系。

3.3 为了解决自变量因子之间的相关性影响分析结果,对自变量因子进行逐步回归法剔除具有显著相关性的因子。最终指标选择腐殖质厚度,龄组,郁闭度,平均年龄,NDVI,b4,坡度7个自变量构建线性回归模型。

4 结果展示

4.1 线性回归模型

最后得到的反演模型如下:

V=0.263X1+0.048X2-0.266X3+0.419X4-0.206X5-1.654X6-0.05X7+0.095

(1)

式中,X1,X2,X3,X4,X5分别代表腐殖质厚度,龄组,郁闭度,平均年龄,NDVI,b4,坡度7个自变量,V为蓄积量,表2是相关系数,从中可以得到模型的拟合度信息。

表2 反演结果

为了直观看出模型的拟合度,使用未归一化的数据制作的蓄积量的预测值和原始蓄积量之间的差值图像如图6所示。

图6 预测值实际值差值

从线性回归结果来看,预测值与真实值之间还有一定的差距且两者之间的差值没有明显的规律,但是基本上稳定在15左右,误差在蓄积量很大的森林中影响不大,但在年份不高,蓄积量偏低的地区模型还需要优化。

4.2 神经网络拟合模型结果

神经网络的构建:首先将样本分为两部分,一部分用于模型的训练,另一部分精度验证,训练样本的容量越大,训练的精度越高。训练以及拟合得到的散点图,如图7所示。

图中training对相应的表为训练样本得到的散点图,test为验证精度得到的散点图,从图中可看出,训练精度高于验证精度,对于原始样本的拟合精度达到0.812,应用训练后的模型,得到验证样本的拟合度,精度达到0.700,总体精度达到0.785。

图7 (BP神经网络结果)

从精度上来看。神经网络的拟合精度高于逐步回归模型精度,但逐步回归分析剔除了很多有相关性的因子,而神经网络是对原始样本的拟合。

5 结果分析与展望

(1)对蓄积量的反演图像预处理,外业数据的获取精度以及反演模型的选择是提升建模精度的关键手段,不同建模方法的建模精度有所差异。对比本文两种反演方法整体上相关性基本趋于一致。由于这些森林参数受气候,地形,种植密度等因素的影响对蓄积量的估计产生偏差,研究中使用的各项指数对于该地区蓄积量的估测可给予指导,对外业工作也有指导作用。

(2)对比相关系数来看,多元线性回归相关系数为0.714,神经网络的相关系数为0.785,因此相关系数关系为神经网络>多元线性回归,其次,神经网络对于数据量的要求很大,这正好满足森林调查数据的特性,综合考虑,机器学系中的神经网络对于蓄积量的反演有更好的效果。两种建模方法对比,神经网络优于逐步回归。多元线性的逐步回归建模方法虽然可以快速建模,特别适用于所要建模的关系不是特别复杂并且数据量不大,易于解决数据变量之间的重相关性等问题,但也会损失部分有效信息,对于非线性数据进行回归设计可能比较困难,在建立线性回归模型解决非线性问题时表现能力较弱。神经网络建模方法需要大量数据样本的支持,但是从训练精度上来看其精度R可达到0.812,且林业数据的样本容量很大,很适合神经网络的反演要求,因此在大面积多样本的蓄积量反演中,神经网络有明显的优势,因此实际应用中可更好的为未来蓄积量的精确估计提供实时高效的技术服务。

(3)经过后期分析发现,平均蓄积量在70~80之间的样地信息对于模型的拟合度更高。

(4)对于特定林场的蓄积量估计可以结合准确的树木类型以及年龄信息建立树木生长模型同时结合神经网络反演模型可以得到更加准确的蓄积量信息。

猜你喜欢
蓄积量反演校正
反演对称变换在解决平面几何问题中的应用
基于ADS-B的风场反演与异常值影响研究
Meteo-particle模型在ADS-B风场反演中的性能研究
长期运行尾矿库的排渗系统渗透特性的差异化反演分析
劉光第《南旋記》校正
基于特征分解的方位向多通道SAR相位失配校正方法
当阳市森林植被碳储量及其价值评价
一种具有自动校正装置的陶瓷切边机
祁连山青海云杉林生物量与碳储量及其影响因素分析
基于在线约束限制的飞行器预测校正制导