基于PROSAIL模型和多角度遥感数据的森林叶面积指数反演*

2021-05-21 08:22丁鸣鸣崔琳琳
林业科学 2021年4期
关键词:植被指数冠层反射率

潘 颖 丁鸣鸣 林 杰 代 侨 郭 赓 崔琳琳

(1.南京林业大学南方现代林业协同创新中心 南京 210037; 2.长江航道工程局有限责任公司华东分公司 南京 210011; 3.南京市水务局 南京 210036)

森林生态系统作为陆地生态系统的最大碳库,在全球碳循环中扮演着源、库、汇的作用,而城市森林作为城市重要的生命支撑系统,是城市可持续发展的基础和保障(林文鹏等, 2008)。叶面积指数(leaf area index, LAI)通常被定义为植被叶、茎、花、果等组分的总面积与土地面积之比(Chenetal., 1996),是生态系统碳循环、水文和气候等模型中不可或缺的重要组成参数,已被广泛应用于森林监测、植被评价和农作物产量预估等(Mynenietal., 2002; Sonnentagetal., 2007)。LAI能够反映植被水平覆盖状况和垂直结构特征,甚至枯枝落叶层厚薄和地下生物量多少,这些也是植被影响土壤侵蚀的主要方面(杨勤科等, 2006; 杨敏等, 2015)。因此,及时、准确、有效估算区域尺度上高质量植被LAI,对研究土壤侵蚀与植被的关系至关重要(Linetal., 2014)。

遥感具有及时、高效探测大面积目标地物光谱特征的能力,是获取区域乃至全球尺度上植被参数的主要手段,利用遥感影像构建植被指数已被广泛用于植被LAI反演研究中(Liangetal., 2015; Linetal., 2014; Liuetal., 2012)。林文鹏等(2008)基于SPOT5遥感影像建立实测LAI与植被指数之间的线性回归关系,结果发现修正土壤调节植被指数(modified soil adjusted vegetation index,MSAVI)和优化叶绿素吸收率指数(modified chlorophyll absorption in reflectance index,MCARI)能够消除土壤背景和叶绿素的影响,适用于城市森林LAI遥感反演,而归一化植被指数(normalized difference vegetation index,NDVI)会受背景等因素不同程度的影响。杨敏等(2015)基于Landsat 8 OLI遥感影像构建隐含层为2层的反向传播(back propagation,BP)神经网络,模型不仅具有较高的LAI反演精度,而且具有较高的空间可靠性。姚雄等(2017)结合法国Pleiades遥感数据,利用12种遥感植被指数构建随机森林(random forest, RF)林地LAI反演模型,结果发现RF模型不容易出现过拟合现象,其精度高于支持向量回归(support vector regression,SVR)模型和BP神经网络模型。

多角度遥感从不同方向多种角度对同一地物进行观测,可提供丰富的地物信息,具备较强的植被结构参数反演能力,且能够减少“异物同谱”和“同物异谱”等现象对反演结果造成的影响(杨贵军等, 2011)。相比于单一角度垂直观测的遥感数据,多角度遥感数据能够反映植被立体结构信息和地物多维空间结构特征,可以改善传统的单角度遥感数据反演植被LAI精度低等问题,对于有效反演地表植被结构参数具有重要意义(李新辉等, 2011; Wangetal., 2016)。Fan等(2009)基于多角度PROBA/CHRIS(project for on-board autonomy/compact high resolution imaging spectrometer)数据和混合冠层反射率模型提出一种新的高光谱方向二阶导数方法(hyperspectral directional second derivative method,DSD),能够有效消除背景影响,提高LAI反演精度。赵妍等(2013)指出,多角度遥感数据反演的LAI对研究森林植被生物量和森林生态系统碳水循环等具有重要意义。

经验模型法和物理模型法是目前最常用的LAI反演方法。经验模型法指在植被指数或反射率与LAI之间建立线性或非线性回归模型,但模型易饱和,且通用性受限(Schlerfetal., 2006)。物理模型法指利用以物理方法为基础的植被冠层反射率模型进行LAI反演,其中植被冠层辐射传输模型PROSPECT+SAIL(scattering by arbitrarily inclined leaves)——PROSAIL模型既考虑土壤的光学特性,又考虑植被的几何结构特征,具有良好的模拟效果(杨贵军等, 2011; 余金林, 2014; Jacquemoudetal., 2009)。谷成燕等(2013)、杜育璋等(2016)利用PROSAIL辐射传输模型模拟的植被冠层反射率建立查找表反演植被LAI,结果发现基于PROSAIL模型的植被LAI遥感反演结果与LAI实测值具有较高一致性,反演精度较高。

综上可知,多角度遥感数据可以充分挖掘植被立体结构信息,随机森林算法能够减少反演过程中的过拟合现象,PROSAIL模型具有较好的植被冠层反射率模拟效果。由此可见,利用多角度遥感数据,结合PROSAIL辐射传输模型和随机森林算法能够提高植被LAI遥感反演精度,对研究森林生态系统碳循环具有重要意义。

鉴于此,本研究基于多角度PROBA/CHRIS遥感数据和野外实测数据,结合PROSAIL模型和随机森林模型反演森林LAI,并对LAI反演结果进行精度验证和评价,以期提高植被LAI遥感反演精度,为区域土壤侵蚀遥感定量监测提供新的方法和模型。

1 研究区概况

紫金山位于南京城区东郊,32°01′57″—32°06′15″N、118°48′00″—118°53′04″E,属低山丘陵,土壤以黄棕壤为主(王春, 2009)。地处北亚热带季风性气候区,四季分明,年均气温15.7 ℃以上,全年降水分布不均,年降雨量1 021 mm左右。典型地带性植被类型为常绿-落叶阔叶混交林,主要由针叶林、阔叶林、落叶常绿混交林、针阔混交林和竹林等组成,树木生长季主要为春夏季。紫金山大部分森林为人工林,森林覆盖率80%,森林郁闭度0.75~0.8(王春, 2009; 陈添兴, 2012)。

幕府山位于南京城区北面,32°07′47″—32°10′00″N、118°44′58″—118°51′06″E,主要由岗地、低山、河漫滩和少量平地组成(李林, 2004)。土壤主要为石灰岩残丘和其他基性岩浆上发育起来的土壤以及少量人工土壤和碳酸土等(李林, 2004; 刘国华, 2004)。地处北亚热带湿润气候区,四季分明,热量充沛,年均气温15.4 ℃,雨量充足,年降雨量800~1 000 mm,降水主要集中在6月中旬到7月中上旬。典型地带性植被类型为常绿-落叶阔叶混交林,无明显优势树种,树木生长季主要为春夏季。幕府山森林以人工林为主、天然次生林为辅,群落结构分为乔木层、灌木层和草本层3个层次(李林, 2004)。

2 研究方法

2.1 样地设置及野外数据测定

2.1.1 叶面积指数测定 于2017和2018年7—9月上旬进行LAI测定,选择天空晴朗、无积云、能见度好的天气,测定时间为6:30—10:30和14:00—17:30,尽量避免太阳直射。由于地面测定时间在遥感数据成像后2年,因此样方选择植被变化少、人为干扰小的区域(曹建军等, 2013)。选取不同林分类型(针叶林、阔叶林、针阔混交林),在每种林分类型内选择地势坡度较缓、植被分布均匀且变化小的地区进行测定,样方大小为10 m×10 m,采样间距大于30 m,共114个样方。采用LAI-2200C冠层分析仪,在每个样方的4个角和中心点测定5个LAI,取其平均值作为该样方的LAI。利用GPS记录样方地理位置,坐标参考WGS-84,重复测定2~3次,取其平均值作为结果。研究区内采样点分布如图1所示,不同植被类型的LAI实测值描述统计如表1所示。

图1 采样点分布Fig. 1 Distribution of sampling points

表1 采样点不同植被类型的LAI描述统计Tab.1 Descriptive statistics of LAI values of different vegetation types in sampling points

2.1.2 叶片光谱测定 叶片光谱测定在天气良好、无风或风力较小的条件下进行,采用美国产ASD FieldSpec Pro2500光谱辐射仪,测定时间为10:30—14:00。光谱范围为350~2 500 nm,采样间隔350~1 000 nm 范围内为1.4 nm,1 000~2 500 nm 范围内为2 nm。探头视场角为25°。每片叶片取3个点进行测定,每个测点视场范围内重复20次,取其平均值。光谱测定前后立即进行参考板校正(张海波等, 2014; 邢著荣, 2010; 刘天凤, 2014)。

2.2 实验室数据测定

2.2.1 叶片面积测定 采用网格法测定叶片面积。首先将采集的新鲜叶片分为3组,每组10片,在方格纸上将每片叶子的轮廓用铅笔描绘下来,然后利用方格面积与叶片面积呈正比的关系计算叶片面积(张清林等, 2011)。

2.2.2 叶片等效水厚度计算 在PROSAIL模型中,叶片含水量为等效水厚度(equivalent water thickness,Cw),定义为单位叶片面积单位质量叶片内含有的水分质量。计算公式如下:

Cw=(叶片鲜质量-叶片干质量)/

(叶片面积·ρ)。

(1)

式中:ρ为水的密度(g·cm-3)。

2.2.3 叶片干物质含量计算 叶片干物质含量(leaf dry matter content,Cm)指叶片内淀粉、纤维素和蛋白质等含量。在PROSAIL模型中,叶片干物质含量定义为单位叶片面积内的干物质质量(g·cm-2)。计算公式如下:

Cm= 叶片干物质质量/叶片面积。

(2)

2.2.4 叶绿素a、b含量测定 叶绿素a、b含量(chlorophyll a and b content,Cab)测定参考张清林等(2011)。取新鲜叶片3份,每份0.2 g,加入95%乙醇及适量石英砂和碳酸钙粉,研磨成匀浆至组织发白,过滤,用UV2450-紫外可见分光光度计测量波长 665和649 nm处的消光度(D)。计算公式如下:

Ca=13.95×D665-6.88×D649;

(3)

Cb= 24.96×D649-7.32×D665;

(4)

色素含量(mg·g-1)=C·V/W/1 000。

(5)

式中:Ca和Cb分别为叶绿素a和叶绿素b浓度;D665和D649分别为波长 665和649 nm处的消光度;C为色素浓度(mg·L-1);V为提取液体积(mL);W为叶片样品鲜质量(g)。

2.3 遥感影像数据及预处理

2.3.1 遥感影像数据 采用多角度PROBA/CHRIS遥感数据,影像获取时间为当年7—9月,尽量选取无云影像(表2)。

PROBA卫星是欧空局2001年10月22日发射的新一代微卫星,为太阳同步轨道,轨道高度615 km,倾角97.89°。卫星上搭载紧凑式高分辨率成像分光计CHRIS、辐射测量传感器SREM和碎片测量传感器DEBIE。CHRIS作为一种成像装置,成像模式多、光谱范围宽、分辨率高,能够获取目标-55°、-36°、0°、36°和55°5种角度的观测信息(角度为正表示前向观测,角度为负表示后向观测)(杨贵军等, 2011)。CHRIS L1数据共有5种成像模式: 模式1为陆地和水成像; 模式2为水成像; 模式3、4和5主要为陆地成像。本研究选取Mode 3数据,共18个光谱波段,天底点地面分辨率为17 m。因多角度PROBA/CHRIS遥感数据受传感器和云层影响较大,故只有2015年9月7日数据。研究区树木生长季主要为春夏季,野外调查时间稍早于影像成像时间,对反演结果影响不大。

表2 多角度遥感数据源Tab.2 Multi-angle remote sensing data resources

2.3.2 遥感影像数据预处理 多角度PROBA/CHRIS遥感数据预处理主要包括去噪、云掩膜、大气校正和几何校正。首先,利用欧空局提供的HDFclean(http:∥www.earth.esa.int/proba/HDFclean v2.htm)软件对影像进行去噪处理和缺失像元填充。由于获取数据时天气良好,没有云层污染,因此未对数据进行云掩膜处理。然后,利用欧空局提供的BEAM软件对CHRIS数据进行大气校正。最后,使用校正好的南京市2007年TM遥感影像,在研究区内选择15个地面控制点,采用二次多项式拟合法和双线性内插法进行几何校正,将误差控制在0.5个像元内。由于多角度PROBA/CHRIS遥感数据获取区域在研究区内,因此未进行影像裁切。

2.3.3 最佳波段选取 CHRIS Mode 3数据包含18个光谱波段,波段间具有较强相关性。为了选取信息量大、冗余性小的波段,利用主成分分析法对高光谱波段间的统计数据进行计算,并通过分析相关系数和协方差矩阵获取最佳反演波段(Brogeetal., 2001)。首先,计算CHRIS影像波段间的相关系数矩阵,如图2所示,18个光谱波段相邻波段的相关系数较高,而间隔较远波段间的相关性较弱,沿对角线明显分块,为方便最佳波段选取,将CHRIS影像波段分为波段1-5、6-11和12-18共3部分; 然后,计算各分段区的协方差矩阵和特征值,确定各分段区的主成分个数,进而计算每个主成分对波段的贡献率,贡献率越大,波段所含信息量越大; 最后,根据贡献率大小选取最佳波段。第n波段第x主成分的贡献率为:

(6)

式中:Pnx为第n波段第x主成分的特征向量;λx为第x主成分的特征向量; Varn为协方差矩阵中第n波段的方差。

最终确定CHRIS数据的最佳波段组合为第5、8和18波段,中心波长分别为570.9、676.0和1 022.0 nm。

图2 CHRIS影像波段间的相关系数矩阵Fig. 2 Correlation coefficient matrix between CHRIS image bands

2.4 研究方法

2.4.1 PROSAIL模型 PROSAIL模型整合叶片光学特性模型PROSPECT和冠层反射率模型SAIL,考虑土壤非朗伯特性、叶片镜面反射、植被冠层热点效应和叶倾角分布情况,使用2层冠层结构,同时考虑植被冠层水平和垂直方向上的异质性,能够很好描述均匀植被冠层的反射特性,具有良好模拟结果,在LAI反演、生理生化参数反演以及光谱模拟等方面广泛应用(谷成燕等, 2013; 赵虹等, 2014; 王李娟等, 2014)。PROSPECT模型是Jacquemoud等(1990)提出的基于ALLEN平板模型改进的辐射传输模型,主要用于计算 400~2 500 nm间隔5 nm的上行和下行辐射通量,从而得到叶片的反射率和透射率。SAIL模型是Verhoef(1984)基于SUITS模型发展的用于描述植被冠层二向性反射率的辐射传输模型。PROSAIL模型公式如下:

ρc=PROSAIL(LAI,ALA,N,Cab,

Cw,Cm,SL,Diff,θv,θs,φ) 。

(7)

式中:ρc为冠层反射率; LAI为叶面积指数; ALA为平均叶倾角(°);N为描述叶片内部细胞结构的参量,与植物种类和生长状态有关,一般情况下单子叶植物N为1~1.5,双子叶植物N为 1.5~2.5,老化叶N大于2.5(Darvishzadehetal., 2008);Cab为叶片叶绿素a、b含量(μg·cm-2);Cw为叶片等效水厚度(cm);Cm为叶片干物质含量(g·cm-2);SL为热点参数; Diff为漫反射系数;θv和θs分别为观测天顶角和太阳天顶角;φ为太阳与观测相对方位角。

2.4.2 PROSAIL模型参数敏感性分析 为更好利用冠层反射率反演LAI,需了解各生化组分参数对冠层反射率变化的敏感程度和影响的波段区间(吴伶等, 2012)。参数敏感性分析是确定模型关键参数和控制模型效率非常有效的过滤工具,细化敏感性大的参数,将敏感性小的参数设为定值,既可建立完整的模拟集,又能减少数据的冗余性,有助于优化模型构建和参数反演(谷成燕等, 2013)。其中,定性分析是通过改变待分析参数取值,固定其他参数取值,得到一系列模拟的冠层反射率,基于冠层反射率曲线变化反映该参数的敏感性强度; 而定量分析则是考察在某个参考值附近一定范围内,模型输出的冠层模拟反射率变化情况(谷成燕等, 2013)。定性分析过程中模型各参数变化范围选取依据如下: LAI变化范围根据野外实测LAI范围设置;N和SL参考石锋(2012);Cab、Cw和Cm变化范围根据实验室测量数据范围设置;θs、θv和φ取值根据观测角度为0°时的影像头文件信息设置。采用Spherical函数(蔡博峰等, 2007)模拟叶面积倾角,土壤背景选择潮湿土壤,具体参数设置如表3所示。

2.4.3 PROSAIL模型适用性分析 利用PROSAIL模型模拟冠层反射率过程中,先通过PROSPECT模型模拟林地叶片反射率,再通过SAIL模型模拟林地冠层反射率。PROSPECT模型模拟叶片反射率时,需先与研究区实测叶片反射率进行匹配,通过不断调试找到最适参数,使模型模拟反射率与实测反射率有较好匹配,匹配情况由误差函数验证(谷成燕等, 2013)。计算公式如下:

(8)

2.4.4 植被指数选取 LAI变化与叶片光学性质变化有关,与植被光谱红光和近红外波段反射率有很强相关性,基于特征波段构建的植被指数可用于估算LAI(Pearsonetal., 1972)。Broge 等(2001)研究发现,当直接使用多波段光谱数据反演 LAI 时,反演方法复杂且容易受影像中水汽吸收等因素干扰,而植被指数利用波段比值等方式,能够减小冠层阴影和土壤背景等干扰因子的影响,从而突出植被信息,是估算植被叶面积指数的重要工具。

本研究借鉴以往经验(姚雄等, 2017),选择RVI(比值植被指数,ratio vegetation index)、NDVI、PVI(垂直植被指数,perpendicular vegetation index)、DVI(差值植被指数,difference vegetation index)、SAVI(土壤调节植被指数,soil adjusted vegetation index)、EVI(增强型植被指数,enhanced vegetation index)、MSAVI和SIPI[结构不敏感色素(植被)指数,structure insensitive pigment (vegetation) index]8 种对LAI敏感的植被指数,计算公式如表4所示。通过分析8种植被指数与LAI的相关性,选择相关性较高的植被指数参与LAI建模和反演,相关性分析采用SPSS 20.0(SPSS Inc,USA)软件进行。

表3 敏感性分析参数设置①Tab.3 Parameter settings of sensitivity analysis

表4 植被指数及其表达式①Tab.4 Vegetation indices and their expressions

2.4.5 随机森林LAI反演 随机森林是一种基于分类回归树的集成机器学习算法,是Breiman(2001)提出的Bagging算法的变体,其运算速度快、计算高效、预测准确性高,对异常值和噪声有很好的容忍度,且由于样本内部进行交叉检验,不会出现过拟合现象(吕杰, 2012; 吴志明等, 2018)。

本研究通过Python自带的scikit-learn机器学习库实现随机森林算法的构建。将植被指数作为自变量,LAI作为因变量,选取70%样本用于参数优化和模型构建,30%样本用于模型检验。主要步骤如下: 1) 采用bootstrap技术进行重采样,在原始数据集中有放回地随机抽取n个样本作为训练集,生成对应决策树,未被抽取到的样本构成袋外数据集; 2) 假设有M个输入变量,每株树的节点从M个变量中随机选择k个,用于确定该节点的最佳分裂点; 3) 使每株决策树都最大限度地生长而不剪枝,直至满足分割终止条件; 4) 对所有决策树求平均值获得最终预测值。

首先将模拟的冠层反射率通过光谱响应函数模拟到多角度PROBA/CHRIS影像的b1(442 nm)~b18(1 019 nm)波段上,以与LAI相关性较高的植被指数作为自变量。其次确定回归过程的关键参数,包括决策树数量(n_estimators)、最大特征数量(max_features)、最大深度(max_depth)和分裂性能函数(criterion)。对于n_estimators,主要通过设置不同决策树数量得到不同模型误差,观察误差变化趋势从而确定n_estimators;当n_estimators增加时,模型误差趋于稳定,选择该值为最佳n_estimators,在本研究中当决策树数量达到1 000后,模型误差趋于稳定,因此将1 000作为最佳n_estimators。max_ features设置为自动,max_depth默认为不输入,criterion设置为均方误差。

LAI反演过程的技术路线如图3所示。

图3 LAI反演技术路线Fig. 3 Pretreatment flow chart of LAI inversion

2.4.6 精度评价 决定系数(coefficient of determination,R2)被用于评价模型模拟值与实测值之间的拟合效果(Qietal., 2013),其值越接近于1,表明模型拟合精度越高。计算公式如下:

(9)

均方根误差(root mean square error,RMSE)和平均绝对百分误差(mean absolute percentage error,MAPE)被用于评价模型预测值与实测值之间的误差,其值越小,表明模型精度越高。计算公式如下:

(10)

(11)

3 结果与分析

3.1 PROSAIL模型参数敏感性分析

图4 冠层反射率随模型参数变化曲线Fig. 4 Curve of canopy reflectance with different model parameters

PROSAIL模型中各生化组分参数在不同波长下的冠层反射率如图4所示。叶面积指数(LAI)对可见光波段(400~800 nm)范围内的冠层反射率影响较小,对近红外和短波红外波段的冠层反射率影响较为显著,冠层反射率随LAI增大而增大;但随着波段增加、LAI增大,冠层反射率变化幅度减小,逐渐趋于饱和。叶片结构参数(N)影响整个光谱范围内的冠层反射率,N增大,植被多次散射效应增强,冠层反射率随之增大,特别是绿光和整个红外波段,冠层反射率逐渐增大。叶绿素a、b含量(Cab)对可见光波段范围内的冠层反射率影响很大,冠层反射率随Cab增加呈逐渐降低趋势,绿光波段处较为敏感;800 nm后,Cab对冠层反射率几乎没有影响,冠层反射率趋于一致。叶片等效水厚度(Cw)对可见光波段范围内的冠层反射率没有影响,这是因为Cw主要通过水分对光谱的吸收作用影响冠层反射率;而水分对960 nm后的波段吸收较为明显,冠层反射率随Cw增大逐渐减小,变化较为显著。叶片干物质含量(Cm)对可见光波段范围内的冠层反射率几乎没有影响,原因可能是叶绿素吸收掩盖了干物质含量对冠层反射率的影响(余金林, 2014);Cm对近红外及其以外波段的冠层反射率影响较为明显,冠层反射率随Cm增大逐渐减小。热点参数(SL)对可见光波段范围内的冠层反射率无明显影响,但在760~1 300 nm和1 400~1 850 nm波段,冠层反射率随SL增大而增大,变化相对明显。

由上述分析可知,LAI和N影响整个光谱范围内的冠层反射率,尤其在近红外波段影响最为显著;Cab对400~800 nm可见光波段范围内的冠层反射率影响较大;Cw主要影响960 nm后的光谱,冠层反射率随Cw增大逐渐减小;Cm对近红外及其以外波段的冠层反射率影响较为明显,冠层反射率随Cm增大逐渐减小;SL影响760~1 300 nm和1 400~1 850 nm波段的冠层反射率。各输入参数敏感性大小为LAI>Cab>Cm>SL>N>Cw。

根据冠层反射率在相应波段的变化程度,结合波段主成分分析,确定多角度PROBA/CHRIS遥感数据的b5、b8和b18波段(分别为绿、红和近红外波段)参与敏感度计算,并将取值范围按照波长划分为5个等级。在参数取值不同的情况下,用各等级的冠层反射率计算模型中各参数的敏感度。计算公式(余金林, 2014)如下:

(12)

式中:Si为敏感度;Ri和Ri+1分别为第i等级和第i+1等级的冠层反射率。

由表5定量分析结果可知,各参数敏感性大小为LAI>Cab>Cm>SL>N>Cw,与定性分析结果一致。

LAI和Cab对冠层反射率影响较大,将其设为变化输入参数,其余设为常量输入参数。LAI取值范围参照野外实测LAI及石锋(2012)和邢著荣(2010);Cab取值范围参照实验室测量数据;Cm和Cw取值源于实验室测得的大量不同树种叶片生化组分参数的加权平均值;θv、θs和φ由多角度影像头文件信息获得;SL、N和ALA取值源于石锋(2012)、蔡博峰等(2007)。PROSAIL模型的变化和常量输入参数如表6、7所示。根据确定的模型输入参数,利用PROSAIL模型模拟5种观测角度下的冠层反射率,得到多角度冠层反射率模拟数据集。

3.2 PROSAIL模型在林地上的适用性

由图5a(以垂直向下观测为例,观测角度0°)可知,PROSPECT模型模拟叶片反射率与实测叶片反射率的一致性相对较好,模拟值与实测值之间线性方程的R2为0.992 7,RMSE为0.034 7,说明模型模拟叶片反射率精度较高,可用于进一步模拟林地冠层反射率。由图5b可知,PROSPECT模型模拟叶片反射率与实测叶片反射率的绝对偏差(丨模拟值-实测值丨)较低,在红光波段(550 nm附近)模拟值偏大,在近红外波段(750 nm后)模拟值偏小,原因可能是模型中一些输入参数没有实测数据,结合参考文献和经验值会给模拟结果带来一定误差,另外实测叶片反射率还受天气和试验仪器等影响,会有一定偏差(邢著荣, 2010)。

表6 PROSAIL模型变化输入参数和范围Tab.6 Variable input parameters and ranges of PROSAIL model

表7 PROSAIL模型常量输入参数Tab.7 Constant input parameters of PROSAIL model

图5 PROSPECT模型模拟叶片反射率与实测叶片反射率Fig. 5 The relationship between the simulated and measured leaf reflectance

通过光谱响应函数,将PROSAIL模型模拟的35个样方冠层反射率匹配到多角度PROBA/CHRIS遥感数据5种观测角度的18个波段上,与多角度数据大气校正后提取的样方地表反射率进行精度对比。由表8可知,除了-55°外,其余由PROSAIL模型模拟的冠层反射率精度较高,其中0°的模拟精度最高,RMSE和MAPE 分别为0.047 3和0.376 1; -55°的模拟精度最低,RMSE和MAPE 分别为0.127 2和0.654 7。由此可见,PROSAIL模型模拟的冠层反射率适用于接下来的计算。不同观测角度数据模拟的冠层反射率精度大小为0°>36°>-36°>55°>-55°。

表8 各角度模拟冠层反射率与影像反射率的精度评价Tab.8 Accuracies of simulated canopy reflectance and image reflectance at different angles

3.3 LAI与不同植被指数的相关性分析

5种观测角度下,实测LAI与模拟冠层反射率计算得到的植被指数之间的相关性分析结果如表9所示。可以看出,除了-36°和±55°的RVI和NDVI与LAI分别呈显著相关(P<0.05)和显著不相关外,其余6种植被指数在5种观测角度下均与LAI呈极显著相关(P<0.01)。除了MSAVI、SAVI和SIPI外,其余3种植被指数与LAI的相关系数均在0.8以上,其中PVI与LAI的相关系数最高,除55°外,均达到0.9以上。

0°和±36°观测角度下,8种植被指数与LAI的相关系数由大到小依次为PVI、DVI、EVI、MSAVI、SAVI、SIPI、RVI和NDVI。±55°观测角度下,8种植被指数与LAI的相关系数由大到小依次为PVI、DVI、EVI、SAVI、MASVI、SIPI、RVI和NDVI。8种植被指数均在0°观测角度下与LAI的相关性最高。

由相关性分析结果可知,选取的8种植被指数均能较好反映林地LAI变化。除了RVI和NDVI外,其余6种植被指数在5种观测角度下均与实测LAI呈极显著相关,且相关系数均在0.5以上,可作为随机森林模型的输入参数。

表9 实测LAI与不同观测角度下植被指数之间的相关性分析结果①Tab.9 Correlation analysis results of LAI and vegetation indices at different angles

4 讨论

4.1 基于多角度遥感数据的随机森林LAI反演模型精度评价

由于多角度遥感数据可以获取地面目标的立体结构信息,植被不同层次对冠层反射率的贡献比例随观测角度改变而变化,因此基于多角度遥感数据进行参数反演能够提高冠层结构参数的识别能力和反演精度(杨贵军等, 2011)。为了探究角度变化和不同角度组合对森林LAI反演结果的影响,本研究利用每种角度模拟的冠层反射率计算每种角度的植被指数,构建单角度和多角度反演数据集,建立基于单角度和多角度数据的LAI-VI反演模型,角度组合形式如表10所示,共31种组合,其中单角度数据集5种、多角度数据集26种。

表10 LAI反演模型构建的角度组合方式Tab.10 Observation angle combinations of LAI inversion model

基于单角度数据的随机森林LAI反演模型精度如表11所示。可以看出,在单角度LAI反演模型中,精度最高的为前向观测角度55°(R2=0.915 7,RMSE=0.235 7,MAPE=0.042 6),该角度与卫星过境时的太阳天顶角(θs=61.88°)最接近,能较好表达植被的前向反射特点(杨贵军等, 2011)。相比传统垂直观测角度0°,前向观测角度55°模型的R2提高0.75%,RMSE和MAPE分别降低3.76%和5.12%。单角度LAI反演模型精度由高到低依次为55°、36°、0°、-55°、-36°。

基于多角度数据的随机森林LAI反演模型精度最高的组合汇总如表12所示。可以看出,在多角度LAI反演模型中,精度最高的为0°、36°和55°的3角度组合(R2=0.918 4,RMSE=0.231 9,MAPE=0.041 5),相比单角度55°,R2提高0.29%,RMSE和MAPE分别降低1.61%和2.58%。相比传统垂直观测角度0°,3角度组合模型的R2提高1.05%,RMSE和MAPE分别降低5.31%和7.57%。

表11 基于单角度数据的随机森林LAI反演模型精度Tab.11 Accuracies of random forest LAI inversion model based on single angle data

由表12还可以看出,增加1种观测角度,模型反演精度有一定提高,特别是从1种角度增加到2种角度时,模型R2相比单角度55°提高0.21%,RMSE和MAPE分别降低1.15%和0.70%;当观测角度从2种增加到3种时,模型反演精度也有所提高,模型R2提高0.09%,RMSE和MAPE分别降低0.47%和1.89%。但随着角度组合数进一步增加,模型反演精度反而减小,特别是由4种角度增加到5种角度时,分析其原因可能是角度组合数过多会造成光谱信息冗余,且由于单角度-36°和-55°反演LAI时精度较低,因此包含这2种角度的模型精度会有所降低。由此可知,一方面,增加观测角度可提供更多植被冠层结构信息,LAI反演精度随观测角度增加而增加,但另一方面,观测角度过多会使像元空间重采样、叶片阴影和土壤阴影等问题带来更多不确定性,LAI反演精度反而下降。

表12 基于多角度数据的随机森林反演模型精度Tab.12 Accuracies of random forest LAI inversion model based on multi-angle data

5种观测角度下,PVI与LAI的相关性均最高。为了进一步证明随机森林反演模型在区域尺度上反演森林LAI的优越性,本研究利用单角度和多角度数据分别构建基于像元尺度的LAI-PVI回归模型,包括指数、线性、对数和幂函数模型,结果发现,指数模型的反演精度最高(表13)。相比非线性回归模型,单角度随机森林LAI反演模型的R2提高0.70%,RMSE和MAPE分别降低15.40%和11.98%; 多角度随机森林LAI反演模型的R2提高0.79%,RMSE和MAPE分别降低6.72%和9.19%。由此可知,无论是单角度还是多角度数据,随机森林LAI反演模型精度均高于非线性回归模型,表明相比传统回归模型,随机森林模型能够明显提高LAI反演精度,适用于区域植被LAI反演。

表13 基于单角度和多角度数据的非线性回归模型反演精度最高的组合汇总Tab.13 Summary with the highest accuracies of non-linear regression models based on single and multi-angle data

4.2 基于多角度遥感数据的随机森林LAI反演模型应用

综上分析可知,基于多角度PROBA/CHRIS遥感数据的随机森林LAI反演模型最佳角度组合为0°、36°和55°的3角度组合。鉴于多角度遥感影像的公共区域只有紫金山西部,因此本研究只对该区域进行LAI反演,得到紫金山西部区域LAI介于0.44~6.70之间,林地LAI均值为3.04,紫金山西部林地LAI整体上呈北部和南部高、中间低的空间分布格局(图6)。

紫金山西部大部分林地的LAI高于3.0,而大部分城区的LAI低于2.0。林地北部和南部的LAI相对较高,结合野外调查数据和小班资源图发现,紫金山林分类型以阔叶林为主,其次为针叶林和针阔混交林,且针叶林的LAI大部分高于3.5,林地垂直结构多为乔灌草; 而中间部分林地的LAI小于3.0,原因可能是该区域植被较稀疏,林分结构单一,林地垂直结构多为乔草。由于研究区植被类型复杂,多角度PROBA/CHRIS遥感数据的覆盖区域较小,且建模数据比影像数据延后2年,加上影像范围内缺少充足有效的实测植被冠层反射率数据,因此将模型移植到影像上的反演结果会存在一定偏差。

为进一步考察基于PROSAIL模型和多角度遥感数据的随机森林LAI反演模型在紫金山西部林地的应用精度,本研究利用紫金山区域内20个样方的实测LAI进行验证。由图7可知,LAI实测值与反演值的散点图较好地分布在1∶1线附近,RMSE和MAPE分别为0.190 3和0.026 0,表明基于多角度遥感数据的随机森林模型反演紫金山西部森林LAI是可行的,反演精度较高。传统垂直观测只考虑了林地水平覆盖,而倾斜观测与多种观测角度组合可以捕捉到森林冠层结构和林地垂直结构,能够显著改善传统垂直观测反演LAI精度较低的问题。

图6 基于PROBA/CHRIS遥感数据的0°、36°和55° 融合反演得到的LAI分布Fig. 6 The LAI distribution obtained by using 0°, 36° and 55° based on the PROBA/CHRIS data

图7 LAI反演值与实测值的关系Fig. 7 The scatter plot between the measured LAI and estimated LAI

LAI可较好反映森林生长状况,是评价森林健康的良好指标(杨慧乔等, 2014),其不仅影响森林的碳吸收,而且能够通过改变感热与潜热通量比例直接影响区域乃至全球气候(柳艺博等, 2012),因此准确估算森林LAI对研究森林生态系统及全球碳循环具有重要意义。研究表明,LAI与冠层反射率具有较强相关性(李映雪等, 2006)。目前,不少学者采用波段比值构建植被指数来反演林地LAI,单一植被指数包含的信息容易出现饱和现象(宋开山等, 2006),而植被指数过多也可能产生过拟合现象(杨福芹等, 2016)。随机森林模型对数据集的适应力较强,具有很好的抗噪性能和拟合能力(姚雄等, 2017),但不少学者利用随机森林进行参数反演时,直接将各种植被指数作为模型输入参数,没有对输入参数进行筛选(韩兆迎等, 2016; 李粉玲等, 2015)。由于植被指数具有抗饱和、消除或降低土壤背景影响等能力,因此分析不同植被指数与LAI的相关性,选择最佳植被指数作为输入参数尤为重要。

PROSAIL模型整合叶片光学特性模型PROSPECT和冠层反射率模型SAIL,考虑土壤非朗伯特性、叶片镜面反射、植被冠层热点效应和叶倾角分布情况,能够很好描述均匀植被冠层的反射特性;但PROSAIL模型模拟的光谱反射率只代表无空间尺度大小的“点”,且多角度PROBA/CHRIS遥感数据不同观测角度对应的地面视场范围不一致,从而导致像元分辨率存在一定差异(杨贵军等, 2011)。本研究中PROSAIL模型的一些输入参数没有实测数据,结合参考文献和经验值会给模型模拟结果带来一定误差。此外,PROSAIL模型反演过程中可能受参数敏感性带来的误差影响,本研究只设置LAI为最敏感参数,其他参数设置为定值,也会影响到LAI反演精度。

由于多角度PROBA/CHRIS遥感数据容易受传感器和天气影响,数据获取困难,且观测角度重合区域较小,因此后续对多角度遥感数据反演LAI的研究可以尝试利用其他易于获取且具有多种观测角度的影像数据,从而进一步扩大研究范围,建立反演精度高、适用于更大尺度的LAI遥感反演模型。

5 结论

1) PROSAIL模型中各输入参数敏感性大小为LAI>Cab>Cm>SL>N>Cw,模拟的冠层反射率精度大小为0°>36°>-36°>55°>-55°。

2) 在选取的8种植被指数中,5种观测角度下PVI与LAI的相关性最高,相关系数均达到0.9以上。除了RVI和NDVI外,其余6种植被指数在5种观测角度下均与实测LAI呈极显著相关,且相关系数均在0.5以上,可作为随机森林模型的输入参数。

3) 单角度LAI反演模型中,精度最高的为前向观测角度55°(R2=0.915 7,RMSE=0.235 7,MAPE=0.042 6),该角度与卫星过境时的太阳天顶角最接近,能较好表达植被的前向反射特点。相比传统垂直观测角度0°,前向观测角度55°模型的R2提高0.75%,RMSE和MAPE分别降低3.76%和5.12%。

4) 多角度LAI反演模型中,精度最高的为0°、36°和55°的3角度组合(R2=0.918 4,RMSE=0.231 9,MAPE=0.041 5),相比单角度55°,R2提高0.29%,RMSE和MAPE分别降低1.61%和2.58%。然而角度组合数过多会带来光谱信息冗余、叶片和土壤阴影等问题。相比传统垂直观测角度0°,3角度组合模型的R2提高1.05%,RMSE和MAPE分别降低5.31%和7.57%。

5) 相比非线性回归模型,单角度随机森林LAI反演模型的R2提高0.70%,RMSE和MAPE分别降低15.40%和11.98%; 多角度随机森林LAI反演模型的R2提高0.79%,RMSE和MAPE分别降低6.72%和9.19%。

6) 紫金山西部区域LAI介于0.44~6.70之间,林地LAI均值为3.04,林地LAI整体上呈北部和南部高、中间低的空间分布格局。

猜你喜欢
植被指数冠层反射率
利用镜质组反射率鉴定兰炭与煤粉互混样的方法解析
密度与行距配置对向日葵冠层结构及光合特性的影响
商品条码印制质量检测参数
——缺陷度的算法研究
车灯反射腔真空镀铝反射率研究
基于无人机图像的草地植被盖度估算方法比较
不同灌溉条件下一个春小麦重组自交系(RIL)冠层温度与产量性状的相关性
基于激光雷达的树形靶标冠层叶面积探测模型研究
冬小麦SPAD值无人机可见光和多光谱植被指数结合估算
密度与播期互作下棉花冠层PAR时空特征分析
基于地面边缘反射率网格地图的自动驾驶车辆定位技术