基于回归分析的黄河三角洲湿地植被生物量研究

2022-11-16 13:46杨晓芜宋敬茹
农业与技术 2022年21期
关键词:因变量植被指数波段

杨晓芜 宋敬茹

(华北理工大学矿业工程学院,河北 唐山 063210)

引言

地上生物量(AGB)是评价植被作物生长发育和营养状况的重要参数,其变化能够直接表征植被光合作用的能力,也是评价某一生态系统健康状况的关键指标[1,2]。湿地植被生物量,作为湿地生态系统固碳能力的评价指标,发挥着重要作用。传统生物量测量方法耗费大量人力物力和时间,存在明显的局限性,且会对采样调查区域造成严重破坏,而使用遥感影像数据可弥补传统方法在空间全局观以及采集样品的时效性,为湿地植被生物量反演提供大量有用波段信息[3]。许多学者从不同的光学遥感数据、反演回归模型以及植被指数等方面促进湿地植被生物量的研究进展。

随着多源遥感的不断发展,利用多源遥感数据与实测生物量协同反演已成为趋势。目前利用多源遥感数据反演湿地植被生物量干重的研究仍较少,于彩芬等运用Person相关系数和回归分析法构建互花米草生物量回归模型,表明互花米草的生物量可用相关性较高的形态指标进行回归建模分析[4];闻馨基于LiDAR、S2等提取的特征变量,随用随机森林算法实现漳江口红树林生物量的准确估算[5];神祥金等利用实地调查数据结合全国沼泽湿地分布数据集,在全国尺度估算草木沼泽植被生物量[6]。因此,本文选取黄河三角洲为研究区,采用一元非线性回归、多元线性回归以及多元逐步回归构建该区域湿地植被生物量的估算模型,为分析黄河三角洲植被空间分布规律,探求植被生物量与各因素的定量关系,对湿地生态系统恢复以及生物多样保护提供数据支持,对研究湿地生态环境有重要意义。

1 数据与方法

1.1 研究区概况

黄河三角洲自然保护区位于黄河入海口处(N37°35′~38°12′,E118°33′~119°20′),北临渤海,东靠莱州湾[7]。整个保护区包括位于现行黄河入海口板块和在1976年改道的黄河故道入海口处板块,总面积153000hm2,是世界上土地面积增长最快的自然保护区[8]。海岸线呈弧形,长度为131km,平均气温为11.9℃,年平均日照总时数为2781.7h,年平均降水量为592.2mm,雨热同期,土壤类型丰富,沿黄河流向分布有潮土、盐化潮土和潮盐土等,植被类型以自然植被为主,湿地类型有淤泥质海滩、河口水域、草本沼泽和灌丛沼泽等[9]。

1.2 数据获取

1.2.1 野外数据采集

本次在黄河三角洲自然保护区淤泥质海滩和草本沼泽湿地内共采集43个样点,样点的选择沿黄河及道路两侧,遵循交通可达性原则,样方设置为1m×1m。在植被分布均匀地方随机取样,记录样方内的株数,并齐地收割植株地上部分,立即称其鲜重,取每个样方内植被的1∶5的比例装入密封袋内,贴上标签后带回实验室[10-12]。放入恒温箱中烘干,在80℃的温度下持续烘12h后取出称重,记录称重结果,确定选取比例的植被生物量干重,经过比例换算,确定样方植被的地上生物量干重,见表1。

表1 生物量干重值

1.2.2 遥感影像数据

本文使用同期Landsat-8遥感影像数据,利用ENVI对影像进行辐射定标大气校正等,将各波段DN值转换为地表反射率,提取各样点对应像元波段值,本研究选取6个波段值以及7种植被指数构建遥感变量库,用于后续的建模分析,见表2。

表2 遥感变量计算公式

1.3 方法

1.3.1 相关性分析

相关性分析是描述自变量和因变量之间相关关系程度的常用统计方法。本文采用皮尔逊相关系数法(-1~1)[13]。|0.8~1|表示变量间高度相关;|0.5~0.8|为显著紧密相关;|0.3~0.5|为实相关关系;|0.0~0.3|为微相关关系。公式:

(1)

1.3.2 回归方法

从遥感变量库中随机选取32个样点数据作为训练样本,分别建立一元非线性回归、多元线性回归[14]以及多元逐步回归模型[15]。多元线性回归相对于单个变量能更有效地进行预测或估计。多元逐步回归逐一将自变量引入方程,剔除显著性不大的变量,建立最优回归模型,可以更好更合理地反映自变量与因变量间的关系。

Y=b0+b1x1+b2x2+b3x3+…+bpxp

(2)

式中,Y为因变量;b0为常数项;xi(i=1,…,p)为p个自变量;bi为回归系数。

1.3.3 精度评价指标

精度评价指标用于评定模型的优劣程度,选取决定系数(R2)、均方根误差(RMSE)、平均绝对误差(MAE)3个指标进行模型精度验证。R2值越接近1,表明模型拟合程度越好,RMSE值越小、MAE值越小,表明估测精度越高,计算公式如下:

(3)

(4)

2 结果

2.1 相关性分析

表3、表4为波段、植被指数与植被生物量干重的相关系数。大多数波段与生物量干重呈负相关,各植被指数与植被生物量干重呈正相关,且均在0.01水平上显著相关。植被生物量干重与波段相关系数大小排序为B4>B5>B2>B1>B3>B6,植被生物量干重与植被指数相关系数大小排序为NDVI>ARVI>SAVI>EVI>DVI>RVI>PVI。综合表3、表4可得,各植被指数与植被生物量干重的相关性要强于波段与植被生物量干重的相关性。

表3 生物量干重与波段的相关系数

表4 生物量干重与植被指数的相关系数

2.2 回归结果分析

2.2.1 一元非线性回归

本文所建立一元非线性回归包括对数函数、倒数函数、二次函数、三次函数等模型,最终选取最优模型如表5所示。由表5得出,当波段B5为自变量时,判别系数最大的是三次模型R2=0.677,RMSE=360.015g·m-2;当DVI为自变量时,判别系数最大的是三次模型R2=0.629,RMSE=385.874g·m-2。综合上述各曲线模型,以B5为自变量建立的三次模型判别系数最大,这与以DVI作为自变量建立的模型相比,判别系数略大,拟合精度也比线性模型好,但是为了进一步提高拟合精度,还需进行多元线性以及多元逐步模型的回归分析。

表5 一元非线性回归最优估算模型

2.2.2 多元线性回归

本文采用的多元线性回归模型能定量全面衡量多个遥感变量对生物量估算的影响,模型以多个自变量建立拟合方程,将9个变量参与建模,植被生物量干重为因变量。最终选取变量主要由红边波段与植被指数构成,说明这些变量对生物量具有较好的敏感性。尽管部分遥感变量因子与生物量干重相关性较弱,但仍对因变量有所影响。为得到最优模型,逐一筛选自变量,最终都得到模型y=1175.43+892.19×B4+2308.12×NDVI+1335.95×RVI-58.77×SAVI-167.91×ARVI-2389.36×EVI,R2=0.662,RMSE=404.92g·m-2。与一元非线性回归模型相比,模型拟合优度不如以波段B5为自变量的一元回归模型,因此还需要用其他方法对模型进一步优化。

2.2.3 多元逐步回归

在进行多元逐步回归时,采用步进、输入以及后退等方法,其中步进最终选取自变量为NDVI、PVI,模型R2=0.578,RMSE=404.26g·m-2;输入法中自变量最终留下B1、B2、B3、B4、B5、B6、NDVI、RVI、ARVI和EVI共10个变量,模型R2=0.725,RMSE=383.33g·m-2;后退法中自变量最终留下B2、B3、NDVI、EVI共4个变量,模型R2=0.72,RMSE=341.58g·m-2。综合考虑模型稳定性与误差,最终选取后退法建立的生物量估算回归模型。

表6 多元逐步回归最优模型

3 结论

本文采用一元非线性回归、多元线性回归以及多元逐步回归对黄河三角洲生态自然保护区分别进行回归分析。经模型结果及精度评定,可以发现,5个波段、7个植被指数与植被生物量干重均达到0.01显著水平,植被指数与生物量干重的相关性明显高于波段值;以植被指数与波段值结合的自变量,利用逐步回归估算生物量干重效果最好;3种模型中以B2、B3、NDVI、EVI为自变量达到最优估算效果,R2=0.72,RMSE=341.58g·m-2;多元逐步回归模型拟合精度最高,优于一元非线性回归和多元线性回归模型。本研究可为黄河三角洲自然保护区湿地植被生物量估算提供一定的数据支持,为进一步探究回归分析在生物量估算领域提供一定的参考价值。

猜你喜欢
因变量植被指数波段
调整有限因变量混合模型在药物经济学健康效用量表映射中的运用
基于植被指数选择算法和决策树的生态系统识别
适应性回归分析(Ⅳ)
——与非适应性回归分析的比较
AMSR_2微波植被指数在黄河流域的适用性对比与分析
河南省冬小麦产量遥感监测精度比较研究
偏最小二乘回归方法
M87的多波段辐射过程及其能谱拟合
日常维护对L 波段雷达的重要性
主要植被指数在生态环评中的作用
基于SPOT影像的最佳波段组合选取研究