基于Landsat 8 OLI数据的镜泊湖水体叶绿素a 浓度反演

2022-01-08 11:43朱丹瑶
湖北农业科学 2021年23期
关键词:镜泊湖波段叶绿素

刘 宇,朱丹瑶

(牡丹江师范学院历史与文化学院,黑龙江 牡丹江 157012)

随着内陆水体污染的不断加剧,地表水状况已然成为影响社会经济可持续发展的一个重要因素。作为水质评价的重要手段,水质参数监测的结果将直接影响区域生产活动与居民用水状况[1,2]。近年来,由于人类活动的增加和全球气候的改变,地表水质状况发生显著变化[3]。水质的恶化还有可能进一步危及水生生态系统(如鱼类栖息地),从而影响人类生态与经济效益[4]。众所周知,内陆水域富营养化程度逐步加剧,将导致水质明显下降[5]。因此,对内陆水体的连续监测,特别是对水源地和保护区的监测至关重要。同时,长时间持续的监测也有助于更好、更快地了解水域水质所发生的变化,以及人类活动对生态系统的影响[6]。

利用遥感影像水色信息可以有效地推断出水域的水质状况。水色信息通常取决于水体的组成成分、类型和数量等。常用的水质监测指标包括叶绿素a(Chl-a)、有色溶解有机物(CDOM)、总悬浮物(TSM)和浑浊度等。随着遥感技术的日益成熟,遥感监测可选择的指标也在逐渐增多。在众多水质参数中,叶绿素a 作为水域浮游植物的主要组成成分,一直是水体富营养化水平监测的重要指标[7]。

目前,内陆水体水质遥感的研究方法多种多样,但无论采用哪种方法,其算法都具有一定的局限性。模型算法通常依赖于传感器的特性和水体的环境条件[8]。因此,在不同营养状况下的水域,由于水体光学特性的差异,模型通用性很难保证。对于内陆水体,利用遥感数据反演水质状况主要集中在富营养状态的水域,而对于中营养/贫营养状态水域的研究,主要集中在光学特性较为简单的大洋及近海等地。由于水体组分较为单一(主要为叶绿素),海洋水色遥感算法已经较为成熟。如SeaWiFS的OC4算法和MODIS的Chlor MODIS 算法等[9,10]。与大洋水体相比,中国大部分内陆湖泊光学特性较为复杂,水体组分除叶绿素外,通常还包括悬浮颗粒物和有色可溶有机物。因此,这也导致内陆水体的反演算法适用性不同于大洋水体。

根据生态环境部《地表水环境质量评价办法(试行)》中综合营养状态指数法(TLI),以叶绿素a 作为基准参数,对照单一指标表明,镜泊湖水体大部分处于中营养/贫营养状态。相比于富营养化较为严重的湖泊,镜泊湖不仅为该地区提供重要的淡水资源,而且位于国家5A 级旅游景区、世界地质公园的核心位置。近些年,由于流域内旅游经济的快速发展,人类活动对水环境的干扰显著增加,尤其上游地区农业活动的影响,湖区生态环境遭到了破坏,湖泊生态系统的平衡也受到严重影响[11]。因此,通过对镜泊湖叶绿素a 遥感监测,不仅可以实时、全面地了解水域水质状况,为其开展水资源保护、旅游资源开发等提供重要的数据基础与理论依据[12];同时,也为中营养/贫营养状态水域、保护区的遥感监测算法提供一定的参考。

1 材料与方法

1.1 研究区概况

选择镜泊湖为研究区,其地理范围为E 128°30′—E 129°30′,N 43°46′—N 44°18′。由于距离亚洲大陆东岸较近,镜泊湖地区属于典型的温带季风气候,群山环抱、森林密布,该地区也具有一些湖区独特的小气候。区内年降水量为500 mm 左右,夏季降水占到全年降水量70%以上,年平均气温为3.6 ℃,气温年较差大。湖区呈西南—东北走向,蜿蜒曲折,呈“S”型,平均水位约350 m,湖面面积约为91 km2(图1)。除牡丹江干流外,仍有30 多条山间河流入湖。镜泊湖不仅为该地区提供重要的淡水资源,而且位于旅游景区的核心位置。

图1 镜泊湖采样点分布

1.2 遥感影像数据

Landsat 8 影像(重访周期为16 d)携带OLI(Operational Land Imager,陆地成像仪)和TIRS(Thermal Infrared Sensor,热红外传感器)2 个传感器。其中OLI 传感器包括9 个波段,1~7 波段和第9 波段空间分辨率为30 m,第8 波段(全色波段)空间分辨率为15 m。TIRS 包括2 个单独的热红外波段(10、11 波段),空间分辨率为100 m。本研究选取了近红外波段(NIR)和所有可见光波段。具体波段如下:B1(海岸波段0.435~0.451 μm);B2(蓝波段0.452~0.512 μm);B3(绿波段0.533~0.590 μm);B4(红波段0.636~0.673 μm);以及B5(近红外波段0.851~0.879 μm)。

本研究卫星过境时间为2015 年9 月22 日,轨道号116-29(云量显示为4.85%)。如图2 所示,经过辐射定标和FLAASH 大气校正后,研究区Landsat 8 OLI 光谱曲线较为接近水体的真实反射光谱。即在350~600 nm,水体的反射率很低,吸收量也很少,大部分电磁波通过透射进入更深的水层;在近红外、中红外波段,由于水体的吸收率很强,水体吸收了大部分电磁波能量,因此该波段范围的反射率很低;另外,本研究区的光谱曲线在700 nm 附近,有明显的反射锋区,通常认为是由植物色素的荧光效应引起的,也称为荧光峰,并且该反射峰位置会随着水体叶绿素a 浓度变化而变化。因此,该反射峰的位置和数值也常用来估算叶绿素a的浓度值。

图2 镜泊湖水体光谱曲线

1.3 野外采样及数据选取

采样时间为2015 年9 月22 日10—14 时,日期与遥感影像同步,共采集镜泊湖地表水水样32 个,其中有效采样点30 个。采样时通过GPS 记录每个采样点经纬度信息,为了有较好的代表性,本次采样点尽可能均匀分布整个湖区。分布如图1 所示。叶绿素a 浓度测量方法采用热乙醇萃取的分光光度法,每个样本测量3 次,取平均值。通过数据显示,所采样本叶绿素浓度为0.506~3.275 μg/L,平均浓度为1.406 4 μg/L。

1.4 统计模型

结合镜泊湖水体Landsat 8 OLI 光谱曲线特征,选取了11 个波段中的前5 个波段建立波段特征值与叶绿素a 浓度的线性回归模型(LR)。LR 模型可以由单个自变量或多个自变量组成,当自变量只有1个时,将其命名为简单线性回归模型(SLR)。当使用2 个或多个自变量时,称之为多元回归模型(MLR)。基于相关文献研究表明,叶绿素a 浓度与Landsat 8 OLI 波段之间的线性关系明显,尤其使用1~5 波段的简单排列组合(加、减、乘、除、二次方等)效果最优[1,13,14]。因此,本研究同样选1~5 波段建立SLR 模型与MLR 模型,共测试了几十种不同的组合。模型公式可表示为:

式中,yi表示预测叶绿素a 浓度,μg/L;α为截距;βi为自变量Xi(由波段1~5 组合而成)的系数。

1.5 模型拟合度与验证方法

本研究预测模型的拟合度用决定系数R2和调整后R2来评定。它们的大小表示离差平方和中可以由回归平方和解释的比例,代表了自变量与因变量相关的密切程度。当值越接近1 时,表示反演模型的参考价值越高;相反,越接近0 时,表示模型的参考价值越低。R2和调整后R2的区别在于后者同时考虑了样本量回归中自变量个数的影响,这使得调整后R2永远小于R2。而且调整后R2的值不会由于回归中自变量个数的增加而越来越接近1。也就是说,当向模型中添加新的预测变量时,R2总是增加,进而导致模型过度参数化。因此,对于具有2 个或多个预测变量的模型,通常使用调整后R2来评价拟合效果。

对于模型的反演效果,本研究采用了均方根误差(RMSE)和平均相对误差(MRE)来评价,RMSE是预测值与实测值偏差的平方与观测次数n比值的平方根,是用来衡量观测值同真值之间的偏差。其公式可表示为:

平均相对误差是指预测值与实测值的绝对误差与实测值比值的平均值,常以百分比表示。一般来说,平均相对误差更能反映反演的可信程度。其公式可表示为:

2 结果与分析

2.1 最佳模型的选择

利用建模数据库(22 组采样点数据,平均分布),本研究共构建了56 个叶绿素浓度反演模型,其中SLR 模 型40 个,调整 后R2值 位于0.031~0.808;MLR 模型16 个,调整后R2值位于0.403~0.843。表1显示了拟合度最优的3 个SLR 模型和MLR 模型。由表1 可以看出,具有最高R2值和调整后R2值的SLR模型是波段B3与B22的比值,它可以解释80.8%的总样本变异。R2值和调整后R2值最高的MLR 包含了4个光谱波段(B2、B3、B4和B5),它可以解释84.3%的总样本变异。

表1 拟合度最优的3 个SLR 模型和MLR 模型

2.2 模型验证

利用验证数据库(剩余8 组采样点数据),采用均方根误差(RMSE)和平均相对误差(MRE)来评价以上模型的预测效果。如表2 所示,RMSE和MRE最低的SLR 模型是波段B3与B22比值模型,均方根误差与平均相对误差分别为0.210 μg/L 和16.6%;RMSE和MRE最低的MLR 模型包含了4 个光谱波段(B2、B3、B4和B5),该模型均方根误差与平均相对误差分别为0.189 μg/L 和14.6%,两种方法都可以较高精度预测叶绿素a浓度。

表2 3 个最佳SLR 模型和MLR 模型的预测效果

图3 显示2 种最佳模型标准化残差的直方图和散点图,结果表明,2 种模型的残差均呈正态分布,残差与拟合值无异常值。在最后的反演模型中,选取了反演精度较高、稳定性较好、包含了4 个光谱波段(B2、B3、B4和B5)的MLR 模型。

图3 最佳SLR 模型和MLR 模型残差分析

2.3 镜泊湖叶绿素a 浓度反演及分析

图4 显示2015 年9 月镜泊湖叶绿素a 预测浓度的空间分布状况。结果显示,镜泊湖叶绿素a 浓度在空间分布上存在显著的差异性。其中,湖中心地带为研究区的低值区。一方面,湖中心地带受沿岸的农业生产活动影响较小,另一方面,湖中心地带水体深度较大,营养盐由于沉积作用,多稳定在湖泊底部。研究区的高值区主要分布在镜泊乡、小姜窑沟等地。其中镜泊乡是研究区主要河流汇入区,且支流两岸多分布农业用地,使用化肥产生的N、P 等营养元素将通过支流集聚到湖口地带。小姜窑沟叶绿素a 浓度较高,一方面是由于浅水区营养盐难深入湖底,另一方面,岸边酒店、山庄产生的生活污水也为藻类的生产提供了丰富的有机养料。

图4 镜泊湖叶绿素a 浓度分布

3 讨论

本研究以可见光与近红外波段光谱反射率为自变量,同步实测叶绿素a 浓度为因变量,使用简单线性模型和多元线性模型评价了Landsat 8 OLI 数据在镜泊湖水体叶绿素a 浓度的估算方法。结果表明,利用波段B1(海岸波段)、B2(蓝波段)、B3(绿波段)、B4(红波段)及B5(近红外波段)可以有效估算叶绿素a浓度。

截至目前,已有文献表明利用Landsat 8 OLI 影像与实测采样数据,可以建立简单或多元线性回归模型来估算叶绿素a 浓度。但是,波段的选择差异较大,一些学者使用了单一波段来建立估算模型[15,16];也有一些学者认为,2 个敏感波段的比值建立模型的效果更好[17,18];最后,一些学者提出,通过建立不同波段组合的多元线性回归模型可以更好地估算内陆水体中的叶绿素a 浓度[19,20]。因此,这些方法的差异也使得内陆水体遥感反演的最优模型产生了一定的不确定性。据文献研究表明,叶绿素a在400~500 nm(蓝波段)和680 nm(红波段)具有较高的吸收率。最大反射波长分别为550 nm(绿波段)和700 nm(近红外波段)。因此,叶绿素a 浓度应该与蓝波段呈负相关,即叶绿素a 浓度越高,该波段反射率越低。而叶绿素a 浓度应该与绿波段和近红外波段呈正相关,即叶绿素a 浓度越高,该波段反射率越高[21,22]。

本研究首先利用Pearson 相关系数评价了叶绿素a 浓度与前5 个波段(B1~B5)光谱反射率之间的相关关系,但得到的结果中有两点值得注意:①叶绿素a 浓度与单波段B1~B5光谱反射率之间具有一定相关性,其中B4波段相关性最高,达到0.69。②叶绿素a 浓度与B1、B3、B4、B5波段相关性均为正相关,与B2波段相关性为负相关。而在这方面,Lim 等[19]发现蓝、绿、红及近红外波段和和叶绿素a 浓度之间的相关系数大于0.6,并且相关值为负值。另一方面,Patra 等[20]发现蓝色、绿色、红色和近红外波段与叶绿素a 浓度之间的相关性小于0.5,且呈正相关。赵文宇等[1]也具有类似的观点,叶绿素a 浓度与B1~B5波段相关系数为正,且B5相关系数最高,其中叶绿素a浓度与B1~B4相关系数位于0.4~0.5,与B5波段相关系数高达0.98。上述估算叶绿素a 浓度所在研究区均为内陆淡水区域,在湖泊、河流等淡水水体中,水体浑浊度不同(由颗粒有机物引起)通常会引起不同波段的适用性不同[23,24]。

也有学者指出,近红外波段与可见光波段比值与叶绿素a 浓度有较高的相关性[15,20]。本研究通过对比发现叶绿素a 浓度与绿波段和蓝波段平方的比值(B3/B22)具有较高的相关性。不仅如此,在所选波段中,B2波段作为波段比值的分母加入,会在一定程度提高波段比值模型的拟合度。

综上所述,研究选择使用多元线性回归模型(MLR)来评估叶绿素a 浓度与光谱率之间的线性关系。结果表明,模型结果与预期的(chl-a的吸收/反射特性)结果高度一致,特别是与叶绿素a 浓度具有负相关的蓝波段(B2)和具有正相关的绿波段(B3)、近红外波段(B5)。在这方面,Lim 等[19]与Brivio 等[22]利用Landsat OLI 影像,通过多元线性回归模型来估算叶绿素a 浓度,得到的最佳模型系数显示出相反的结果。例如,与蓝波段(B2)的正相关性和绿波段(B3)的负相关性。而Matus-Hernández 等[17]则得出与本研究相似的结论。

截至目前,基于遥感影像反演叶绿素a 浓度已经取得了不错的结果。但在比较其方法和结果时,却有很大差异[25-30]。一方面可能是由于模型本身的局限性所致;另一方面,不同研究区的环境类型也会对水体遥感产生一定的影响。因此,在一个特定的环境中应用的方法很难在另一个不同的环境中得到复制。这也表明内陆水体遥感仍然需要大量工作去完成,长时间(不同年份、不同季节)、大尺度的监测数据或许会给内陆水体反演模型标准化带来一定的帮助,这也是本研究今后改进的主要方向。

4 小结

本研究结合2015 年9 月镜泊湖实测叶绿素a 浓度与同步Landsat 8 OLI 影像前5 个波段建立了简单线性模型(SLR)与多元线性模型(MLR)。结果表明,模型结果与预期的(chl-a的吸收/反射特性)结果高度一致,该方法可以为同类型内陆水体叶绿素a 遥感反演提供可靠的依据。从模型的预测效果来看,多元线性模型(MLR)和简单线性模型(SLR)都可以较高精度预测叶绿素a 浓度。其中,最优MLR模型均方根误差(RMSE)与平均相对误差(MRE)分别为0.189 μg/L 和14.6%。镜泊湖叶绿素a 浓度在空间分布上存在一定差异,湖边浅水区高于湖心区,支流汇入区高于其他地区。

猜你喜欢
镜泊湖波段叶绿素
提取叶绿素
桃树叶绿素含量与SPAD值呈极显著正相关
叶绿素家族概述
游镜泊湖
M87的多波段辐射过程及其能谱拟合
镜泊湖连环战斗——歼敌7000却无人知晓的抗战第一大捷
日常维护对L 波段雷达的重要性
基于SPOT影像的最佳波段组合选取研究
由松针制取三种叶绿素钠盐及其稳定性的研究
L波段雷达磁控管的使用与维护