基于高分一号卫星遥感数据的复杂水体信息提取方法研究

2021-11-10 01:58桑国庆曹方晶
关键词:决策树波段水体

李 飞,桑国庆,孙 盈,曹方晶

(1. 水发规划设计有限公司,山东 济南 250100; 2. 济南大学 水利与环境学院,山东 济南 250022;3. 山东省海河淮河小清河流域水利管理服务中心,山东 济南 250014)

水资源在生物圈中发挥着至关重要的作用。高效提取水体信息在湿地保护、洪水监测、蓄洪抗旱方面具有重要的意义和价值。水文和水体信息的常规获取途径主要是水文站点的监测数据和野外测量。人工野外测量能够获得高精度的面积、流速、流量等信息,但高危险、长周期等特性限制了该方法的使用。为了弥补人工野外测量的缺点与不足,遥感手段更加适用于高时空分辨率的水资源信息获取和实时监测[1]。随着国产高分一号(GF-1)遥感卫星成功发射及正常运转,覆盖范围广、获取速度快及更新周期短等众多优点使其常被用来提取水体信息,学者们在采用国内高分遥感影像进行水体信息提取的研究方面进行了深入的探讨[2-3]。

国外开展水体遥感提取的研究大多数是在陆地卫星(Landsat)、中分辨率成像光谱仪(MODIS)、法国地球观测卫星(SPOT)等中、高分辨率的卫星影像的基础上进行的,比我国的研究要早。伴随着我国越来越重视遥感技术的发展,GF-1卫星遥感越来越受到关注[4]。目前国内外也有不少学者利用GF-1卫星遥感影像波段信息提取水体数据,针对如何提高遥感影像的水体信息提取精度开展了相关研究。黄帅等[5]在特克斯河研究中利用面向对象方法完成了对水体信息的提取,提取精度比最大似然法的提高了4.01%。陈文倩等[6]提出了一种适用于特克斯河流域的决策树法,提取水体信息的结果较为完整,可以有效地区分水体和积雪等不同环境。张德军等[7]结合目视解译和支持向量机(SVM)的方法在三峡库区对水体实现了精细化提取,结果表明,4个试验区的总体提取精度都达到90%以上。以上研究多集中在山区河流和水库等区域,针对复杂水体信息提取的研究尚不多见,因此本文中以山东省微山县为研究区,以GF-1卫星遥感影像为数据源,利用单波段阈值法、归一化水体指数法与决策树法提取复杂水体信息,为快速、准确地从遥感图像提取水体信息,满足应急水情监测及防灾的需要提供借鉴。

1 研究区概况及数据源

1.1 研究区概况

微山县位于山东省西南部,地理位置为东经116°39′—117°23′、北纬34°26′—35°7′,我国北方最大的淡水湖泊——微山湖位于研究区内。该研究区内地物类型复杂多样,主要有开阔湖区、河流水渠、农田、湿地植被、养殖区、建筑区等,其中水体面积占大多数,类型多样,包括微山湖开阔水体、入湖河流水渠、湖岸和岛屿边缘围网养殖水面以及城市水体4大类水体。

1.2 数据源与数据预处理

1.2.1 数据源

本文中数据源为GF-1C全色多光谱相机(PMS)传感器的两景影像,全色波段空间分辨率为2 m,多光谱波段空间分辨率为8 m。两景影像拍摄时间均为2019年7月1日,为1A级影像,轨道号为(662,97~98),太阳方位角为126.269 332°,太阳高度角为17.753 367°,覆盖范围为东经116°24′—117°24′、北纬34°23′—35°21′,影像无云覆盖。GF-1卫星遥感影像包括蓝光(波长为0.45~0.52 μm)、绿光(波长为0.52~0.59 μm)、红光(波长为0.63~0.69 μm)、近红外(波长为0.77~0.89 μm)4个波段。

1.2.2 数据预处理

GF-1卫星1A级遥感数据属于相对辐射校正数据,为了确保后续水体信息提取的精度,在遥感图像处理平台ENVI 5.3.1中对影像进行预处理操作,主要包括辐射定标—大气校正—正射校正—融合—镶嵌—裁剪等流程。辐射定标是一种转化关系,是根据元数据把图像上的数值(digital number, DN)转变成辐射亮度值的过程。对影像继续进行大气校正,目的是去除大气中气溶胶对影像的影响,提高影像质量。为了消除影像因地形起伏而引起的偏移,正射校正利用从地理空间数据云(http://www.gscloud.cn/)下载的分辨率为30 m的数字高程数据(DEM)对影像进行地形变形的纠正。考虑到GF-1卫星遥感影像全色波段与多光谱波段的分辨率成4倍关系,融合方法采取全色图像锐化(Pan-sharpening)方法,该方法保真效果好,可将多光谱的色彩信息与全色波段的空间细节信息结合在一起。图像镶嵌是将上述两景处理后的分辨率为2 m的遥感影像进行无缝拼接。

为了缩短软件运行耗时,确保研究区水体的完整性,选取目标区的矢量数据裁剪出研究区的影像作为研究数据,完成预处理后的研究区影像由蓝、绿、红、近红外4个波段组成。图1所示为由假彩色波段组合显示的标准假彩色影像,图中深蓝色表示水体,红色表示植被。

2 研究方法

2.1 水体的光谱特征分析

在可见光波段内水的反射率一般较小,通常为4%~5%,且与波长呈负相关[8-9]。水体在蓝、绿波段呈现高反射、低吸收的特点;但在近红外波段呈现相反特征,因此遥感图像中水体颜色呈现深色。由于水体在不同波谱上的呈现具有差异性,因此能更好地区分开水体与其他类型地物。

图1 研究区预处理后标准假彩色影像

研究区含有水体、建筑区、湿地植被以及农田等4大类典型地物,对研究区创建相应的感兴趣区域,绘制对应的地物类别,得到研究区典型地物样本,利用遥感图像处理平台ENVI中感兴趣区域工具(ROI Tool)对感兴趣区域进行n维可视化处理,得到4类典型地物在不同波段的反射率,见表1(其中反射率扩大10 000倍)。

表1 研究区典型地物在不同波段的反射率均值

2.2 水体提取方法

利用GF-1卫星遥感影像,分别采用单波段阈值法、归一化水体指数法与决策树法对研究区内水体信息进行提取,并对这3种方法提取结果的精度进行比较。

2.2.1 单波段阈值法

根据研究区典型地物在GF-1卫星遥感影像的4个波段中的光谱特征,可以区分水体与其他地物。水体在近红外波段具有强吸收、弱反射的光谱特性,而湿地植被、建筑区和农田则具有强反射的光谱特性,因此单波段阈值法选取近红外波段进行水体提取,具体公式为

B4T,

(1)

式中:B4为近红外波段像元值;T为水体提取的阈值。

式(1)表示在阈值T范围内的像元均为水体。经过灰度直方图分析,且多次试验比对分析,确定阈值T为1 128时水体信息提取效果最佳。

2.2.2 归一化水体指数法

目前水体指数法提取水体信息在水体研究中应用最普遍,依据归一化植被指数(normalized difference vegetation index, NDVI)的构建原理,McFeeters[10]选取绿波段和近红外波段提出了归一化水体指数(normalized difference water index, NDWI),具体公式为

(2)

式中:Indw为归一化水体指数;B2为绿光波段像元值。

将NDWI运用到GF-1卫星遥感影像中,能够在很大程度上去除植被信息,强调水体信息,同时利用适当的阈值将水体与非水体进行区分。将预处理后研究区内的影像进行NDWI运算,统计运算后影像的像元值,得到灰度直方图。经过大量试验验证,选择NDWI灰度直方图中2个波峰之间的平缓谷底作为经验阈值时水体信息提取的效果最好,即NDWI大于-0.007 6时水陆边界分离结果最好,因此,选择-0.007 6作为水体与其他地物的区分阈值。

2.2.3 决策树法

决策树(decision tree,DT)类似二叉树,是由一个根节点、若干个内部节点和叶节点组成的分类方法,主要使用与决策属性相对应的每个叶节点进行分类,最终决策则是从连续决策中得出的。该方法的分类思想实质上是一种分类程序,在对每个叶节点进行测试的基础上,将一个数据集递归地划分为小分支,决策树的构建就是对一组训练数据的递归分割,通过对一个或多个特征值的测试,将一组训练数据分成分类特征相同的数据集[11-12]。水体提取实质上属于二元分类,而决策树是解决二元分类问题的有效手段,知识决策树模型特别适用于基于简单特征的地物提取问题。

基于单波段阈值法和归一化水体指数法2种方法在GF-1卫星遥感影像中的应用,分析其优势与不足,本文中采用近红外波段阈值、NDVI、NDWI等多种方法构建决策树算法,对研究区水体进行提取。为了区分出暗色像元和亮色像元来大致提取水体和非水体,采用GF-1卫星遥感影像近红外波段像元的阈值确定水体与非水体的分割边界,将二者阈值设为1 128,确定水体像元亮度范围为[0,1 128),非水体像元亮度范围为[1 128,8 000]。考虑到其他暗色地物可能混入水体像元中,例如某些水生植被、农田用地及部分建筑用地等,为了将其与水体分离,依次利用NDVI和NDWI区分水体和湿地植被、农田、建筑等背景。为了最大程度地抑制植被信息,突出水体特征,经NDVI灰度直方图反复试验,发现阈值设定为-0.007 4时,效果最佳。

利用NDWI抑制农田用地及建筑用地的信息,从而突出水体,根据NDWI灰度直方图反复试验,确定阈值为-0.007 6时提取效果最好。决策树水体提取模型如图2所示。

B4—红外波段像元值;NDVI—归一化植 被指数;NDWI—归一化水体指数。图2 决策树水体提取模型

3 结果及讨论

3.1 提取结果

根据以上3种方法提取的水体信息得到的图像进行二值化处理,结果如图3所示,其中白色表示水体,黑色表示非水体,以便区分水体与背景值。3种方法均采用灰度直方图获得阈值,结果如图4所示。

(a)单波段阈值法(b)归一化水体指数法(c)决策树法图3 不同方法提取的水体信息结果(白色为水体,黑色为非水体)

提取结果中通常会存在不同程度的碎片化,由于本文中采用3种不同方法进行水体信息的自动提取,因此不进行后续的人为处理,以确保提取结果的真实性。从图3中可以看出,3种方法都可以较完整、准确地提取出微山湖开阔水体,但是在地物分布较为复杂的区域存在差异,主要表现是对阴影、建筑、养殖区的误提,以及对养殖区、农田、河流水渠、城市水体的漏提。为了得到将颜色较深的水体与其他地物进行区分的阈值,单波段阈值法需要大量反复试验确定阈值,但在与水体光谱特征相近的阴影区、建筑区等区域存在较多的误提现象。相比之下,NDWI法易于操作,但提取效果与真实水体存在差异,表现在建筑区水体、河流水渠、湖泊浅滩及养殖水域呈现不同程度的错误。决策树法提取水体造成误提和漏提现象不明显,较完好地提取了开阔水域,同时兼顾了大、小河流以及养殖鱼塘、虾池处水体信息的完整性,但提取过程比前2种方法更繁杂,所需的时间也更长。

(a)单波段阈值法

(b)归一化水体指数法

(c)决策树法图4 不同方法灰度直方图的阈值结果

3.2 细节对比

单波段阈值法、NDWI法及决策树法提取结果的主要区别是在非水体(农田、建筑区、阴影)和水体(河流水渠、湖区、养殖区、城市水体)处。水体及非水体的具体细节对比如表2所示,黄色框内为不同地物的主要对比区域。

由表可知,3种方法在对农田附近水体、养殖区水体、城市水体以及河流水渠处提取特征时都出现了漏提,其中NDWI法的漏提最为严重,相比之下,决策树法的漏提和误提现象相对较少,与实际水体的分布情况较为吻合,单波段阈值法的提取效果处于两者之间。对于部分建筑区,NDWI法存在严重的误提现象,单波段阈值法和决策树法提取的效果相似,仅出现少量的误提区域。此外,3种方法在获取细小河流、水渠类型的水体信息时通常出现“断流”现象,其中单波段阈值法和决策树法提取的信息相对连续和完整,而NDWI法提取效果不佳。单波段阈值法和NDWI法存在将阴影错误提取为水体的现象,而决策树法提取时基本无误。

3.3 精度验证及比较

基于研究区的卫星遥感影像,将人工目视解译出的水体信息作为真实参考值,验证3种方法的提取结果的精度,并进行统计分析。

首先通过在预处理后的遥感影像上的人工目视判读,解译出水体信息;然后对人工判读的结果进行二值化处理(水体为1,非水体为0);最后分别用3种不同提取方法得到的结果与人工解译结果进行差值运算(被减数为自动化提取二值化影像像元,减数为对应人工目视解译的二值化影像像元)。经过运算后统计3种方法提取水体的精度,用漏提率、误提率和提取精度来定量对比不同方法的提取精度,其中-1表示未被提出的水体像元,该类像元数与总像元数的比值即为水体的漏提率;0表示地物类别被提取正确的像元,该类像元数与总像元数的比值即为水体的准确提取精度;1表示把其他类别地物像元错误提取为水体的像元,该类像元数与总像元数的比值即为水体的误提率[13]。分别将3种方法提取的研究区水体结果进行差值运算,结果如表3所示。

由表中可以看出,NDWI法的水体漏提、误提的比例偏高,原因主要是受研究区水体类型多样性、分布复杂性、以及混合像元高占比等因素的影响。决策树法水体漏提的比例最低,误提率也比单波段阈值法低,得益于该方法综合考虑了水体信息在近红外波段与其他地物的差异性、NDVI和NDWI,可以很好地提取水体信息。

表2 水体与非水体提取结果细节对比

表3 水体信息提取结果统计

为了验证3种方法对不同类型的水体信息提取精度,采用混淆矩阵表示分类结果与地表真实信息。首先,采用分辨率为0.5 m的天地图影像,选取研究区内的湖区、河流水渠、养殖区、城市水体与非水体的样本各50个;然后,在3种方法得到的结果上分别导入上述样本,将样本类别与最终提取分类结果相匹配,从而得到精度评价,将3种方法提取分类结果中的“1”匹配至样本信息中的湖区、河流水渠、养殖区、城市水体,“0”匹配至样本信息中的非水体;最后,输出混淆矩阵,统计不同类型水体提取的总体精度结果,如表4所示。从表中可以看出,采用决策树法提取的各类型水体的精度高于其他2种方法提取的,但在不同类型水体的提取精度上存在差别。当提取水体类型为湖区和河流水渠时,决策树法优于单波段阈值法和NDWI法,单波段阈值法和NDWI法存在河流断线以及湖泊边界像元误提的现象。当提取水体类型为养殖区时,单波段阈值法更优,养殖区边界提取较清晰。当提取水体类型为城市水体时,3种方法的提取精度较差,误提和漏提严重,原因是城市水体面积小,且城市水体存在与建筑阴影等暗地物间的光谱信息混淆现象。

表4 不同类型水体提取总体精度结果

结果表明,3种方法在综合考虑各种漏提、误提以及不同类型水体的提取精度的情况下,精度稍有差别。其中,决策树法的提取精度最高(98.767 2%),湖泊、河流水渠和养殖区等水体提取较为完整;其次为单波段阈值法,提取精度为98.152 6%,该方法能够利用水体的光谱特性来确定阈值,从而实现水体的有效提取;但是,由于部分建筑区、阴影等地物的波谱特征与水体相似,因此该方法无法精准区分,可能误提为水体。NDWI法的提取精度最低(95.297 7%),并且对各类型水体提取的效果都比其他2种方法的差。

4 结论

本文中以山东省微山县为研究对象,以GF-1卫星遥感影像为数据源,基于单波段阈值法、NDWI法及决策树法提取研究区的水体信息,得到如下结论:

1)单波段阈值法、NDWI法及决策树法按基于GF-1卫星遥感影像提取微山湖区水体信息的精度由高到低依次为决策树法、单波段阈值法和NDWI法,表明决策树法更适用于利用卫星遥感数据提取该研究区的水体信息。

2)3种方法在进行湖区开阔水体的提取时效果都较为理想,然而从不同方法呈现的提取细节来看,部分建筑区、阴影等地物的波谱特征与水体的相似,导致利用单波段阈值法进行提取时,此类地物的像元存在较严重的误提现象。另外,水体复杂程度及人为因素对决策树法和NDWI法的最佳阈值选取的影响较大,从而存在一定程度的漏提和误提现象。

3)决策树法提取精度较高,在对不同尺度和多种类型的水体进行提取时较为适用,但随着节点数量增加,运算效率较低;单波段阈值法常出现“异物同谱”的情况,更适用于对单一水体提取;NDWI法提取方法简单,易操作,但不同水体类型影响其阈值,需要对阈值进行反复试错,在对复杂区内水体提取时效果较差。

本文中在验证不同方法的水体提取的精度时,不仅验证了全域影像水体的总体精度,而且验证了不同方法对不同类型水体的提取精度。在今后的研究中将进一步研究适用于不同水体类型的提取方法,提高复杂区水体提取的精度。此外,为了充分推广国内数据源的应用和发挥国内高分辨率数据的优势,下一步将继续利用GF-1、高分六号(GF-6)、资源三号(ZY-3)等卫星遥感影像数据进行水体提取方法的研究,并探索适用于多源遥感数据的水体提取方法。

猜你喜欢
决策树波段水体
农村黑臭水体治理和污水处理浅探
多源污染水体水环境质量提升技术应用
生态修复理念在河道水体治理中的应用
一种针对不均衡数据集的SVM决策树算法
决策树和随机森林方法在管理决策中的应用
基于PLL的Ku波段频率源设计与测试
小型化Ka波段65W脉冲功放模块
广元:治理黑臭水体 再还水清岸美
基于决策树的出租车乘客出行目的识别
M87的多波段辐射过程及其能谱拟合