澜湄流域30 m 分辨率陆表水体产品

2021-01-20 10:46彭燕何国金王桂周尹然宇
关键词:反射率流域水体

彭燕,何国金,王桂周,尹然宇

1. 中国科学院空天信息创新研究院,北京 100094

2. 中国科学院大学,北京 100049

3. 海南省地球观测重点实验室,海南三亚 572029

引 言

2016 年3 月23 日,澜沧江-湄公河区域六国(中国、缅甸、老挝、柬埔寨、越南、泰国)领导人在三亚举行“六水合一”仪式,正式启动澜湄合作,该合作是因水而生,水资源对于澜湄流域的重要性不言而喻。澜湄流域属于西南季风气候区,6 月至11 月为湿季,12 月至次年5 月为干季,年降水量较高,但时空分布 不均,上游与下游间的气候及水资源分布特征存在较大差异,澜沧江流域降水集中在6 月至8 月,而湄公河流域降水峰值集中在9 月和10 月[1]。近期以来,受强厄尔尼诺现象的影响,越南南部、柬埔寨等湄公河流域遭受了严重的干旱袭击。因此,澜湄流域30 m 分辨率的陆表水体产品能反映澜湄流域陆表水体空间分布情况以及变化轨迹,在澜湄流域水资源安全和管理、气候变化、生态环境等方面具有重要的应用价值。清华大学、国家基础地理信息中心、美国马里兰大学、欧盟联合研究中心等均发布了全球陆表水体产品,时间从1985 年到2015 年,空间分辨率从25 km 到30 m 不等,所采用的方法大多为决策树、指数阈值法等方法。而目前尚缺少2018 年澜湄流域的陆表水体产品。

本文提供2018 年30 m 分辨率的澜湄流域年度陆表水体产品,给出了澜湄流域30 m 陆表水体产品生产的方法与技术流程。采用基于多指数和先验知识驱动的全球尺度遥感水体智能提取方法,首先对所需要的Landsat 8 地表反射率数据集、GDEM(ASTER Global Digital Elevation)数据集以及GLCF-GIW(2000)(the Global Land Cover Facility Global Inland Water)水体产品数据集进行数据预处理,随后根据GLCF-GIW(2000)水体产品进行水体样本与非水体样本选择与优化,最后采用决策树分类法进行自适应阈值确定,从而得到初步的水体提取结果,最后再进行空间过滤等后处理得到最终的陆表水体产品。

1 数据采集和处理方法

1.1 数据采集方法

本文所生产的澜湄流域季度陆表水体产品主要是在Landsat 8 地表反射率的基础上进行生产的,地表反射率数据主要来自于中国科学院空天信息创新研究院何国金研究员团队所生产的中国Landsat 系列卫星遥感数据地表反射率产品数据集[2]。所需要的DEM 数据来自于GDEM Version 2.0 dataset[3];并采用 2000 年 GLCF-GIW version 1.0 水体产品[4]作为样本库,该数据集可从http://www.landcover.org/data/watercover/免费获取。

1.2 数据处理方法

采用基于多指数和先验知识驱动的全球尺度遥感水体智能提取方法来提取澜湄流域季度陆表水体专题信息,其技术路线如图1 所示,主要分为数据预处理、样本选择与优化、自适应确定阈值、连通像元合并及空间过滤后处理4 个步骤。

1.2.1 数据预处理

需要对Landsat 8 地表反射率、DEM 数据集以及已有的30 m 水体产品进行数据预处理。首先,对于2018 年的所有地表反射率产品根据质量评估文件(QA)进行去云处理,将所有Landsat 8 地表反射进行中值合成,得到2018 年澜湄流域的中值合成影像,最终为了便于计算,将澜湄流域的年度中值合成影像按5120×5120 pixels 的大小分块,共计约179 块。图2 为澜湄流域Landsat 8 地表反射率中值合成影像的分块示意图。然后,将全球范围内的DEM 数据集镶嵌成VRT 格式。由于2000 年GLCF-GIW 的水体产品是以景为单位存储的,坐标系投影为WGS84 UTM(Universal Transverse Mercator Projection,通用横轴墨卡托投影),为了能适应于澜湄流域甚至是全球区域的陆表水体信息提取,需要将该水体产品处理成VRT 格式的镶嵌结果。

图1 澜湄流域陆表水体生产技术路线图

图2 澜湄流域Landsat 8 地表反射率中值合成影像分块示意图

1.2.2 样本选择与优化

根据2000 年的GLCF-GIW水体产品对每一分块影像分别分层随机选取水体与非水体样本各150个。由于所利用的训练样本数据为2000 年的水体产品,然而水体会随着时间和季节的变化而变化,难免会出现样本数据为水体,而待提取的数据为非水体(如植被)的现象。因此为了避免出现这种因样本不准确而导致误分的问题出现,需要对样本进行进一步优化。利用坡度(Slope)和山体阴影(Hillshade)两种地形指数以及NDVI(Normalized Difference Vegetation Index,归一化差值植被指数)、NDWI(Normalized Difference Water Index,归一化差值水体指数)对所选取的样本进行基于先验知识驱动的样本优化。NDVI 指数用于建立植被掩膜,为避免因时相变化引起的训练样本不完全正确时,将植被误认为水体的问题。NDWI 主要用于优化非水体样本中存在的水体样本的问题。并将Hillshade<150 且Slope>20 的区域认为是山体阴影[2],建立山体阴影掩膜,优化水体样本中存在山体阴影的问题。

1.2.3 自适应确定阈值

采用了马里兰大学发布的2000 年的水体产品(GLCF-GIW)作为先验知识选取水体与非水体样本,并将slope 和hillshade 等地形指数、NDVI、NDWI、NDBI(Normalized Difference Build Index,归一化差值建筑指数)作为输入,采用决策树方法对优化后的样本进行了样本训练,自适应确定分类规则,该分类规则便是所选择指数的一个阈值组合,从而根据该分类规则得到一个初步的陆表水体专题信息提取结果。

1.2.4 后处理

由于基于像元的分类方法所得到的结果往往会出现独立像元或者一两个像元的孔洞现象,因此需要将得到的初步的陆表水体专题信息提取结果进行联通像元合并及空间过滤。初始结果是分块的,因此需要将分块结果进行镶嵌,从而得到最终的澜湄流域30 m 空间分辨率陆表水体专题信息产品。

2 数据样本描述

2018 年澜湄流域30 m 陆表水体产品数据集包括1 个结果文件和1 个相应的影像成像时间文件。陆表水体产品文件的命名规则为:water-lanmei-yyyy.TIF(如:water-lanmei-2018.TIF)。影像的空间分辨率为0.00025°(约30 m),投影坐标系是WGS84 经纬度。陆表水体产品结果为灰度二值图,其中1 表示水体,0 表示非水体。为了降低存储空间,对栅格结果进行了“LZW”的无损压缩。图3 为2018 年澜湄流域陆表水体产品示意图,底图采用的是2018 年Landsat 地表反射率合成图,波段组合为R(6)G(5)B(4)。对应的影像成像时间文件的命名规则为waterdate-lanmei-yyyy.TIF(如waterdatelanmei-2018.TIF),为16 位整型灰度图像,对应的灰度值表示该年的儒略日,如18 表示为该像元采用2018 年1 月18 日的Landsat 8 影像进行制图而成。

3 数据质量控制和评估

图4 给出了本数据集水体提取精度验证的抽样分布情况。为了对本方法的水体提取结果进行验证,在澜湄流域进行分层随机选取样本点,水体和非水体各约2000 个。以原始影像结合GoogleEarth、GF-1/2 等高空间分辨率遥感影像作为参考影像,进行精度验证。表1 为水体提取结果精度验证混淆矩阵,水体的制图精度达99.34%,用户精度达98.25%,总体精度达98%以上。

陆表水体信息提取的难点在于高建筑物以及山体阴影的影响,因此为了验证本数据集在此方面的表现,将本数据集与国际上已有的陆表水体产品进行交叉验证。由于目前国际上尚无2018 年澜湄流域的陆表水体产品,因此将本数据集分别与清华大学发布的2010 年30 m 全球土地覆盖产品中的水体类别(FROM-GLC water mask)[5]以及美国马里兰大学发布的2000 年30 m 全球陆表水体产品(GLCF-GIW)[6]进行对比分析,如图5 所示。分别选取了城区和山区两处的陆表水体结果进行对比,具体位置如图5 中澜湄流域示意图上标识的1 处和2 处。位置1 处各产品的局部放大图如图5(af)所示,位置2 处各产品的局部放大图如图5(g-h)所示。为了避免由于时相引起的水体变化,图5 分别将各产品所对应的Landsat 数据也展示出来。从图5 可以看出,位置1 处,FROM-GLC water mask产品和GLCF-GIW 产品均存在将城区误分成水体的现象,本数据集较好地区分了建筑物阴影与水体(如图5(f)所示);位置2 处,FROM-GLC water mask 产品和GLCF-GIW 产品均存在将山体阴影误分成水体的现象,本数据集较好地区分了山体阴影与水体(如图5(l)所示)。以上结果均表明本数据集水体提取精度较高。

图3 2018 年澜湄流域陆表水体产品示意图

表1 水体提取结果精度验证混淆矩阵

图4 澜湄流域季度陆表水体产品精度验证样本分布情况

图5 本数据集与国际上已有陆表水体产品的对比验证图

4 数据价值

本文推出2018 年澜湄流域30 m 分辨率陆表水体产品,采用基于多指数和先验知识驱动的全球尺度遥感水体智能提取方法,精度较高,后续本数据集将会补充其他年份的季度产品。本数据集在澜湄流域水资源管理与灾害应急、生态环境监测等方面具有重大的应用价值。

致 谢

衷心感谢刘慧婵和江威在产品质量检验时给予的建设性意见。

数据作者分工职责

彭燕(1988—),女,湖南郴州市人,在读博士,工程师,研究方向为遥感图像智能处理。主要承担工作:算法集成程序编写,数据生产流程设计,论文撰写。

何国金(1968—),男,福建龙岩人,博士,研究员,研究方向为遥感数据智能处理与信息挖掘。主要承担工作:总体思路与方案设计,论文修改。

王桂周(1984—),男,山东省济宁市人,博士,高级工程师,研究方向为遥感图像智能处理。主要承担工作:技术指导。

尹然宇(1996—),男,山东省临沂人,在读博士,研究方向为遥感图像智能处理。主要承担工作:数据挑选、整合与预处理。

猜你喜欢
反射率流域水体
利用镜质组反射率鉴定兰炭与煤粉互混样的方法解析
商品条码印制质量检测参数
——缺陷度的算法研究
车灯反射腔真空镀铝反射率研究
压油沟小流域
滇池流域水生态环境演变趋势、治理历程及成效
农村黑臭水体治理和污水处理浅探
昌江流域9次致洪大暴雨的空间分布与天气系统分析
多源污染水体水环境质量提升技术应用
生态修复理念在河道水体治理中的应用
本市达到黑臭水体治理目标