HY-1C卫星CZI影像卤虫条带提取研究
——以艾比湖为例

2023-02-26 07:43王欣刘建强丁静田婧怡孙相晗田礼乔
遥感学报 2023年1期
关键词:卤虫条带光谱

王欣,刘建强,丁静,田婧怡,孙相晗,田礼乔

1.武汉大学 测绘遥感信息工程国家重点实验室, 武汉 430079;

2.湖北珞珈实验室, 武汉 430079;

3.自然资源部国家卫星海洋应用中心, 北京 100081

1 引 言

卤虫(Artemia)是一种生活在高盐度水体中的小型甲壳动物(任慕莲 等,1992),不仅是鱼虾养殖业的最佳活体饵料,也是盐湖碳通量和生物链的重要组分,具有非常重要的经济和生态价值(Bruce 和Imberger,2009;Marden 等,2020)。据统计,卤虫成品干质量的全球年产量约为3000—4000 t,涉及人民币25亿元(Litvinenko等,2015)。但是,由于盐湖生态环境的恶化和全球水产养殖业对卤虫需求量的逐年增加,卤虫资源量逐渐萎缩(杨俊涛 等,2019)。明确卤虫资源储量和时空分布规律,有利于实现其经济效益并保持生态环境的可持续发展。长期以来,世界主要卤虫资源统计大多基于现场采样,如设立固定采样点评估伊朗乌尔米耶湖卤虫种群密度(Stappen 等,2001),使用垂直间隔采样法调查西藏当雄错卤虫的空间分布特征(Liu 等,2014)。但这种现场采样调查方式受到地域和采样点数限制,代表性有限,对长时序大范围的卤虫资源估算不确定性较大。因此,亟需一种大规模、高效率的卤虫资源动态监测方法,以指导卤虫的捕捞利用与保护。

卫星遥感因其大范围同步观测、高动态、高效获取信息等技术优势(沈亚峰 等,2020),已经成为监测浮游生物、溢油、漂浮垃圾等水面漂浮物的重要手段(Qi 等,2020;Yamano 等,2020)。基于卫星遥感光谱信息,研究人员已经提出了多种水体与其他地物的区分方法。McFeeters(1996)构造归一化水体指数NDWI(Normalized Difference Water Index)分离了水体与非水体;Hu(2009)首次提出浮游藻类指数FAI(Floating Algae Index),现已广泛应用于内陆和沿海的各种大型藻类监测中(张娇 等,2016;Visitacion 等,2019);Xing和Hu(2016)针对无短波红外波段卫星数据,提出了虚拟基线高度浮藻指数VB-FAH(Virtual-Baseline Floating macro Algae Height)开展藻类提取;Shi等(2018)利用碳氢键(-CH)和羟基(-OH)基团的光谱诊断特性实现了墨西哥湾溢油监测;Yamano 等(2020)通过红、绿波段信息组合探测了日本石垣岛珊瑚虫带。上述直接利用光谱特征构建指数并结合阈值的监测方法机理明确、操作简便、应用广泛,但易受环境(如气溶胶、薄云)和观测几何差异等因素的影响(Hu,2009),难以满足成像条件差异较大的遥感数据信息提取需求(Zhang 等,2016)。此外,诸如支持向量机法SVM(Support Vector Machine)、最大似然分类法MLC(Maximum Likelihood Classification)等监督分类方法也分别成功应用于藻华提取(Zhang 等,2020c)和溢油分类(Garcia-Pineda 等,2020)中,性能良好、准确率高;但参数分类器MLC需要正态分布的数据、SVM易于产生椒盐噪声,它们通常忽略数据的空间分布与混合像元引起的空间自相关性,只关注光谱变化(Kanniah 等,2015;Rawat 等,2022)。因此以上方法是否适于卤虫条带提取还有待探索。目前,基于遥感的卤虫条带提取研究较少,李微等(2018)使用面向对象法完成了资源3 号(ZY-3)卫星影像的艾比湖卤虫条带提取;Qi 等(2020)在美国大盐湖的可见光红外成像辐射仪VIIRS(Visible Infrared Imaging Radiometer Suite)影像上观测到了疑似卤虫聚集引起的红色条带,但并未对卤虫条带的提取进行深入分析与探讨。

深度学习作为一种适于大数据分析、自适应性强的新型算法,可使提取的特征更具鲁棒性,现已成功应用于云阴影去除(Zhang 等,2020a)、图像分类(Chen 等,2014)、目标识别(姚红革 等,2020;郑益勤 等,2020)、变化检测(Wang 等,2018)等领域。在水面漂浮物监测方面,Hill 等(2020)基于卷积神经网络CNN(Convolutional Neural Networks)和长短期记忆网络LSTM(Long Short-Term Memory)监测了有害藻华;Niu 等(2019)通过实时目标检测算法YOLOv3(You Only Look Once v3)自动识别水面漂浮垃圾;Qi等(2021)分析了美国大盐湖卤虫卵的特征光谱并应用深度残差U 型神经网络Res-UNet(Deep Residual U-Shaped Network)检测了中分辨率成像光谱仪MERIS(Medium Resolution Imaging Spectrometer)和海陆颜色仪OLCI(Ocean and Land Color Instrument)影像上的卤虫卵带时空分布变化。但是,较高空间分辨率的深度学习卤虫条带识别与提取尚未见报道。

鉴于此,本文以中国首颗业务化运行的海洋水色卫星HY-1C 搭载的海岸带成像仪CZI(Coastal Zone Imager)影像为基础,结合由Landsat 8 卫星陆地成像仪OLI(Operational Land Imager)数据得到的模拟样本,建立了艾比湖的卤虫-水体数据集,利用U-Net算法识别和提取卤虫,并根据精确率、召回率、F1 分数等指标,与SVM、MLC、NDWI方法进行了对比分析,最后还简单探讨了艾比湖卤虫条带与水体面积的相关变化。

2 数据与方法

2.1 研究区域概况

艾比湖(44°54′—45°09′N,82°25′—83°10′E,)是新疆维吾尔自治区最大的咸水湖(图1(a)),位于新疆博尔塔拉蒙古自治州精河县境内,平均水深1.4 m,面积在420—965 km2之间剧烈变化(Zhang 等,2015;Wang 等,2019)。艾比湖卤虫资源量占据中国内陆盐湖榜首,虫体年存量达4000 t,一般每年3月开始成带,5—8月密度达到峰值,9月数量迅速减少;干燥卵年存量达200—400 t,卵带出现于4月,7—9月密度最高(徐金传和易翀,2012;杨俊涛 等,2019)。卤虫内含胡萝卜素、血红素等色素(Gilchrist和Green,1960),具有较明显区别于水中其他水色参数和漂浮物的光谱特征,尤其是在短波红外和近红外波段,因此可通过遥感手段探测(李微 等,2018)。卤虫生命周期短暂,自主运动能力差,在其生长繁殖期内受到风的驱动形成长达数千米、宽几十米的易于遥感识别且形状各异的漂浮条带(Qi 等,2021);但由于艾比湖水深较浅、水体浑浊且光学特性复杂(Liu 等,2021),也给卤虫条带的遥感识别与提取带来了不少挑战(图1(b)—1(d))。

图1 研究区域及不同形状卤虫条带Fig.1 Study area and Artemia slicks of different shapes

2.2 数据集

2.2.1 卫星数据及光谱分析

2018年9月发射的HY-1C 卫星是中国第一代海洋水色卫星HY-1A/B 的后继星,其搭载的海岸带成像仪CZI(Coastal Zone Imager)成像幅宽大、辐射分辨率优良、信噪比较高;3 天重访周期、50 m 空间分辨率基本满足近海与海岛信息监测需求,能实现海陆交互区域的数据获取(梁超 等,2020);在内陆湖泊水体遥感监测中,CZI也展现出很大的应用潜力(周屈 等,2020;Sun等,2021)。但CZI缺乏最典型的卤虫光谱特征波段——短波红外波段,因此具有强大学习能力和可移植性的深度学习方法可以尝试CZI影像的卤虫条带提取(Qi等,2021;Zhao等,2022)。

为利用更加丰富的样本建立更加稳健的深度学习模型,本文同时对30 m 空间分辨率的Landsat-8卫星OLI数据进行模拟转换,作为HY-1C卫星CZI 数据的辅助和补充。图2(a)展示了OLI和CZI 光谱波段响应的差异,图2(b)则是通过随机采样方法,从几何配准后多景同步影像上的同一区域,分别获取了卤虫、水体、水生植被端元的平均反射率曲线。由图2 可知,OLI 数据的光谱反射值略高于CZI数据,但二者的光谱趋势一致性良好。卤虫的光谱反射值在近红外波段和短波红外波段明显高于水体,在绿波段明显低于水体,且与水生植被和其它漂浮物光谱区别明显,这种差异为获取样本与利用深度学习方法区分卤虫和水体提供了可能。

图2 OLI和CZI的光谱波段响应差异与同期影像上的不同端元平均反射率曲线Fig.2 Differences between OLI and CZI in spectral response and average reflectance curve of image-based endmembers

2.2.2 样本模拟与生成

本文使用了2019年—2021年的10 景HY-1C卫星CZI Level 1C 辐亮度影像(https://osdds.nsoas.org.cn/[2021-10-20]),及2013年—2021年的16景Landsat-8卫星OLI地表反射率SR(Surface Reflectance)影像(https://code.earthengine.google.com/[2022-04-27])来共同构建卤虫—水体数据集。考虑到卤虫的生长周期与艾比湖的结冰情况,获取的遥感影像主要集中于每年的4—11月份。在数据集构建之前,需对CZI 影像进行几何配准、大气校正、云掩膜等预处理操作,得到与OLI数据几何信息和量纲都一致的地表反射率数据。为排除水陆边界影响,艾比湖水体范围由全球地表水GSW(Global Surface Water)数据集(Pekel 等,2016)中93%水体发生率的像元向内缓冲300 m 得到。为充分包含不同密度、形态、尺寸的卤虫条带正样本以及受漩涡、耀光、薄云、阴影和底质影响的复杂水体负样本,本文将OLI 数据模拟为CZI 数据来构建丰富可靠的卤虫—水体数据集,辅助算法的精度分析与鲁棒性检验。

首先,为解决CZI 和OLI 的空谱差异实现数据模拟,采用光谱匹配因子SBAF(Spectral Band Adjustment Factors)(Zhou 等,2018)对OLI 进行光谱调整,如式(1)和(2),并将OLI 数据重采样到50 m分辨率。

式(1)和(2)中,λ0、SRFλ分别是OLI 或CZI 的中心波长和光谱响应函数;a1—b1是CZI 的光谱范围,a2—b2是OLI的光谱范围;ρ(λ)是参照图2(b)的CZI 影像端元光谱,通过控制试验由SVC HR-1024 光谱仪获取的目标(卤虫或水体)的连续光谱反射值。

其次,选取8 景CZI 影像和全部模拟影像构建训练数据集和验证数据集,用于U-Net算法的模型训练。为保证样本量、减少分割过程中的上下文信息丢失,样本是按照40%重叠率的滑动窗口方法裁剪成64×64大小,并通过旋转和镜像操作进行增广的(Zhang 等,2020b;Zhao 等,2022)。由于裁剪过程中卤虫样本量远少于水体背景样本量,易导致正负样本失衡,故通过人工筛选去除水体背景占比大于90 %的样本。

然后,预留2019年4月28日和5月1日2 景CZI 影像,按照无重叠的滑动窗口方法裁剪为测试数据集,用于U-Net算法的提取精度评估。

最终,构建了代表性较强、样本容量为837的卤虫—水体数据集,且其训练集、验证集和测试集的样本分配基本符合7∶2∶1(吴樊 等,2021)。

2.3 U-Net算法架构与训练

本文选取U 型全卷积神经网络(U-Net)算法进行CZI 影像的卤虫条带提取。U-Net 算法最初针对生物医学影像的分割问题提出(Ronneberger 等,2015),它结构对称,分为编码和解码两部分;可利用跳网结构连接网络中的深浅层信息。这种独特的体系结构能捕获上下文、准确定位目标特征并提取更高层次的场景信息,已在遥感影像的特征检测任务中表现出优于传统方法的性能(Wang和Hu,2021)。在深度学习网络中添加批归一化BN(Batch Normalization)层能有效解决因网络加深引起的梯度消失和爆炸(He 等,2016)问题、提升算法精度,一般置于卷积层或全连接层之后、激活层之前(Ioffe和Szegedy,2015)。

本文属于卤虫和水体的二分类问题,语义信息较为简单、卤虫与水体的相对位置较为固定、卤虫正样本远少于水体背景样本,在此基础上可确定U-Net 算法的模型深度与架构(图3(a)):(1)该算法基于Tensorflow 框架,深度为5 层;以归一化后的可见光、近红外波段光谱信息作为输入,以卤虫与水体的分割结果作为输出。其中,算法模型的编码端进行了4 次步长为2 的池化下采样,图像大小变为原来的1/16,再通过4次步长为2 的上采样恢复维度。(2)此外,在模型的每一次3×3 卷积后都添加BN 层,再使用ReLU 函数激活,可加快训练、防止过拟合。(3)实验中,模型的初始学习率设为1e-4,优化器选择自适应矩估计(Adam),损失函数为二值交叉熵(Binary Cross Entropy);训练批大小设为4,当迭代中验证集的损失值连续3 轮不下降时学习率减半,连续10 轮不下降则停止训练。

图3 卤虫条带提取的U-Net算法结构与训练曲线Fig.3 The structure and training curves of U-Net algorithm for Artemia slicks extraction

最终迭代了6700 次,用时约35 min,训练过程中损失和精度曲线变化见图3(b)和图3(c)。

2.4 精度评估

选取未参与模型训练的测试集样本,对训练后的U-Net算法进行精度评估,检验算法的实际应用效果,主要指标包括:精确率(Precision)、召回率(Recall)和F1 分数(F1-Score)(Zhao 等,2022)(见式(3)—(5))。

式中,TP、FP和FN分别为卤虫—水体二分类问题中卤虫的正检、误检和漏检样本数。

3 结果与分析

3.1 提取结果与精度评价

为评估U-Net算法的有效性,使用2019年4月28日和5月1日获取的2 景CZI 影像检验其提取精度。对比U-Net算法与其他可用作水面漂浮物提取的SVM、MLC 监督分类方法和NDWI 光谱指数方法,将其卤虫提取结果分别展示如图4,从中可以看到,SVM 和MLC 方法存在大量的误提取像元,精确率较低;主要是因为它们对卤虫像元过于敏感,对混合像元判别不准。NDWI方法提取阈值难以确认且往往不能兼顾所有尺寸的卤虫条带;主要是因为水体背景光学特性复杂且不确定度高,以及卤虫和陆地像元的光谱特征相似导致;如高浑浊水体或太阳耀光引起的水体反射率抬升容易混淆卤虫、水体像元产生误提取;为防止大型条带被过度提取,受阈值限制更易忽略小型零散条带造成漏提取。此外,这3种卤虫提取方法的中间处理过程往往需要人工介入,耗时耗力,极大地影响了算法效率。相比之下,U-Net算法通过特征抽象将光谱特征与高层语义信息结合,减少了因水体反射率抬升或卤虫—水体混合像元带来的误提取与漏提取现象,使提取的卤虫条带更加连续集中、条带边缘更加清晰平滑、影像的提取噪点得以减少,拥有更高的容错性和参数调节能力;且U-Net算法不受阈值限制,可基本实现自动化提取,有效规避了复杂水体背景的影响,拥有更高的适应能力(Pan等,2020)。

图4 2019-04-28和2019-05-01艾比湖HY-1C CZI影像(R,G,B= 3,2,1)的4种卤虫条带提取方法结果对比图Fig.4 Comparison of Artemia slicks extracted from four methods using HY-1C CZI images(R,G,B= 3,2,1)in Ebinur Lake on April 28 and May 1,2019

对于检测的1500 个卤虫像元,U-Net 算法的正检数目达到1337 个;漏检像元163 个,约为NDWI 方法的1/3;误检像元116 个,约为NDWI 方法的1/4、SVM 方法和MLC 方法的1/5。由此计算得到这4 种算法的精确率、召回率和F1 分数见表1,U-Net 算法的各种评价指标均在90%左右,其中精确率和F1 分数均远优于其他方法,但召回率略低于SVM方法和MLC方法。

表1 4种卤虫条带提取算法的检测结果对比Table 1 Comparison of the four Artemia slicks extraction results

3.2 鲁棒性分析

从CZI 影像和模拟数据组成的数据集中选取50 幅水体背景较为复杂的样本来验证U-Net 算法的鲁棒性。部分检测效果如图5,依次对应云雾、漩涡、太阳耀光和低浑浊水体像元、浑浊水体、浅滩浅水底质影响、低密度卤虫条带等情况,识别和提取效果较好且错误率仅为3.3%。也就是说,U-Net算法不易受环境背景干扰,对云雾、耀光和浑浊水体反射有一定阻抗能力;对卤虫像元反应灵敏,不论是高密度还是低密度的卤虫条带,都能被有效提取;另外,从细节上看,存在部分不连续、破碎的卤虫条带。这可能是由于卤虫条带受到强风吹拂变得离散,也可能是由于混合像元、样本标注等引入的误差。总的来说,U-Net算法能适用于复杂水体背景下的卤虫条带提取,精度较高且鲁棒性较强。

图5 HY-1C CZI影像和模拟CZI影像(2014-07-19)U-Net算法卤虫条带提取结果鲁棒性分析Fig.5 Robustness analysis of the extracted Artemia slicks by U-Net algorithm from HY-1C CZI images and simulated CZI image(19 July,2014)

3.3 应用分析

作者利用U-Net 算法实现了艾比湖2019年—2021年10 景CZI 影像的卤虫条带提取,并简单分析了卤虫条带与水体面积之间的相关关系,详细统计信息见图6。卤虫条带最小面积为1.58 km2,最大面积为9.27 km2,约为最小面积的5.8 倍,变化异常剧烈;水体最小面积为330.93 km2,最大水面积为497.34 km2,最大最小面积之比约为3∶2,变化也十分显著。根据研究,卤虫的生长与表面条带的形成受到盐度、温度、风速、光照强度、溶解氧、PH 值等自然因素(任慕莲 等,1992;马婷 等,2020)的影响,也受到饵料投喂类型(马婷 等,2020)、过度捕捞(刘海涛 等,2004)、水环境污染、水利设施建设等人为因素的扰动。从图6 可以看出,前7 个时相的艾比湖卤虫条带面积与水体面积相关性较高(R2=0.77),这可能是由于艾比湖水体面积变化影响了水体盐度,进而引起了卤虫生长环境和条带面积的变化。后3个时相卤虫条带面积与水体面积相关性较低,尤其是2021年7月10日出现了卤虫条带面积的极大值,除去水体盐度变化、湖面强风驱动等自然因素,还需考虑本研究组在7月6—8日赴艾比湖的船舶调研扰动了深层卤虫,使之上浮并在表层聚集形成大面积卤虫条带。自然因素与人为因素对卤虫条带面积和空间分布的影响机理较为复杂,还有待进一步深入研究。

图6 2019年—2021年艾比湖10景HY-1C CZI影像卤虫条带面积和水体面积统计Fig.6 The statistics of the Artemia slicks area and water area in Ebinur Lake by 10 HY-1C CZI images from 2019 to 2021

4 结 论

针对较高空间分辨率遥感影像的卤虫条带提取空白,本文以艾比湖为研究区,利用HY-1C CZI数据和深度学习方法实现卤虫条带提取,是利用遥感手段进行渔业资源调查的一次有益尝试。具体分析了HY-1C卫星CZI影像可见光—近红外波段的卤虫条带光谱特征;结合Landsat 8卫星OLI数据建立了有效样本量为837 的卤虫—水体数据集;基于U-Net 算法实现了CZI 影像的卤虫条带识别和提取,其精确率和F1分数分别为92.02%和90.55%,均明显优于SVM、MLC 和NDWI 等指数方法(高出约11%—23%);通过2019年—2021年10 个时相提取结果分析认为卤虫条带面积动态变化性高,最大可达9.27 km2,为最小面积的5.8 倍;且与水体面积的变化存在一定关联,但还需考虑盐度、风速等影响卤虫条带形成的其他要素。

未来将主要从以下几个方面进行研究:(1)综合利用多源多平台遥感数据,建立多分类、大范围的卤虫数据集,考虑不同区域盐湖在水体光学特性上的差异以及影像空间分辨率和混合像元对卤虫提取精度的制约,提高样本的代表性和普适性,加入漂浮藻类、漂浮垃圾等样本,将卤虫—水体二分类问题向多分类问题扩展;(2)开发效率、精度更高且适用性、稳定性更强的深度学习算法,解决多源遥感大数据集的多分类问题;(3)利用多源遥感数据,提取长时序卤虫条带,结合气象、水文等辅助数据,分析卤虫条带的形成与自然环境的相互作用,动态监测并分析卤虫条带的变化规律,进而指导相关部门进行卤虫资源管理和估产,实现卤虫生物资源的可持续利用。

猜你喜欢
卤虫条带光谱
基于三维Saab变换的高光谱图像压缩方法
卤虫营养强化研究
华北地区地震条带的统计分析
采用变分法的遥感影像条带噪声去除
天津塘沽盐场卤虫种群生态调查
关于盐田大面积卤虫增殖的初步探索
铁皮石斛组培植株和大田植株中的多糖及其卤虫毒性
基于条带模式GEOSAR-TOPS模式UAVSAR的双基成像算法
星载近红外高光谱CO2遥感进展
基于 Savitzky-Golay 加权拟合的红外图像非均匀性条带校正方法