高分五号卫星高光谱遥感分类方法研究综述

2024-01-03 06:45杜润凤王霄鹏张佳华尚晓笛严传奇
关键词:光谱卫星分类

杜润凤, 王霄鹏, 张佳华, 尚晓笛, 熊 瑄, 严传奇

(1. 青岛大学计算机科学技术学院遥感信息与数字地球研究中心, 山东 青岛266071;2. 中国科学院空天信息创新研究院数字地球重点实验室, 北京 100094)

目前,卫星遥感广泛应用于农业、环境、地矿、海洋、军事等多个领域[1-3],卫星遥感图像分类的研究目标是通过识别卫星遥感图像数据中对应的地物特征,识别目标地物信息[4]。高分五号卫星是“高分专项”中一颗重要的科研卫星,自投入运行以来,为我国遥感科研领域提供了大量优质的高光谱遥感数据,也支撑了众多的研究成果。高光谱遥感技术因其波段数量多、光谱分辨率高和光谱信息连续适用于多个研究领域,成为当前研究的热点。高光谱遥感技术的出现,使许多使用宽波段遥感技术无法探测的地物信息,更容易被探测,提供了更多的地表信息。随着机器学习技术的迅速发展,更多的分类算法被发展并运用在高光谱遥感应用领域,使高光谱遥感数据的分类技术成为目前研究主流[5]。本文介绍了高分五号01卫星和02卫星的载荷和数据特点,结合前人的研究,对当前使用的主要分类算法进行了详细的分析,同时通过分析机器学习和深度学习分类算法在高光谱图像分类过程中的应用,对各种分类算法性能进行评估,找出其中分类效果最好的几种分类方法,并指出高光谱卫星遥感图像在分类过程中可能出现的问题。该研究为高光谱图像分类领域上的研究提供了一些参考。

1 高分五号卫星及数据特点

1.1 高分五号卫星

中国高分系列卫星是我国高分辨率对地观测系统重大专项研制和发射的卫星系列,累计发射32颗卫星[6-7]。2018年,高分五号01卫星成功发射,这是全球首颗实现对大气和陆地综合观测的全谱段高光谱卫星。该卫星能够有效探测国产卫星无法覆盖的大气污染气体,满足了环境综合监测等领域的迫切需求。2021年9月7日,高分五号02卫星在太原卫星中心成功发射,与“高分”五号系列卫星相比,高分五号02卫星提高了高光谱成像的最高光谱分辨率,达到了2.5 nm;幅宽为60 km,同时最高的大气探测光谱分辨率可达0.03 nm,综合性能指标在同类卫星中处于先进水平。高分五号01卫星轨道参数如表1所示,高分五号02卫星轨道参数如表2所示。

表1 高分五号01卫星轨道参数

表2 高分五号02卫星轨道参数

1.2 高分五号卫星载荷

高分五号01卫星是世界首颗对大气和陆地综合观测的全谱段高光谱卫星,搭载了6个载荷,其中4个是大气观测载荷,分别是大气主要温室气体探测仪(greenhouse gas monitoring instrument,GMI),光谱范围为四段0.759~0.769 μm、1.568~1.583 μm、1.642~1.658 μm、2.043~2.058 μm;大气痕量气体差分吸收光谱仪(exhaled breath molecular ions,EMI),光谱范围为240~710 nm,光谱分辨率为0.3~0.5 nm;大气环境红外甚高分辨率探测仪(atmospheric infrared ultra-high resolution spectroscopy ,AIUS)光谱范围为2.4~13.3 μm,光谱分辨率为0.75 px;大气多角度偏振探测仪(atmospheric multi-angle polarimetric detection instrument,DPC),光谱范围分为8段433~453 nm、480~500 nm(p)、555~575 nm、660~680 nm(p)、758~768 nm、745~785 nm、845~885 nm(p)、900~920 nm。这些载荷可用于探测大气中的气体成分和物理参数。另外2个载荷是对地观测载荷,分别是可见短波红外高光谱相机(visible and shortwave infrared hyperspectral imager,AHSI)和全谱段光谱成像仪(full spectrum spectral imager,VIMI)。VIMI是一款从可见光到热红外光谱范围的星载多光谱成像仪,谱段范围覆盖0.45~125 μm,分为可见光近红外(visible and near-infrared supplement,VNIR)、短中波红外(shortwave and midwave infrared supplement,SWIR/MWIR)和长波红外(longwave infrared supplement,LWIR)3个影像数据通道,共12个谱段。载荷的运行大大提高了卫星的观测效果,具有重要的应用价值,可在资源调查、环境监测、灾害预警等方面发挥作用。其中可见光-短波红外谱段的空间分辨率为20 m,而中长波红外谱段的空间分辨率为40 m[8],可见短波红外高光谱相机(AHSI)的光谱覆盖范围在0.4~2.5 μm之间,空间分辨率为30 m,幅宽达到了60 km[9]。这些性能参数作为实际应用中非常关键的指标,决定卫星在资源调查、环境监测、灾害预警等方面的精度和应用范围。

高分五号02卫星搭载了7个有效载荷,其中2个是对地成像载荷,分别为AHSI和VIMI,可用于环境综合监测和国土资源调查等方面;另外还有5个大气探测载荷,包括GMI、(electromagnetic measurement technology,EMT)、DPC、(precision position and orientation sensor,POSP)和(atmospheric aerosol spectrometer,AAS),被用于探测大气中的温室气体、气溶胶、偏振等参数,可监测温室气体、PM2.5、污染气体等大气环境要素。这些载荷的运行提升了卫星的能力和效果,在环境监测、气象预报、灾害预警、资源调查等领域具有重要的应用价值,为保障国家重大战略和长期发展提供了有效的手段和技术支持。

1.3 高分五号卫星高光谱遥感数据的特点

高光谱遥感技术结合了成像和光谱技术,利用多个很窄的电磁波波段从目标上获取大量光谱数据,同时探测目标的二维空间信息和一维光谱信息,因此可以获得非常详细的物质光谱特征信息[10]。高光谱遥感数据的光谱分辨率高且连续,对材料的光谱特性有更高的识别和分辨能力,可以识别出更多的地表材料信息,如土地类型、植被覆盖、水体、岩石等,还能够检测大气成分、污染物、温度等环境参数。高光谱遥感技术广泛应用于环境监测、农业生产、自然资源调查、城市规划等领域,对于保护环境、推动可持续发展具有重要的意义。和其他宽波段遥感图像相比,高光谱遥感图像主要具有以下特点:

1) 光谱分辨率高,波段多,这种多波段的光谱数据能更好的的对地表物质进行区分。

2) 波段间相关性较强。地物光谱反射特性导致高光谱图像在一定光谱区域内表现出相似性。

3) “图谱合一”技术能够同时提供光谱信息和空间信息。

4) 高光谱图像的波段增多,使其数据量也在急速增长。

和其他高光谱图像数据相比,高分五号卫星上装载的可见短波红外高光谱相机(AHSI),在提高性能的同时,大幅改善了图像清晰度,高光谱遥感技术在图像采集时可以使用成像仪器获取目标的二维图像。但是由于不同波长下光的传播和吸收具有不同的特性,因此在传统光学系统中,图像的光谱信息往往会发生畸变。高光谱遥感技术利用的光谱成像仪器可以通过过滤器或光栅分离不同波长的光线,保证了光谱信息的准确性和精度。 因此,高光谱遥感技术着重解决了图像光谱畸变问题。同时AHSI配置了丰富的定标手段,确保了数据的精度和稳定性。2005年,自美国Hyperion[11]停止工作以来,国际上星载短波红外高光谱数据获取一直处于空白状态。高分五号卫星的成功发射,极大地丰富了高光谱遥感信息资源的获取方式,显著提高了高光谱遥感图像的质量;光谱分辨率更高,能识别更多物质;波段更多,波段之间的信息校正更加容易;高光谱图像数据维度更高,在高维空间中不同类别的样本重叠率更低,更容易区分。这些优势对于提高遥感数据的精确度、准确性和实用性具有非常重要意义。

2 高光谱卫星遥感分类的一般过程及面临问题

2.1 高光谱卫星遥感分类一般过程

高光谱影像分类是根据影像中的像素向量为每个像素向量分配类别标签[12],高光谱图像分类一般过程如图1所示。

图1 高光谱图像分类一般过程

1) 光谱数据预处理是高光谱影像分类中非常重要的一步,包括波段剔除、辐射定标、大气校正和几何校正等部分。其目的在于消除高光谱图像中由大气散射、折射以及几何畸变等因素引起的干扰噪声,提高高光谱图像数据的精度和可靠性。预处理后的数据更加准确,为后续处理和应用提供更好的基础数据支撑。

2) 对于预处理后的数据,需要进行目视解译来区分特征的类型,确定分类类别的数目,并选择每个分类类别的训练样本来训练分类器。

3)为了减少计算量,有些数据需要通过波段选择和特征提取进行数据降维。常用的特征提取算法包括独立成分分析(independent component analysis,ICA)[13]、主成分分析(principal component analysis,PCA)、因子分析(factor analysis,FA)[14]、线性判别分析(linear discriminant analysis,LDA)[15]、局部线性嵌入(locally linear embedding,LLE)[16]和核主成分分析(kernel principal component analysis,Kernel PCA)[17]等。这些算法能够将高维度的高光谱数据转换为低维度的特征空间,并保留了原始数据的主要信息,方便后续的数据处理和分析。

4) 对于不同的高光谱图像数据集,需要选择合适的模型以获得最佳的分类效果。在模型选择过程中,需要考虑多个因素,如数据集的特征、数据量的大小、计算资源的限制等。同时,也需要进行实验评估,选择最优的分类模型,以保证高光谱图像分类的准确性和可靠性。

5) 在分类高光谱数据后,采用主成分滤波等方法消除孤立点和噪声,进一步提升分类效果[18]。这些滤波手段可以去除高光谱数据中的异常点和噪声,使处理后的数据更加平滑和准确。通过滤波处理后的分类结果,可以更好地对高光谱数据进行分类和分析。

6) 在高光谱图像分类中,除了选择适合的模型之外,对分类结果进行评估非常重要,可以通过混淆矩阵、Kappa分析、漏分误差和多分误差等方法对分类结果进行评价。混淆矩阵可以展示分类结果的详细信息,包括真实分类和预测分类的数量,以及各个类别之间的分类情况。利用混淆矩阵可以计算分类的准确率、召回率和F1值等指标,以全面评估分类效果。Kappa分析是一种常用的分类评估指标,用来反映分类结果与随机分类的差异,它将观测数据与期望数据进行比较,计算出Kappa系数来衡量分类结果的准确性。漏分误差和多分误差是衡量分类结果错误的指标。漏分误差是指将某个类别的样本错误地分为另一个类别,而多分误差是指将不同类别的样本错误地分为同一个类别。通过计算漏分误差和多分误差,可以更全面地评估高光谱图像分类结果的准确性和可靠性。总之,在高光谱图像分类中,需要根据不同的评估指标对分类结果进行全面、准确、可靠的评价,为后续处理提供更加精确可靠的数据支持。

2.2 高光谱卫星遥感分类面临的问题

早期的遥感图像分类方法是人工提取图像特征,如颜色、形状、纹理和光谱等信息,这需要具备专业知识和实践经验的专家设计不同的特征。虽然这些特征包含了大量可以用于目标分类的有用信息,但是这种方法存在局限性,因为设计特征的专家经验对其描述能力会产生影响,在处理复杂图像时表现不佳,无法发挥机器学习算法的最佳效果。随着深度学习技术的发展,越来越多的方法使用卷积神经网络(convolutional neural network,CNN)等深度学习架构自动学习图像特征并进行分类。与传统人工特征设计方法相比,深度学习方法更为通用、准确,且具有更强的鲁棒性,并广泛应用于各种遥感图像分类任务。通过使用深度学习方法,可以自动学习数据中优秀的特征,与手动选择的特征相比,能够更有效地提高遥感图像分类的准确性和效率。因此,深度学习算法已成为遥感图像分类中的一种重要技术手段。

随着遥感技术的不断发展,遥感图像分辨率越来越高,图像中包含的细节越来越多。为解决单一特征无法全面表达目标对象的问题,多特征融合方法被广泛运用于遥感图像分类中。这种方法将来自图像不同方面的特征结合起来,从而提高了分类的准确性和鲁棒性。通过融合多个特征,可以充分挖掘不同特征之间的相关性和互补性,更全面地描述遥感图像中的情况。例如,可以同时使用深度学习模型获取纹理、形状和光谱等不同特征,并将它们融合在一起,以增强分类算法对复杂遥感图像的处理能力。在多特征融合方法中,可以采用不同的融合策略,如加权平均、层次式融合、元学习等方法,以最大限度地提高分类效果。因此,目多特征融合方法是遥感图像分类领域的一个重要研究方向,它有望进一步提高遥感图像分类的准确性和鲁棒性,为智能化遥感应用提供更加精确的支持。常见的多特征融合方法包括特征层叠方法、特征叠加方法、特征加权方法等。这些方法在实际应用中取得了很好的效果,成为遥感图像分类领域的重要研究方向之一。2021年,冯凡等人[19]提出了一种基于多特征融合和深度学习的精细分类方法,用于机载高光谱影像作物的精细分类。这种方法利用了形态剖面、灰度共生矩阵(gray-level co-occurrence matrix, GLCM)纹理和端膜丰度特征以及高光谱影像的空间信息,并将多个空间信息和原始光谱信息融合,生成分类结果。为了实现多特征融合,该方法考虑了特征堆叠、决策融合和概率融合三种方法。此外,该方法采用具有条件随机场(DNN+CRF)模型的深度神经网络来进行分类,进一步提高了分类的准确性和鲁棒性。该方法在实验中取得了非常令人满意的分类结果,证明了多特征融合和深度学习技术的有效性和优越性,为机载高光谱影像作物分类研究提供了新思路。2022年,HUANG L P等人[20]利用高分一号全景多光谱扫描仪(panchromatic and multispectral scanner, PMS)传感器模拟,和真实的高分五号,高光谱成像(hyperspectral imaging, HSI)、多光谱成像(multispectral imaging,MSI)和全色成像(panchromatic imaging,PAN)影像作为实验数据,提出了一种新的分步融合策略来提高高光谱成像(Hyperspectral Imaging)的空间分辨率,并将其与传统的融合策略(HSI + PAN)进行对比。研究结果表明,与传统的融合策略相比,分步融合策略更能提高高光谱影像的空间分辨率,并且对于不同种类的遥感图像,需要选择不同的融合策略。

高光谱数据存在着异谱同物和异物同谱的现象,这些现象会影响到图像的分类精度。早期的研究者通常只关注图像在光谱维度上的信息,而忽略了空间维度上的信息[21]。随着研究的不断深入,空间信息也被应用于分类过程中,以提高分类精度。近年来,深度学习算法的应用进一步提高了分类的精度。针对自然场景中高光谱图像中端元光谱可变性的问题,王艳红等人[22]提出了一种新型的高光谱解混算法。该算法基于多尺度的频谱空间加权与扩展线性混合模型,能更有效地解决光谱可变性的问题。特别是对于具有复杂光谱混合问题的高光谱图像,效果更明显。同时,该算法的复杂度较低,适用于大规模遥感图像的处理。该研究为解决高光谱图像混合问题提供了一种新思路和方法,并且在实验中取得了良好的解混结果,证明了算法的有效性和可行性。刘颖等人[23]提出了一种改进的空谱联合协同表征分类算法,旨在解决高光谱图像分类中空间和光谱信息利用不充分的问题。该算法通过计算训练像素与测试像素之间的欧式距离,能够充分挖掘光谱信息,同时,还能计算测试像素与训练像素之间的空间信息,更好地利用空间结构。将这两种信息进行联合建模,并使用最小残差法进行高光谱图像分类。通过实验比较,该方法在高光谱图像分类方面表现出较高的分类精度,远胜于传统算法。该研究方法在解决高光谱图像分类中空间和光谱信息利用不充分的问题上提供了一种新思路和方法,并取得了良好的实验效果。此外,该方法的优势在于能够更好地利用高光谱图像中的各类信息,并有效地提高分类精度。因此,针对高光谱图像分类问题,该算法具有重要的实际应用价值。利用3D-CNN对高光谱图像进行分类时,通过空间光谱联合信息的加入,可在一定程度上减弱异谱同物和异物同谱的影响,提高分类精度。虽然深度学习算法的出现已经在一定程度上降低了这些问题的影响,但是在真实应用场景中,仍然存在许多亟待解决的难题。比如,高光谱图像中存在着很多与目标物体无关的背景噪声,这些噪声会对分类结果产生干扰;同时,由于高光谱图像数据量较大,处理速度过慢也是一个需要解决的难题。因此,在未来需要进一步研究和改进相关算法,以提高高光谱图像分类的准确性和效率。

3 高分五号高光谱图像分类方法研究现状及进展分析

近年来,基于概率统计原理的机器学习方法为遥感图像分类提供了多种可行方案。传统的机器学习分类方法主要包括监督分类和无监督分类。其中,监督分类通过基于部分训练样本的练习构建分类器,使其根据输入的自变量值确定最可能的离散因变量,即分类结果。无监督分类是一种不需要进行训练样本选择的遥感图像分类方法,它可以仅利用有限的初始输入数据,按照一定的规则将像元划分到某一集群组中,然后通过与参考数据的比较,将每个集群组划分到某一类别[24]。无监督分类不需要先验知识,也不需要事先确定类别的数量和类型,因此具有很强的灵活性和实用性。在遥感图像分类中,无监督分类通常基于像素的特征信息,可以先使用聚类算法将像素分成不同的类别,再根据它们的相似性来对应不同的地物类型。由于无监督分类算法对数据质量的要求比较高,因此在处理遥感图像之前需要进行数据预处理和去噪。

3.1 监督分类

常用的监督分类方法包括支持向量机分类(support vector machine,SVM)、神经网络分类(neural network,NN)、随机森林分类(random forest,RF)、决策树分类(decision tree classification,DTC)、最小距离分类法(minimum distance classification,MDC)、最大似然法分类(maximum likelihood classification,MLC)等。

3.1.1 支持向量机

SVM是一种用于二类分类的模型,它利用特征空间中的最大间隔超平面进行分类,是一种线性分类器,不同于感知器。此外,SVM还可以使用核函数将样本数据从原始特征空间映射到高维空间,以解决原始特征空间中的线性不可分离性问题[25]。SVM通过硬间隔最大化来学习线性分类器,从而使得训练数据集能够被完全分开。当训练数据不满足线性可分时,SVM通过软间隔最大化来学习线性分类器,在允许一定程度上的误分类的同时,尽可能减小分类错误的数量和程度。此外,当训练数据线性不可分时,SVM利用核技巧将其映射到高维空间,从而实现非线性分类器的学习。在这种情况下,SVM仍然应用软间隔最大化来学习分类器,以平衡较高的复杂性和较低的误差率,提高分类精度,并减小过拟合风险。SVM在图像识别、文本分类等任务中具有广泛的应用。2008年,T.OOMMEN等人[26]为提高图像分类的可靠性和准确性,引入基于统计学习理论的支持向量分类(support vector classification,SVC)方案,旨在降低模型结构的不确定性和数据的适应性,并与最大似然法(maximum likelihood classification,MLC)比较分析。研究结果表明,SVC提高了分类准确性,稳健性。2017年,李斌[27]提出了一种改进型相关向量机算法,该算法利用主成分分析法和线性判别分析法,对高光谱数据进行二次降维。该算法可以增大数据的类间距离、减小数据的类内距离、降低数据维度,并保留主要信息,从而提高相关向量机的分类精度。这些实验结果表明,改进型相关向量机算法具有优秀的遥感图像分类效果,可以在实际应用中发挥重要作用。2022年,为探究国产高分五号(GF-5)高光谱和高分六号(GF-6)多光谱遥感数据及其不同特征组合在中高纬度湿地信息分类中的能力,潘煜琳等人[28]利用SVM、RF和KNN等3种分类器提取湿地信息,实验结果表明基于GF-5和GF-6波段组合后的特征组合与SVM算法的结合获取的湿地信息总体分类效果最好。

近年来,基于SVM与其他方法的混合模型应用越来越广泛。居红云等人[29]提出基于K-means与SVM结合的遥感图像全自动分类方法;2020年,O.OKWUASHI等人[30]提出整合DL和SVM,以形成一种混合的由四个核函数实现的DSVM(dual support vector machine),并在印度松树和帕维亚大学2个公开的高光谱数据集进行实验,实验结果表明,在高光谱遥感图像分类中,DSVM具有很强的鲁棒性,明显优于传统的SVM;2022年7月,陈珠琳等人[31]利用GF-5数据,研究了3种降维方法和3种分类方法(随机森林、支持向量机和K邻近KNN),实验发现SVM在高维空间具有非常好的抗噪能力,分类精度高于RF和KNN。实验结果也证明了含有SVM的具有23维输入的L1-SVM-SBS分类模型总体分类精度最高。

3.1.2 决策树分类

决策树是一种基于树形结构的分类算法,通过递归地进行划分来实现分类。该算法会在训练数据上学习一个类似于流程图的树形结构,其中每个内部节点表示一个属性判断,每个分支表示判别结果的输出,每个叶节点则表示一种分类结果。在构建决策树分类器的过程中,需要确定哪些特征用于分类及如何将数据进行划分。通常决策树分类算法(decision tree classification algorithm,DTCA)包括决策树的生成和修剪2个步骤,其生成算法采用自上而下的递归方式,在决策树内部节点进行属性值的比较,并根据不同的属性值进行分支。通过反复迭代,决策树可以不断细化属性之间的关系,最终在叶节点处得到输出结果,完成分类[32-33]。 2015年,针对高光谱遥感应用中地类光谱混淆性问题,沈聪颖等人[34]基于GF-5影像数据,构建了一种单波段阈值法与构建的阴影水体指数相结合的决策树水体提取模型,与传统的单分类算法相比,该方法能够有效抑制山体阴影和裸地影响,显著提升了山区水体提取精度;2021年,Y.C.SINGH等人[35]提出了一种新的框架,即混合多关系决策树学习算法,克服了现有决策树学习算法存在的技术缺陷和其它异常,减少了决策树学习算法执行时间。在不同数据集上的实验结果表明,混合多关系决策树学习算法是一种综合性较好的方法。

3.1.3 随机森林

随机森林算法将多个决策树结合在一起,每次从数据集中随机选择一部分样本(有放回地抽样),同时随机选取部分特征作为输入,所构造的“森林”是决策树的集成。2016年,李垒[36]提出了一种基于随机森林的高光谱遥感图像分类方法,充分利用高光谱图像的光谱信息和空间结构信息,提高遥感图像分类的精度。与单一特征的分类方法相比,该方法可以同时处理多个特征,包括光谱、空间和上下文信息等,更全面地描述像素点的特征。该方法使用随机森林算法进行分类,通过组合多个决策树的结果,减少过拟合情况,提高分类的稳定性和准确性。实验结果表明,该方法在AVIRIS和ROSIS高光谱图像上的分类性能优于传统的高光谱图像分类方法,具有较高的分类精度和泛化能力,并能有效降低数据噪声和复杂度对分类结果的影响。2019年,王怀警等人[37]针对高光谱遥感数据树种识别精度不高现有多分类器组合策略难以避免人为因素干扰的问题,利用自适应权值模型组合支持向量机和随机森林2种机器学习算法,有效改善森林类型精细识别精度,对GF-5星载高光谱遥感数据应用具有借鉴意义和参考价值。2021年,杨红艳等人[38]以内蒙古荒漠草原遥感图像为例,使用无人机搭载高光谱成像系统采集数据,构建了包含24个变量的随机森林分类模型。该分类模型融合了光谱、植被、地形和纹理等多种特征,能够更全面地描述图像的特征。与支持向量机、K近邻算法和最大似然分类法相比,随机森林分类方法的分类效果最好,总体分类精度达到91.06%,Kappa系数达到0.90,表明随机森林算法具有较高的分类准确性和泛化能力,而且对于高光谱遥感图像的特征提取和分类任务具有较强的适应性和优势。因此,随机森林算法可以被广泛应用于高光谱遥感图像的分类和解译等领域,为自然资源管理和环境保护等提供重要的技术支持。

3.1.4 神经网络分类

人工神经网络(artificial neural network,ANN)是一种基于生物学中神经系统的模拟数学模型,模拟人类大脑的信息处理方式,可以分为前馈型网络(feedforward neural network,FFNN)和反馈型网络(recurrent neural network,RNN)2大类。其中前馈型网络是一种大规模的非线性映射系统,常用于分类和回归问题等,而反馈型网络则是一种大规模的非线性动力系统,常用于时序预测、控制和优化等方面。人工神经网络根据学习方法的不同,分为有监督学习、无监督学习和半监督学习;根据工作模式,可以分为确定性和随机性;根据时间特性,可以分为连续型和离散型等。人工神经网络在图像处理、语音识别、自然语言处理、机器翻译和智能控制等领域都有广泛的应用,具有良好的适应性和扩展性。

2021年,P.LEVENTE等人[39]利用高光谱遥感数据监测入侵植物种类,将SVM 和ANN分类算法应用于高精度的野外参考数据。在SVM分类的情况下,总体准确率达到92.95%,利用ANN模型,总体精度达到99.61%。针对高光谱图像分类中存在的样本标签有限和3D-CNN网络特征提取不全面的问题,王立国等人[40]提出了一种改进的3D-CNN算法,该算法采用生成式对抗网络,对原始数据进行数据增强,并解决部分样本标签少,导致分类模型出现过拟合的问题;同时,在3D-CNN网络中,加入纹理信息增强模型,以更好地提取图像的空谱特征。实验结果表明,在小样本数据情况下,该方法比原始网络具有更高的分类精度,能够自适应地提取高光谱图像的空谱联合特征。该方法对于解决高光谱图像分类中的问题具有一定的优势和实际意义,为高光谱遥感图像的分类与解译等领域提供一种新的技术手段和思路。2022年,刘一鸣等人[41]利用GF-5高光谱影像,设计并开发了基于人工神经网络的神经网络校正器,对悬浮泥沙浓度反演结果进行二次校正,实验结果表明,校正后的模型在高分五号高光谱图像得到的精度最高。

3.1.5 最小距离分类法

最小距离分类法是最基本的分类方法之一,该方法计算未知类别向量到预先已知类别中心向量的距离,然后将向量分配到这些距离中最小的类别中,从而实现分类。欧氏距离和曼哈顿距离是最常用的计算距离的方法,但由于该方法只考虑了待分类样本与每个类别中心的距离,而没有考虑已知样本的分布,虽然分类速度很快,但准确率不高。此外,当特征维数很高时,最小距离分类法的运算量和计算复杂度会明显增加,影响分类效率和准确性。因此,在应用最小距离分类方法时,需要充分考虑不同情况下的适用性和限制性,以确保其正确性和有效性。近年来,部分学者对其进行研究,但在高光谱领域研究较少,通常被用于和其他算法进行对比。2018年,朱培乐[42]提出基于自适应最小距离分类法的水质反演模型,对MNDWI(modified normalized difference water index)、NDTBI(normalized difference temperature and brightness index)、AWEI(automated water extraction index)、RNDWI(ratio normalized difference water index)4种水体指数中最佳水体提取结果进行优化。2015年,QIN F P等人[43]采用基于图论的谱聚类算法解决波段选择问题,用支持向量机和最小距离分类法对高光谱图像进行分类,得到SVM的总体精度约为94.08%和94 .24%,MDC的总体精度约为87.98%和89.09%。

3.1.6 最大似然分类法

最大似然分类法(maximum likelihood classification,MLC)又被称为贝叶斯(Bayes)分类法或极大似然估计法,它是一种使用概率模型进行参数估计的方法。利用已知的样本结果,构建概率模型,并在此基础上,通过求解模型参数,反推最有可能产生这个结果的模型参数值[44]。最大似然分类法的分类过程可以分为3步。首先确定训练样本,计算每个样本的特征值,利用这些特征值建立判别模型函数,最后将每个像元的特征向量代入判别模型函数,根据所得到的概率值,将像元划分为概率最大的一组类别[45]。MIC考虑了待分类样本与已知类别中心的距离和已知类别的分布特征,可以更准确地对待分类样本进行分类。与最小距离分类法相比,MIC分类方法具有更高的分类精度,能够更好地处理数据集中的噪声和变异。此外,MIC算法还可以通过先验概率来调整分类结果,提高分类的准确性。因此,在实际的分类任务中,MIC算法也是常用的分类方法之一,但最大似然法在应用时存在一些问题。为解决这些问题,2012年,周国琼等人[46]提出了一种基于模糊C均值聚类改进的最大似然分类法,并将其应用于遥感领域。实验结果表明,改进后的最大似然分类法具有更高的分类精度,远高于传统的最大似然分类法。

3.2 无监督分类

常用的无监督分类方法有K均值聚类法(K-means)及ISODATA动态聚类。

3.2.1 K均值聚类算法

K-means聚类算法是一种基于欧氏距离的迭代聚类算法。该算法首先随机选择k个对象作为初始的聚类中心,然后计算每个对象与所有聚类中心之间的距离,并将其分配到距其最近的聚类中心所在的簇中。对于每个簇,重新计算其中所有对象的重心,并将其作为该簇的新聚类中心,形成新的k个聚类中心和k个簇。接下来,继续重复上述过程,直到满足某个终止条件,终止条件可以是没有(或最少数量的)对象被重新分配到不同的簇或没有(或最少数量的)簇中心再次改变或误差平方和为局部最小。通过这个过程,K-means算法能够将数据点分为k个不同的簇,使同一簇内数据点相似度较高而不同簇之间数据点的相似度较低。该算法在数据挖掘和机器学习领域有广泛的应用,例如在图像分割、文本聚类、人群分析等方面都有所应用。2018年,K.YASSER等人[47]将K-means方法应用于高光谱数据立方体,成功检测出光谱组织差异,验证了在高光谱图像分析中,图像处理算法K-means在构建能够识别和分类正常和导管原位癌组织的半自动化系统方面的巨大潜力。2019年,李玉等人[48]在解决高光谱数据的"维数灾难"问题方面,提出了一种新的高光谱图像分类算法。该算法是在K-means聚类算法的基础上进行改进,考虑了各个波段对不同聚类的重要程度,并且综合类间信息,提高了分类的精度。这种算法被称为熵加权K-means全局信息聚类。

这种算法的核心思想是使用熵权法对波段进行权重分配,以将各个波段的重要程度考虑在内。此外,算法还引入了一种新的距离度量方法,以更好地反映不同类别之间的差异。通过这些改进,该算法可以更准确地区分不同的类别,从而获得更好的分类效果。相比传统的K-means聚类算法,这种算法在处理高光谱数据时表现更为出色,分类精度更高。因此,在实际应用中,熵加权K-means全局信息聚类算法可以更好地应用于高光谱图像分类任务中。2020年,汪凌志等人[49]提出了一种新的高光谱数据分类方法,以应对其典型问题。该方法基于光谱和空间特征相结合,通过空间特征与光谱特征相结合,并进行降维处理,最后使用K-means算法得到更佳分类结果。与普通的K-means算法不同,该算法在分类之前引入了空间特征的提取和处理过程,从而有效地利用了图像的空间信息。通过将空间特征与光谱特征相结合,该方法可以更全面、更准确地描述图像中的信息,从而提高了分类的准确度。该算法已成功应用于长波红外的高光谱图像分类中,并在实验中获得了较好的分类精度。因此,这种基于光谱和空间特征的K-means分类方法为高光谱数据的处理提供了一种新的思路和方法。

3.2.2 ISODATA动态聚类

迭代自组织数据分析技术(iterative self-organizing data analysis technique, ISODATA)聚类算法是K均值算法改进后的算法,它与K-means算法不同,一是ISODATA算法采用了批量样本校正法,而不是逐样校正法,这使算法更加高效;二是ISODATA算法允许自动合并和拆分聚类,从而生成数量合理的聚类结果。这种自动化的特性可以帮助ISODATA算法更加准确、快速地完成聚类任务,因此该算法在实际应用中得到了广泛的运用。HONG P等人[50]提出的改进型ISODATA聚类算法结合了高光谱图像的频谱信息和空间信息,使用加权矩阵,分别计算2个像素之间的相似度,更准确地确定它们是否属于同一类别。这种方法在高光谱图像的空间目标材料识别任务中取得了非常好的效果,证明了该方法的有效性。实验结果也证明了这种新方法在在空间目标材料识别相关的高光谱图像上十分有效。

3.3 深度学习方法

深度学习是一种新兴的机器学习技术,在图像分类领域得到广泛应用。与传统的机器学习算法不同,深度学习旨在建立一种类人脑进行分析学习的神经网络模型,从而能够在处理大量训练数据和多层隐藏层的深度模型中提取更有用的特征,并提高分类准确性。近年来,在遥感图像分类应用方面,深度学习取得了重大的突破,越来越多的研究者开始将深度学习技术应用于遥感图像处理中。利用深度学习技术,可以有效地获取遥感图像中的丰富信息,从而更好地描述图像特征,并提高分类准确性。同时,深度学习方法还能够自适应地对不同类型的遥感图像进行处理,具有较强的泛化能力和鲁棒性。总之,深度学习技术在遥感图像分类应用中具有广阔的发展前景和重要的应用价值。随着这一领域的不断发展和深入研究,深度学习技术将会在遥感图像处理中发挥越来越重要的作用。

常用的深度学习方法包括自动编码器[51]、卷积神经网络[52]、深度信念网络[53]和迁移学习[54]。近几年,利用深度学习解决高光谱数据分类问题在GF-5数据上得到应用。2022年,ZHOU S Y等人[55]使用一份GF-5数据和两份PRISMA卫星数据,通过深度学习和经光谱特征训练的机器学习模型,检测和识别飞机中不同类型塑料,利用CNN、RF和SVM等算法,取到了较好的实验效果。2022年,季超[56]使用数据融合和降维等预处理技术,以及光谱角匹配法、支持向量机和基于深度学习的ENVINet5模型进行GF-5高光谱遥感数据的地物特征提取及分类研究,并对3种方法的结果进行综合分析。实验结果表明,3种方法的总体分类精度均达到80%以上,证明GF-5高光谱数据在地物特征提取与分类方面表现良好,且在精细化分类方面具有较好的应用前景。

4 展望

综合以上相关研究的分析,高分五号卫星影像数据的高光谱遥感分类主要呈现以下发展趋势:

1) 高效及高精度的分类算法研发仍然是高光谱影像分类的主要研究方向。

2) 将空谱特征与其他高分辨率影像联合进行分类仍然是遥感图像处理领域的研究热点。通过将高光谱遥感影像与其他高分辨率影像进行融合,可进一步提高图像分类精度,为实现更加准确和可靠的地物分类任务提供技术支持。

3) 探索和开发具有强大泛化能力的分类器,使其能够在实际应用中有效地解决地物精细分类问题。

4) 深度学习是近几年来的研究热点,越来越多的学者将重心转移到深度学习算法模型的构建上,提高了高光谱图像的分类精度。

5 结束语

本文通过研究国内外高光谱及GF-5数据在不同分类算法下的分类性能差异,并根据前人的经验,对高光谱图像分类未来的发展提出一些建议:

1) 减少人力消耗。高光谱图像包含了大量丰富的信息,但由于数据量庞大,初期处理往往需要依靠大量的人力,耗时费力。因此,考虑有效的自动化算法解决该问题,使高光谱图像的处理更加高效、准确和可靠,这也成为遥感图像处理领域的一个重要研究方向。

2) 将机器学习与深度学习相结合。在高光谱图像分类研究中,不断涌现出各种机器学习或深度学习算法,但是将两者结合的算法却较少。通过分析GF-5高光谱图像分类实验或者进行对比实验可以看出,支持向量机有很大的发展前景,基于SVM的分类模型分类精度依旧处于前端。未来,高光谱图像分类算法可以将研究重点放在如何有效地结合支持向量机、神经网络等机器学习和其他深度学习方法上,从而实现更加准确可靠的高光谱图像分类。

3) 将基于空谱联合的分类方法应用到具体场景。尽管传统的基于光谱特征的分类方法已经取得一定成果,但是由于未考虑高光谱数据的空间信息,因而其分类精度较低且在实际场景中的应用也不够广泛。因此,基于空谱联合的方法成为解决未来实际应用问题的重要研究方向。结合高光谱数据和其他遥感影像数据,将传统的基于光谱特征的分类方法拓展至基于空谱联合的范畴,可以提高分类精度,促进高光谱图像分类算法在实际应用中的推广和应用。

猜你喜欢
光谱卫星分类
基于三维Saab变换的高光谱图像压缩方法
miniSAR遥感卫星
分类算一算
静止卫星派
分类讨论求坐标
数据分析中的分类讨论
教你一招:数的分类
Puma" suede shoes with a focus on the Product variables
星载近红外高光谱CO2遥感进展
苦味酸与牛血清蛋白相互作用的光谱研究