高光谱遥感图像波段选择研究进展综述

2022-05-19 13:25杨红艳杜健民
计算机工程与应用 2022年10期
关键词:波段光谱分类

杨红艳,杜健民

1.内蒙古工业大学 机械工程学院,呼和浩特 010051 2.内蒙古农业大学 机电工程学院,呼和浩特 010018 3.内蒙古自治区特殊服役智能机器人重点实验室,呼和浩特 010051

随着传感器光谱分辨率的不断提高,遥感数据挖掘出的地物信息越来越丰富,使人们对地物特征的认知得以不断深入,高光谱遥感技术也因此成为遥感领域的研究热点之一。高光谱遥感是指用大量狭窄的电磁波通道获取地物的空间、辐射和光谱三重信息的技术[1-3]。通过在电磁波谱的可见光、近红外、中红外和热红外波段范围内获取地物图像数据,图像上任意一点的光谱反射值可以连成一条几乎连续的光谱曲线,因此高光谱图像构成一个图像数据立方体,二维空间描述了地物的空间维特征,光谱维描述了地物的光谱特征。高光谱图像纳米级的光谱分辨率不仅可以区分不同类型的地物,而且能够识别同一种地物的不同类型,使得在多光谱遥感中难以探测的物质,在高光谱遥感中能够被识别并区分。

高光谱遥感识别能力的提高促使遥感的监测目标发生本质改变,也给数据处理、信息分析技术带来了根本性的变化。庞大的数据量使得计算量剧增,数据存储空间增大,数据运算处理时间增长;在样本数据不足的情况下,高光谱图像的分类精度随着波段数量的增加,总体呈现先升高后降低的趋势,并且样本数量越小,这种趋势越明显,即产生维数灾难Hughes现象[4];过高的波段数量使分类器对类内的变化过于敏感,增加了分类的难度,这些变化成为制约高光谱遥感技术进一步发展和应用的因素。针对上述问题,通常采用数据“降维”的方法,保留能够描述地物本质特征的代表性波段,去除冗余、噪声波段来提取特征,减小数据量,提高数据处理效率[5-7]。

高光谱图像数据降维有特征提取和特征选择两种方法。特征提取通过数学变换将光谱波段重新组合、压缩和优化。特征选择又称波段选择,通过从原始波段中选择部分特征波段实现降维,同时使波段的物理信息得以保留,在后续分析中能够揭示数据潜在的模式机理。本文仅以波段选择方法为研究对象,分析其研究进展和面临的挑战。

波段选择是高光谱遥感图像预处理的一项重要内容,其最终目标是从原始波段中选择出信息量大、相关性小、类别可分性好的少数特征波段组合[8]。然而,高光谱遥感图像的波段选择面临巨大挑战。一方面,由于信息量大的波段往往相关性也大,使得波段选择难以同时满足所有约束条件,导致选择的波段组合在实际应用中不能获得预期的效果;另一方面,数据结构的高度非线性、数据量庞大等原因使得波段选择算法复杂,数据处理耗时长,效率较低。基于以上原因,高光谱图像数据的波段选择需要建立正确的评价准则、数学表达模型和算法以准确地反映数据的内在本质,提高数据处理效率。

本文结合高光谱遥感图像波段选择的常用方法、最新进展和发展前沿,在探讨高光谱遥感图像波段选择策略的基础上,对高光谱遥感图像波段选择的研究进展、关键技术、主要问题与挑战进行综述与分析,并提出未来可能的发展趋势。

1 高光谱遥感图像的波段选择策略

由于地物特征对电磁波谱不同波段反射的敏感性不同,使得各波段在数据分析中的作用及重要性各不相同[9]。波段选择通过从所有原始波段中选择出能够代表地物特征的少数波段,实现降低数据维、去除冗余信息、降低噪声和满足特定任务等目的。因此,高光谱遥感图像波段选择的特点在于:(1)波段维数高且相关性强,计算数据量大,耗时长;(2)波段选择的评价准则不唯一,不同评价因素有时难以同时满足;(3)针对不同应用,同样数据源的波段选择结果可能不同;(4)波段选择的结果应使模型应用的性能达到或优于使用原始全部波段时的性能。

当前高光谱遥感图像波段选择采用的策略主要包括:(1)以评价准则为依据的波段选择;(2)以特征选择方式为依据的波段选择;(3)以训练样本为依据的波段选择;(4)以与应用模型的关系为依据的波段选择。

1.1 以评价准则为依据的波段选择

从波段选择采用的评价准则来看,高光谱遥感图像的波段选择方案包括:(1)以信息量作为波段选择的标准,选择信息总量最大的波段子集,通常采用信息熵、互信息、交叉熵、联合信息熵、信息散度、方差、协方差矩阵特征值等来构建信息量的评价指标[10]。需要注意的是,噪声对基于信息论的这些指标的影响较大,噪声大的波段会导致较大的方差,同时也会降低与其他波段的相关性而被误选,但这些受到噪声或者异常影响的波段往往具有较低的鲁棒性和可靠性。(2)以类别可分性作为波段选择标准,期望选取的波段子集有利于研究地物的分类识别。衡量类间可分性大小常以距离来度量,典型的度量指标有离散度、B距离(Bhattacharyya distance)、JM距离(Jeffreys Matusita distance)等[6,11-13]。(3)以波段间的相关度作为波段选择的标准,选择相关性最弱的波段子集,以减小信息冗余,常用光谱相关系数、光谱角、光谱信息散度和正交投影散度等作为度量指标[14-15]。

1.2 以特征选择方式为依据的波段选择

根据特征选择方式的不同,高光谱遥感图像的波段选择分为:(1)基于搜索的波段选择,其实质是准则函数的优化问题,其中准则函数和搜索策略是此法的关键。准则函数与波段选择评价准则相关,通常为分类准确率的最大化、波段相关性的最小化、波段信息量的最大化等,属于多目标优化问题。理论上全局搜索能够得到最优解,但计算量非常大,有时甚至难以得到实际应用[16]。(2)基于排序的波段选择,按照评价准则对所有波段的重要性进行量化并排序,根据排序指标阈值[17-19]或指定的波段个数[20-22]选择优先级高的光谱波段。优点是计算复杂度低,执行速度快;缺点是该方法只考虑单个波段的情况,没有探索整个波段子集的优化。(3)基于聚类的波段选择,通过将原始波段按某种指标划分为多个类簇,从各类簇中选择与聚类中心最近的波段组成最终波段子集[23-24],如K均值(K-means)聚类[25-27]、亲和力传播(affinity propagation,AP)聚类[28-29]等。这种方法的优点是可以优化整个波段子集而不仅仅是单个波段,并且适合于无监督的特征选择[30-31];缺点是对初始化很敏感,在优化过程中容易陷入局部最优解[8],另外受到聚类类别数如何选择问题的影响,鲁棒性较差。

1.3 以训练样本为依据的波段选择

根据是否依靠样本先验信息,将高光谱图像波段选择分为监督波段选择和非监督波段选择。监督波段选择利用标记的训练样本参与波段选择过程,使得选出的波段子集具有较好的实际应用性能。但因训练样本需要进行实地调查,其获得的成本高,耗时费力,有时甚至无法获得,使得监督波段选择的使用受限[32-35]。非监督波段选择不需要除影像本身之外的其他先验性的训练样本信息[14,23,30],只根据影像本身的特点进行选择,在样本难以获得的情况下更具实用性。由于没有标记样本而无法获得高光谱图像的准确信息,非监督波段选择一般以波段信息量和波段间的相关性为准则来进行选择[36-37]。同时,这些波段容易受到噪声或者异常的影响,往往具有较低的鲁棒性和可靠性。此外,非监督波段选择技术一般并不针对特定的应用,因此选择的波段子集的实际应用效果较有监督选择的波段子集差。

1.4 以与应用模型的关系为依据的波段选择

依据波段选择与应用模型学习算法的关系,高光谱遥感图像的波段选择分为:(1)过滤式波段选择,该方法先按评价指标对高光谱数据进行波段搜索,然后再训练模型学习器[35],波段选择过程与应用模型的学习算法无关,二者之间相互独立。这种方法相当于先用波段选择过程对数据进行“过滤”,再用过滤后的特征来训练模型,特点是计算量小,速度快,但波段选择结果与应用模型所需性能偏差较大。(2)封装式波段选择,该方法将应用模型的建立与波段搜索的过程结合起来,利用模型学习算法的训练准确率作为波段子集的评价准则,因而应用模型性能精度较高,波段选择结果偏差小,但每次波段子集评价都需要重新训练学习器,运算复杂度高,计算开销大,不适用于大规模数据集。(3)嵌入式波段选择,该方法在应用模型学习器的训练过程中通过优化目标函数自动完成波段选择。其性能介于过滤式和封装式法之间,相对于封装式法,嵌入式法避免了评估每一个波段子集对学习器进行的重复训练;相对于过滤式法,嵌入式法的波段选择结果与应用模型适应性更好。但嵌入式法性能的优劣依赖于参数调整,且目标函数构造较困难。

综上所述,高光谱遥感图像波段选择的技术框架和策略总结如图1所示。

图1 高光谱遥感图像波段选择的技术框架和策略Fig.1 Technical framework and strategy of band selection for hyperspectral remote sensing image

2 高光谱图像波段选择的研究进展

国内外学者利用模式识别、压缩感知技术、机器学习、智能优化等领域的先进算法和最新成果,充分挖掘高光谱遥感数据隐含的丰富信息和特征,发展了一系列波段选择新方法。

2.1 评价准则的变化

在波段选择过程中,评价准则的确定是极为关键的一步。评价准则不同,波段子集及其性能会出现较大差异。传统的评价准则采用单一判据,所建立的目标函数无法完全满足高光谱波段选择的需要;近来新出现的评价准则采用多重判据,虽在理论上看似趋于完善,但在实际应用中却显示出偏颇,没有达到理论所承诺的优越性[38]。出现所选出的波段在下游任务中没有取得应有的良好结果,在多个判据间难以找到合适的折中,计算量过大等问题。

经典的多评价准则——最佳指数因子(optimum index factor,OIF)[39],其计算公式如式(1)所示。

式中,Si是波段i的标准差,Rij是波段i和波段j之间的相关系数,N为选取的波段数量。通过将所有可能组合波段的OIF值排序,选择OIF值最大的波段子集作为最佳组合波段。OIF兼顾了波段所含信息量和波段间相关性的问题,以波段标准差最大且波段间相关系数最小为目标选择波段。因为高光谱图像相邻波段间的相关系数很大,距离较远的波段间的相关系数通常较小,所以这种方法容易选取相距较远的波段组合,但这些波段的信息量可能并不大。此外,计算所有波段间的相关系数将产生庞大的计算量,使OIF的使用受限。

针对OIF法计算量过大的问题,刘春红等[40]提出了自适应波段选择法(adaptive band selection,ABS)。ABS仅计算相邻波段之间的相关性,而不用计算所有波段间的相关系数,运算量大为减少,其波段指数I i计算公式如式(2)所示[41]。

式中,R i-1,i和R i,i+1是第i个波段与其前后两个波段的相关系数。值得注意的是,ABS仅关注了候选波段与相邻波段间的相关性,容易选出与相邻波段间相关性弱的波段,但不一定是最有代表性的波段。

不论是OIF还是ABS法,在单一公式内设置两个评价准则,很难同时使信息量和相关性达到最优,最终选取的波段不一定是最优的波段组合。针对这一问题,分阶段求解多个准则在波段相关性、信息量和计算量之间取得了较好的平衡[42-44]。分阶段求解通常按照相关性先将所有波段划分为若干个子空间,在各子空间内根据方差、信息熵等选出信息量最大的波段,用这些波段带入OIF公式进行计算。吴逍航等[45]采用这种方法并使用信息熵代替标准差,获得改进的OIF′,如式(3)所示,这种方法由于只对子空间中信息量最大的波段进行组合,使得在运算量显著降低的同时波段信息量获得较大提升。

式中,H代表选取波段的信息熵。

多评价准则的波段选择实质属于多目标优化问题,通过设定多目标的合理权重,将其他目标转换为约束的单目标优化、粗糙集理论及进化算法等来寻找最优解。Zhang等[46]建立了一种基于波段相关性和信息量的多目标波段选择模型,通过人工蜂群算法搜索最优波段组合;刘瑶[38]、张伍等[47]分别建立了基于波段相关性、冗余度、信息量及分类精度的多目标准则,将粗糙集理论应用到高光谱波段的优化搜索中,选择的波段子集均取得了较好的综合性能。

2.2 波段选择方法中空、谱信息的结合

由于地物分布的连续性,高光谱图像中包含的纹理、形状、对象等空间信息,可显著提高图像分类精度,减少分类图像椒盐现象,获得空间连续性好的分类结果图[1,48]。目前,光谱与空间特征的结合已成为高光谱图像分类的主流研究方法,但在高光谱图像的波段选择中,空谱信息结合的研究相对较少。

Cao等[49]利用马尔科夫能量函数将图像局部空间信息与光谱信息进行结合,其能量函数E()L如式(4)所示:

式中,V表示光谱能量项,W表示空间能量项,m、n代表像素,m~n代表相邻像素,k为像素个数,L m代表像素m的类标。根据马尔科夫能量函数预测图像的分类准确度,能量函数值越小,分类精度越高,证明所选择波段的辨识能力越高。

在图像分割方面,梁甜[50]利用聚类算法对图像进行分割,得到超像素分割图,将分割图与像素级分类图通过式(5)联合得到全局分类准确度A,采用序列前向波段选择算法选择使A最大的几个波段。

式中,Q表示分类图中每一类包含的像素数目,P表示分割图中每一个分割块中的像素数,a为超像素,t是最终的超像素数目。该算法通过图像分割将空间信息引入到波段选择中,有效地提升了波段选择的性能。

形态学是一种旨在分析像素间空间关系的理论,Tan等[51]应用形态学轮廓法提取图像空间特征,将提取到的空间特征与光谱特征联合,应用支持向量机(support vector machine,SVM)分类器进行分类,按分类结果精度选择波段子集,实现间接利用图像空间特征影响波段子集的选择。

总体来看,光谱和空间特征相结合的波段选择技术是基于利用光谱和空间信息进行分类,以提高分类精度为准则进行波段选择,其应用尚处于简单的特征提取与组合阶段,基于空、谱信息结合的波段选择方法原理如图2所示。

图2 基于空、谱信息结合的高光谱遥感图像波段选择方法Fig.2 Hyperspectral remote sensing image band selection method based on combination of spatial and spectral information

2.3 半监督学习用于高光谱图像波段选择

遥感图像的地面真实信息必须在数据采集的同时在现场收集,获取过程费时费力,价格昂贵,通常只能获得有限数量的训练样本。虽然基于监督的波段选择以样本标签信息作为先验知识来评估所选波段的质量,能够选择出分类精度高的波段子集,但由于有标签的样本较难获得,使得监督波段选择的实际应用有一定困难。无监督波段选择不需要标签样本的验证,但其选择波段的分类精度通常低于监督波段选择。

半监督学习(semi-supervised learning,SSL)结合监督学习与无监督学习的优点,在减少训练样本的同时,又能获得比较高的学习准确性,在模式识别和机器学习领域中受到人们的重视。近年来,研究者们将SSL应用于高光谱图像的波段选择中,将无标记的样本引入训练过程,在一定程度上解决了高光谱图像缺少标记样本的难题,所选波段子集的性能相比无监督方法有一定程度的提高。

Feng等[52]在自适应克隆波段搜索算法中,基于SSL法利用少数标记样本和多数未标记样本选择出高区分度、高信息量和低冗余度的波段子集,并在公开的高光谱数据集(Pavia University、Indian Pines和Salinas)上对比监督学习和非监督学习进行了算法验证,性能均有提升。

魏翠翠[53]、Cao等[54]针对缺少标记样本的问题,首先使用带标签样本训练分类器,用训练好的分类器分类并给无标签样本标记“伪标签”,再根据图像空间局部平滑性对分类结果降噪、优化,进而调整样本伪标签,使优化后的分类图更接近真实地物分布。同时将待选波段图像输入到训练好的分类器中进行分类,按分类结果给无标签样本标记“预测标签”。最后根据优化后的“伪标签样本”评价“预测标签样本”的分类精度,选择分类精度最高的波段组合。

值得注意的是,实际应用中在噪声干扰下无标签样本数据分布的不确定性和复杂性,都将对波段选择过程产生干扰。

2.4 基于稀疏表达的波段选择

按照稀疏理论原理,每个波段均可由其他几个波段的线性组合来稀疏表示,即可用少数非零值表达高光谱图像光谱数据的本质特征,同时降低高光谱数据处理的复杂度[55-56]。稀疏表示通过字典和稀疏系数矩阵表达高光谱波段矩阵。

基于稀疏理论的波段选择法常见的有:(1)根据稀疏系数对波段进行排序,选取稀疏系数直方图中出现频率高的波段[57]。(2)通过稀疏系数聚类来选择代表性波段[58-60]。(3)基于稀疏系数搜索最佳波段组合[61]。(4)面向应用的基于稀疏表示的波段选择法,其稀疏系数最优解选择的波段可获得更好的任务性能,如分类精度更高[58,62]、目标识别率更高[63]等。

Baisantry等[64]提出了一种基于散度相关指数和稀疏表示的高光谱图像波段选择法,该方法分聚类、排序两个阶段进行波段选择。在聚类阶段,利用稀疏子空间聚类将相似波段聚类成组;在排序阶段,引入联合发散相关指数来选择最具判别性和相关性最小的波段作为聚类代表。实验结果表明,该方法能够有效地选择一组信息丰富、相关性低、类别可分性高的波段。Sun等[65]提出了一种稀疏谱聚类方法来选择高光谱图像的特征波段,通过给谱聚类添加稀疏性和块对角约束,使得波段聚类性能进一步提高,最后从每个聚类中选择特征波段。

总的来说,稀疏表达可使线性可分问题的学习任务难度降低,用少数非零值表达高光谱图像数据的方式减少了存储空间,也使得模型的可解释性提高。基于以上原因,使得基于稀疏表达的波段选择在高光谱数据处理中受到重视。

2.5 智能搜索算法的应用

智能搜索算法是受到物理现象、生物进化和群体智能的启发发展而来的。

基于物理现象的智能搜索法依据物理规则在空间中寻找目标函数的全局最优解,如模拟退火(simulated annealing,SA)[66-67]、引力搜索算法(gravitational search algorithm,GSA)[68]、量子搜索算法(quantum search algorithm,QSA)[69]等。这类算法通过引入随机因素,克服了传统算法优化过程中容易陷入局部极值的缺陷。谢欢等[70-71]在利用近红外光谱预测玉米秸秆纤维素含量的研究中,通过SA与联合区间偏最小二乘法联合选择特征波段,起到了降低数据维度、提高模型的预测精度和建模效率的作用。

生物进化算法利用组合和变异的机制演化生成下一代,使种群中的个体得以优化,新个体比原个体更能适应环境,如遗传算法(genetic algorithm,GA)[72-73]、多目标进化算法(multi-objective evolutionary algorithm,MOEA)[74]、免疫算法(immune algorithm,IA)[75]、进化算法(evolutionary algorithm,EA)[76]等。Nagasubramanian等[77]在利用高光谱成像技术鉴定大豆生长早期炭疽病的研究中,应用GA搜索使健康和炭疽病茎分类性能最大化的波段子集,波段选择(即染色体)在连续几代中经选择、变异和交叉遗传在解空间中搜索,直到获得最优解。最终选定的波段子集获得了健康和感染大豆茎样本97%的分类准确率。此外,这些选定的波段可用于多光谱相机的设计,实现大豆炭疽病侵染的远程鉴定,具有较强的实际应用价值。

群体智能算法通过模仿生物群体的社会行为如信息交互、合作等来实现寻优,粒子群优化(particle swarm optimization,PSO)[11,78-79]、蚁群算法(ant colony algorithm,ACA)[80-81]、萤火虫算法(firefly algorithm,FA)[82]和人工蜂群(artificial bee colony,ABC)算法[83-85]等都属于这类算法。群体智能算法由于没有集中控制,不需全局模型,系统更具有稳健性。ABC算法是由Karaboga和Basturk[86]模仿蜜蜂的觅食行为提出的,通过对雇佣蜂、观察蜂和侦察蜂搜索最短路径、最大蜜源行为的模拟,实现对目标问题最优解的搜索,该算法具有收敛速度快、易于实现等优点。Zhang等[46]将ABC算法应用于高光谱图像波段选择中,并通过设置多方向搜索、空间拥挤度搜索及自适应变异三种改进措施,使搜索过程能够跳出局部最优,波段选择性能得到进一步提升。

与传统优化搜索算法相比,智能搜索算法在不需了解优化问题数学模型的前提下,通过模拟自然界的现象,在搜索过程中不断调整搜索策略,能在最短时间内得到最接近的最优解。

目前,智能搜索领域的研究重点为多目标问题、智能搜索算法之间的混合及与其他算法的混合。Singh等[87]基于自动编码器(autoencoder,AE)和GA联合的AEGA高光谱数据波段选择,利用AE的编码特性,将高维输入数据进行压缩,提取数据的内在特征,将编码结果引入到GA,利用GA在压缩后、分段的数据中搜索最优波段,充分利用GA的并行性,使求解速度加快。Wang等[88]将自然计算中的膜计算(membrane computing,MC)与群体智能算法中的鲸鱼优化算法(whale optimization algorithm,WOA)相结合并命名为MWOA。利用MC将原始波段分解为一系列基本膜以缩短编码长度,每个基本膜对应一个子分类器并实现并行计算,有效缩短CPU的计算时间。利用WOA在每个子分类器里搜索最佳波段组合。该算法在计算效率和波段性能之间保持了良好的平衡。戴天虹等[89]通过引入黄金正弦算法(golden-SA,GS)改进斑鬣狗算法(spotted hyena optimizer,SHO)搜索位置的更新方式,降低了算法陷入局部最优可能性,明显地提高了原斑鬣狗算法的全局搜索能力。以分类精度和波段个数为指标对该波段选择算法GSSHO优化性能进行评价,对Pavia Centre数据集的分类精度达99.08%,优化选择的波段个数约为原波段个数的1/10,降维效果显著,实验结果证明GSSHO方法是一种高效的波段选择方法。

表1总结了主要的智能搜索波段选择算法。

表1 智能搜索波段选择算法的优缺点比较Table 1 Comparison of advantages and disadvantages of intelligent search band selection algorithms

2.6 深度学习在波段选择中的探索

深度学习是一种基于人工智能的复杂的机器学习算法,其深层网络学习样本数据内在规律的能力[90]、强大的特征提取能力[91-93]、对复杂非线性问题灵活的适应性等特征[94-96],使其在语音和图像识别等方面取得的效果远远超过先前的相关技术,同时也引起了高光谱图像研究者的广泛关注。

以深度学习中的卷积神经网络(convolutional neural networks,CNN)[97-98]为例,通过多层网络结构,将初始的“低层”特征表示转化为抽象的“高层”特征表示后,用简单模型即可完成复杂的分类等学习任务,减少了手工提取特征的步骤,较好地解决了高光谱图像数据波段特征和空间特征选取的繁复冗杂问题。陈建通[99]在图卷积神经网络(graph convolutional network,GCN)的深度学习中,以样本为GCN的主干网络节点,波段为附加分支网络节点,以波段间的相似性关系为分支网络的邻接矩阵。网络第一层执行波段选择,去除冗余、噪声波段,将已选择波段的图像通过空谱联合模块提取图像空、谱特征后输入分类层进行分类,取得了令人满意的结果。

与传统的学习方法相比,深度学习除了具有很强的特征提取能力等优点外,其模型参数量大,运算量大,占用的存储空间大。现阶段,采用模型压缩等技术降低参数量和尺寸,通过对已训练好的模型进行剪枝、权值共享、稀疏连接、编码[100]、迁移学习等措施降低所需训练数据量,减少运算量。例如,通过深度可分离卷积(depthwise separable convolution,DSC)可使网络的参数量和计算执行次数显著降低。Feng等[101]设计了一个11层的CNN网络,通过DSC将三维卷积分为空间卷积和波段卷积两步,不仅使网络参数数量降低,更与高光谱图像的数据结构相适应,分别提取了图像的波段特征与空间特征。在高光谱数据集Indian Pines、Salinas和Pavia University上,分别使用5%、1%和1%的标记数据进行训练,分类准确率高达96.46%、98.25%和96.59%,实现了用较少的训练数据学习数据的空间-光谱特征。

深度学习用于高光谱图像数据的波段选择还处于初步发展阶段,目前只有部分深度学习网络模型结构被用于波段选择。但深度学习较强的非线性数据表达能力及通过多层网络挖掘数据深层特征的特性,使其在高光谱图像数据波段选择的结果中性能明显优于其他波段选择方法。另一方面,深度学习网络模型复杂、计算量大、训练时间长、对计算机硬件要求高、监督学习需要大量带标签样本等特点,又使其的广泛应用受到制约。因此,根据波段选择的不同应用场景,选择合适的深度学习模型并解决其技术瓶颈是未来的重要研究趋势。

综上所述,表2总结了五类最新高光谱图像波段选择算法,并对每类算法的优点和缺点进行了比较。

表2 高光谱图像波段选择算法优缺点比较Table 2 Comparison of advantages and disadvantages of hyperspectral image band selection algorithms

3 高光谱图像波段选择面临的挑战与未来发展趋势

分析现有高光谱遥感图像波段选择技术,不难发现,虽然波段选择明显地减小了高光谱图像数据处理量,在后续应用任务中基本能够取得较好的效果,但仍然面临一些问题与挑战,亟待提出有效的解决方案。

(1)波段选择算法的泛化能力

泛化能力衡量的是波段选择算法在提取高光谱图像光谱特征时适应变化的能力。根据变化对象的不同,泛化能力可分为针对样本的泛化和针对任务的泛化。前者对于不同的输入样本,算法选择的波段在当前任务上都能取得较好的结果。样本在监督学习中占有非常重要的地位,训练样本所包含的信息及其在数据中的分布直接影响着模型的性能和泛化能力。但高光谱图像大规模标记样本库的建立十分困难,对于小样本应用任务问题,由于可供算法学习的训练样本相对较少,算法容易出现过拟合的现象,使模型泛化能力下降,对未知样本的波段选择结果将会受到影响。针对任务的泛化是指对于同种类的不同应用任务,如分类里边的农作物分类、树木分类、矿物分类等不同任务,参数反演里的植物叶绿素反演、土壤重金属物定量反演、水质参数反演等不同任务,目标探测里边的特殊植物探测、建筑物探测、飞机探测等不同任务,算法选择的波段均有较好的效果,即波段选择算法模型对于同类型的多任务是泛化的。

现有波段选择算法都是针对单一的、特定的高光谱图像解译任务设定的,对于具有相同规律的不同应用任务或当数据类型和处理对象发生变化时,原有的波段选择算法模型不能继续给出合适的选择结果。针对不同的应用任务,如何将原有的波段选择算法很好地移植;针对数据类型和对象的多样化,如何使波段选择算法具有良好的适应性,成为波段选择算法面临的一项重要挑战。可通过深度学习生成对抗网络生成的虚拟图像以增加训练数据,并根据样本可能的变化做出相应的调整,解决样本泛化的问题。采用迁移学习将已取得良好性能的网络模型结构应用到相近的应用任务中,通过参数微调等方法提高算法对不同任务的泛化能力。

(2)波段数量的确定

高光谱图像波段选择数量的确定,目前还没有统一的标准。较普遍的一种方法是在进行波段选择之前,人为确定一个波段数量N,在执行波段选择模型过程中选择满足判断标准的前N个波段[35,102]。这种波段个数确定的方法,通常没有理论依据支撑,多数靠研究者的经验。另一种观点认为,高光谱图像总体特征维数随图像中地物类别数线性增加,因此以类别的数量作为光谱波段的选择数量[51]。也有研究者提出了渐进式波段数量确定法[54,103],即通过扩展或减少波段数量来渐进地选择波段,这种渐进式波段确定过程是通过各种应用确定的条件来停止的。

总的来说,当选择较少数量的波段时,波段之间的区别较大,相关性小,但部分特征信息可能被遗漏。当选择较大数量的波段时,波段之间高度相关,部分波段提供的是冗余重复信息。如何确定使应用任务性能优良、计算时间短、复杂性低的波段数量仍然是一个具有挑战性的问题。可重点研究嵌入式特征选择方法,将波段个数的确定与任务的性能结合起来,通过网络模型迭代训练、反向传播等算法使二者在性能上达到平衡。

(3)所选波段的物理意义

当前以光谱来区分地物时,是通过其完整波形进行判断的。但地物光谱中真正具有识别意义的是光谱完整波形曲线中的一系列光谱吸收特征,这些吸收特征的位置、深浅和形状信息与物质的属性、成分、形状及所处环境因素密切相关[1,104]。因此,波段选择的每个波段都对应一定的光谱诊断特征,选定的波段组合能区分特定的地物类别。但对这种波段和光谱诊断特征对应关系、波段组合和地物特征对应关系的研究并不深入,甚至是不清楚的。当前的研究更侧重于将波段选择作为复杂的数学问题建模求解,未来的研究应更注重波段组合所代表的物理含义,将所选波段与其在实际应用中的贡献联系起来。深入探索地物光学特性、地物电磁反射与波段之间的关系,了解波段电磁反射值代表的物理意义将是可行的解决方案。

随着高光谱遥感图像光谱、空间分辨率的不断提高和应用领域的日益广泛,继续引入智能搜索、优化算法和深度学习等领域的新理论、新模型,发展更先进、更有效、智能化的波段选择方法也是未来高光谱图像波段选择技术的主流发展方向。

4 结束语

本文针对高光谱遥感图像波段选择进行相关研究,一方面,根据波段选择策略的不同,将现有方法分为以评价准则为依据、以特征选择方式为依据、以训练样本为依据和以与应用模型的关系为依据的方法,并对这四类方法进行细分和特征介绍;另一方面,分析了高光谱波段选择技术六方面的最新进展。最后,根据在实际应用中的难点问题,提出波段选择领域的三个挑战,并指出应对这些挑战的方法,为研究者提供新的研究方向。

猜你喜欢
波段光谱分类
基于三维Saab变换的高光谱图像压缩方法
最佳波段组合的典型地物信息提取
分类算一算
高光谱遥感成像技术的发展与展望
分类讨论求坐标
数据分析中的分类讨论
基于PLL的Ku波段频率源设计与测试
小型化Ka波段65W脉冲功放模块
教你一招:数的分类
L波段kw级固态功放测试技术