基于视觉显著性波段选择的高光谱分类

2021-06-24 03:14彭忻怡付志涛

云南民族大学学报（自然科学版） 2021年3期

彭忻怡,罗斌,付志涛

(1.武汉大学测绘遥感信息工程国家重点实验室，湖北武汉 430079； 2.昆明理工大学国土资源工程学院，云南昆明 650093)

高光谱图像由于其非常窄的波段宽度与众多的光谱数目，存在维度较高、波段间相关性高、信息冗余量大的问题，一方面给图像的存储、传输与运算带来了更大负担，大大增加了处理的时间与空间复杂度；另一方面，随着数据维度的过度增长，有限的样本训练出的数据分布模型精度反而会降低，即出现“维度灾难”[1]，对地物分类与图像分析产生影响[2].高光谱图像波段选择是遥感领域的常见数据预处理方法，其目的是从高光谱图像中选择有限的波段以减轻计算负担，同时避免对分类精度造成较大损失，并保留波段的物理特性.

大部分波段选择方法可以根据选择策略划分为基于排序、基于聚类、基于贪婪算法及基于演化算法的的波段选择方法.基于排序的方法通常利用拉普拉斯值[3]、样本成分分析值[4-5]、信息离散度[6]、流形排序[7]等作为波段评价指标.其中基于主成分方差最大的波段选择[8]已成为波段选择的基准方法之一，若排序指标未充分考虑波段之间存在重叠，则还需要对排序后波段进行去冗余操作.聚类方法则是直接从波段相似性出发，选出冗余度最小的波段组合.常见的有基于响应平滑性约束的优化聚类方法[9]、快速密度峰值聚类方法[10]、低秩子空间聚类[11]、基于图的聚类方法[14]等，然而这样可能会漏选信息量更大或对分类具有更强正面作用的波段图像.因此也有将排序与聚类组合的波段选择方法，先通过聚类筛掉冗余度大的波段，接着将剩余波段进行排序后选择[15].基于贪婪的方法[16-17]采用前向或后向搜索策略进行多次迭代，每次选取一个波段进入候选子集或者从候选子集中移除一个波段，这种方法由于每次增加一个波段需要重新遍历所有剩余波段，算法复杂度随着波段数目的增加而平方增加.基于演化计算的方法[18-19]是随机生成一组波段候选子集，接着通过不断迭代更新波段子集的方法，同样存在计算量过大的问题.

人类视觉系统能够迅速在复杂背景下进行信息筛选，准确识别出特殊区域，这些区域往往在图像整体中体现出了与众不同的视觉表观,并且与相邻区域具有较大的视觉差异,因此才能吸引人类视线.视觉显著性正是利用算法模拟人类视觉注意机制，筛选出显著目标的方法.由于显著性区域中涵盖大量高级语义信息，该方法被广泛运用于目标检测与识别等多个领域.有一些研究提到了显著性波段的概念，然而显著性只是作为差异性的同义词被使用，与本文提到的视觉显著性方法存在差异.

传统波段选择方法倾向于选择包含更多信息的波段子集，通常以各波段代表性与波段间相关性为评价标准，其选出的丰富信息量波段图像不一定能得到最好的地物分类效果，因此本文引入视觉显著性方法，定义基于显著图的波段评价指标，以充分利用各波段图像的空间信息，结合固有的光谱信息进行波段选择，并通过结构相似度(structural similarity index, SSIM)作为相似波段的筛除标准.

1 基于显著性的波段选择方法

基于视觉显著性的波段选择方法流程如上图1所示.首先，引入视觉显著性作为波段评价指标，以对所有波段排序；然后，基于结构相似性对冗余波段进行筛除，使所选频段包含较少的重叠信息；最终得到优选的波段子集以用于后续的地物分类.

图1 基于显著性的波段选择方法

1.1 以视觉显著性为量度

考虑单独以信息量最大为依据选出的波段子集，并不一定是针对特定分类任务的最优解，为使那些于区分不同地物更有利的信息得到突出，本文引入了视觉显著性量度，而后续的实验证明这种思路具有可取之处.视觉显著性是根据数学模型模拟人类视觉机制，判断并评价目标与背景差异程度的一种衡量标准.视觉显著性方法将影像处理为显著图，每个像素值代表了该点在原图的显著程度，即与周围背景点的差异程度.正是因为这样的特性，我们才将其作为基于高光谱分类任务的波段选择中的重要量度，这样能够根据不同的分类任务，更有针对性地选出对分类更有帮助的波段子集.

不同侧重的视觉显著性方法会输出不同的显著图.基于空间加权差异(spatially weighted dissimilarity, SWD[20])方法根据图像块间的空间距离定义显著性.基于主成分分析(principal component analysis, PCA[21])的方法则是将图像块通过主成分分析体现的不同分布进行对比.快速有效显著性(fast and efficient saliency, FES[22])方法认为视觉显著性分布符合于某种密度函数，并通过对滑动圆进行采样来推导该函数.基于分割(segment, SEG[23])的方法同样利用了概率函数，它将滑动圆改为滑动窗口.基于情境感知(context-aware, CA[27])的方法利用了全局与局部对比，不仅考虑显著性物体，还考虑了一些背景中与显著性物体相关的情境部分.基于图规整(graph-regularized, GR[24])的方法引入了基于凸包的中心图以抑制背景，并以图结构对空间差异进行加权.光谱残差法(spectral residuals，SR[25]) 定义了光谱残差概念，并在频率域计算显著性，.基于鲁棒性背景检测(robust background detection，RBD[26])方法引入了鲁棒性量度，定义了直观的代价函数最小障碍距离(minimal barrier saliency, MBS[28])方法则定义了新的空间距离，对以某点为起点，边缘点为终点的每一条路径，都计算其最大像素值与最小像素值之差，最终将所有路径的输出值下限定义为最小障碍距离.

图2展示了上述不同算法对高光谱图像某一波段的显著图输出结果与groundtruth对比.尽管存在输出区别，上述方法都可以探测到如喷漆金属板屋顶的显著目标，目标都聚集成簇，成为全图中的显著区域.如果某一波段的目标区域与背景区域(通过少量训练样本得到)的显著性的差异更大，则可以认为该波段能为分类提供更好的帮助.

基于视觉显著性的波段排序算法伪码如下表1.高光谱图像Im×n×l可以被视作一系列二维图像的集合{i1,i2,…,il}，其中ik是图像I的第k波段.对每个波段图像ik分别输出显著图Salik.少量的训练样本Tc={(xi,yi)|yi=c}能够指明需要被分类的兴趣区域，其中xi是地物c的二维坐标，而yi是地物标签.那么对于特定c类地物在k波段上的显著性就可以根据公式1加权计算得到，其中Nc是训练子集Tc的基数.

(1)

图2 不同视觉显著性方法效果区别

表1 基于显著性的排序方法

那么，对于需要分类各项地物的总体分类任务C，我们定义了波段ik的显著性OSal(ik)如公式2所示，它刻画了两两不同地物之间的对比度.根据波段显著度性，我们可以将波段集合降序排列.实验发现，少量(10%)训练样本就能够在数据集上取得不错的效果.排序后选取前m个波段，待分类地物在这些波段上会比背景更明显.

(2)

表2是对pavia数据集进行排序后选出的波段序号及其显著性.而图 3分别对比了最显著与最不显著的波段图像.可以看到，显著波段在右半部分具有更清晰明显的细节部分.由此可见，这样的排序方法有其合理之处.然而，波段之间是存在重叠与冗余的，正如表2中显示的那样，选择出的前10波段会存在序号过近的现象，增加了重复信息.所以需要对冗余波段进行筛除操作.

表2 前10波段显著性

1.2 以SSIM进行过滤

(3)

C1=(K1L)2,C2=(K2L)2.

SSIM的范围在-1到1之间，其绝对值越接近于1，则两个波段图像越相似；越接近0，则2个波段图像更不相关.下图 4证明了SSIM能够作为滤除相似波段图像的量度.滤除操作的伪码如下表3，首先计算两两波段间的SSIM，若其高于设定阈值，则筛除更不显著的波段，即是排序后序号更大的波段.

图3 显著与不显著波段的对比

图4 相似图像对与不相似图像对的SSIM对比

表3 SSIM 过滤器

2 实验结果

为了验证提出的基于视觉显著性的波段选择方法，我们在3个数据集上进行了实验.肯尼迪航天中心 (Kennedy space center，KSC)数据集是由 NASA AVIRIS 传感器获取，去除低质量波段后共有176个波段，包含13种不同地物.而Pavia中心和Pavia大学(PaviaU)数据集则由ROSIS 传感器获取，都包含9种不同地物，分别有103和102个波段.

2.1 不同显著性方法的对比

为了找到更适合于高光谱分类的视觉显著性算法，我们将大部分经典视觉显著性算法带入上节提到的算法框架中进行实验对比.我们测试了9种不同的显着性算法，最终都选出10个波段，随机选择了10%的样本进行监督训练.根据经验，SSIM阈值设置为0.90.实验结果如下表4所示.采取了Kappa系数和总体精度(overall accuracy, OA)作为评价指标.

表4 不同显著性方法的分类结果对比

可以看出，MBS是最适合高光谱分类的显著性算法，在各数据集中都有稳健优异的表现.这可以解释为，因为大多数显著性算法都是基于人眼的预测或加上了中心偏移的先决条件.中心偏移的前提条件是，感兴趣的对象始终位于图像的中间，这在自然图像中效果很好，但在高光谱图像中表现不佳. MBS算法基于距离变换来描绘目标与背景之间的潜在对比，而无需后处理部分就可以很好地工作.因此，建议使用基于MBS视觉显著方法进行波段选择.

2.2 与其他波段选择算法在高光谱图像分类上的对比

为了验证视觉显著性波段选择方法的可行性与有效性，将其与其他几类选择算法进行了比较. 线性映射方法(linear projection,LP[29])选择最不相似的频段作为组合，交叉信息方法(mutual information，MI[30])通过排序选择信息熵更多的频段. 增强快速密度峰值聚类方法(enhanced fast density peaked clustering，EFDPC[31])通过使用聚类的密度估计来解决频带选择. 显著波段选择方法(saliency-based band saliency，SBSS[32])还利用尺度选择来利用频谱信息，并希望找到差异波段.这几种算法涵盖了大部分波段选择方法类型.

用这5种方法分别选出了10波段组成的波段子集，并进行了20次独立的重复实验，最终得到的kappa系数和OA结果分别列于表5和表6.结果表明，基于MBS的视觉显著性波段选择方法在高光谱分类中具有不错的效果. SBSS和MBS在不同的数据集中都可以很好地工作，这证明了显著性可以作为频段选择的重要指标.而MBS具有更好的表现，是因为进一步探讨了显着性概念，它不仅是波段系列中的奇异波段，而且还刻画了波段图像中不同地物的突出程度.

表5 不同波段选择方法的Kappa系数

表6 不同波段选择方法的OA对比

3 结语

本文基于信息量最大波段子集并不一定是最适合分类的波段子集这一思路，引入了视觉显著性作为适合高光谱分类任务的波段选择尺度，认为显著性描述的目标与背景差异能够更好体现波段质量.为了去除冗余频段，使用SSIM筛选类似的频段，并在实验上取得了不错的效果.然而，基于结构相似度的冗余波段筛选方法也存在计算量大，速度较慢的问题.在后续研究中，若能将排序方法与聚类策略进行结合，或许能够更高效地为高光谱分类服务.