地空同步试验高光谱影像特征提取与分类

2019-09-12 00:38廖小露刘嘉周兴霞
自然资源遥感 2019年3期
关键词:谱段波谱波段

廖小露, 刘嘉, 周兴霞

(四川测绘地理信息局测绘技术服务中心,成都 610081)

0 引言

高光谱数据具有光谱波段多、波段连续以及图谱合一等特点,且能够提供更为丰富细致的地表信息,在地物的识别与分类方面具有多光谱数据无可比拟的优势,为识别宽波段探测方式中难以识别的地物提供了可能,已被越来越广泛地应用于岩矿识别、植被类型区分和生态环境监测等方面[1]。依托高光谱技术的定量遥感将能更准确地反演地物分布特征。高光谱影像处理方法相对于多光谱也在发生变化,其中减少影像冗余信息,更精细地提取和识别感兴趣目标地物是其广泛应用的前提[2-3]。

当前,机器学习、计算机视觉和模式识别理论与方法已成为高光谱影像分类的重要技术手段。国内外学者为充分挖掘高光谱数据隐含的丰富信息和特征,发展了核变换技术[4-6]、特征挖掘技术[7-8]、半监督学习和主动学习[9-10]、光谱-空间分类[11]、稀疏表达[12]和多分类器集成[13-14]等一系列解决方案[15-16]。高光谱特征提取与反演方法处理思想多源于多光谱研究,存在以相对较粗层次的方法和思想解决较细层次问题的不足,如何在应用实践中充分发挥高光谱数据精细光谱、图谱合一等特点,开展针对高光谱影像“空间维、光谱维、空间-光谱维”综合知识的高光谱数据处理方法研究,选取高光谱影像的特征谱段以突出感兴趣区域,对有效地进行高光谱数据处理、分析及信息提取至关重要[17]。

本文从光谱分析的角度,探讨高分高光谱成像应用下 “地-空”一体的高光谱遥感成像应用实验,通过获取、分析采集的地面光谱特征,从已知光谱中选取能有效区分不同地物的特征谱段,采用改进的投影寻踪方法计算投影向量,构建分类规则,并结合航空高光谱影像开展分类研究,探索地面光谱与航空影像同步的应用方法。

1 光谱特征分析与提取

1.1 波段可分性与重要性分析

类内密度与类间距离作为遥感影像分类指标广泛应用于影像分类算法构建,文献[18-21]通过探讨类内紧密度和类间离散度达到最优值,提高了分类结果的准确性和鲁棒性。本文构建“类内密度最大,类间距离最大”指标,自动计算不同波谱范围对不同地物识别的可分性与重要性,并通过不同地物光谱反射率在相同波段上的离散度与紧密度,分析波谱的可区分性特征,实现光谱特征的自动选取。

“类内密度最大,类间距离最大”指标由2个定量参数确定,其一为类内密度,具有值愈大,分类愈显著的特性; 另一为类间距离(方差),具有值愈大,分布愈分散的特性。该指标可用于分析反射率在某一波谱上的可分性特征[22-23],并具有综合特征,比单独使用方差和信息熵等指标更能反映数据分布特点。其表达式为

Q(a)=s(a)d(a),

(1)

式中:s(a)表示方差;d(a)表示类内密度。

以rij表示任意2个波段的距离,即

rij=│Zi-Zj│,

(2)

式中Z表示某一波段的像素值,0

则类内密度d(a)表达式为

(3)

(4)

式中:f(t)为一阶单位阶跃函数;R为估计局部散点密度的窗宽参数,以该宽度内至少包括一个散点为原则选定,其取值与样本数据结构有关,可依方差或距离取值。

1.2 改进的投影寻踪方法

投影寻踪方法是将样本在整体上按照一定的约束条件实现样本最大差异化的投影[24],例如在局部投影点尽可能密集成若干个点团; 而在整体上投影点团之间尽可能分散。其默认各波谱范围上反射率相对于不同波段具有相同的重要性。但在实际应用中,不同地物在不同波段上具有不同的特性; 不同波段对不同地物的识别具有不同的响应特征,因此本文提出了改进的投影寻踪方法。

该方法首先根据不同波谱范围,讨论其对不同地物识别的重要性程度,再给出不同波段在不同地物识别中的权重系数,并在此基础上,对各波段反射率进行加权处理。具体步骤如下:

1)按波谱范围计算不同波段权重系数。该步骤的目的是突出波谱范围内不同地物的特征,以增强不同谱段的地物识别能力,提高可区分性,在式(1)的基础上,确定不同波谱范围上地物识别权重系数,权重系数的大小根据第i波段的Q(ai)在整体Q(a)上所占比重确定,即

(5)

式中ω(ai)为权重系数。

(6)

3)投影寻踪分类。以投影寻踪方法为基础,构建指标使得投影后的值在局部投影点尽可能密集,且整体投影点团之间尽可能分散。结合目标函数式(1),实现非线性优化,约束条件为

(7)

改进的投影寻踪方法,本质上讲就是对数据分别进行2次不同方向投影的“综合”,第一次投影是针对各评价指标相对于评价目标的重要程度而进行的; 后一次加权是为了尽量拉开各被评价对象之间的整体差异而进行的。2次投影的背景是截然不同的,前者的投影方向由“功能驱动”决定,即波段重要性,而后者是由“差异驱动”生成。

2 应用实验验证

实验区位于山西省临汾市某苗圃,范围大小为400 m×200 m。实验以地面实测数据为基础,在进行不同谱段上地物的可分性与重要性分析基础上,确定分类特征谱段范围,并对波段进行加权处理,拉大波段间的差异性。结合改进的投影寻踪分析方法,以“地物逐类识别,逐层剔除”为目标,构建基于地面实测光谱的不同谱段不同地物识别分类规则,即完成具有监督样本信息的分类规则构建; 最后结合PHI航空遥感试验数据,应用训练的分类规则,对采样到的与航空影像具有相同成像光谱范围和光谱分辨率的地面光谱数据计算投影向量,实现不同地物信息的提取。

2.1 数据采集与预处理

野外光谱实验中,对实验区范围内有代表性的不同地物进行选择,并确定具有群体特性的植株作为观测目标。测量中以10个光谱为一个采样组,计算3组测量值的平均值作为该点的光谱反射率,并采用S-G去噪方法[26],对平均后的光谱曲线进行去噪处理,获取实测地物光谱曲线。实验区主要地物类型有灌木、冬青、柳树、龙爪槐、柿子树、伏地猪草、玉米、红叶林、桃树、道路以及土壤等。

同步开展PHI高光谱影像获取,PHI航摄仪成像波段为450 ~ 1 000 nm,共计128个波段,成像相对高度为1 500 m,影像空间分辨率为1.5 m。其数据预处理主要包括光谱重采样、大气校正以及影像去噪。通过设定波长信息与波谱半幅值全宽(full width half maximum,FWNM),应用FWHM间隔的高斯模型,对光谱进行重采样,将地面样本光谱重采样到与影像相同的波谱范围与光谱分辨率。由于航空影像飞行高度较低,受大气影响较小,采用基于统计的大气校正方法,设真实值X与辐亮度值Y之间存在的函数关系为

Y=kX+b,

(8)

式中k和b为转换系数。根据实地采集光谱数据(主要为土壤、柏油路和水泥路),计算地面反射率,便可计算k和b,再反求其他点校正后的光谱曲线。最后应用S-G去噪方法对高光谱影像进行去噪处理。预处理后影像如图1所示。

图1 预处理后影像(PHI B74(R),B89(G),B104(B)彩色合成)Fig.1 Preprocessed original image

2.2 特征光谱选择

运用“类内密度最大,类间距离最大”指标的波段可分性与重要性分析方法,开展地面实测植被光谱的自动特征选择。局部散点密度的窗宽参数R依距离取2个波段最大距离的1.5倍,并与PHI高光谱影像谱段范围一致,分析350~1 000 nm范围上的光谱重要性,如图2所示。

图2 植被谱段范围350~1 000 nm的波谱重要性分析Fig.2 Spectral importance analysis ofspectral range 350~1 000 nm

结合植被波谱重要性分析,计算其导数值并归一化处理后,确定极值点对应的特征谱段。

1)实验区内植被最显著的特征范围在715 nm处,对比其他地物光谱一阶微分结果,土壤、道路与植被可分性特征主要集中在710~730 nm附近峰值,土壤与道路光谱导数在此处无显著“峰值”,且该区域对应于植被典型的红边效应范围; 不同植被光谱的一阶微分结果在720 nm附近峰值位置,并且峰值大小均有差别。波谱区间680~750 nm为不同地类的较高可区分范围。植被受水分、冠层和叶绿素等影响,都将在该区间产生较大波动。该方法所获取的可分性区间与同类研究中所选用的波谱区间相吻合[27-28],该方法具有可行性和正确性。

2)另一较大可分性波段在520 nm处,区间范围为500~540 nm处,该谱段亦是土壤、道路与植被可分性特征,该范围可分性主要由叶绿素的反射产生,可有效区分植被中的非绿色植被。

3)570 nm,610 nm,660 nm,810 nm,890 nm和930 nm范围均为较明显的分类特征谱段。570 nm附近光谱曲线上绿光波段反射峰右侧有一急速下滑趋势,红叶林的该特征不太明显,其值基本为0,与其他植被特性相差较远,其中伏地猪草在该处为负值,最为明显。

应用“类内密度最大,类间距离最大”指标,自动计算波谱指标重要性,且结合PHI影像成像光谱范围以及信噪比较高谱段,确定8个特征波段范围区间,即420 nm附近、520 nm附近、570 nm附近、610 nm附近、660 nm附近、690 nm附近、715 nm附近及810 nm附近。波段重要性分析的特征谱段与光谱一阶微分结果的特征谱段高度吻合。

2.3 基于实测光谱数据分类规则建立

2.3.1 全谱段整体最优分类分析

在确定的8个谱段范围上对11个细分地类进行投影分析,结果见表1。

表1 实测光谱8个谱段投影结果Tab.1 Eight spectral projection resultsof the measured spectrum

土壤和道路投影均值最低,而其他地类投影均值相对于土壤和道路较明显,呈数量级差距,可优先区分植被与非植被; 但不同种类植被间可分性仍不强,需在全谱段整体最优识别基础上,继续围绕光谱重要性分析,开展不同特征谱段上的局部最优投影,实现植被的精细化分类。

2.3.2 分谱段局部最优投影分析

以不同特征谱段为局部波谱分析单元,分别在不同谱段上对不同植被进行投影计算,分析投影后地物可识别的最佳投影谱段。并在此基础上,通过逐次寻优,实现地物最佳识别的波谱范围提取,逐次剔除已识别植被,分谱段、分层次循环投影实现不同植被识别。

2.3.3 基于实测光谱数据建立地物分类规则

基于以上分析,构建结合投影寻踪方法的实验区地物分类规则,为PHI高光谱影像分类提供依据,如图3所示。

图3 基于实测光谱数据构建地物分类规则Fig.3 Classification rules based on measured spectral data

2.4 结合地面光谱的PHI航空影像分类

将地面光谱数据重采样到与航空影像具有相同光谱成像范围及光谱分辨率,再运用由实测数据构建的分类规则(图3),对重采样后的地面光谱数据按相应谱段计算投影,并应用此投影方向,计算PHI高光谱影像在此投影上的结果,以此逐次提取分类后地物。分类思路为先应用典型样本训练规则,再应用规则指导分类地物,其数学意义在于,在大样本统计下应用少量的典型样本可以估计整体分布。图4(a)为全部8个投影方向实现不同种类地物识别的结果,即植被与非植被(道路,土壤)分类提取结果,图4(b)为计算得到的归一化植被指数(normalized difference vegetation index,NDVI)图像。图4中2个分类结果整体相似,植被在影像上表现出亮色调,而道路和土壤明显得到抑制,整个影像中表现为明显的暗色调。因投影寻踪分析中约束条件的影响,投影分类的结果层次更强,提取的植被明显呈现出层次感(亮度等级不同),植被与土壤、道路等反差增大(投影分析结果值域无固定范围,且明显较NDVI图像值域范围大),可分性更强。投影寻踪分析中植被个体特征更加明显,较之于NDVI提取的结果,能有效地避免太阳阴影的影响,NDVI图像中植被多为成片分布,而投影寻踪结果能更好地区分不同物种,植被轮廓更加清晰,纹理特征更加丰富,例如高大茂密的植被特征明显突出。基于改进的投影寻踪分析方法,PHI航空影像分类结果如图5所示。

(a) 8个谱段范围投影图像(b) NDVI图像

图4 8个谱段范围投影图像及NDVI图像

Fig.4ProjectionimageofeightspectralrangeandNDVIimage

图5 实验区地物分类结果Fig.5 Classification result of the study area

以实地采样样本类型与位置为依据,对提取结果开展定量分析,分类结果如表2所示。在11种地类中,有5种地物分类准确率高达90%以上,3种地物分类准确率达80%以上,分类总体精度达85%以上,算法分类结果准确度高。

表2 分类结果精度分析Tab.2 Accuracy analysis of classification results

3 结论

围绕“地-空”一体的高光谱遥感成像应用,以特征选择和精细化分类为目的,讨论了基于实测光谱的PHI高光谱影像不同地物类型提取方法,结论如下:

1)应用“类内密度最大,类间距离最大”指标,结合高光谱PHI影像成像范围与信噪比较高波段,自动计算不同波段在地物识别中的可分性和重要性,确定研究区内作物在420 nm,520 nm,570 nm,610 nm,660 nm,690 nm,715 nm及810 nm 等8个谱段附近具备强可分性。该结论与地物光谱一阶微分结果以及同类研究高度吻合。

2)采用改进的投影寻踪分类方法进行PHI高光谱影像分类,研究区分类精度达85%以上,识别效果同NDVI相比,具有层次感强、植被轮廓更加清晰、有效避免阴影影响的特点,适用于不同植被精细分类应用。

但是,改进的投影寻踪分析方法的应用需以知道场景内基本地物分布为前提,若假设前提不能完全满足时,如何有效运用该方法仍有待进一步探讨。

猜你喜欢
谱段波谱波段
最佳波段组合的典型地物信息提取
高分多模卫星德国荷兰交界多光谱融合影像
盐酸四环素中可交换氢和氢键的核磁共振波谱研究
高分六号卫星WFV 新增谱段对农作物识别精度的改善
推扫式多光谱遥感相机动态范围拓展方法
基于PLL的Ku波段频率源设计与测试
琥珀酸美托洛尔的核磁共振波谱研究
小型化Ka波段65W脉冲功放模块
L波段kw级固态功放测试技术
检疫性杂草假高粱与近缘植物种子的波谱鉴别方法