基于CR-SAM的博斯腾湖西岸湖滨带典型植被分类*

2022-11-28 12:30张子慧李新国李勇
关键词:沙枣树芦苇波段

张子慧,李新国,李勇

1. 新疆师范大学地理科学与旅游学院,新疆 乌鲁木齐 830054

2. 中国科学院新疆生态与地理研究所,新疆 乌鲁木齐 830011

3. 新疆干旱区湖泊环境与资源重点实验室,新疆 乌鲁木齐 830054

高光谱数据在植被反射率光谱特性差异分析与特征波段提取方面有较大的潜力,可见光、近红外和短波红外波段是研究植被分类的重要波长区域[1]。基于高光谱数据进行植被分类,可以在更大程度上突出不同植被间的光谱细节特征、提取植被光谱特征波段,更有效地对不同植被进行分类识别且分类结果精度更高。部分学者已在这方面取得了一定的研究成果。Hirano 等[2]利用AVIRIS 高光谱遥感影像,结合光谱数据库,采用SAM 分类方法对湿地地物类型进行分类,识别出泥沼地、水域和10 种湿地植被类型;曾帅等[3]利用实测高光谱数据,提取了各项光谱特征参数,对研究区6种植被进行了分类精度验证;吴见等[4]测试了北京市10 种常见树种不同时间的叶片高光谱数据,通过分析不同树种不同时间的光谱特征,筛选出了不同时相条件下高光谱遥感识别树种的特征波段;杜培军等[5]阐述了高光谱遥感影像分类进展,突出高光谱遥感记录精细光谱特征的优势,发展了针对应用需求的有效分类方法。植被遥感分类研究多采用SAM 方法对光谱曲线进行特征提取,但该方法对特征波段差异较小的地物分类效果较差。Ceamanos 等[6]提出了一种基于支持向量机的分类器集成算法,对高光谱数据进行分类,发现多模型集成的分类精度优于单一算法的精度。李凯等[7]对竹叶原始光谱进行CR、FD、CR-FD 变换后提取特征波段进行叶绿素含量估算,发现CR-FD 模型为竹叶叶绿素含量的最优估算模型,CR 处理后能够增大光谱值差异。白继伟等[8]基于CR 算法对高光谱图像进行分类研究,发现对高光谱图像进行CR 后,抑制了噪声,突出了地物光谱的特征信息,提高了图像的分类运算效率和精度。张雪红等[9]基于CR算法对油菜氮素营养进行评价,发现CR 处理扩大了原始反射光谱中由氮素胁迫引起的吸收特征微小变化。在考虑到多模型集成方法的基础上,本文选取CR 算法对SAM分类方法进行改进,对博斯腾湖西岸湖滨带典型植被进行分类识别与数字制图,实时获取典型植被分布状态对研究区的监测与生物多样性保护具有重要意义。

1 材料与方法

1.1 研究区概况

博斯腾湖西岸湖滨带位于新疆焉耆盆地东南部 博 湖 县 境 内,地 理 位 置 为41°44′N~42°12′N、86°10′E~86°50′E,属于典型的山前湖泊绿洲区(图1)。研究区年均温8.2~11.5 ℃,年降水量47.7~68.1 mm,年蒸发量1 880~2 786 mm,属典型的温带大陆性荒漠气候[10]。研究区内土壤类型主要有草甸土、沼泽地、灌耕潮土、盐土、风沙土、棕漠土等,地下水埋深1.0~2.5 m。受气候、土壤、湖泊等因素的影响,其植被分布具有独特性,典型植物群落类型有箭杆杨(Populus nigravar.thevestina(Dode)Bean)群落、沙枣树(Elaeagnus angustifolia)群 落、 芦 苇(Phragmites australis)群落等[10-11]。

图1 研究区地理位置与采样点分布示意图Fig.1 The geographical location of the study area and the sample sites

1.2 数据来源

1.2.1 实地踏勘数据2018年7月30日和2019年8 月7 日两次对研究区进行实地勘察后,确定箭杆杨、沙枣树和芦苇3种为研究区典型植被群落,布置30 个采样点并采样(图1)。其中箭杆杨、沙枣树、芦苇分别采集了7、9、14 个样点,记录采样点经纬度、海拔高度、植被分布现状、覆盖度等信息,作为分类结果目视解译评定的依据。

1.2.2 高光谱数据同期,基于实地踏勘数据,采集箭杆杨、沙枣树和芦苇3 种典型植被叶片样本,利用ASD FieldSpec 3 便携式地物光谱仪测取高光谱数据;并对箭杆杨、沙枣树和芦苇3种典型植被叶片进行采样。为使数据能够具有代表性,采样点均匀分布于研究区,每个样方大小设置为15 m×15 m,采样时天气晴朗(云量小于10%)。进行光谱测量时间在12:00~14:00,为避免随机噪声影响,每个样本重复测取10 次,取平均值作为最终光谱曲线,获取的高光谱数据波段范围为350~2 500 nm。

1.2.3 遥感影像数据来自2019 年8 月7 日欧空局官网(https://scihub.copernicus.eu/dhus/#/home)相对轨道编号为R019 的Sentinel-2A L2A 级遥感数据,对研究区进行典型植物群落分类与制图。

高光谱数据能够提供光谱信息,采取CR 处理提取光谱特征波段,选择典型植被光谱细节特征,与遥感影像上植被光谱信息进行匹配,探讨SAM分类算法在研究区典型植被特征提取和遥感分类中的应用,获得研究区典型植被分类识别结果,进行典型植被群落分类与数字制图。

1.3 Sentinel-2A遥感影像分类识别方法

1.3.1 光谱角制图方法光谱角是目标数组与待测数组两向量的夹角,通过比较目标数组与待测数组的相似度进行光谱曲线所对应的地物识别。将遥感图像各个像元的光谱曲线看成波谱空间中的一个向量,计算待测光谱向量与目标光谱向量的夹角大小来表示两者之间的相似度[12-13]。光谱角越小,说明待测数组与目标数组是同一类地物的可能性越大[14-15]。光谱角

其中Ti和Ri分别代表待测数组和目标数组中第i个波段的反射率值,n为光谱曲线的波段数。

1.3.2 包络线去除包络线是连接波谱顶部的凸起的直线段拟合,以最大值点作为一个端点沿长波方向连接光谱曲线上的极值点,向短波方向进行类似计算,形成曲线的包络线。用实际光谱反射率去除包络线上相应线段的反射率值,即“包络线去除”[16]。包络线去除可以有效地突出光谱曲线的吸收和反射特征,对原始光谱曲线作归一化处理,有利于和其他地物的光谱曲线进行特征比较从而提取特征波段[17]。

1.3.3 特征波段提取剔除箭杆杨、沙枣树、芦苇3种典型植被的光谱曲线中噪声等原因造成的异常值,求取均值光谱曲线等预处理、包络线去除处理,考虑到植被在不同的波段有不同的吸收和反射特征,在可见光和红边波段范围内光谱响应最为敏感,确定研究波段为450~850 nm,并设置阈值提取特征波段,用于分析3种典型植被之间的光谱特征差异,对研究区进行典型植被分类。

1.3.4 解译标志基于实地踏勘数据,选取研究区3 种典型植被和水体建立解译标志,如表1 所示,进行目视解译得出遥感影像目视解译结果,用于对分类结果进行精度检验,确定精度更高的分类方法。

表1 地物解译标志表Table 1 The table of the sign of geo-interpretation

2 结果与分析

2.1 实测光谱数据特征分析

从图2可知,箭杆杨和沙枣树的原始光谱曲线差异最小,最大差异值仅为0.070 4,CR处理后最大差异值增加到0.156 3,增加了0.085 9,CR 处理增加了箭杆杨和沙枣树之间的可区分特征波段的差异性,能够突出箭杆杨和沙枣树之间光谱细节特征;其次,CR 处理前,箭杆杨和沙枣树的光谱可区分特征波段位于507~653 和754~850 nm,CR 处理后,箭杆杨和沙枣树的光谱可区分特征波段位于458~732 nm,将原始光谱曲线中位于近红外波段的特征波段转移到了可见光波段。

图2 箭杆杨和沙枣树可区分特征波段Fig.2 The distinctive bands of Populus nigra var.thevestina(Dode)Bean and Elaeagnus angustifolia

由图3可知,箭杆杨和芦苇的原始光谱曲线差异最大,最大差异值为0.116 2,CR处理后最大差异值增加到0.302 8,增加了0.186 6,CR 处理增加了箭杆杨和芦苇之间的可区分特征波段的差异性,能够突出箭杆杨和芦苇之间的光谱细节特征;其次,CR 处理前,箭杆杨和芦苇的光谱可区分特征波段位于450~712 和785~850 nm,经过CR 处理后,箭杆杨和芦苇的光谱可区分特征波段位于452~716 nm,将原始光谱曲线中位于近红外波段的特征波段转移到了可见光波段。

图3 箭杆杨和芦苇可区分特征波段Fig.3 The distinctive bands of Populus nigra var.thevestina(Dode)Bean and Phragmites australis

从图4可知,沙枣树和芦苇的原始光谱曲线的最大差异值为0.087 9,CR处理后最大差异值增加到0.158 5,增加了0.070 6,CR 处理增加了沙枣树和芦苇之间的可区分特征波段的差异性,能够突出沙枣树和芦苇之间的光谱细节特征;其次,CR 处理前,沙枣树和芦苇的光谱可区分特征波段位于450~648 和741~850 nm,经过CR 处理后,沙枣树和芦苇的光谱可区分特征波段位于461~718 nm,将原始光谱曲线中位于近红外波段的特征波段转移到了可见光波段。

图4 沙枣树和芦苇可区分特征波段Fig.4 The distinctive bands of Elaeagnus angustifolia and Phragmites australis

3 种典型植被的光谱曲线在绿光和近红外波段均存在局部极值,两两区分的波段差异较小,经过CR 处理后可见光谱段内植被两两区分的特征波段差异明显增加,相当于对原始光谱曲线进行归一化处理,减少环境背景对3种典型植被光谱曲线的影响,位于近红外波段的特征波段转移到了可见光波段,虽然特征光谱波段数减少,却使可见光波段的特征差异增大,能够突出植被光谱细节特征,提高信息利用率,更大效率上对研究区3种典型植被进行分类识别。由此得出,CR 处理后不仅改变了特征波段分布位置且更易于不同植被间的特征提取与目标识别。

2.2 遥感影像分类结果分析

从图5 可知,箭杆杨的面积3.98 km2,占研究区总面积的2.01%,主要分布于道路两侧并且部分与芦苇地相间分布;沙枣树的面积19.76 km2,占研究区总面积的9.98%,主要分布于耕地与荒地之间的过渡区以及人为种植的片状分布;芦苇的面积174.26 km2,占研究区总面积的88.01%,主要分布于湖滨带湿地以及开都河下游沿岸。

图5 3种典型植被分布现状标准目视解译结果Fig.5 The result of standard visual interpretation image of the distribution status of three typical vegetation

SAM 和CR-SAM 两种方法分类结果图如图6和图7所示。为了对分类效果进行定量比较,统计了3种典型植被的识别面积以及识别百分比,结果见表2。

表2 3种分类方法的研究区典型植被分类结果统计表Table 2 Statistical table of typical vegetation classification result of three classification methods in the study area

图6 3种典型植被SAM分类结果Fig.6 SAM classification result of three typical vegetation

图7 3种典型植被CR-SAM分类结果Fig.7 CR-SAM classification result of three typical vegetation

从表2和图6可知,箭杆杨地面积为1.96 km2,沙枣树地面积为9.55 km2,芦苇地面积为104.27 km2。SAM 分类方法对箭杆杨、沙枣树、芦苇典型植被的识别总面积百分比分别为0.99%、4.82%、52.66,总识别百分比为58.47%,与图5 相比,以芦苇地的识别效果为例,可以清晰地看出SAM 分类方法对于芦苇的识别效果较差,大部分芦苇区都没有识别出来。

从表2和图7可知,箭杆杨地面积为2.59 km2,沙枣树地面积为13.23 km2,芦苇地面积为140.84 km2。CR-SAM 分类结果识别出了65.08%的箭杆杨地,较SAM 分类结果增加了15.83%;CR-SAM分类结果识别出了66.95%的沙枣树地,较SAM分类结果增加了18.62%;CR-SAM 分类结果识别出了80.82%的芦苇地,较SAM 分类结果增加了20.98%。CR-SAM 分类方法对3 种典型植被的总识别百分比为79.12%。虽然与图5 相比仍然有部分箭杆杨、沙枣树和芦苇地未识别出来,但较图6已经得到了改善,其中芦苇区的改善效果最佳,沙枣树地次之,箭杆杨地改善效果较差,产生这个结果是考虑到影像空间分辨率的影响,由于芦苇地和沙枣树地大多是片状分布,在影像中能够识别出来,而少量箭杆杨地是分布在道路两侧,对于覆盖度较低的箭杆杨不能识别出来。

对比图6 和图7 的基础上,由图5 可知芦苇地识别效果明显提升,在开都河下游沿岸的芦苇区也能够清晰地被识别出来,并且与沙枣树的区分性也有所提高,更易于分辨,经CR 处理后,箭杆杨的光谱特征得以增强,能够较大程度地识别出来,肯定了CR 处理能够突出植被光谱细节特征,提高了研究区3种典型植被分类识别效果。由此可见,CR-SAM 对于箭杆杨、沙枣树和芦苇3 种典型植被的分类识别效果更好,能够在更大程度上对研究区典型植被进行识别。

2.3 分类精度评定

通过目视解译结果对两种方法分类结果进行精度评定、计算Kappa系数,衡量分类结果的吻合度,具体精度评定结果见表3。

从表3 可知,CR 处理前,箭杆杨、沙枣树和芦苇3种典型植被的生产者精度和用户精度都比较低,经CR 处理后,3 种典型植被的生产者精度和用户精度均在不同程度上得到了提升,其中对沙枣树的分类识别效果最好,生产者精度增加了34.52%,用户精度增加了23.16%,并且每种典型植被所识别出来的像元数也得以增加,识别出的总像元数由1 177 644 增加到1 566 597,总体分类精度由SAM 分类的53.00%上升到CR-SAM 分类的70.50%,Kappa 系数由0.32 增加到0.66。CRSAM 分类方法所得的分类结果与目视解译结果更吻合,能够更好地识别出3 种典型植被的分布现状,增强了植被的可区分特征。SAM 分类的总体分类精度相对较低,原因可能是实测仪器和卫星成像仪间所获得的数据存在差异以及受到大气干扰,因此,CR-SAM 分类方法更具有应用前景,实用性更强。

表3 SAM与CR-SAM分类精度统计表Table 3 Statistical classification accuracy table of SAM and CR-SAM

3 讨 论

SAM 分类方法仅考虑了匹配光谱的形状特征,而光谱特征拟合匹配方法能够很好地对植被光谱进行识别。本文采取CR-SAM 分类方法对研究区典型植被进行分类识别,发现能够提高分类精度,总体分类精度增加了17.5%,这一结论与明群杰[18]的研究结果相近;发现经CR 处理后,植被光谱曲线特征差异明显增加,能够减弱环境背景的影响,提高信息利用率,这与周伟等[19]研究结果相似。在SAM 分类方法的基础上选用CR 处理,未选用杨可明等[20]的研究中的谐波分析的方法,在其研究成果的基础上进行改进,是因为谐波分析能够消除部分原始光谱某些波段的噪声影像,而CR 处理不仅能够消除噪声影像还能突出地物光谱细节特征,增加地物光谱曲线的可区分特征波段的差异性。在此基础上对研究区典型植被进行分类,探讨CR-SAM 分类方法的应用前景,并从定性和定量两个方面对研究区典型植被分类特征加以分析。姬旭升等[21]通过基于像素与面向对象的遥感数据分类方法研究,比较了SAM、SVM、DTs和RF算法在遥感影像分类中的作物识别精度,可知SAM 算法的分类总体精度最高为87.47%,最低为68.56%,对比可知其分类总体精度不高且变化较大。本文利用CR 处理对SAM 方法进行改进,发现经CR 处理后能够有效抑制光谱噪声的影响,突出植被光谱的特征信息,改善SAM 分类效果,提高其分类精度,对于CR-SAM 分类方法提高植被分类精度的机理有待于进一步研究。

4 结 论

1)SAM 分类方法对箭杆杨、沙枣树、芦苇的识别百分比分别为49.25%、48.33%、59.84%,总识别百分比为58.47%;CR-SAM 分类方法对箭杆杨、沙枣树、芦苇的识别百分比分别为65.08%、66.95%、80.82%,总识别百分比为79.12%,其相比较SAM 分类方法对3 种典型植被的识别百分比提高20.65%。

2) CR-SAM 分类结果的总体分类精度为70.50%,SAM 分类结果的总体分类精度仅为53.00%,较SAM 分类方法提高了17.5 个百分点,Kappa系数为0.66,因此,CR-SAM 分类方法对研究区3种典型植被分类识别的总体精度更高,效果更好。

3)箭杆杨占地面积为3.98 km2,主要分布区域为与部分芦苇区相间分布的过渡带和道路两侧,占研究区总面积的1.79%;沙枣树占地面积为19.76 km2,主要分布于耕地与荒地之间的过渡区以及人为种植的片状分布,占研究区总面积的8.89%;芦苇占地面积为174.26 km2,主要分布于湖滨带湿地以及开都河下游沿岸,占研究区总面积的78.43%。

猜你喜欢
沙枣树芦苇波段
最佳波段组合的典型地物信息提取
石磨豆腐
芦苇
沙枣树上还挂满去年的果实
基于PLL的Ku波段频率源设计与测试
芦苇
看啊,芦苇
小型化Ka波段65W脉冲功放模块
L波段kw级固态功放测试技术
沙枣