基于Landsat 8 OLI影像的山区园地提取方法

2021-05-28 12:38王刚王加胜苗旺元陈波
现代计算机 2021年10期
关键词:园地纹理光谱

王刚,王加胜,苗旺元,陈波

(1.云南师范大学信息学院,昆明650500;2.西部资源环境地理信息技术教育部工程研究中心,昆明650500)

0 引言

山区园地的提取在国内国外的相关研究普遍比较少,利用遥感技术对山区园地的提取也比较难。近年来,果园的提取主要是用光谱特征和植被指数来操作的。例如罗等人[1]把环境卫星遥感影像作为数据基础影像,把NDVI、波段、高程和纹理信息等作为提取果园的特征,然后使用决策树的分类模型对研究区的果园进行遥感提取和分类。李等人[2]和Immitzer等人[3]综合了光谱信息提取并且对其进行分类。因为地面特征相对来说比较复杂,结合光谱和植被指数特征的果树提取精度通常是比较低的,容易出现分类错误和遗漏的现象[4-5]。为了提高分类精度,国内外的学者运用了光谱结合纹理特征的提取方法进行果树研究[6-7]。例如岳等人[8]把不同高精度分辨率的高分一号遥感数据作为基础影像,把光谱和纹理特征作为提取特征,分别使用多种遥感分类模型对研究区主要栽培的果树进行遥感识别分类。PU等人[9]和Dian等人[10]把空间信息和光谱特征作为提取特征对果树进行遥感提取分类,证明了把空间信息和光谱特征结合起来可以很大地提高果树分类的准确性。宋等人[11]把QuickBird影像作为基础遥感影像,先利用小波变换的方法对纹理信息进行提取,然后使用随机森林这个分类方法自动提取出猕猴桃果园。郝等人[12]利用面向对象的高分辨率影像结合纹理特征对耕地进行提取。黄等人[13]从纹理、形状和对象的角度来进行提取和分析影像的特征,在这个基础上,用三个分辨率比较高的对影像有实际应用的案例来验证自己提出的方法。陈等人[14]利用高分辨率影像,把光谱和纹理特征作为提取特征数据,通过比较选取最好的纹理特征组合,使用决策树这个分类方法进行分类。

综上所述,在现有的果园提取方法中,结合光谱与植被指数特征的果树提取精度相对较低,然而后来提出的一种把光谱和纹理特征作为提取特征的方法,很好地提升了对遥感影像的分类精度。但是因为遥感影像空间分辨率的限制和制约,对影像的分类精度来说仍然具有比较大的提高空间。为此,亟需开展基于高分辨影像、融合光谱、地形、纹理等多特征的园地提取研究。

GEE(Google Earth Engine)是一个综合科学分析和地理信息数据可视化的平台。本身存储了近40年来主要公开的遥感影像数据集,并每天不断进行更新,使得GEE用户可以方便地提取、调用和分析海量的遥感大数据资源。与常规影像处理软件相比,GEE可以实现更加快速、在线批量处理大数据等功能,对各种植被指数、水体指数具有快速且精确计算的特点。

本文拟以云南省昭通市昭阳区为研究区域,以GEE为软件平台,把Landsat 8 OLI遥感影像作为基础的数据影像,地形图等地理数据作为辅助,对园地的特征进行提取,主要包括了光谱特征、纹理特征、地形特征和缨帽变换特征,然后采用随机森林(Random For-est)这个比较常见的分类方法进行分类并且采用决策树(Decision Tree)的分类方法和支持向量机(Support Vector Machine)的分类方法进行提取2019年以昭阳区为研究区的园地并加以对比。

1 研究区与数据

1.1 研究区概况

昭阳区隶属于昭通市,在昭通市的西南方向,金沙江的南边,在27.1°N-27.6°N、103.1°E-103.9°E之间,位于云贵高原的西北部(如图1所示)。东、南、西、北边分别与贵州省的威宁县、昭通市的鲁甸县、四川省的金阳县、昭通市的彝良县,大关县和永善县三县相邻,是昭通市最富裕的县区,占地总面积大约2167平方公里,占昭通市总面积的9.4%。昭阳区的气候类型属于北纬高原大陆季风气候,春夏秋冬四季的温差比较小,干季湿季差别比较明显,垂直差异比较大。全年无霜期约为220天,相对北方来说比较长,全年平均气温约为11.6摄氏度,比较适合水果的生长,全年平均降水量约为735毫米,全年平均日照时间约为1902.02小时,昼夜的温差较大,日温差也比较大。该地区以红壤为主,多为山区,山区占64.3%,境内水系发达。独特的水文气候条件,造就了“昭通苹果”等水果品牌。

1.2 数据与预处理

(1)Landsat 8 OLI数据。

根据昭阳区果园生长期以及影像的质量等因素,选取来自GEE(https://earthengine.google.com/)平台的28景Landsat 8 OLI遥感影像数据。时间是从2019年2月1日到2019年10月31日,包括果树的发芽期、开花期、幼果期、膨大期、着色期和成熟期,分辨率为30m。首先对在GEE上获取的Landsat 8 OLI遥感卫星数据进行数据的预处理工作,由于GEE中的Landsat 8 OLI遥感数据已经进行了大气校正的工作,所以后续的预处理主要包括影像去云,影像融合镶嵌,影像裁剪等过程,然后进行特征提取。

图1 研究区位置示意图

(2)SRTM数据。

本文使用SRTMGL1_003数据,空间分辨率30 m。运用STRM数据进行特征提取,包括DEM、坡度、坡向和阴影等信息。

(3)样本数据。

选择合适的样本点是提高植被分类结果的可靠性以及精度的前提。根据昭阳区的地形图,土地利用方式和分布,将研究区的主要的土地作物种植类型化分成6种,分别为水体、草地、耕地、林地、建筑用地和园地,这6种土地作物种植类型在Google Earth平台本身提供的高分辨率影像上具有非常明显的识别特征。通过Google Earth平台提供的2019年左右的高分辨率影像,利用目视解译的办法得到所有土地类型的样本数据,收集得到的样本点随机且均匀分布于整个昭阳区。把目标年份的样本数据先进行随机的分配,比例按照7:3来分配,其中采集到的70%的样本数据放入三种分类器进行分类训练,而剩下的30%的样本数据用来进行混淆矩阵的精度评价。样本数如表1所示。

2 研究方法

研究技术路线如图2所示。首先要对Landsat 8 OLI遥感影像进行预处理的工作,由于GEE上的Land-sat数据已经进行了大气校正,所以在这里主要进行其他的一些预处理,包括影像去云、影像融合镶嵌和影像裁剪等一系列过程,然后结合地形图作为辅助数据进行特征信息提取,包括物候特征、地物光谱特征、纹理特征、地形特征和缨帽变换特征,最后采用RF、CART、CART这三种常见的分类模型进行分类并且进行精度评价。

图2 技术路线图

2.1 特征提取

特征变量的选择对遥感分类来说非常重要,把不同的特征变量有机的组合起来可以使遥感分类的准确性有比较明显的改善[15]。本文综合利用光谱特征、纹理特征、缨帽变换特征和地形特征进行果园的遥感提取。

(1)光谱特征。

本文的光谱特征主要使用了一些多光谱波段和一些光谱指数[16]来表示的,光谱指数发展到今天有很多,本文使用了一些方便区分园地的光谱指数,分别是归一化植被指数(NDVI)、归一化湿度指数(NDMI)、调整土壤亮度的植被指数(SAVI)、比值植被指数(RVI)和差值植被指数(DVI)。计算公式如表2所示。

表2 光谱指数公式

其中L表示的是土壤调整系数,当L=0时,SAVI=NDVI,在研究中,L=0.5,植覆盖度处于中等水平。

(2)纹理特征。

本文使用的纹理特征主要是通过灰度共生矩阵(GLCM)[17]计算得到的,分别是二阶矩、对比度、相关性、方差和熵,计算公式如表3所示。

表3 纹理特征和公式

(3)缨帽变换特征。

缨帽变换是根据固定的变换矩阵将原始影像投影综合变换到具有物理意义的亮度(Brightness)、绿度(Greenness)和湿度(Wetness)特征向量的三维特征空间,分别反映了裸土岩石、植被覆盖度和水分信息。这个变换的过程达到了减少特征维数、增强影像信息的效果。其变换公式如下:

式中,X、Y分别为变换前后的多光谱空间的像元矢量;C为变换矩阵;b表示的是避免出现负值所添加的常数。Landsat 8 OLI影像下缨帽变换矩阵系数如表4所示[18]。

表4 Landsat 8 OLI影像下缨帽变换矩阵系数

(4)地形特征。

地形特征包括基于SRTM的数字化高程模型(DEM)及其衍生产品(坡度、坡向、阴影)[19],引入地形特征作为限定条件,增加部分限定条件以提升精度。

2.2 分类方法

随机森林分类算法是一种包含多个决策树(CART)的机器学习算法,已被大量应用在许多领域,例如土地利用变化图等,这种分类方法在分类特征比较多的情况下被认为具有比较好的分类效果[20-21]。随机森林主要包括2个阶段,分别是训练和分类。在训练这个阶段,首先对输入的数据通过每棵树自举重的方法对采集样本进行采样,随机重复抽取N个新的样本集合来替代原来的训练样本集合,然后通过这个样本集合生成几个独立的CART决策树。在分类这个阶段,通过算术平均计算所有树产生各种类别的概率,由每棵树的分类结果通过投票得到[22-23]。最后通过GEE这个二次开发平台,使用随机森林分类算法对2019年目标年份的所有输入的特征集合来进行分类得到分类结果。

2.3 精度评价

在分类精度检验与评估中,遥感分类结果需要使用参数指标来片判别分类结果与实际土地类型的差异程度。把混淆矩阵(也称误差矩阵)作为评价分类的指标[24]来展示结果的好坏,包括总体分类精度(OA)、Kap-pa系数(KC)、错分误差(CE)、漏分误差(OE)、用户精度(UA)和生产者精度(PA)等,遥感影像分类的准确性就是用这些评价指标从不同的方面来表现出来的[25-26]。本文运用了混淆矩阵中总体分类精度与Kappa系数来衡量试验区分类结果质量。用验证样本来计算目标年份分类结果的OA、KC、UA、PA,用这些结果的好坏来评估果园遥感提取的准确性。评价指标如表5所示。

表5 评价指标

3 结果与分析

3.1 不同分类方法结果的精度对比

用相同的样本集合进行SVM和CART的分类来评估RF算法的分类性能的好坏。3种算法的分类结果如表6所示。

目标年份的果园提取结果利用分类精度评价参数来评估。由表6可知,RF分类的OA、Kappa系数、UA和PA高于相同特征下的SVM和CART分类结果,与CART分类相比OA、KAPPA系数、UA和PA分别提升2%、3%、7%和6%,与SVM分类相比OA、Kappa系数、UA和PA分别提升6%、8%、11%和15%,表明RF提取果园的效果和稳定性比较好。

表6 分类结果

3.2 三种不同分类方法的果园空间分布对比

图3表示的是通过不同的分类算法获得的昭阳区的土地利用分类图。可以明显的看出,SVM分类结果中果园和耕地草地之间的错分现象较为严重,CART分类结果中果园分布完整性较好,与其他地物类型的混分状况有较大改善。由图3可以看出,CART分类与RF分类结果相对来说比较相似,但是果园和耕地之间错分漏分的现象有所增加。综合三种分类结果表明,采用RF分类算法提取的果园与其他两种分类方案相比具有更好的连续性,影像的整体分类效果在果园的提取上有明显的提高,这与表6中的定量分析相符。经统计,基于RF分类算法提取的果园面积为318.9hm2。2019年果园分布图显示,昭阳区果园主要集中分布与洒渔、永丰、旧圃、北闸、小龙洞等镇。

3.3 研究区果园空间分布

经统计,基于随机森林分类算法提取的果园面积为318.9hm2,占昭阳区总面积的14.7%。2019年果园分布图(如图4所示)表明,昭阳区果园主要集中分布于洒渔、永丰、旧圃、北闸、小龙洞等镇。

4 结语

本文通过GEE平台,选用覆盖昭阳区的2019年共28个时相的Landsat 8 OLI遥感卫星影像并完成数据的预处理,构建包括光谱、纹理、地形、缨帽特征在内的分类特征集,使用随机森林分类算法,对昭阳区进行园地信息提取,最终得到了2019年昭通区果园空间分布情况,对研究区园地栽种面积进行估算,提取精度较高。研究得到的主要结论如下:

图3 三种分类方法结果图

图4 果园分布图

(1)通过比较RF、CART和SVM这三种分类器的分类性能,结果表明,在相同分类特征下,RF算法的分类结果最好,OA和Kappa系数比其他两种分类器要高,与CART分类相比OA提高了2%,与SVM分类相比OA提高了6%。

(2)根据RF分类方法提取的园地结果,制作了昭阳区的园地分布图,结果显示,昭阳区园地总面积为318.9 hm2,占昭阳区总面积的14.7%,RF分类的OA达到96%,Kappa系数达到0.95,分类效果相对其他两种分类器来说比较好。

(3)在昭阳区各镇均分布有园地,其中,洒渔镇园地分布最多,果业为该镇农业产业中的主导产业。

但是,基于像元的分类将无法避免导致“椒盐现象”的发生,如何确定最佳的影像分割阈值,如何更有效地选取训练区域样本,以及如何更准确地选择分类指标与规则,都需要在后面继续积极探索。

猜你喜欢
园地纹理光谱
煤炭矿区耕地土壤有机质无人机高光谱遥感估测
园地再现
郭守敬望远镜获取光谱数破千万
肺纹理增多是病吗?
童梦
TEXTURE ON TEXTURE质地上的纹理
浅析光谱技术在200 nm以上和以下尺度范围内的不同
艺术园地
消除凹凸纹理有妙招!
书画园地