基于无人机多光谱影像的土地利用分类方法研究

2022-04-19 13:33孙玉琳
新疆农机化 2022年2期
关键词:决策树光谱土地利用

孙玉琳,黄 宇,2※,李 伟,张 卓

(1.无锡谱视界科技有限公司,江苏无锡 214142;2.南京农业大学农业高光谱技术创新实验室)

0 引言

土地利用变化是全球变化研究的重要因素,是可持续发展研究的热点[1]。土地利用分类是了解土地覆盖类型,进一步研究农作物产量预估、树种分类识别[2]、水体变化监测的基础。由人类活动造成的土地利用变化是区域乃至全球气候变化的重要驱动力[3]。因此,土地利用分类受到广泛的关注。

随着遥感技术的发展,遥感影像数据被广泛应用于土地利用分类中。陈磊士[4]等人基于Landsat8 与Sentinel-1A 影像使用卷积神经网络和BP 神经网络2 种分类算法对融合前后的遥感影像进行土地利用分类信息提取,其总体分类精度和Kappa系数分别为85.8091%和0.8124。肖艳[5]等以吉林省长春市部分区域为研究区,基于Landsat8遥感影像,在多尺度分割的基础上,提取影像对象的光谱、纹理、形状和空间关系特征,使用SVM分类器对研究区进行土地利用分类,总体分类精度和Kappa 系数分别为85.88%和0.8036。

然而,卫星影像容易受天气影响,且成本高、分辨率低。近年来,无人机遥感由于其操作简单、成本低、分辨率高且受天气影响小等特点,迅速成为遥感监测的重要手段。刘舒[6]等基于超高分辨率的无人机影像,采用随机森林算法对吉林省农耕区进行土地利用分类,总体精度最高达到了98.04%,Kappa系数为0.980。Akar[7]基于无人机影像对土尔其市区和农村两个研究区进行土地利用分类,总体分类精度达到了93.33%。本研究以安徽省广德市西庄村为研究对象,采用8种监督分类方法对研究区进行土地利用分类,对比不同分类方法的分类效果。通过对比不同分类方法在同一分类条件下的适用性,探讨无人机多光谱影像在土地利用分类方面的潜力,为采用无人机多光谱影像进行土地利用分类提供方法参考。

1 材料与方法

1.1 研究区域

研究区域位于安徽省宣城市广德市西庄村,地理位置为东经119°29′,北纬30°57′。属暖温带与亚热带过渡区,季风明显,四季分明,春暖多变、夏雨集中、冬季寒冷。该研究区的植被、水体、建筑用地较多。

图1 研究区分布

1.2 无人机多光谱影像获取

采用无锡谱视界科技有限公司研发的大禹Specvision-W(图2)无人机光谱成像系统进行数据采集。

图2 大禹Specvision-W 无人机多光谱成像系统

大禹Spe-cvision-W 无人机光谱成像指数分析系统可实现实时飞行实时监测指标,多光谱相机参数见表1。数据采集时间为2021年10月22日,天气为阴天,无人机飞行高度为150 m,航向重叠度于旁向重叠度均为60%。

表1 大禹Specvision-W 无人机多光谱成像系统主要性能参数

1.3 数据预处理

大禹Specvision-W 无人机高光谱数据预处理主要包括去马赛克、图像配准、去串扰、反射率校正以及图像的拼接。图像去马赛克、配准、去串扰以及反射率校正集成在相机中完成,图像拼接主要在Agisoft PhotoScan软件中完成[8],主要过程为导入需要拼接的影像图片以及POS信息,在此基础上提取点云、网格和DEM,最终生成正射影像。预处理流程如图3。

图3 无人机影像预处理流程

1.4 分类方法

遥感影像的分类方法众多,根据是否具有先验知识分为监督分类和非监督分类,在实际的影像分类中,不同分类方法的适用性存在差异[9]。本研究采用监督分类方法中的最小距离法、马氏距离法、最大似然法、神经网路、波谱角、决策树、支持向量机、随机森林8 种分类方法进行土地利用分类,对比不同分类方法的分类效果。

1.4.1 最小距离法与马氏距离法

最小距离法和马氏距离是常用的监督分类方法中计算分类距离的方法,基本原理为求一个已知类别向量和一个未知类别向量之间的距离,并将未知类别向量归属到距离最小的已知类别向量中。具有计算速度快、方法简单的优点[4]。

1.4.2 最大似然法

最大似然法通常应用于两类或者多类判别中,其基本原理为假设遥感影像每个波段中每个类的分布是正态分布,计算遥感数据中待分类样本在所有类别中的归属概率,依据归属概率最大原则对分类样本进行判别[10]。分类过程中最大似然法依据贝叶斯判决准则建立非线性判别函数集[11]。

1.4.3 波谱角

波谱角分类方法的基本原理是将多个波段的波谱响应作为矢量,通过未分类光谱与参考光谱间的夹角进行像元匹配分类,夹角越小未分类像元与参考像元越相似[12]。波谱角分类法由Kruse 于1993 年提出[13],研究证明,波谱角分类方法对波谱相似的林地和耕地分类效果较好[14]。

1.4.4 决策树

决策树是一种通过训练样本进行归纳学习,建立决策树或决策规则,然后使用决策树或决策规则对数据进行分类的方法。决策树由不同的节点组成。每个节点只能有一个父节点和两个或多个子节点。节点之间通过分支相互连接,每个内部节点对应一个测试属性或属性组,每个属性组对应不同的可能属性值。决策树分类方法具有层次结构清晰、运算简单、处理速度快等特点[15]。

1.4.5 支持向量机

支持向量机(Support Vector Machine,SVM)最初由Comes&Vapnick 于1936 年[16]提出,这是机器学习的里程碑。SVM本质是一种统计学习算法[17],是一种线性和非线性均使用的算法。SVM作为监督分类算法,其核心是寻找最小化结构风险,即将不同类别的样本无差错分类的同时,保证各样本间具有最大分类间隔。SVM 的最优分类面取决于支持向量,因此,在遥感影像分类中,核心是根据各类别的训练样本和约束条件,选取最优支持向量,并基于支持向量构建超平面(最优分类面)。SVM最初用于二分类,根据两类样本计算超平面[18]。SVM判别函数为:

公式中xi为支持向量,x为未知向量,f(x)就是支持向量机分类器,在形式上类似于一个神经网络,其输出的结果是若干中间层节点的线性组合,而每一个中间层节点对应输入样本与一个支持向量的内积,因此也被叫做支持向量网络分类结果。

1.4.6 随机森林

随机森林(Random Forest,RF)算法是由Breiman[19]等人于2001 年首次提出的,是在决策树的基础上提出的一种学习算法,其核心是多个决策树集成的分类算法。相比其他机器学习算法,随机森林在运算量没有显著提高的前提下提高了预测精度[20,21]。随机森林算法的原理是在原始样本中利用自主抽样随机抽取N 个样本,对每个样本进行决策树建模,在此基础上集成多棵决策树的预测,通过每棵决策树的投票结果得出预测结果。其中,随机森林分类是由很多决策树分类模型组成的组合分类模型,且参数集是独立同分布的随机向量[22]。

1.5 样本选取

通过对安徽省广德市土地利用情况进行调查,结合研究区的无人机多光谱影像、0.1 m 空间分辨率的辅助摄像头图像以及Goole Earth 影像,利用实地调查资料以及目视解译法选取训练样本集和验证样本集。依据《土地利用现状分类》(GB/T21010-2007)[23]标准中的一级分类,确定研究区的土地利用分类类别为建筑用地、林地、耕地、水体、裸地5 类。本研究选取不同地类样本点共计15 000个,分别以2:1 的比例将各类样本分为训练样本和验证样本。训练样本和验证样本的选取采用随机模式,确保训练样本和验证样本服从同一分布。

1.6 精度评价

采用混淆矩阵对分类结果进行评价,确定分类结果的精度以及可靠性。构建混淆矩阵是目前遥感影像分类中最常用的一种量化分类精度方法[24],研究利用验证样本,基于最小距离法、马氏距离法、最大似然法、波谱角、神经网络、决策树、随机森林、支持向量机的分类结果,采用混淆矩阵对土地利用分类精度进行评价。评价指标为生产者精度(PA)、用户精度(UA)、总体分类精度(OA)和Kappa 系数[25]。公式如下:

式(2)~(5)中Pii为混淆矩阵第i行第i列的样本数;Pi+和P+i分别为混淆矩阵第i行和第i列的样本总数;N为样本总数;m为土地覆盖类型。

2 结果与分析

2.1 不同地类光谱分析

研究提取不同地类的光谱曲线各2 000条,求其平均值,作为不同地类的光谱曲线(图4)。从图中可以看出机载多光谱数据不同地类之间光谱曲线存在一定的差异,特别是在500nm、600nm以及750nm范围。光谱曲线的差异为采用光谱特征信息对土地利用进行分类提供了基础。

图4 大禹Specvision-W 无人机多光谱成像系统

2.2 不同分类方法分类结果分析

为了对比分析不同分类方法对机载多光谱数据地物分类性能的影响,研究采用最小距离法、马氏距离法、最大似然法、波谱角、神经网络、决策树、随机森林、支持向量机等8 种分类方法对安徽省广德市研究区进行土地利用分类,8 种分类方法的分类结果如图5。分析8 种分类方法的分类结果,各地类在空间上表现出相对一致性。8种分类方法分类结果中建筑用地主要位于研究区的中部且分布区域较少。林地遍布整个研究区,主要分布在研究区的中下部。水体贯穿整个研究区域,分布范围仅次于林地。耕地在西北部以及西南部有分布,裸地主要分布于建筑用地附近,位于研究区域的东北部。8 种分类方法中支持向量机、随机森林、决策树、最大似然法分类方法各地物的类别分布范围一致性较高,马氏距离法、神经网络、最小距离法分类结果具有破碎现象,地类分布范围相对一致性较差。

图5 8 种分类方法分类结果对比

研究采用训练样本进行分类,在得到土地利用分类结果的基础上,采用验证样本对分类结果及进行检验。精度检验可以表明土地利用分类效果的可靠性。下表为不同分类方法生产者精度(表2)、用户精度(表3)、总体精度以及kappa系数(表4)。表2中,随机森林、支持向量机和决策树分类法的各地类的生产者精度均在95%以上,其中支持向量机分类法中水体和建筑用地的生产者精度达到了100%。最大似然法各地类的生产者精度也达到了80%以上,波谱角与最小距离法的生产者精度较差,最小距离法耕地的生产者精度仅为39.83%。

表2 不同分类方法生产者精度(PA)(单位:%)

表3 不同分类方法用户精度(UA)(单位:%)

表4 不同分类方法总体分类精度(OA)和Kappa 系数

表3 中,随机森林、支持向量机和决策树的用户精度最高,均达到了95%以上,其次是最大似然法,最大似然法的用户精度均达到了89%以上,神经网络和马氏距离法各地类的用户精度也达到了87%。

表4中,支持向量机土地利用分类的总体分类精度最高,达到了98.91%,kappa 系数为0.99。土地利用分类结果图中随机森林和决策树分类法分类结果与支持向量机分类结果具有一致性,随机森林的总体分类精度为98.74%,kappa 系数为0.98,决策树的总体分类精度为97.75%,kappa系数为0.97。其次是最大似然法,总体分类精度为98.05%,kappa系数为0.94。神经网络和马氏距离分类法分类精度均为93%左右,kappa 系数分别为0.92、0.90。波谱角分类法的总体分类精度为90.21%,kappa 系数为0.87,最小距离法的总体分类精度最低仅为78.74%,kappa系数为0.73。

3 结论

本研究以安徽省广德市西庄村为研究对象,通过机载无人机多光谱数据结合Goole Earth 影像以及无人机自带的0.1 m 的RGB 影像,采用最小距离法、马氏距离法、最大似然法、波谱角、神经网络、决策树、随机森林、支持向量机分类法对研究区进行土地利用分类,结果表明:(1)机载多光谱数据由于其极高的空间分辨率以及较高的光谱分辨率,能够很好地提高土地利用分类的精度;(2)对比不同的分类方法,随机森林、支持向量机、决策树以及最大似然法的分类精度较高,分类精度高于最小距离法20%左右。由此可见,基于无人机多光谱数据进行土地利用分类,随机森林、支持向量机、决策树分类法适用性更好,最小距离法和马氏距离法适用性最差。

土地利用分类一直是城市建设规划、水体变化监测、森林树种识别等研究的关键,本研究所得结论为基于无人机多光谱影像数据的土地利用分类的方法提供了借鉴,进一步发挥了无人机多光谱技术在土地资源可持续发展利用方面的优势。

猜你喜欢
决策树光谱土地利用
城市土地利用变化模型研究进展与展望*
五台县土地利用变化研究
基于“风险—效应”的土地利用空间冲突识别与测度
基于三维Saab变换的高光谱图像压缩方法
煤炭矿区耕地土壤有机质无人机高光谱遥感估测
土地利用变化与大气污染物的相关性研究
基于3D-CNN的高光谱遥感图像分类算法
简述一种基于C4.5的随机决策树集成分类算法设计
决策树学习的剪枝方法
决策树在施工项目管理中的应用