光学遥感影像土地利用分类方法综述

2021-11-23 13:16杨永清张俨娜
科学技术与工程 2021年32期
关键词:决策树土地利用精度

周 珂, 杨永清, 张俨娜, 苗 茹*, 杨 阳, 柳 乐

(1.河南大学计算机与信息工程学院, 开封 475004; 2.河南大学河南省大数据分析与处理重点实验室, 开封 475004; 3.河南大学实验室与设备管理处, 开封 475004)

土地利用和人类的生活与生产息息相关,人类一系列的活动正以前所未有的速度影响着陆地环境[1]。人类进行的活动对土地利用的变化是发生全球环境变化的主要因素,因此土地利用的研究已成为全球变化研究的重要内容[2-3]。

遥感技术以覆盖面广、信息量大等优势为土地利用分类提供新的技术手段。光学遥感影像凭借其较高的空间分辨率和时间分辨率、适合的光谱分辨率以及共享度高等优势,在土地利用分类中被广泛使用[4-6],主要对利用光学遥感影像进行土地利用分类的工作进行分析总结归纳了土地利用分类时所用到的光学遥感影像数据、分类方法,分类效果等内容。

1 土地利用分类数据源与预处理

1.1 数据源选择

土地利用分类在选择遥感图像数据时,需要根据研究区域和分类目标的特点选择不同的数据。研究区域较大的一般需要选择中低分辨率大尺度数据[4],区域较小研究则需要选择高分辨率的影像数据;分类目标较小的选择高分辨率影像,分类目标较大的选择中低分辨率影像。高分辨率的影像并非是所有土地利用研究的最佳数据源[5],因其覆盖范围较窄,对于研究大范围的土地利用带来了一定的复杂度,所以在选择影像数据时,要根据具体的分类场景及分类目标进行选择[6]。常用数据源如表1所示[7]。

表1 土地利用分类常用的光学遥感影像数据源[7]Table 1 Optical remote sensing image data sources commonly used in land use classification[7]

图1 影像预处理基本流程[8]Fig.1 Basic process of image preprocessing[8]

1.2 数据预处理与预处理工具

原始遥感影像在对目标提取之前一般要进行预处理[8-9]。不同星源提供的数据需要的预处理过程不完全一样,影像预处理基本流程如图1所示。当前,有较多的开源或商业遥感影像软件工具提供预处理功能,为影像的预处理提供了较好的技术支持。Sentinel-2[7]官网提供有已经进行过辐射校正和几何校正的数据,可以根据研究目的决定是否利用其官网提供的影像处理软件进行大气校正。白秀莲等[10]对数据预处理时选择图像可视化环境软件(environment for visualizing images,ENVI)进行图像裁剪,提取研究区域影像数据。肖国峰等[11]将ENVI和像素信息专家(pixel information expert,PIE)两个软件结合使用对高分二号数据进行大气校正、影像融合等预处理。王瀚征[12]进行实验时,选择ENVI中的 FLAASH(fast line-of-sight atmospheric analysis of spectral hypercubes)大气校正工具进行大气校正。杜启胜等[13]利用ENVI使用几何校正、图像裁剪等方式对数据进行预处理,最终将预处理后的数据与地图叠加绘制了遥感专题地图。

2 土地利用分类方法

应用较多的土地利用分类方法主要包括目视解译、监督分类、非监督分类等[14-17]。近年来,随着人工智能的发展,深度学习方法也逐渐引入土地利用分类中。

2.1 目视解译

目视解译是一种通过影像特征,建立解译标志,图形判读,完成土地利用分类的一种影像信息分类方法[14]。Antrop等[15]利用目视解译方法对郊区景观全方位进行研究,构建了景观指数图,指出目视解译,对复杂、异质景观和空间单元进行分类而言是一种有效的分类方法。李镇等[16]以陕北吴起县和绥德县为研究区,使用QuickBird 影像为实验数据对该地区的土地切沟形态参数的精确度进行研究,采用目视解译对实验结果进行分析,结果表明在草本覆盖的区域中目视解译精度更高。赵旦等[17]在研究汶川地震后地表植被恢复状况检测时,采用目视解译分类方式识别森林资源的变化,并根据植被指数变化对灾区森林恢复做出评价,效果良好。

目视解译对研究人员的经验知识有较强的依赖性,分类结果会因个人经验存在差异,同时目视解译效率较低,适用于数据量较少,需精准分类情况,近年来,研究人员多将目视解译结果作为其他分类方法的比对对象。

2.2 监督分类方法

监督分类是指分析者对图像区域特征了解的基础上,选择已知的类别特征作为训练样本让分类系统学习训练出模型,并按照一定的分类原则对所有待分类图像的像元进行判别处理,即通过系统已经掌握的分类特征去识别未进行训练的图像的像元的过程[18]。常见的有监督分类算法有:决策树、最大似然分类、支持向量机等。

2.2.1 决策树分类算法

决策树分类[19]算法是建立在信息论的基础上,将复杂抽象的信息转化为易于理解的判断。决策树在层级上是数据结构中的树或者二叉树的结构内部节点代表分类特征或属性,每一个内部节点处只根据较少属性值进行判决[20],叶子节点代表分类结果。决策树模型的基本结构如图2所示。白秀莲等[10]以内蒙古赤峰市巴林右旗、林西县等区域为实验区,利用决策树分类器模型对LandSat数据和高程数据进行处理,实验结果表明,决策树分类可以有效的减少目标物的同物异谱、异物同谱的影响,总体精度高达83%以上。张宇等[21]以山东任城区为实验区,以LandSat影像作为数据,利用决策树算法确立各地类的综合阈值建立模型,得到三期影像数据全体精度均达到86%以上的结果。杨雪峰等[22]以塔里木河下游为研究区,数据源选取多角度成像光谱辐射计(multi-angle imaging spectro-radiometer,MISR)数据,利用4种决策树模型:J48模型、逻辑模型树(logistic model trees,LMT)、C5.0模型、分类回归树(classification and regression tree,CART)进行土地利用分类研究,结果显示相比其他分类方法,决策树中的C5.0算法分类效果最佳,而且实验发现近红外波段相比其他波段对地物反射异质性信息更敏感。周星宇等[23]以国产GF-1高分辨率影像作为数据源,选择中国沿海海岸线作为实验区,利用决策树分类方法提取中国沿海地区地表物类信息,结果表明决策树分类方法除了在堤坝、裸地方面分类精度不如其他分类方法,其他地物类型分类精度均表现良好。

决策树分类算法可以在很大程度上不受异物同谱的影响,当遥感影像空间特征复杂,数据维度较高时,决策树分类算法表现良好。决策树模型的好坏对分类精度影像较大,因此设计更好决策树模型是未来重要的研究方向之一。

图2 决策树分类基本结构[20]Fig.2 The basic structure of decision tree classification[20]

2.2.2 最大似然分类法

最大似然分类[24-25]又称为贝叶斯(Bayes)分类,也是应用较多的一种分类方法,在进行分类时主要依据是Bayes准则,判断函数的构造和对应的分类准则是整个方法的重要内容,在对遥感数据进行分类时,将多波段的影像数据看成满足多维正态分布的数据,从而进行构造分类函数。

最大似然分类方法原理:设有n个类别,用ω1,ω2,…,ωn表示n种类别,用P(ω1),P(ω2),…,P(ωn)表示每一种类别发生的概率,设有未知类别的样本X,P(X|ω1),P(X|ω2),…,P(X|ωn)为每一类对应的条件概率,由贝叶斯定理可得样本X出现的后验概率为[26]

(1)

通过将后验概率作为判断依据进而判断所对应的类别,其分类准则为[26]

(2)

通过观测样本将先验概率P(ωi),通过转换成后验概率P(ωi|X),然后将后验概率最大设置为分类原则,确定样本属于哪种类别。

郑彦龙等[27]以Landsat 影像为实验数据,选择咸安区为实验区,使用最大似然分类法将该区域的土地利用类型分为六类,实验表明该区域的地物提取总体精度高达90%以上。李杰等[28]在对土地利用类型进行分类时选择五类土地利用类型(树林、农田、人工水域、人工建筑、裸地)作为训练样本,以0.5 m分辨率的WorldView-2影像数据和1 m分辨率的IKONOS全色遥感图像作为实验数据,利用最大似然分类方法在4组实验数据进行实验,结果4组实验数据总体精度都高达85%,其中最佳实验组总体精度达到88.28%。郭力娜等[29]以LandSat 8影像为数据源,研究唐山市土地利用变化情况,实验对比发现监督分类中最大似然法分类在本研究区中分类精度最高,最大似然分类在耕地、园林、人工绿地分类精度达到94%以上。樊利恒等[30]以印第安纳州Tippecanoe郡为实验区,基于该实验区的多光谱影像数据测试改进后最大似然分类方法,结果表明改进后算法对地物类别总体分类精度提高3%以上。Otukei等[31]以LandSat影像为实验数据,研究帕利萨区的基巴莱县的土地利用变化,最大似然分类将帕利萨区的基巴莱县影像中地物类别分为:森林、草本湿地、灌木湿地、草原、草地等,总体地物分类精度达到87%以上。陈明等[32]对黄土高原的平朔矿区的高分一号影像进行地类信息提取时采用了最大似然分类法,结果表明:居民点、旱地、工业用地、采矿用地、复垦土地地类信息总体精度为81.66%,Kappa系数为0.79。梅树红等[33]用最大似然法进行土地利用分类实验,结果表明最大似然法分类在分类精度方面没有其他方法高,但计算效率优势明显。

最大似然法的优点是简单,便于操作,而且可以和贝叶斯理论、其他先验知识融合,但是它也有自身的缺陷比如:只适合于波段数少的多波段数据,还有分类时间长,训练样本要求较高等问题。

2.2.3 支持向量机分类法

Corina等[34]在1993年提出支持向量机(su-pport vector machine,SVM),通过计算出待分离样本之间的最佳分离超平面对样本进行归类。图3为两类样本数据可分离的支持向量机原理[34]。平面L要满足两个条件:一是可以划分两类样本;二是L1距离L和L2距离L的距离要保证最大[34-36]。

当严格要求样本不可以越过L1、L2两个超平面时,这种情况被称为硬边缘分类,但是硬边缘分类存在对异常值过于灵敏和只对线性可分离的数据有效等问题,因此在满足最大化分类间隔的基础上引入损失函数构建新的优化问题,从而使少量样本允许出现在间隔带中,这种情况称为软边缘分类[37-39]。

□、○为两种待分类的样本;L为最佳分离超平面; L1、L2为两个平行平面,其作用主要是阻隔样本图3 二维线性分类[34]Fig.3 Two dimensional linear classification[34]

对非线性可分的情况,非线性可分情况要通过使用核函数将待分离样本进行归类,主要是通过对二维空间使用核函数[40]转换到高维空间,在高维空间寻找分类样本的方法。

赵恒谦等[41]使用SVM分类方法对2006—2016年北京市通州区地物类型进行分类,分析该区域4类(水域、建筑用地、耕地、绿化用地)土地利用情况,结果表明使用SVM分类方法整体分类精度均高于80%以上。张静等[42]使用Landsat TM 多光谱影像,以延安市、嘉峪关市、果洛藏族自治州等地为研究区域,通过对支持向量机引入地表植被指数以及地物在影像中的纹理信息特征进行优化,结果显示改进后的算法在延安市的总体精度最高达到97%。李玲等[43]以高级陆地观测卫星(advanced land observing satellite, ALOS)高空间分辨率图像为数据源,选取浙江省湖州市为实验区,将纹理特征加入到原始算法中,实验结果表明,改进后的支持向量机在林地提取精度达到92%,水域和公共建筑精度为100%,交通设施精度达到95.45%,总体精度达到90%以上。邓曾等[44]通过主成分分析降低训练样本维度和优化网格搜索参数对传统支持向量机进行改进,实验时以World-View2影像作为实验数据源,采用改进后的算法对道路、水体等五类地物进行分类,结果分类精度平均都在90%以上。

支持向量机通过对样本在光学遥感土地利用分类过程中的训练,搭建了地物类型和光学遥感影像信息因子之间的桥梁,取得了较好的分类精度,适合解决小样本、高维的、非线性的多源数据分类,特别是一对一多类方法的模型和以径向基(一种支持向量机核函数)核函数为基础的支持向量机模型更适合提取遥感影像中的类别信息。

2.2.4 随机森林

随机森林(random forest, RF)算法是由Breiman[45]率先提出的一种将多颗决策树组合到一起进行分类的算法。其随机主要体现在两方面:一方面是子模型的训练样本是随机抽取的;另一方面是子模型对应的特征信息也是随机抽取的。每一颗决策树模型的训练是通过自助采样法(Boostrap抽样)抽出来的,在构建每一颗决策树模型的时候是从所有特征中随机抽取一个子集来对模型进行训练。随机森林算法是由众多的决策树组成,每一决策树会产生一种分类结果,而随机森林则是将所有结果汇总从中选出最佳的分类器,进行分类。由于该方法所具备的极高的准确率、能够评估各个特征在分类问题上的重要性以及能提供快速、可靠的分类结果,所以在影像分类上具有广泛的应用[46]。田绍鸿等[47]使用RF分类方法结合TH-1数据对新疆阿勒泰地区北屯市的土地利用情况进行研究,结果表明,通过 RF分类,分类精度达到80%以上。郭玉宝等[48]以北京市某区为研究区域,实验数据选取国产高分一号数据,利用随机森林算法对实验区的土地利用情况进行分类提取分析,结果表明,在3种分类方法中随机森林总体分类精度达到85%以上,随机森林算法计算效率在3种方法中也是较优。张磊等[7]以黄河三角洲湿地为研究区,使用Sentinel-2影像作为实验数据,利用随机森林算法对湿地进行地物信息提取,实验表明地表植被指数和红边指数提高地物分类的精度,而纹理特征信息则导致分类精度下降。刘代超等[49]以黄山市为研究区,数据源使用是国产GF-6影像和Google Earth影像,利用随机森林算法对该地区林地与非林地信息进行提取,结果表明,红边波段信息和多时相数据融合使得随机森林算法在该地区总体分类精度达到93%。顾海燕等[50]对潼城区的7种地类进行研究,将算法特征数量设定为10时,随机森林的总体分类精度最高达到91.08%。李国庆等[51]以陕西麻塔流域为研究区,通过使用最大似然算法和随机森林算法处理LandSat 8影像数据,发现随机森林算法更适合用于麻塔流域土地利用分类,分类总体精度为74%。

随机森林算法是一种比较成熟的算法,在光学遥感影像土地利用分类中普遍使用,特别是在数据维度较高,样本数据少,同时对准确性要求较高的多光谱、多时相遥感影像分类中,随机森林算法更能体现速度快、精度高、稳定性好的优势,取得了很好的应用效果。

2.3 非监督分类方法

非监督分类,也称为聚类分析,凭计算机自己对数据进行处理从而分出不同类别,但是不能确定分类结果的属性[52]。迭代自组织数据(ISODATA)分析算法[53-54]是一种常见的非监督分类算法,广泛使用在遥感影像中的信息分类[55-56]。

ISODATA算法思想首先确定初始分类个数确定归类阈值,通过引入归并与分裂过程不断调整类别个数,两种类别之间的样本均值距离小于参数值时,就触发归并机制进行归类,如果大于参数值则进行分裂,分成两类,如此不断调整分类样本个数和参数值进行分类,直到迭代结果较为满意为止[57]。

韩洁等[58]采用QuickBird影像数据使用非监督迭代自组织数据分析算法进行初步分割,同时融合了几何、纹理等信息进行道路提取,最终结果表明实验相比其他算法在完整率、正确率和监测质量平均提高了26.61% 、5.57% 和 26.77%。朱爽等[59]利用ISODATA算法对北京郊区LandSat TM影像中冬小麦种植区进行提取,研究表明,ISODATA算法的像元精度达到86.6%。Abbas等[60]以巴基斯坦大气研究委员会的卫星数据为数据源,选择巴基斯坦东北部巴德地区作为研究区域,以ISODATA算法作为影像分类的研究方法,当把迭代次数从1到10依次增加时,分类精度明显提高,同时聚类数目也增加了10个。Vimala[61]使用LandSat7、LandSat8影像数据,对塞勒姆市的土地覆盖变化进行研究,利用无监督ISODATA算法将遥感影像中土地利用类型划分为道路、建筑、植被、水体、休耕土地、矿山和荒地,结果表明各种利用类型的精度均在83%~86%。

ISODATA算法简单具有较好的分类精度,同物异谱和同谱异物对ISODATA算法分类精度影像较大。传统的ISODATA算法以一整幅遥感影像为处理对象,边学习边分类,分类效率低,并行计算技术和ISODATA算法的结合解决了运算耗时问题。

2.4 深度学习分类方法

深度学习技术[62-65]的主要思想是利用神经网络进行信息识别,通过利用大量的样本进行训练,寻找样本数据内在的规律,得到最优训练模型,然后将待处理数据输入训练模型得到最优分类的过程。在影像识别领域,神经网络是最常用的分类方法。

2.4.1 BP神经网络分类算法

反向传播(back propagation,BP)神经网络[66-67]是按照误差反向传播的多层前馈神经网络,其基本网络结构有:输入层、隐藏层、输出层,结构示意如图4所示[66]。BP神经网络主要流程是由输入层接受待处理数据,然后由输入层神经元将数据传递到隐藏层,由隐藏层对数据进行计算处理,最后交给输出层,如果输出层收到数据不能满足预期,则由输出层反向传入隐藏层进行处理,并且修改参数,直至最终结果达到预期效果。

x1, x2,…, xn为输入数据;y1, y2,…, yn为输出数据图4 BP神经网络拓扑结构[66]Fig.4 BP neural network topology[66]

神经网络以数据为驱动,通过自动提取遥感影像中的高层语义特征来识别目标物的能力得到了广泛的应用。王佃来等[68]将BP算法和最邻近节点算法 (K-nearest neighbor,KNN)融合,融合后的算法在土地分类精度提高了6.43%。刘倩[69]研究了全卷积神经网络模型应用于遥感影像地物分类的可行性和优势,结果表明神经网络在本实验中相比其他分类方法均提高9%以上。吕京国[70]以常州市为实验区,选择航空影像数据,分别使用单一神经网络分类器和多种神经网络分类器集成的方式进行实验,结果表明BP神经网络在对四类地物分类总体精度达到79%。何爽等[71]以江苏省河口湿地为研究区,数据源选择Sentinel-2影像,使用遗传算法对神经网络中的阈值进行设定,研究湿地的土地利用情况,结果表明改进后神经网络在7类地物类型的总体分类精度提高了7%。肖国峰等[11]利用BP神经网络对廊坊市进行实验时发现,对于路面材质的提取精度最高达到91.4%。卢柳叶等[72]选择山西定襄县区域的LandSat影像为数据源,将神经网络融入了光谱信息、归一化植被指数(normalized difference vegetation index,NDVI)以及纹理信息,结果发现纹理信息和NDVI融合之后的神经网络比未改进的神经网络提高了6%以上。

神经网络于其他统计分类方法相比没有对数据的分布特征有任何假设限制,神经网络是非线性的,对特征空间较为复杂的影像数据分类时表现效果比传统分类方法更优。但随着神经网络层的增加,对计算机内存的消耗也是巨大的,未来在应用中如何降低对内存的消耗也是重点的研究方向。

2.4.2 空-谱结合的分类算法

空-谱结合的高光谱影像分类算法是一种将提取到的光谱特征信息和空间特征信息结合对高光谱影像进行分类的算法[73-74]。在传统的空-谱结合是先将影像数据进行主成分分析进行降维用一维卷积神经网络(one-dimensional convolution neural network,1D-CNN)将光谱信息特征提取出来,然后再用一个二维卷积神经网络(two-dimensional convolution neural network,2D-CNN)对影像数据对应的空间信息提取出来,将两次提取到信息进行计算完成分类。图5为卷积神经网络的基本结构示意[75],1989年CNN模型被首次提出,1998年计算机科研人员创造了LeNet模型[75],LeNet模型很小,但是却包括了CNN基本的五层结构,其中卷积层有3个,池化层有两个每一层都有不同的参数,目前其他深度学习模型都以其为基础进行改进。姚琼等[76]在对高光谱图像进行联合空谱特征进行分类时先提取光谱特征信息再提取空间特征信息模式,首先将原始的影像按光谱信息划分为多个子集,然后在子集上进行提取空间结构特征建立视图,实验结果表明,基于空谱特征建立视图进行分类精度最高达到99.73%,可见将空间特征信息和光谱信息进行有机结合可以更加清晰划分不同地物差异,提高分类精度。

图5 卷积神经网络的基本结构[75]Fig.5 The basic structure of convolutional neural network[75]

三维卷积神经网络(three-dimensional convolution neural network,3D-CNN)[77],3D-CNN可以在3个不同维度空间同时进行计算,与原来的一维加二维提取方式相比3D-CNN可以将提取光谱特征和空间特征的工作同时进行,不再像以前先提取光谱特征再提取空间信息,三维卷积核能够提取三维信息,可以使用两个维度提取空间特征信息,一个维度用来提取光谱特征信息。陈亨等[78]将3D-CNN计算过程拆解成三步计算,以此来降低计算成本,并且在帕维亚大学高光谱数据集上进行实验,实验结果表明,改进后的三维卷积神经网络对9种地物类别分类的总体精度高达95%以上,训练时间与未分解相比降低了16%。Chen等[79]提出了一种策略改进原始的三维卷积神经网模型,改进后的模型在提取光谱特征信息和空间特征信息时融合了正则化方法。袁静文等[80]利用高分五号高光遥感影像为实验数据,研究区域为江北核心区,实验方法是在空-谱联合算法的基础上进行改进,在提取影像数据中的光谱特征信息和空间特征信息时采用的是端到端的模式,并且对分类结果使用条件随机场方式进行再次细分。黄鸿等[81]使用帕维亚大学数据集和萨利纳斯山谷数据集作为实验数据,利用基于深度学习的空谱联合研究方法,对帕维亚大学区域和加利福尼亚州萨利纳斯山谷进行土地利用类型分类实验,实验结果表明,在1%的样本条件下总体分类精度达到90%以上,5%的样本条件下总体分类精度达到97%以上。谢幸雨等[82]在使用空谱联合提取地物信息时,在Indian Pines数据集上精确度为0.929,耗时762 s,在Pavia University精确度为0.914,耗时365 s。

实验结果表明,空-谱结合的分类算法较单一的基于光谱信息进行地物提取精度要高,而且对于遥感影像的同谱异物和同物异谱现象的存在,空-谱结合的分类算法可以通过加入空间特征信息结合神经网络模型有效地提高分类精度。空-谱结合的分类算法同样会因为数据维度的增加,计算效率下降,未来的研究可以从增加维度、提高效率方面进行研究。

3 土地利用分类方法综合分析

各种分类方法的最终目的都是将影像中的每个像元根据其在不同的波段、空间或其他信息中表现出来与其他周围像元不同的特征,依据一定的规则和算法将其进行归类。最简单的是依靠专业人士的专业经验对像元信息进行判断,随之便是利用单一光谱亮度值进行半自动化分类。复杂的分类方法不仅考虑像元在波段的光谱亮度值,同时结合该像元与周围其他像元之间的空间关系,如形状、方向性等信息,对像元进行归类。因此对于维度信息的增加,计算量同样也会增大,进而算法的计算效率会下降,但是分类精度有所提高。

目视解译主要依靠专业人士的专业知识对遥感图像的分析解译以及相应的光谱特征描述。通过解译标识的建立、类别的判断等工作完成土地利用分类,该方法过于依赖人的专业知识,面对海量影像数据分类效率不高,但是总体分类精度较高。

监督分类利用计算机自动分类,计算效率远高于目视解译方法,适用于大范围的研究区域,是目前遥感影像信息提取普及率较高的方法之一。监督分类可以根据研究区域和研究目的,充分利用该地区的先验经验,来决定分类类别,避免不必要的分类,可以通过对训练样本的控制与检查判断样本数据是否被精准分类,避免重大错误。由于监督分类中训练样本的选择人为因素较强,研究人员定义的分类类别可能并非影像中存在的类别,或者影像中某些类别没有被定义均会导致监督分类方法无法识别。

非监督分类不需要像监督分类预先对研究区域进行样本训练,降低了研究人员对样本分类差错导致的分类错误的概率,但是仍然需要经验丰富的研究员对分类集群进行解译。非监督分类只需要设定初始参数(迭代次数,误差阈值等)即可自动进行分类,而且可以识别影像中特殊的、小覆盖类别。由于分类之前没有进行过训练,其分类结果需要大量的分析,结果中的类别可能并非研究员所需要的类别,研究人员需要对结果进行类别匹配,而且分类集群会因光谱特征的变化(时间、地形变化)无法连续。

深度学习分类模型应用最广泛的是BP神经网络,神经网络对于待分类别的先验知识要求较少,计算过程高速并行,可以处理海量数据,处理特征空间较为复杂数据,在处理非线性分类时优势明显。由于神经网络层数确定并没有理论基础,目前均以实验确定,因此算法存在收敛速度慢,参数复杂,易限于局部极小,网络层和神经元个数难确定的局限。

针对各类分类方法中具有代表性算法的计算效率影响因数、精度、是否需要人工辅助、适用性等特点进行了分析,具体如表2所示。

从表2对比分析中可知,当样本数据量过大、分类目标不明确时,非监督的ISODATA算法最为合适;当处理的数据维度较高或者数据来源较多但数据规模小时,应选择支持向量机和随机森林方法;样本可训练时且有较好的训练模型,数据规模大可以采用基于深度学习的神经网络模型分类法。但是各种分类方法都有自身的局限性,在利用计算机分类后再依靠人工目视解译最后分类效果会更好。

4 结论与展望

光学遥感影像的土地利用分类近年来得到了深入的研究,虽然目前土地利用分类方法众多,也取得了一定的研究成果和进展,但是目前的分类方法都有各自的局限性。

表2 土地利用分类方法特点Table 2 Characteristics of land use classification methods

目视解译在中、高分辨率数据源下效果较好,方法简单,但效率低,难适应海量数据的分析。监督分类、深度学习的分类方法在进行分类之前需要对分类模型进行大量的训练,训练过程复杂,这导致很多训练之后的模型方法过于依赖训练样本出现过拟合现象,训练过程中一味增加训练次数可能导致分类精度下降。非监督分类不要预先训练,可以处理海量数据,处理流程主要是数据特征归类,较为简单,但是其分类结果和实际类别差距较大,精度不高,结果需人工进行模式匹配。

在对光学遥感影像土地利用分类方法进行总结的同时,以下问题也值得进一步探索。

(1)光学遥感影像本身包含大量的信息,对于影像数据在土地利用分类方面进行处理时缺乏大型的、已标记的公开数据集,在进行深度学习训练时,训练数据不足导致算法和模型对分类结果影响较大,光谱数据标记比较困难,人工标注代价太大。现阶段的神经网络应用都处于大样本、小任务的处理,研究构建高维、小样本数据集分类算法是重要的研究方向。

(2)数据维度过高在数据存储和处理方面都会非常困难,如何降低光谱数据维度,降低数据存储的开销也是光谱数据处理的一个难点。

(3)多数分类算法仅从数据的角度进行考虑,从应用需求出发,重视影像分类的地学解释和意义也是当下一个关注热点。

猜你喜欢
决策树土地利用精度
土地利用变化与大气污染物的相关性研究
热连轧机组粗轧机精度控制
基于GIS⁃Logistic回归模型的土地利用变化及驱动机制研究
中国地质大学(北京)土地利用与生态修复课题组
土地利用规划的环境影响评价分析
决策树和随机森林方法在管理决策中的应用
基于DSPIC33F微处理器的采集精度的提高
决策树学习的剪枝方法
决策树多元分类模型预测森林植被覆盖
以工匠精神凸显“中国精度”