面向遥感数据下土地资源分类方法的比较分析

2021-11-15 03:58赵俊祥
科技与创新 2021年21期
关键词:训练样本精确度分类器

赵俊祥

(城乡院(广州)有限公司,广东 广州 510000)

在近年来的科技发展中,由于遥感技术的进步,数据采集方法的优化,基于遥感技术的应用需求持续增加,遥感数据技术的应用领域变得更加广泛。采用遥感技术可以获取到多样化的地表信息数据,还可以分析预测到地表的动态变换趋势,能收集多样化的微观层面数据变换,在土地资源勘测工作中可以节省大量的人力、物力并提升效率。借助遥感技术可以对特定区域的土地资源分布、覆盖范围加以监测和分类,这也是土地资源分类中最为迅速也是更可靠、理想的方法之一。本文结合Ensemble-ELM 分类器的特点[1],分析了应用多通道分割算法的测试SAR 数据表达方法[2],与单个ELM、SVM 分类器[3-4]、随机分类器[5]、KNN 分类器加以对比分析,研究后评估采用集成ELM 分类算法的优势与不足。

1 某研究地区土地资源分类方法比较

以广州市增城区某区域为例,研究范围分为水域、植被、城市和乡村。在比较实验中,地面区域参考图中已对地表类的样本点加以标注,累计有8 038 个,包括训练样本803 个、测试样本7 235 个,不同地物类别的待测样本与测试样本数量如表1 所示。

表1 增城某地区待测训练样本点、测试样本点数目

1.1 图像对比

对于采用多通道分割算法[2]分析某地区SAR 图像加以分类,方法分别为集成ELM、单个ELM、SVM、随机森林、KNN 分类。其中ELM 中文名为极限学习机,它作为人工神经网络学习中一个最新出现的用于训练数据的模型,被充分地应用于人类多样化情感识别、人体行为方式识别以及系统故障检查测试等诸多方面,被很多领域的专家学者所关注。而集成ELM 则是在此方法基础上的扩展与集成,相对更有优势。依据分类图中的数据,与地面的实际参考图加以对比,借助实验确定的训练方法与样本、地表中确定的标记数据分类后加以评估。此方法可以用于判定使用的分类是否合理,验证采用的分类方法是否准确,为分析提供准确的数据支持。在精度评估比较中,不用借助图片中相关图像数据,只利用所确定的训练样本即可实现。

1.2 精度对比

本文借助四个精度指标加以评估分析:生产方精确度(Producer’s Accuracy,PA)、用户精确度(User’s Accuracy,UA)、总体精确度(Overall Accuracy,OA)、Kappa 系数(Kappa Coefficient,KC)。指标的详细说明如下。

生产方的精确度(PA):此种分类中,对于任何一个待测资源,此类别确定训练样本,可以正确表达此种类别的发生概率。

用户精确度(UA):这种分类中,对于任一类待测样本而言,分类在此类别中的各类训练样本,可以分析类别的发生概率。

总体精确度(OA):表明准确分类后的训练样本累计数量(面向各类地物类型)占整个累计训练样本数的比例,相除得到结果,可以反映分类结果的正确度。

Kappa 系数(KC)[6]:这种方法由 Cohen 在 1960 年首次创立,采用随机分类的方法体现指标,可以应用于校验一致性,也能应用于分类精度的分析。由于其有着非常好的适用性,而被医学、人口普查与统计、遥感等行业广泛地使用。通常来说,Kappa 系数变动处于0~1 范围内,Kappa 数值大表明更高精度的分类:0.0~0.2 表明极低条件下存在一致性(slight),0.21~0.4 表明存在一般条件近似性(fair),0.41~0.60 表明存在中等一致性(moderate),0.61~0.80 表明存在高度一致性(substantial),0.81~1 表明几乎完全一致(almost perfect)。Kappa 综合体现了不同图像分类的错误分类、未被分类、正确分类的结果,可以全面、有效、准确地表达算法的优势与分类精度。

2 结果分析

对广东某地区土地资源的分类精度加以研究,采用Ensemble-ELM 分类器、单个ELM、SVM 分类器、RF 分类器、KNN 分类器的数据结果的精确度分别对应为92.52%、90.46%、85.58%、75.30%和74.35%。Kappa 系数分别为0.898、0.870、0.825 8、0.664 5 和 0.653 9。不同单个ELM 算法的应用,本次研究采用Ensemble-ELM 分类器可以使分类后的整体精度提高约2.1%,Kappa 系数可以提高约0.028。水域和植被两种地物采用单个ELM 与Ensemble-ELM 分类器,这两种分类器的精度都可以保证。但是从待测类别的分类结果来分析,采用Ensemble-ELM 分类器具有优势,这种方法可以提升各类待测地物的生产方精度和使用方精度,对比结果表明集成策略的应用和ELM 加以结合,可以提升ELM 性能,应用于遥感图像的数据分类具有可靠的结果,采用Ensemble-ELM 分类器可以满足SAR 图像分类相关标准。另外,结合广州市增城区某区域识别出的地物特点与类别,可以看出Ensemble-ELM 分类器可以提高生产者精确度,还可以保证用户精确度。从各方面数据做对比也可以看出RF 分类器和KNN 分类器精度相对较差,均只有75%左右。

对比几种方法的分类效率,上述对比实验均在同一系统上执行。Ensemble-ELM 全过程用时消耗约为30 s,采用单个ELM 的时间消耗约为28 s,SVM 的时间消耗280 s,RF训练时间约为120 s,KNN 的时间消耗约为370 s。Bagging集成处理是对各类弱分类器采用串行方式加以组合完成训练,训练Ensemble-ELM 需要的时间会增加,另外单个ELM训练的时间也会增加,集成模型的应用增加了计算过程的时间消耗,但是可以提升分类的稳定性。不同于RF、KNN 与SVM,这种算法应用于SAR 图像分类任务有速度上的优势,可以满足土地资源分类的实际需求。

3 总结

对采用多通道模式下的分割算法得到的SAR 图像加以地物方面的分类,可以验证集成ELM 分类器具有的普适性。另外,此类方法具有预测作用,计算效率与单个ELM、SVM、随机森林、KNN 加以对比,结果表明,Ensemble-ELM 应用于资源分类可以提高预测的准确性,虽然Ensemble-ELM 应用于模型分析与预测样本消耗的时间高于单个ELM,但综合来看,这是一种特别有效的方法,也充分说明该方法可以应用于本研究区域之中。另外展望未来,也将会把该方法应用于自然资源监测中,从而提高相应工作的效率。

猜你喜欢
训练样本精确度分类器
少样本条件下基于K-最近邻及多分类器协同的样本扩增分类
学贯中西(6):阐述ML分类器的工作流程
基于朴素Bayes组合的简易集成分类器①
人工智能
放缩法在递推数列中的再探究
基于AdaBoost算法的在线连续极限学习机集成算法
数形结合
基于小波神经网络的网络流量预测研究
近似数1.8和1.80相同吗