面向遥感数据下土地资源分类方法的比较分析

2021-11-15 03:58赵俊祥

科技与创新 2021年21期

赵俊祥

（城乡院（广州）有限公司，广东广州 510000）

在近年来的科技发展中，由于遥感技术的进步，数据采集方法的优化，基于遥感技术的应用需求持续增加，遥感数据技术的应用领域变得更加广泛。采用遥感技术可以获取到多样化的地表信息数据，还可以分析预测到地表的动态变换趋势，能收集多样化的微观层面数据变换，在土地资源勘测工作中可以节省大量的人力、物力并提升效率。借助遥感技术可以对特定区域的土地资源分布、覆盖范围加以监测和分类，这也是土地资源分类中最为迅速也是更可靠、理想的方法之一。本文结合Ensemble-ELM 分类器的特点[1]，分析了应用多通道分割算法的测试SAR 数据表达方法[2]，与单个ELM、SVM 分类器[3-4]、随机分类器[5]、KNN 分类器加以对比分析，研究后评估采用集成ELM 分类算法的优势与不足。

1 某研究地区土地资源分类方法比较

以广州市增城区某区域为例，研究范围分为水域、植被、城市和乡村。在比较实验中，地面区域参考图中已对地表类的样本点加以标注，累计有8 038 个，包括训练样本803 个、测试样本7 235 个，不同地物类别的待测样本与测试样本数量如表1 所示。

表1 增城某地区待测训练样本点、测试样本点数目

1.1 图像对比

对于采用多通道分割算法[2]分析某地区SAR 图像加以分类，方法分别为集成ELM、单个ELM、SVM、随机森林、KNN 分类。其中ELM 中文名为极限学习机，它作为人工神经网络学习中一个最新出现的用于训练数据的模型，被充分地应用于人类多样化情感识别、人体行为方式识别以及系统故障检查测试等诸多方面，被很多领域的专家学者所关注。而集成ELM 则是在此方法基础上的扩展与集成，相对更有优势。依据分类图中的数据，与地面的实际参考图加以对比，借助实验确定的训练方法与样本、地表中确定的标记数据分类后加以评估。此方法可以用于判定使用的分类是否合理，验证采用的分类方法是否准确，为分析提供准确的数据支持。在精度评估比较中，不用借助图片中相关图像数据，只利用所确定的训练样本即可实现。

1.2 精度对比

本文借助四个精度指标加以评估分析：生产方精确度（Producer’s Accuracy，PA）、用户精确度（User’s Accuracy，UA）、总体精确度（Overall Accuracy，OA）、Kappa 系数（Kappa Coefficient，KC）。指标的详细说明如下。

生产方的精确度（PA）：此种分类中，对于任何一个待测资源，此类别确定训练样本，可以正确表达此种类别的发生概率。

用户精确度（UA）：这种分类中，对于任一类待测样本而言，分类在此类别中的各类训练样本，可以分析类别的发生概率。

总体精确度（OA）：表明准确分类后的训练样本累计数量（面向各类地物类型）占整个累计训练样本数的比例，相除得到结果，可以反映分类结果的正确度。

Kappa 系数（KC）[6]：这种方法由 Cohen 在 1960 年首次创立，采用随机分类的方法体现指标，可以应用于校验一致性，也能应用于分类精度的分析。由于其有着非常好的适用性，而被医学、人口普查与统计、遥感等行业广泛地使用。通常来说，Kappa 系数变动处于0～1 范围内，Kappa 数值大表明更高精度的分类：0.0～0.2 表明极低条件下存在一致性（slight），0.21～0.4 表明存在一般条件近似性（fair），0.41～0.60 表明存在中等一致性（moderate），0.61～0.80 表明存在高度一致性（substantial），0.81～1 表明几乎完全一致（almost perfect）。Kappa 综合体现了不同图像分类的错误分类、未被分类、正确分类的结果，可以全面、有效、准确地表达算法的优势与分类精度。

2 结果分析

对广东某地区土地资源的分类精度加以研究，采用Ensemble-ELM 分类器、单个ELM、SVM 分类器、RF 分类器、KNN 分类器的数据结果的精确度分别对应为92.52%、90.46%、85.58%、75.30%和74.35%。Kappa 系数分别为0.898、0.870、0.825 8、0.664 5 和 0.653 9。不同单个ELM 算法的应用，本次研究采用Ensemble-ELM 分类器可以使分类后的整体精度提高约2.1%，Kappa 系数可以提高约0.028。水域和植被两种地物采用单个ELM 与Ensemble-ELM 分类器，这两种分类器的精度都可以保证。但是从待测类别的分类结果来分析，采用Ensemble-ELM 分类器具有优势，这种方法可以提升各类待测地物的生产方精度和使用方精度，对比结果表明集成策略的应用和ELM 加以结合，可以提升ELM 性能，应用于遥感图像的数据分类具有可靠的结果，采用Ensemble-ELM 分类器可以满足SAR 图像分类相关标准。另外，结合广州市增城区某区域识别出的地物特点与类别，可以看出Ensemble-ELM 分类器可以提高生产者精确度，还可以保证用户精确度。从各方面数据做对比也可以看出RF 分类器和KNN 分类器精度相对较差，均只有75%左右。

对比几种方法的分类效率，上述对比实验均在同一系统上执行。Ensemble-ELM 全过程用时消耗约为30 s，采用单个ELM 的时间消耗约为28 s，SVM 的时间消耗280 s，RF训练时间约为120 s，KNN 的时间消耗约为370 s。Bagging集成处理是对各类弱分类器采用串行方式加以组合完成训练，训练Ensemble-ELM 需要的时间会增加，另外单个ELM训练的时间也会增加，集成模型的应用增加了计算过程的时间消耗，但是可以提升分类的稳定性。不同于RF、KNN 与SVM，这种算法应用于SAR 图像分类任务有速度上的优势，可以满足土地资源分类的实际需求。

3 总结

对采用多通道模式下的分割算法得到的SAR 图像加以地物方面的分类，可以验证集成ELM 分类器具有的普适性。另外，此类方法具有预测作用，计算效率与单个ELM、SVM、随机森林、KNN 加以对比，结果表明，Ensemble-ELM 应用于资源分类可以提高预测的准确性，虽然Ensemble-ELM 应用于模型分析与预测样本消耗的时间高于单个ELM，但综合来看，这是一种特别有效的方法，也充分说明该方法可以应用于本研究区域之中。另外展望未来，也将会把该方法应用于自然资源监测中，从而提高相应工作的效率。