基础性地理国情监测成果质量分析方法的研究

2021-01-26 08:35黄海英
地理空间信息 2021年1期
关键词:错漏国情图层

黄海英,熊 芬,张 博,史 乘

(1.湖北省测绘质量监督检验站,湖北 武汉 430074;2.湖北工业大学 体育学院,湖北 武汉 430068;3.湖北省航测遥感院,湖北 武汉 430074)

湖北省在2017 年和2018 年的基础性地理国情监测成果验收工作中,自主创新,设计包含了地表覆盖与国情要素错误的“监测成果错误数据集”。两年的验收工作形成了数量可观的成果检验数据,成果每年更新,检验工作每年进行,如何利用成果历史检验数据,有针对性地为后续开展的监测工作进行技术指导和质量控制,是值得质检工作者深入分析的问题。

1 数据来源

1.1 验收工作数据成果

成果检查采用程序自动检查、人机交互检查和人工比对检查3 种方式。检查中发现的数据质量问题形成“错误数据集.mdb”。湖北省验收总面积为18.59 万km2,包括103 个县级行政区划。根据规定要求,2017 年、2018 年分别抽取了11 个县级任务区作为样本进行验收,其中地表覆盖分类数据抽样采用了多阶段抽样方法,即对于成果采集精度和分类精度两项质量元素的检查,在县级测区范围内抽取不低于样本10% 面积的图幅进行详查[1]。验收抽样面积达3.1 万km2,2017 年和2018 年形成了包含县级任务区检查意见和分幅图检查意见在内的236 个样本“错误数据集.mdb”。

1.2 错误数据集设计

本文采用以Access 数据库为基础的个人地理数据库格式.mdb,设计样本错误数据集。该数据集中包括3 个数据层,层名和字段定义如表1 所示。

表1 错误数据集图层和字段定义

2 监测成果质量研究

质量研究的主要工作包括成果质量数据库建设、数据处理和数据分析,主要流程如图1 所示。

2.1 成果质量数据库构建

1)数据合并。利用Python 脚本语言编写批量处理命令代码,调用ArcPy 模块中的ListFiles 函数、ListFeatureClasses 函数、Append_management 函数[2]可对236 个样本“错误数据集.mdb”进行批量同图层合并,并存储到新建的个人地理数据库中(.mdb),即成果质量数据库。

图1 监测成果质量研究流程图

2)数据叠加。利用ArcMap 叠加分析功能将湖北省任务区范围界线数据链接到成果质量数据库,为成果质量数据库中所有图层添加样本名称、生产单位、任务区面积、样本量等字段。

2.2 数据处理

对成果质量数据库进行数据处理,利用ArcGIS 转换数据格式,输出地表覆盖点状错误图层(.xls)、地表覆盖分类精度错误图层(.xls)、国情要素错误图层(.xls)3 个文件。人工编辑提取“质量问题描述”、“所属质量元素”、“错误个数”、“错误字段”、“正确CC 值”、“错误CC 值”、“错误重要程度”等字段内容,并按照一定规则统一规范质量问题描述;再对各差错类别的主要问题描述进行关键字提取,合并同类问题,整理形成最终质量问题汇总表。

2.3 数据分析

最终质量问题汇总表包括2017 年、2018 年地表覆盖分类数据成果与地理国情要素数据成果的质量问题,分别对两类数据成果进行质量分析。

2.3.1 地表覆盖分类数据成果

地表覆盖分类数据成果在进行质量问题记录时,分类精度按照面积记录[1],其他质量元素按照个数记录,因此将地表覆盖分类数据分为两类进行质量透视分析。

1)分类精度错误统计。①对一级类分类错误与二三级类分类错误的面积进行统计,得到2017 年一级类分类错误的面积占比为91.16%,二三级类分类错误的面积占比为8.84%,2018 年一级类分类错误的面积占比为72.02%,二三级类分类错误的面积占比为27.98%;②对分类错误所属地类类别进行统计,按照一级类种植土地(01)、林草覆盖(03)、房屋建筑(05)、铁路与道路(06)、构筑物(07)、人工堆掘地(08)、荒漠与裸露地表(09)、水域(10)、地理单元(11)、地形(12)[3]共10 类统计错误面积,占比如图2所示;③对分类错误所属地类类别进行细分统计,统计每个一级类中被错分的地类类别,结果如图3 所示。

2)其他质量元素错漏统计。①对错漏类型所属质量元素进行统计,分别统计表征质量、采集精度、拓扑一致性、属性精度的错漏个数占比,2017 年分别为3.39%、63.29%、1.13%和32.19%,2018 年分别为4.15%、61.83%、7.88%和26.14%;②对错漏类型所属检查项进行统计,错漏类型包括属性不接边、Tag 赋值错误、ChangeType 赋值错误、面连续、图斑与影像套合超限、几何不接边、面折刺、极小面,错漏所属质量元素与个数占比如图4 所示。

图2 分类错误所属地类类别统计

图3 地表覆盖分类数据分类错误所属地类类别细分统计

图4 地表覆盖分类数据错漏类型所属检查项统计

2.3.2 地理国情要素数据成果

1)错漏所属质量元素统计。分别统计表征质量、逻辑一致性、属性精度、完整性、位置精度的错漏个数占比:2017 年为0.81%、3.85%、62.01%、9.63%和23.71%;2018 年为1.96%、15.36%、49.35%、19.61%和13.73%。

2)错漏所属图层统计。经分析,最终质量问题汇总表中国情要素质量问题出现在社会经济区域单元层的UV_BERA、UV_BERP、UV_BGBA,行政区划与管理单元层的UV_BOUA、UV_BOUL、UV_BOUP,城镇综合功能单元层的UV_BUCA、UV_BUCP,水域层UV_HYDA、UV_HYDL,铁路与道路层的UV_LCTL、UV_LLKL、UV_LRDL、UV_LRRL、UV_LVLL,构筑物层的UV_SFCA、UV_SFCL、UV_SFCP共计18 个图层中,各层错误占比如图5 所示。

3)UV_LRDL 公路层属性值错漏统计。公路层属性值错漏占比最高,因此单独对公路层错漏进行统计分析。按照属性值错漏所属字段分别统计错误个数,占比如图6 所示。

图5 地理国情要素数据错漏所属图层统计

图6 UV_LRDL 公路层属性值错漏频次统计

2.4 结果分析

在两年的验收工作中,成果未出现空间参考系、概念一致性、时间精度以及地表覆盖分类数据面缝隙、面重叠等属于“符合/不符合”性质的质量问题。该类问题通过质检软件自动检查[4],生产阶段便可进行有效控制。

2.4.1 地表覆盖分类数据成果质量分析

1)分类错误集中在种植土地、林草覆盖、水域3 大类,特别是种植土地和林草覆盖的二三级类的混淆。2017 年种植土地错分为林草覆盖的比例最高,2018 年水域错分为种植土地的比例最高。

2)地表覆盖分类数据中一级类错分的比例较高,2018 年较2017 年同比下降21%;但2018 年技术规定进行了修改[3],导致2018 年地表覆盖分类数据中ChangeType 赋值错误比例远远高于2017 年。

3)地表覆盖分类数据除分类精度外,2017 年的常见错误为图斑与影像套合超限、图斑属性不接边、ChangeType 赋值错误等;2018 年的常见错误为图斑与影像套合超限、ChangeType 赋值错误、几何不接边以及面连续等。出错比例最高的质量元素为采集精度,2017 年的错误占比为63.19%,2018 年的错误占比为51.87%,同比下降11.32%。

2.4.2 地理国情要素数据成果质量分析

1)地理国情要素数据质量问题主要集中在属性精度上。2017 年的属性精度错漏占比约为62%,2018 年的属性精度错漏占比约为49%。国情要素属性填写与地理国情要素生产流程有关[5],在生产前需收集民政、国土、环保、交通、水利、农业、林业、旅游、教育、卫生等多个行业的最新版专题资料数据,再分析、整理后应用到国情要素的采集和属性赋值中。从2017 年和2018 年的错漏占比来看,2018 年与2017 年同比下降20.97%,由于2018 年湖北省基础性地理国情生产单位成立技术专班,对收集到的专题资料进行了统一分析,详细规定了资料利用原则,有效提高了地理国情要素数据属性填写的正确性。

2)属性精度错漏最多的图层UV_LRDL(公路)在2017 年的错漏占比达52%,在2018 年的错漏占比为23%,同比下降55.77%。该图层错漏集中在ChangeAtt(更新字段说明)、WIDTH(路宽)、MATRL(铺设材料)、TYPE(类型)4 个字段。

2017 年、2018 年湖北省监测成果质量问题数量逐年减少,质量水平总体发展呈上升趋势,得益于监测技术部门对质量问题产生原因的分析,找到了生产作业中应关注的重点和薄弱点,制定了相应的改进措施,避免了后期生产出现同类型的质量问题,从而保障监测成果质量不断提高。

3 结 语

本文建立统一标准的错误数据集和规范化的错误描述库,收集整理各级质检形成“错误数据集.mdb”,结合Python 中的ArcPy 模块建立年度成果质量数据库。本文通过对成果质量数据库构建方法的研究以及对建库数据的统计分析,确定了质量问题产生的原因并提出了科学有效的建议,为对持续性地理国情监测工作进行有效质量控制提出了一个新思路,为建立科学合理的自然资源质量管控体系起到了一定的参考作用。

猜你喜欢
错漏国情图层
数字化防错漏装技术应用研究
家国情 诗词魂
不能将错漏百出的读本发给学生使用
浅析数学课堂教师追问的艺术
推广生物乙醇汽油:迫切且合乎国情
巧用混合图层 制作抽象动感森林
1∶10 000 DLG质量检查及质量评定方法
图层法在地理区域图读图中的应用
地理国情监测知识支持库初步设计
跟我学添加真实的光照效果