基于百度地图API的专题数据处理技术在地理国情普查中的应用

2015-06-28 06:15尹言军叶琳刘玉春余咏胜秦艳华
城市勘测 2015年4期
关键词:国情普查数据处理

尹言军,叶琳,刘玉春,余咏胜,秦艳华

(武汉市测绘研究院,湖北 武汉 430022)

1 引 言

地理国情主要是指地表自然和人文地理要素的空间分布、特征及其相互关系,是基本国情的重要组成部分。地理国情普查是一项重大的国情国力调查,是全面获取地理国情信息的重要手段,是掌握地表自然、生态以及人类活动基本情况的基础性工作。在地理国情普查中,对专题数据资料的性准确性、现势性都提出了较高的要求:需要搜集并利用各专业部门拥有的现势性较好、规范程度较高的行业专题数据,为普查工作提供重要参考依据,特别是一些专业性较强的专题属性内容,行业专题数据可以发挥重要作用,应尽可能收集利用。

武汉市地理国情普查收集到了武汉市发改委、市教育局、市公安局等28 家委办局的专题数据资料。这些数据资料具有数量大、来源复杂、时间跨度大等特点,且多为文本资料,经整理分析后需要将大部分数据资料进行空间定位表示,如学校、医院、旅游景点、酒店等。为进一步提高专题数据空间定位的作业效率,改善目前人工定位耗时长,缩短作业周期,本文利用百度地图API 和FME(Feature Manipulate Engine)软件中对专题数据处理技术进行了研究和探讨。

2 百度地图API 和专题数据

当前,百度地图提供免费的API,且百度地图API是一套由JavaScript 语言编写的应用程序接口,通过这些接口可以在网站中构建功能丰富、交互性强的地图应用等功能。百度地图API 不仅包含构建地图的基本功能接口,还提供了诸如地址信息查询、本地搜索、路线规划等数据服务。利用百度地图API 可对专题数据中的单位进行地址解析和逆解析,从而实现空间定位。FME 软件是一个空间数据的提取、转换、处理的强大工具,提供了多源数据处理和应用的解决方案,用户可以根据项目实际需求建立具有特色的空间数据处理模型,实现数据之间的转换、处理;它还提供网络地图访问服务,可批量实现专题数据中单位的空间定位。

百度地图上单位也就是POI(Point of Interest),这些POI 主要分布在道路周边,基本上涵盖了地理国情普查中的单位院落,但由于现势性参差不齐,名称更新不及时、数据加密等原因造成名称错误、定位精度降低,且定位点的要求与地理国情要素中的定位要求、精度要求存在不同。

地理国情普查中对要采集的专题数据的空间定位要求如下,其定位点一般定位在城镇综合功能单元的主要出入口或大门口的中心处。当一个单位院落同时包含学校、医院、政府、社会福利机构等四类单位院落时,行业代码需表示相关分类,用“/”分隔开;如同一个地址包含多个单位院落(分别挂牌,如医院与社会福利机构共用一个地址)时,采集一个定位点并赋不同属性,用“/”隔开。除该四类单位院落外,几个单位院落共用同一个地址时,一般只采集一个点,属性填写行政等级最高或规模最大、最主要单位的相关属性值。

尽管百度地图在定位点要求和现势性方面存在不足,但在专题数据整理时,可以参考利用百度地图中的POI 信息,提高专题资料整理和空间定位的效率。

3 专题数据处理技术的实现

3.1 专题数据处理方法与实现

专题数据作为地理国情普查数据的重要来源之一,具有很强的现势性、权威性,专题数据的定位和应用进一步增强了地理国情数据的权威性和现势性,但收集到的专题数据与大部分是文本形式,多为描述性信息如名称、地址、电话等信息,给专题数据的整理和空间定位带来了极大的挑战。

以学校专题数据为例,所收集到的学校专题数据(如图1 所示),包含序号、学校名称、所属区、学校标识码、学校地址、组织机构代码、学校属地管理教育行政部门名称、学校所属主管教育行政部门代码、办学类型、规模属性信息,这些资料信息中学校名称、所属区、办学类型可以利用并转换应用到城镇综合功能单元中的NAME(名称)、ADMNGD(归属)、TYPE(行业代码)属性中去。

图1 学校专题数据内容

FME 软件中提供了HTTPFetcher、JSONExtractor、2DpointReplacer、EsriReprojector 等转换器,可以进行地名地址的查询,将查询后的地址分离过滤后生成坐标点,并使投影转换后与所使用基础数据的坐标系保持一致;具体方法如下:

首先,根据数据资料利用StringConcatenator 函数生成查询语句,格式类似于http://api.map.baidu.com/geocoder?address=@ Value(名 称)&output=$(output)&key(key)&city=$(city);并将该字段赋给HTTPFetcher 进行地名查询。利用JSONExtractor 提取获取到的经纬度坐标信息,并添加语句json["result"][" location"][" latitude"],查询出纬度(latitude),经度(Longitude)的查询也类似。

其次,利用tester 过滤掉经纬度不在测区范围内的数据,然后生成点坐标。

最后,利用EsriReprojector 进行投影转换,Offsetter进行平移、调整到大概位置,并输出成初步结果。专题数据处理模型如图2 所示。

图2 专题数据处理模型

3.2 匹配结果的坐标校正处理

百度地图是公开版电子地图,其表示要符合《公开地图内容表示若干规定》、《公开地图内容表示补充规定(试行)》、《基础地理信息公开表示内容的规定(试行)》《导航电子地图安全处理技术基本要求》等规范和要求,其中要求位置精度不得高于50 m,经过加密处理会有偏移,且分布不均匀,因而需要对初步成果数据进行校正。该处理方法虽不能还原百度地图数据的精度,但可以极大地接近其真实地理位置。

在同一坐标系下,均匀选取一定数量的初步成果数据和真实坐标位置的公共点,并记录两者之间的坐标偏移信息,生成矢量数据格式或在FME 软件中用相应的转换器进行转换,再使用AffineWarper 进行坐标转换,即可得到较为准确的数据结果。专题数据坐标校正处理模型如图3 所示。

图3 专题数据坐标校正处理模型

3.3 专题数据处理结果分析

为验证本文提出的专题数据处理技术的效率、准确程度及本文本方法的可行性,以学校、医院这两类专题数据进行了对比和实验。

学校专题数据包含大学、中学、小学、幼儿园等,总共有1 112所学校,程序运行时间5 min,匹配成功876所,成功匹配率78%;医院专题数据包含480 个,程序运行时间2.5 min,匹配成功336 个,成功匹配率70%。

利用匹配成功后的专题数据根据地理国情普查中的城镇综合功能单元定位要求,将定位点定位到主要出入口或大门口的中心处。利用整理后的数据成果和整理前同一单位进行对比分析,按距离大于100 m(含)、50 m(含)~100 m、小于50 m进行分析,分析结果如表1 所示:

专题数据整理后和整理前的比较分析(单位/个) 表1

通过实际利用比较匹配成功率70%以上,由于百度数据源的现势性、全面性不得而知,部分单位定位不成功,故匹配成功率、各个分段的比例也不完全一致。总体而言,其利用百度地图API 技术处理专题数据的结果比较理想,该技术实现批量化操作,很大程度上减少了专题数据处理的复杂性,提高了专题数据处理的准确性、高效性和实用性。对于未匹配成功的数据需要根据多方资料进行核实定位,必要时根据外业调查进行核查确定。

4 结 语

本文利用百度地图API 在FME 软件中实现地理国情普查中专题数据的空间定位,充分发掘和利用了搜集到的专题数据资料的价值和利用程度,有效地改善目前专题数据定位效率低下,提高了工作效率。实际生产应用过程中,大部分专题资料可以利用百度地图中的POI 数据信息进行定位,但需要逐一核实检核,以免地图现势性不够造成定位错误;对于没有匹配成功的数据,需要进一步搜集多方数据进行定位,也可在外业调查核查时重点核查。

该方法在地理国情普查项目生产中弥补了现有基础地理信息数据现势性不足。与常规专题数据定位方式相比,本文方法利用公开版网络地图提供的数据接口进行空间定位,明显地提高了生产效率,缩短了作业周期,同时最大限度地减少了重复工作,可以为地理国情普查工作中专题数据空间定位提供了一种技术解决方法;同时该方法有效地利用了多源地理信息,做到了多源数据的互补和融合利用,也是多源数据融合应用的一次尝试,具有较强的实际应用价值。

[1]罗名海.地理市情监测研究[J].地理空间信息,2012,10(5):1~4.

[2]使用FME 实现电子地图应用之地址解析.[EB/OL].2013-09-02:http://blog.163.com/antufme@126/blog/static/140492492201382921340/

[3]张志军,李霖,于忠海等.多尺度地理市情监测专题地图表达研究[J].测绘通报,2014(9):115~118.

[4]李德仁,眭海刚,单杰.论地理国情监测的技术支撑[J].武汉大学学报·信息科学版,2012,37(5):505~512.

[5]刘成宝,杜洪涛,张坤.面向地理国情普查的济南市地理信息数据库建设[J].测绘与空间地理信息,2014,37(9):66~68.

[6]国务院第一次全国地理国情普查领导小组办公室.地理国情普查内容与指标[M].北京:测绘出版社,2013.

猜你喜欢
国情普查数据处理
立即全面普查 警惕二代粘虫发生
认知诊断缺失数据处理方法的比较:零替换、多重插补与极大似然估计法*
基于低频功率数据处理的负荷分解方法
胡春华强调:确保脱贫攻坚普查取得圆满成功
ILWT-EEMD数据处理的ELM滚动轴承故障诊断
悠悠游子心 深深家国情——一个普通海外留学生的成长
家国情 诗词魂
推广生物乙醇汽油:迫切且合乎国情
关于农业文化遗产普查与保护的思考
基于希尔伯特- 黄变换的去噪法在外测数据处理中的应用