地学多源数据集成方法分析与应用

2014-01-12 08:32刘英才路来君付俊张广宇那福超
地质与资源 2014年6期
关键词:数据格式中间件空间数据

刘英才 ,路来君 付俊 ,汪 岩 ,张广宇 ,那福超

(1.吉林大学,吉林长春130061;

2.沈阳地质矿产研究所/中国地质调查局沈阳地质调查中心,辽宁沈阳110034)

1 概述

从20世纪60年代末世界上第一个地理信息系统——加拿大地理信息系统(CGIS)诞生[1],到21世纪国内GIS软件行业的蓬勃兴起,经过40多年的发展,经历了专家应用阶段和企业应用阶段,现今正向着三维地理信息系统(3D GIS)、网络地理信息系统(WebGIS)、开放式地理信息系统(OpenGIS)等社会化GIS时代的几个重点方向发展.随着GIS系统在社会多领域中的广泛应用,需要集成多种数据源以及不同格式的数据才能完成GIS应用,所以多源数据集成方法就成为实现GIS应用的关键性技术.

不同的GIS软件都有各自不同的数据格式,导致了空间数据异构性的产生.从广义上讲,多源空间数据可以包括多数据来源、多数据格式、多时空数据、多比例尺(多精度)、多语义性几个层次[2].从狭义上讲,多源空间数据主要是指数据格式的多样式,包括不同数据源的不同格式及不同数据结构导致的数据存储格式的差异[3].随着地学信息资源的不断积累、信息技术的发展、信息化的程度越来越高,依据信息进行决策的程度也越来越高.基于地质行业标准和社会实际应用为目的的多源数据信息的集成开发和利用将是推进国家地质工作不断前进的动力,是更好地为地调科研和社会大众服务的保障.

2 地学多源数据的形成

地学数据是地调成果资料的汇总和集成,是地质调查信息化建设的重要体现.经过多年的数据积累产生的已有数据存在多源、异构、多时空、多尺度、不同坐标系等复杂多样性问题,导致了多源空间数据的产生.

(1)多源性:地学数据采集方式不同,包括来自采集系统、图表、遥感、GPS、掌上机等手段;数据存储格式不同,不同的GIS软件采取不同的文件存储格式;另外还包括与地质实体相关的属性信息等,采用不同的技术要求.

(2)异构性:数据库结构不一致,采用的规范标准不同.各专业标准间协调性差,各行其是,造成数据标准的多样性,不利于使用.

(3)多时空性:地学数据源既有同一时间不同空间的数据系列,也有同一空间不同时间序列的数据,不同时期建立的数据源受当时技术条件和认知水平的影响,表达的信息量不尽相同.

(4)多尺度性:对地理现象和过程及过程时空特征的认知通过地学空间数据来表达,使得空间数据具有空间维和时间维,而从尺度角度来描述,则对应着空间尺度[4].空间数据的空间尺度通过比例尺来表达,目前常用的地质图空间数据库的尺度就有1∶5万、1∶20万、1∶25万、1∶50万等,不同比例尺代表着不同的数据精度.

(5)不同坐标系:不同来源的空间数据有着不同的坐标系和不同的投影方式.常使用地理坐标系和投影坐标系:我国地形图和地质图大多采用北京54坐标系或者西安80坐标系,而GPS采集的信息是WGS84坐标系,这些都是地理坐标系;平时经常用到的投影坐标系有高斯-克吕格投影坐标系和兰伯特投影坐标系.

地学空间数据集成的目的是为了实现异构数据源、不同GIS应用系统、不同操作系统和平台之间无损的数据共享,应该具备简单、透明、开放、有效等特征.在统一标准和运行模式下,在国家级信息服务框架中,加强数据库管理与应用研究,建立基础地学数据库集成管理体系,提高数据二次开发利用和开放式社会化服务水平.

3 几种数据集成方法

集成(Integration)是指通过结合分散的部分形成一个整体[5].从逻辑上分析,数据集成指不同来源、格式、特征的地学数据逻辑上或物理上的有机集中.有机是指数据集成时充分考虑了数据的空间、时间和属性特征,以及数据自身及其表达的地理特征和过程的准确性[6].空间数据集成技术主要有3种方法:数据格式转换、数据互操作、直接访问.

3.1 数据格式转换法

数据格式转换是最基本的空间数据集成方式,也是GIS系统数据集成的主要办法.它是不同GIS系统的数据格式之间的直接转换,比如从ArcView的Shape格式转换为MapGIS的数据格式,这种方式不仅会导致信息损失,而且只有在详细掌握对方数据结构的前提下才能实现.

3.2 数据互操作法

数据互操作模式是OpenGISConsortium(OGC)制定的数据共享规范.GIS互操作是指在异构数据库和分布计算的情况下,GIS用户在相互理解的基础上,能透明地获取所需的信息[7].采用空间数据交换格式标准作为中介实现不同GIS之间的数据转换.国际标准化组织(ISO)和OGC推出的GML数据格式,可以作为空间数据交换格式的标准,但这些数据格式转换标准一般都很复杂,需要投入较大资金和精力去支持和维护.

3.3 直接访问法

基于直接访问的数据集成是一个GIS系统直接读取多个数据源不同格式的数据,避免了数据格式转换的繁琐过程,提供了一种较为经济实用的数据互操作模式.它将GIS带入了开放式的时代,从而为空间数据集中式管理和分布存储与共享提供了操作的依据.直接访问数据的前提是要充分了解数据源的数据格式和数据模型,如果某个数据源的数据不公开,直接访问其数据就比较困难.

4 多源数据集成方法应用

4.1 基础GIS系统的选择

在通用商业GIS软件中,ArcGIS和MapGIS占据国内的主要GIS软件市场.从MapGIS 7.0以后的产品,提供了完善的空间数据仓库解决方案,实现了强大的多源异构的空间数据管理功能.

MapGISK9采用地理数据库(GDB)管理空间和非空间数据,GDB企业管理器是面向实体空间数据模型的全局视图,完整、一致地表达了被描述区域的地理模型.一个地理数据库包括1个全局的空间参照系、1个域集、1个规则集、多个数据集、多个数据包和各种对象类.因此通过该管理器可以很好地对地质图数据进行管理,可以创建空间要素数据集合,包括要素类、对象类、注记类、关系类、CAD类、简单要素类等.非空间数据集合包括Excel表、Access表、txt文本等.平台采用中间件的方式支持在MapGIS平台下对异构数据的浏览和更新.

4.2 数据中间件

动态投影技术、中间件技术和分布式管理技术实现了不同空间参考和不同格式数据间的逻辑拼接和叠置,使用户能在统一的空间参考和同一个系统操作界面上访问多个物理数据库中的数据[8].中间件是一种独立的系统软件或服务程序,分布式应用软件借助这种软件在不同的技术之间共享资源,中间件位于客户机服务器的操作系统上,管理计算机资源和网络通讯[9].

在传统的二层体系结构下,一般客户端是从数据库直接读取所需要的数据,而在三层体系结构下,数据中间件是联系客户端和数据库的中介,客户端应用程序不再直接访问数据库,而是访问中间件,中间件再访问数据库进而传回访问的数据给客户端显示.它实际上就是空间数据引擎(Spatial-data Engine),具有统一的接口,封装成动态连接库(Dynamic Linking Library).在GIS软件启动时自动搜索,动态调入并注册.

中间件就是MapGIS平台和异构数据之间的桥梁.根据MapGISK9平台的实际应用背景,将MapGISK9中间件划分为两类:数据中间件和功能中间件.数据中间件提供应用程序直接访问多源异构数据的途径,从而达到在MapGISK9平台上整合数据资源目的.功能中间件包括:ArcGIS中间件、ArcSDE中间件、VCT中间件、MapInfo中间件、AutoCAD中间件、Oracle中间件及OGR中间件.

4.3 地学数据集成

空间数据、集成GIS软件及集成规则是地学数据集成的3个必备条件.空间数据是集成的对象;软件是可以处理空间特征、属性特征及其之间关联的通用或专用GIS软件;集成规则是进行数据集成的依据.地学数据库按照“地学数据库—数据集—类”这几个层次进行数据组织(详见图1),数据集成软件采用地质行业通用MapGIS系统,通过平台支持异构空间数据的功能,对地学空间数据进行集成管理(详见图2).

规则集包括4种类型的规则:属性规则、连接规则、关系规则、拓扑规则.为地学数据库建立空间拓扑规则,用灵活的方式来确定和维护空间数据的质量和完整性.拓扑是用来描述空间实体的邻接,连通,邻近和重叠关系.它的实现依赖于一组完整性规则,定义了空间相关的地理要素和要素类的行为.拓扑规则包括3种:点拓扑规则,线拓扑规则,多边形拓扑规则.通过规则创建向导可以建立不同的点、线、面拓扑规则,具体操作见图3所示.

图1 地学数据组织结构图Fig.1 The structureofgeologicaldata

图2 地学数据库集成管理Fig.2 The integratedmanagementofgeologicaldatabase

图3 多边形拓扑规则的建立Fig.3 The creation ofpolygon topological rules

通过专业GIS软件平台,集成空间数据(点、线、面)和外部数据集.首先,建立地学数据库,并添加1∶5万地质图空间数据库,并导入外部表格数据,表格数据属于一种特殊的类——对象类,它没有空间特征,是可关联某种特定行为的表记录.同时也可导入其它类型空间数据或关系型数据库,实现了同时管理地质图空间数据库和地质工作程度等关系型数据库的功能,多源数据集成显示效果如图4所示.同理,可集成mif、e00、shp、dxf等多种数据源,从而在数据无损的情况下,进行多类型数据的集中管理.

图4 地学多源数据显示效果Fig.4 The display ofmulti-source geologicaldata

5 结束语

经过了十几年的地质调查信息化建设,取得了一定的数据成果,同时也发现了许多不足的地方,如何科学的管理数据,如何有效开发应用,是今后工作的方向和重点,以需求为导向,采用数据集成等新方法和新技术,更好地提高地质信息的利用效率和效能,充分发挥地质调查信息社会化应用的作用.

[1]闵连权.地理信息系统的发展动态[J].地理学与国土研究,2002,18(4):19—24.

[2]钟耳顺,王康弘,宋关福,等.GIS多源数据集成模式评述[A]//1999年中国GIS年会论文,深圳,1999.

[3]马照亭,潘懋,林晨,等.多源空间数据的共享与集成模式研究[J].计算机工程与应用,2002,32(24):31—34.

[4]许辉熙,卢正,薛万蓉.GIS中多源空间数据集成方法研究[J].测绘与空间地理信息,2009,32(5):1—5.

[5]李军,费川云.地球空间数据集成研究概况[J].地理科学进展,2000,19(3):203—211.

[6]李军,周成虎.地球空间数据集成多尺度问题基础研究[J].地球科学进展,2000,15(1):48—52.

[7]宋关福,钟耳顺,刘纪远,等.多源空间数据无缝集成研究[J].地理科学进展,2000,19(2):110—114.

[8]李华,孟宪素,翟刚,等.基于国土资源“一张图”的综合监管与共享服务平台建设研究[J].国土资源信息化,2011,11(4):27—32.

[9]王志欣.什么是中间件[J].SoftwareWorld,2007,223(2):31.

猜你喜欢
数据格式中间件空间数据
GIS空间数据与地图制图融合技术
RFID中间件技术及其应用研究
基于Android 平台的OSGi 架构中间件的研究与应用
元数据驱动的多中心空间数据同步方法研究
论子函数在C语言数据格式输出中的应用
基于特征库的测井数据格式自动识别与转换方法
中间件在高速公路领域的应用
基于文件系统的分布式海量空间数据高效存储与组织研究
基于ArcGIS的规划数据格式转换研究
一种支持智能环境构建的中间件