地形图数据库中的数据字典与元数据

2013-12-11 07:28路丽华李敬年
测绘通报 2013年6期
关键词:字典定义要素

路丽华,李敬年

(1.中华地图学社,上海200063;2.河北省地质矿产勘查开发局第四地质大队地勘院,河北承德067000)

一、引 言

数据字典与元数据是地理信息产业最常用到的两个专业名词之一,也是最易混淆的两个名词。两者都被认为是“关于数据的数据”。然而此“关于数据的数据”非彼“关于数据的数据”,二者是有明显区别的。本文从定义出发对二者的区别与联系等展开论述,并给出了一个地形图数据库数据字典与元数据的样例。

二、数据字典与元数据的定义

1.数据字典

《基础地理信息要素数据字典 第一部分:1∶500 1∶1000 1∶2000基础地理信息要素数据字典》(GB/T 20258.1—2007)的起草人段怡红、吕玉霞认为数据字典是关于地理实体数据描述信息的集合。《地图学术语》(GB/T 16820—2009)中将数据字典定义为描述数据库中各数据属性与组成的数据集合。目前还没有关于数据字典的标准定义,但一般有以下几种理解方法:

1)数据字典是以数据库中数据基本单元为单位,按一定顺序排列,对其内容作详细说明的数据集。

2)数据字典中存放着系统中所有数据的定义,即对所有数据库结构的描述。数据字典提供了对数据库数据描述的集中管理手段。

3)数据字典是一个定义应用程序中使用的所有数据元素和结构的含义、类型、数据大小、格式、度量单位、精度及允许取值范围的共享仓库。

从上面的描述可以看出,数据字典有3个基本特性:描述范围的完整性,强调描述范围包括所有数据或数据元素;描述内容是数据库结构;编排有顺序。

2.元数据

元数据(metadata)又称描述数据、诠释数据,是关于数据的数据。1993年IEEE第一届元数据研讨会上提出了元数据的几种定义:

1)元数据是有关存储的关于信息实体的信息,即语义信息和内容、元素的类型和编码、实体之间的关系数据结构、数据格式、数据类型、相关的数据、数据推论和派生等;

2)元数据是有关数据存储管理的信息,即位置和名称、访问时间、访问方法等;

3)元数据是有关数据应用的信息,即使用限制、使用方法、历史记录等。

《地理信息 元数据》(GB/T 19710—2005)对元数据的定义是关于数据的数据,即标识、覆盖范围、质量、空间和时间模式、空间参照系和分发等信息。

从上面的几个定义可以大致得出:元数据描述的是数据的内容,主要用于数据的存储、管理和应用,是数据与数据用户之间的桥梁。

三、数据字典与元数据的关系

上文已从定义上对数据字典与元数据进行了分析,以下从更深层次剖析二者的关系。

1.目的、意义及出现的时间先后顺序

数据字典建立的目的是数据库建库的标准化、规范化。数据字典的意义在于:一是确保开发人员使用统一的数据定义;二是数据库设计、生产、建库、更新与维护的重要依据;三是便于数据库应用系统的功能扩展和操作数据范围扩展。

元数据建立的目的是方便用户查找和使用数据。其意义包括:①数据生产单位有效地管理和维护空间数据,在不看或没有原始数据的情况下也能大致了解数据情况,包括数据内容、数据分类、数据质量、数据存储、数据交换网络及数据销售等方面的信息;②帮助用户了解数据,确定数据能否满足其需求;③提供通过网络对数据进行查询检索的方法或界面,以及数据交换或传输的辅助信息,方便用户处理和转换通过网络接收的外部数据。

从数据字典和元数据形成或产生的时间来看,数据字典产生于数据库分析设计阶段,也就是说它在数据生产之前;元数据则产生于数据生产过程当中或完成之后。因此,同一个数据库的元数据要晚于其数据字典。

事实上,两个概念在历史上出现的先后顺序也是如此,数据字典在数据库出现后就存在了,而元数据早期主要用于图书馆的图书编目,真正用到数据库领域是在数据库技术得到高度发展、数据共享问题提上日程后。

2.层次与分级

从层次结构上来看,数据字典分为数据库数据字典、数据集数据字典和要素数据字典3个层次。数据库数据字典对空间数据库整体进行描述,内容主要包括数据的归属、数据源、数据的分层、数据质量及数据质量检测部门等;数据集数据字典对数据库中的数据集进行描述,主要包括数据集中数据的分层和数据命名等;要素数据字典对数据库数据中所包含的数据要素进行描述,主要描述要素的概念、要素的几何表示、属性,以及相关要素间的关系等。元数据的层次结构也分为3层:元数据子集、实体和元素。元素是元数据最基本的信息单元;实体是同类元数据元素的集合;子集是相互关联的元数据实体和元素的集合。

从数据重要程度的分级来看,数据字典各条目的重要程度是相同的,都是必选的,无主次之分;元数据则有全集元数据和核心元数据之分。全集元数据是建立完整的数据集(数据集、数据集系列、要素和属性)文档所需要的全部元数据实体和元素;核心元数据是唯一标识一个数据集(数据集、数据集系列、要素和属性)所需要的最少元数据实体和元素。

3.组织形式

从数据的组织形式来看,数据字典是一组规范的表格,但元数据的组织形式则要灵活得多,可以是文本文件、XML或元数据库。

4.描述的基本对象与可扩展性

数据字典描述的基本对象是要素数据,可随新要素数据种类的出现而扩展;元数据描述的基本对象则是数据集,可扩展为数据集系列,以及数据集内的要素和属性。

5.数据字典与元数据的联系

由于数据字典和元数据都是关于数据的数据,因此就有关于数据字典的元数据和关于元数据的数据字典。前者着重对数据字典内容的解释,后者着重元数据的定义和结构性描述。

四、地形图数据库中的数据字典与元数据样例

地形图数据库数据字典描述的内容包括要素名称、要素描述、要素分类代码、要素属性表、几何表示、几何表示示例与制图表示示例、相关要素和关系。与非空间数据库相比,其增加的内容包括几何表示、相关要素(与本要素有拓扑空间关系的要素)、关系(空间拓扑)等。表1~表5是一个要素级常年河的数据字典。

表1 要素一般信息描述

表2 属性表

续表2

表3 几何表示

表4 可视化表示

表5 相关要素及关系、备注

表6 地形图数据库中的部分元数据要素内容

地形图数据库元数据存放有关数据源、数据分层、产品归属、空间参考系、数据质量(数据精度、数据评价)、数据更新、图幅接边等方面的信息。与非空间数据库相比,其增加了空间参照系、数据源覆盖的空间范围、空间信息表示方法、显示数据的图示表达类目、数据集空间分辨率等元数据要素。表6是地形图数据库中一个图幅级 (相当于数据集级)元数据部分要素内容。

五、结束语

本文讨论了数据字典和元数据的定义,并对这两类数据进行了比较。尽管二者都是关于数据的数据,但二者描述的内容、目的、意义、层次与分级、组织形式、描述的基本对象与可扩展性等不尽相同。数据字典着重于对数据的定义、结构、表示方面的描述,在数据库分析设计时产生,目的是数据库建库的标准化、规范化,适用于数据库设计、生产、建库、更新与维护;元数据则着重于对数据内容、存储、使用的描述,在数据生产过程中或完成后产生,目的是数据共享。数据字典分为数据库数据字典、数据集数据字典和要素数据字典3个层次;元数据的层次结构为元数据子集、实体和元素。数据字典各条目的重要程度相同;元数据则有全集元数据和核心元数据之分。数据字典的形式是一组规范的表格;元数据的形式可以是文本文件、XML或元数据库。数据字典描述的基本对象是要素数据,可随新要素数据类型的出现而扩展;元数据描述的基本对象是数据集,可扩展为数据集系列和数据集内的要素和属性。即使是数据结构等数据字典和元数据均有的内容,两者的作用也不一样:前者要求数据库设计时必须遵守,后者则是对现有数据库结构的描述,也就是说前者决定数据库结构设计,而数据库结构的内容决定了元数据关于数据库结构的描述。

[1]中华人民共和国质量监督检验检疫总局,中国国家标准化管理委员会.GB/T 20258.1—2007基础地理信息要素数据字典 第一部分:1∶500 1∶1000 1∶2000基础地理信息要素数据字典[S].北京:中国标准出版社,2007.

[2]中华人民共和国质量监督检验检疫总局,中国国家标准化管理委员会.GB/T 19710—2005地理信息 元数据[S].北京:中国标准出版社,2005.

[3]中华人民共和国质量监督检验检疫总局,中国国家标准化委员会.GB/T 16820—2009地图学术语[S].北京:中国标准出版社,2009.

[4]吕玉霞,段怡红.关于矢量地形图数据字典的研究[J].测绘标准化,2003(4):1-6.

[5]段怡红,吕玉霞,李建利,等.《基础地理信息要素数据字典第2、3部分》编制说明[J].测绘标准化,2006(2):1-4.

猜你喜欢
字典定义要素
掌握这6点要素,让肥水更高效
字典的由来
观赏植物的色彩要素在家居设计中的应用
大头熊的字典
论美术中“七大要素”的辩证关系
正版字典
也谈做人的要素
成功的定义
修辞学的重大定义
山的定义