元数据在网上高校中的应用研究

2011-01-29 06:25
制造业自动化 2011年4期
关键词:数据表对象资源

林 欣

LIN Xin

(贵州师范大学 数学与计算机科学学院,贵阳 550001)

0 引言

随着我国高校网络信息系统的不断发展,我国高校信息系统整体水平有了很大的提高,取得了较大的成就。然而,在高校信息化的过程中也碰到了一些新的问题,例如:不同高校之间,同一高校不同的部门之间进行业务协作时,应该以哪个高校或者哪个部门的哪些数据作为业务协作的数据标准;高校在建立门户系统时如何统一不同高校、不同职能部门间信息发布的格式等问题。

造成这个问题的原因,笔者认为主要有三方面的因素:首先,基础数据不一致。早期的系统建设过程中,各高校、各行政部门以及各院系只关心内部的事务,很少考虑与外部的协作。因此在数据结构、数据库的设计上只是满足了当时内部需要,造成了基础数据的不一致;其次,信息资源的描述结构不统一。因为以前的系统建设主要是各高校或各行政部门和院系根据自己的需求独立进行建设,例如:网站上校务的发布格式,办事指南的格式都是各个行政部门根据自己的需要确定的,因此产生了信息资源描述的不一致问题;最后一个问题就是制度问题,例如:有些高校、院系不愿意与其他高校、院系共享自己的信息资源。

从数据的层面分析能明确知道,这三方面的因素直接导致了在高校与高校之间、高校各个职能部门与院校之间,或者院校与学生之间需要系统互操作的情况下,存在基础数据需要标准化、文档需要标准化、信息资源分类和描述需要标准化这三方面的问题。那么我们应该用什么来解决这一系列问题呢?笔者认为应该在网上校园系统中引入元数据的概念。

1 元数据的引入

1.1 元数据的定义

“Metadata”一词作为计算机科学领域的专用术语最先出现在美国国家航空与航天局的“Directory Interchange Format”(DIF)手册中,而后被广泛应用于地理界、艺术界、博物馆界、图书情报界等。目前,对Metadata存在不同的译法,主要有“元数据”,“描述数据”,“诠释资料”等。

元数据最简单的英文定义是:“data about data”,即元数据是有关数据的数据。这是人们普遍认同的一个定义,也是具有最广泛外延的一个定义。在元数据的概念应用较广泛的数据仓库中,它是指关于数据的数据,用以描述数据仓库的数据和环境。并可分为两类:一类是管理元数据(Administrative Metadata),它是对源数据及其内容、数据仓库主题、数据转换及各种操作信息的描述。另一类是用户元数据(User Metadata),它帮助用户查询信息、理解信息,了解数据仓库中的数据和组织。

1.2 元数据在网上高校中的作用

尽管不同专业领域对元数据的定义有诸多的不同,但其本质是一样的,通俗的说元数据就是一种有效的信息资源组织和管理的工具,是一种编码体系。笔者认为用元数据来描述高校信息资源或数据对象,可以使高校与高校之间、高校各个职能部门与院校之间,或者院校与学生之间当需要系统互操作的情况下用户能够发现资源,识别资源,评价资源,而且使用元数据可以对相关的信息资源进行选择、定位和调用,追踪资源在使用过程中的变化,实现信息资源的整合、有效管理和长期保存。这样不仅避免了高校的系统与系统之间信息资源描述的不一致导致信息资源出现“信息孤岛”,而且可以集成各类复杂繁多的政务信息、提高数据质量。在通常的网上高校系统开发工程中,数据关系缺乏规范、统一的描述,影响系统管理、维护的效率和质量,系统开发周期长。有了元数据,系统开发人员可以合理规划开发计划,确定工作难点,对改造和升级等工作进行相应分析,提高系统建设各环节的效率。

图1 数据存储元数据

2 元数据在网上校园中的元数据表示

2.1 数据存储元数据

网上高校信息系统功能的实现一般都以高校基础数据为依据,所以灵活、高效的管理这些数据是我们的基本目标。为此,笔者引入(如图1所示)数据存储元数据管理机制。所有与基础数据相关的元数据都采用面向对象三元组(实体、关系、属性)方式表示,例如:数据库表结构存放在一个有序数组中,其中数组中每一个元素描述数据库表的属性信息:如各属性的基本信息,属性之间的关系,数据库表之间的关系等。

2.2 业务管理元数据

网上高校系统不仅要管理数据,更主要的是控制数据流程,包括用户数据流和系统数据流。如果把用户的操作信息及数据传递规则固化在程序中,当用户的操作或规则发生变化时,变动程序是不可避免的,为此该系统提出业务管理元数据。这里可以把整个组织业务看成事务对象的集合,一类工作看成集合中的一个元素,相当于一个事务对象。针对此类工作的所有操作活动联合在一起形成了该事务对象的基本功能。

因此可以把整个业务逻辑抽象成一个可任意扩展的树型结构,它定义用户可选择的系统功能、有权操作的数据子集、设定数据子集的操作方式以及每个数据子集的数据项等信息。以信息流转为例,系统管理员需要控制以下内容:用户可以操作的数据表(例如:办文数据表,校务督察数据表),对数据表的控制权限(完全控制,修改,浏览),可操作的数据表元组的集合(例如:已经得到领导批示的公文),可以选择的操作类型(例如:基本操作或自定义操作),可以操作的数据表的属性(可浏览或可编辑),操作的类型(添加、修改、浏览及统计等)。为实现信息流转需要给不同用户设定相应的操作功能和界面,也就是为用户提供操作集。其中操作全集是系统的关键元数据集,这个元数据集是一个可扩展的树,而每个元数据元素,也就是树的各个节点采用可变数组的方式来表示,这样操作集元数据在各个层次上都是可扩展的,元素之间可以按照业务规则任意组合。

2.3 数据交换元数据

随着时间的推移,不仅可获得的信息数量和类型在不断膨胀,而且信息的领域也更加广泛。所以,利用其他系统的信息以及向其他系统输出信息成为系统设计需要考虑的主要问题。无论是输入还是输出信息都不是简单的拷贝过程,多系统之间除了数据定义方式和输出方式存在很大区别,系统集合也在不断变化。采用元数据解决多系统之间的交互操作是一种比较灵活方便的方法。元数据可以通过对数据交换中数据对象的内容、质量条件等特征与数据交换行为进行描述与说明,帮助用户有效地定位、评价、比较、获取和使用数据对象。其中,对数据对象某一特征的描述,称为一个元数据项。某一交换数据的所有元数据项构成一个元数据纪录。数据交换元数据是一个由若干复杂或简单的元数据项与纪录组成的集合(如图2所示)。在数据交换系统中,数据交换元数据主要可以在下几个方面发挥作用:描述待交换数据对象的内容及完整性规则;描述待交换数据对象的存储方式及位置;描述待交换数据对象的分割、提取、清理、安全性;描述待交换数据对象的转换方法及途径;描述数据交换行为的方式。

图2 数交换元数据

2.4 图像元数据

多媒体信息如音频、图像、视频等需计算机处理的二进制数据,是非结构化的,不能简单地用数学解析式表示。在网上高校中对多媒体数据的要求越来越多。如网上数据共享;网站的网页制作;远程多媒体教学以及多媒体课件制作等。

图像元数据可以通过媒体对象的特征提取函数生成。原始图像信息经特征提取函数(图像预处理器),提取媒体特征后形成独立媒体;再经后级特征提取函数处理形成媒体依赖,即媒体的产生时间、地点和所有者等形成元数据,图像元数据通过检索接口输出,存储并供用户查询使用。

3 结论

从实践运用的角度,对元数据在网上校园中的数据存储、数据交换和数据管理等方面的作用进行了探讨。把元数据的概念引入网上高校,可以使我们现有的网上高校系统具有极高的可操作性、可移植性、可扩展性、可维护性和数据一致性、灵活性。除以上讨论的元数据外,笔者认为保证系统安全、智能化统计、音频、视频等方面的问题在网上高校中的运用还有待研究探讨。

[1]赵慧勤.网络信息资源组织——元数据[J].情报理论与实践.2000.6.

[2]元数据及其相关术语[J].情报理论与实践.2005.5.

[3]庄育飞.Dublin Core∶网络资源组织与整理的新思路.情报学报[J].2000.2.

[4]李郎达.METADATA初探.情报科学[J].2001(6).

[5]赵志荣, 张晓林.GILS∶ 结构、元数据, 应用.情报科学[J].2000.9.

[6]PublicRecord office.Management[J], appraisal and preservation of electronic Records-Vo11.2nd edition 1999.

[7]PublicRecord office.Management[J], appraisal and preservation of electronic Records-Vo12.2nd edition 1999.

[8]张晓林.元数据开发应用的标准化框架[J].现代图书情报技术2001.2.

[9]杨治平、冯素梅.多媒体数据库的元数据存储与检索[J].重庆师范学院学报, 2002.3.

[10]Rachna Dhamija rachna, Adrian Perrig DéjàVu.A user study using images for authentication[J].Proceedings of the 9th USENIX Security Symposium, 2005, 9(2)∶ 201-207.

[11]吕波,王延章,王红梅.数据仓库元数据的界定与分类[J].信息与控制, 2001, 30(6)∶ 498-501.

猜你喜欢
数据表对象资源
基础教育资源展示
涉税刑事诉讼中的举证责任——以纳税人举证责任为考察对象
判断电压表测量对象有妙招
一样的资源,不一样的收获
湖北省新冠肺炎疫情数据表(2.26-3.25)
湖北省新冠肺炎疫情数据表
基于列控工程数据表建立线路拓扑关系的研究
资源回收
攻略对象的心思好难猜
资源再生 欢迎订阅