基于数据仓库的高校学籍管理系统

2009-05-25 04:25唐骄萍尚海英
中国新技术新产品 2009年5期
关键词:数据仓库学籍文档

唐骄萍 尚海英

摘要:随着信息技术的迅猛发展,学籍管理已发生了从纸制文档管理向电子文档管理的迅速转化。在高校中,采用数据仓库技术进行学籍管理是一个可行的办法。本文介绍了数据仓库、高校学籍管理现状等相关内容,指出了数据仓库建立过程中的关键技术,并且提出了将该技术与现代高校学籍管理相结合建立高校电子学籍数据仓库的思路和注意事项,有重要的实践意义。

关键词:数据仓库;学籍管理

引言

教育现代化要求教育信息化,教育信息化促进教育现代化。信息技术的迅速发展已经极大地改变了高校教学、管理的思想和手段。同时,信息共享的最大化和信息传输的快捷化又要求高校各部分间有着统一高效的资源管理系统,这种需要对高校管理系统提出了新的课题和挑战。对于高校学籍管理采用何种手段以达到有效的管理即为面临的课题之一,本文主要论述利用数据仓库技术进行高校文档管理的相关问题。

1 数据仓库(Data Warehouse)的概念

在信息处理过程中,相关数据会不停地上传信息化系统,比如ERP、CRM、Call Center、OA或者计费等,该操作后会产生大量数据。当进行数据查询或报表时,经常需要跨系统作业,这种情况不仅资源消耗大,而且可能影响各个系统的正常运行。签于这种状况,人们就提出专门建设一个数据库系统,把各个系统的数据拿到该数据库系统进行准确的查询和报表制作,这样既方便又准确,而且不会影响业务系统。这个数据库系统就是数据仓库,它是全数据的集合。一般说来,数据仓库主要由下几个部分组成。

(1)数据仓库数据库它是整个数据仓库环境的核心,用于存放数据并提供对数据检索的支持。

(2)数据抽取工具其功用为从不同的存储方式中得到数据,经必要的转化、整理后再存放到数据仓库内。对各种不同数据存储方式的访问能力是数据抽取工具的关键,否则造成数据仓库数据缺乏。

(3)元数据它是描述数据仓库内数据的结构和建立方法的数据。按用途可分为技术元数据和商业元数据。前者是数据仓库的设计和管理人员用于开发和日常管理数据仓库时所用的数据。后者从商业业务的角度描述了数据仓库中的数据。

(4)访问工具它为用户访问数据仓库提供手段。主要有数据查询和报表工具、应用开发工具、管理信息系统(EIS)工具、在线分析(OLAP)工具和数据挖掘工具。

(5)数据集市(DataMarts)它是为了满足特定的需要,而从数据仓库中独立出来的一部分数据。在数据仓库的实施过程中可以从一个部门的数据集市着手,再用几个数据集市组成一个完整的数据仓库。

(6)信息发布系把数据仓库中的数据或其他相关的数据发送给不同的地点或用户。其中,基于Web的信息发布系统是对付多用户访问的最有效方法。

数据仓库主要有以下特点:

(1)面向主题性 数据仓库中的数据是按照一定的主题域进行组织。

(2)集成性数据仓库中的数据是在对原有分散的数据库数据抽取、整理得到的,处理后的信息是关于整个单位的全局信息。

(3)相对稳定性数据仓库所涉及的数据操作主要是数据查询,并用于供决策分析,进入数据仓库中的数据一般情况下被长期保留,并且对其的修改和删除操作很少,通常只会定期加载和刷新。

(4)历史性数据仓库中的数据一般只加不减,是一个从过去到现在的历史记录,反映了一个单位各个阶段的相关情况。

2 建立数据仓库系统的关键技术

经以上论述,建立数据仓库系统的关键技术就解决以下关键技术。

(1)数据抽取

数据抽取是从不同的存储方式中得到数据,经转换、整理后的数据再进入数据仓库。由此可见要解决三个方面的问题。一是被抽取数据的存储方式可能不同,那么怎样完整地得到不同存储方式中的数据。二是从不同存储方式中得到的数据的格式可能是不同的,那么采用怎样的方式进行转换成统一格式的数据。三是得到的数据可能部分是不需要的,那么又如何进行去除多余,保存精华。

(2)存储和管理

由于进入数据仓库中的数据一般情况下被长期保留,并且对其的修改和删除操作很少,这势必造成数据的大量递增,由此要解决海量数据的存储空间问题。

数据仓库中各数据表的数据量往往极不均匀,由此影响决策支持查询的优化。利用普通查询优化器获取查询路径时,都存在所获得的最佳查询路径并非最优的的路径的情况,因此将普通关系数据库改造成适合担当数据仓库的服务器更存在查询路径并非最优化的问题。

(3)数据呈现

数据仓库中的数据最终的目的是呈现给用户,便于用户决策。在这一过程中应尽量以最直观的、最简单的方式将数据呈现给用户。在此,要主要解决多维分析、数理统计和数据挖掘方面方面的技术问题,以便使多维分析更好地体现数据仓库,数理统计更好地验证对某些事物的假设并进行决策,数据挖掘更主动寻找出数据背后的规律。

3 高校学籍管理存在的一些不足

目前,各大学各职能部门的业务管理信息化已初具规模,但是仍存在以下不足。

(1)信息保存在单位内部,其他部门获取某些公共信息较为困难,不能快速、有效地共享相关信息,部门之间横向信息流通不畅。

(2)学校每年都要完成相关教育信息的汇总工作,从基层部门经层层填表整理,直到最终数据的收集统计,需要耗费很多的人力、物力、时间。

(3)很多高校的信息系统是面向事务的,而不具备决策支持能力,系统缺乏进一步扩展应用的能力。

(4)学籍管理系统数据不断增加,机构内部可能存在的不同平台和不同结构会造成数据处理和查询的难度不断增大。

因此,在高校内部建立一个统一的、高效的、充分信息共享的信息平台很有必要。

4 数据仓库技术在高校学籍管理中的应用

高校学籍管理系统存在缺乏整体统一规划、横向信息流通不畅、资源耗费大、扩展应用能力差和数据处理、查询难度不断增大等不足。而数据仓库是一个面向主题的、集成的及随 时间变化的,但信息本身又相对稳定的历史的数据集合,它用于对管理决策过程的支持。所以,可以将数据仓库和高校学籍管理结合起来,用数据仓库具有的技术解决高校学籍管理中的不足。用它处理大量的数据资源,通过它的集成管理器将发展过程中离散的数据有效集中,以此不仅提高业务效率,而且保证机构历史的完整性,集中处理历史数据,获得对某一问题历史的完整认识。

5 如何建立高校学籍管理数据仓库

学籍信息数据仓库的建立过程是一个系统工程,需要参与各方协同工作,其中包括仓库系统选型、模型设计、数据转换等技术工作。一般说来,建立数据仓库的步骤如下:

收集和分析业务需求;建立数据模型和数据仓库的物理设计;定义数据源;选择数据仓库技术和平台;从操作型数据库中抽取、净化、和转换数据到数据仓库;选择访问和报表工具;选择数据库连接软件;选择数据分析和数据展示软件;更新数据仓库。

在此,就有关高校学籍数据库的以下几个方面进行叙述。

(1)文档应用需求分析

对于高校学籍而言,用户多为教职员工及学生,主要涉及到学生的相关信息。所以,要对这些因素进行综合的分析和考量,并以此反映正确的用户信息,为调整文档开放时间、确定文档编研产品等决策提供信息保证。

(2)文档数据采集

通过数据采集技术将不同来源、不同格式、不同构造的数据进行汇总,并经过数据清理转换后集成到统一的文档数据仓库中,共同构成原始信息来源。要着力破除文档信息孤岛的藩篱,沟通各数据单位,实现文档数据共享,同时需要由良好的文档质量保证体系来维护数据质量。

(3)文档数据转换

采集后的数据五花八门,必须对其进行数据转换,达到格式統一规范。在进行数据源特别是学籍数据库建设的同时,应建立健全文档数据质量控制体系,主要包括制定数据质量考核指标、校对制度、备份制度等,定期检查,责任到人,尽量将质量管理的要求嵌入软件功能之中,以期最大限度地保障学籍数据的质量。对于文档数据的逻辑结构,则应当加强依赖于著录标准的元数据库的建设,可以以著录标准为基础,建立一定范围内的元数据标准,并以此构成元数据字典。该字典提供数据项目的结构化信息,包括数据字段的名称、数据类型、长度、默认格式等规范,并说明字段之间的联系。在目前阶段,元数据字典的建设以二次文献信息项目为主,同时应加强文档全文和电子文件元数据规范研究,为文档数据仓库的整合和文档管理系统的深入设计提供规范标准。

6 结论

建立基于数据仓库的高校学籍管理系统是以信息化推动教育信息化的重要手段,高校通过建设基于数据仓库的高校学籍管理系统, 可以充分共享各类资源,提高办公效率,提升学校的管理与决策水平,促进学校信息化的发展,推动学校的现代化水平,有着巨大的现实意义和实践意义。

参考文献

[1]陈涛、邓斌,数据仓库技术在高等学校的应用研究,山东农业大学学报(自然科学版),第36卷(4)591-594.

[2]钱毅,数据仓库在档案信息管理中的应用《北京档案》2006年第4期 29-33.

猜你喜欢
数据仓库学籍文档
浅谈Matlab与Word文档的应用接口
高校学籍异动学生管理工作的思考
有人一声不吭向你扔了个文档
学籍学历电子注册管理系统在学籍管理中的应用与实现
基于数据仓库的住房城乡建设信息系统整合研究
分布式存储系统在液晶面板制造数据仓库中的设计
基于RI码计算的Word复制文档鉴别
探析电力系统调度中数据仓库技术的应用
教育部:不得将学籍作为中小学生入学和转学条件
Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat