基于OLAP的教学质量分析系统设计与实现

2015-01-04 08:51闫朝升
电子设计工程 2015年14期
关键词:数据表数据仓库集市

闫朝升,李 丹

(黑龙江中医药大学 现代教育技术与信息中心,黑龙江 哈尔滨 150040)

教师教学质量评价已成为高校教学质量保障的重要环节。为降低教学质量评价工作成本,提高工作效率,一些高校建立并应用教师教学质量评价系统[1-3],对日常业务处理工作提供了有效的支持,积累了大量的评价历史数据。随着教学质量评价信息需求的日渐迫切,现有的事务处理系统难以满足管理层对历史数据的深层次分析处理。联机分析处理(On-Line Analytical Processing,OLAP)能够快速、一致和交互地获取在多角度下的观测值,为用户提供隐藏在大量数据中的信息。如何从事务处理向联机分析处理扩展,快速、便捷地发现有价值的信息,为管理层的决策提供有效支持,是高校教师教学质量评价工作的关键任务。

目前,一些研究者采用数据仓库技术,设计了教学质量联机分析处理系统[4-5]。但是,现有的研究工作忽略了数据仓库和数据集市之间区别。数据仓库适合全局的信息需求,是高校决策支持所需的单一集成数据源。数据集市则用于服务特定部门的信息需求,是教学质量评价数据分析处理的最佳分析型数据环境。因此,文中提出了基于数据集市的高校教学质量评价联机分析处理系统设计方法,保证系统的实用性,缩短开发周期,降低开发成本,更为高校其他部门的相关系统设计和实现提供高效、可行的解决方案。

1 数据仓库与数据集市

作为决策支持的关键技术,数据仓库(Data Warehouse)和数据集市(Data Mart)之间存在着一定的区别。主要体现在如下两方面:

1)在信息需求方面。数据仓库服务于企业/公司的信息需求;数据集市服务于特定部门的信息需求。因此,数据集市包含企业/公司的不同特定职能范围内的有用信息。另外,针对需求而言,数据仓库的需求是在迭代式开发过程中逐渐清楚的,数据集市则常是在了解需求之后进行结构设计。

2)在开发方法方面。数据仓库采用迭代开发方法[6],即先建立数据仓库的一部分,之后再建立另一部分,且后一阶段的开发依赖于上一阶段的开发结果。这是因为只有在完成数据仓库的部分开发任务并根据用户的使用反馈之后,进一步预测需求,完成数据仓库的下一阶段开发,如此反复。数据集市是根据部门的特殊需求而建立的。数据集市包括从属数据集市和独立数据集市两类。前者依赖于数据仓库的构建,需要预先计划和不同部门之间协调等过程;后者直接由部门创建,而无需考虑其他部门,具有创建费用低、开发周期短等突出特点。

目前,数据仓库在高校领域中的应用尚处于起步阶段。面对数据仓库的开发周期长、工程性强的特点,如何快速、低耗地构建分析型数据环境,构建实用性强、操作便捷、扩展性良好的数据分析平台,力求短时间内满足管理层的信息需求,很快地感受到决策支持服务效果,已成为一项紧迫的任务。

另外,尽管独立数据集市不适合解决全局的信息问题,但是,针对部门级的信息处理问题,独立数据集市无需依赖数据仓库的构建,是一种高效、快速的解决方案。因此,文中采用独立数据集市,构建分析型数据环境。

2 系统设计

2.1 体系结构设计

本系统采用了 Client/Server(C/S,客户机/服务器)模式,由用户端、应用服务端和数据服务端3部分构成,如图1所示。其中,用户端用于提供系统操作界面和结果显示界面;应用服务端用于提供数据检测、数据分析、结果导出、数据查询、数据维护等功能;数据服务端用于实现数据集市的数据存储。

图1 系统体系结构图Fig.1 Architecture diagram of the system

2.2 功能模块设计

1)数据检测:用于确定在数据周期内数据集市的数据载入情况。其中,数据周期是指操作型环境(即教师教学质量评价事务处理系统)中发生变化的主题数据,反映到分析型数据环境(即数据集市)中所经历的时间。

2)数据分析:用于依据用户发出的数据分析请求,进行数据检索和结果显示。其中,数据分析请求分为5类:上卷、下钻、旋转、切块和切片。由于数据集市提供了分析所需的数据,因此,数据分析检索只需一次性地访问数据集市,获取分析结果,保证了数据访问效率。另外,本文采用一种多维数据集浏览界面设计方法[7],用于显示分析结果的前台显示。

3)结果导出:包括结果文件导出和结果打印。其中,前者用于依据多维数据表的显示结果,生成MSExcel格式的结果文件。

4)数据查询:用于实现细节数据的访问。即针对感兴趣的度量值情况(如:“差异性”较强的分析结果),调用本系统和评价事务处理系统之间的接口程序,实现历史数据的访问,进一步获取细节数据,深入理解信息内涵。

5)数据维护:用于实现后台数据的备份和恢复。

6)系统管理:用于实现用户管理和系统开放设置等功能。为保证系统的安全性,系统用户分为4个级别:超级管理员、管理员、管理层、一般用户。不同用户调用相应权限范围内的系统功能,如:除管理员外,其他用户无法调用数据检测功能。

3 数据集市设计

依据教学质量评价工作的特点,本文设计了系统的数据集市,构建了教学质量分析系统所需的分析型数据环境,为用户提供了紧凑的、综合的、方便的数据组织形式,避免大量的数据处理过程,保证系统的多维性和快速性。

3.1 数据模型设计

对于数据集市而言,星形连接是最佳的数据模型[6]。星形连接包括一个事实表和多个维度表。其中,事实表包含一些外键(用于指向相应的维度表)和一些度量值(用于表征观测值);维度表包含维度的主键和一些维度属性值。

文中采用星形连接多维方法,设计了数据集市的多维数据模型,如图2所示。多维数据模型包括:职称维度表(职称码、职称名称),学历维度表(学历码、学历名称),性别维度表(性别码、性别名称),教龄维度表(教龄码、教龄名称),职务维度表(职务码、职务名称),聘任维度表(聘任码、聘任名称)和学年维度表(学年码、学年名称)。另外,在事实表中,度量分为2类:测评成绩和测评等级。进一步地,每一类度量被划分为4个子类:学生类、督导类、管理干部类和综合类。其中,测评成绩是指平均测评成绩;测评等级是指依据等级判定原则,依据测评成绩,生成的4种评定结果(即优秀、良好、中等和较差)。

图2 多维数据模型Fig.2 Multidimensional data model of the system

依据多维数据模型的设计结果,为避免数据缺失问题,本文在前期工作基础上[2],完善了评价事务处理系统的后台数据库设计,如:在教师基本信息表中,增加性别、教龄、聘任状态等字段。

3.2 数据加载设计

数据加载用于完成操作型数据的聚集(如:均值计算、计数、等级判定等),并将结果载入数据集市,实现批量式的综合性数据载入。本系统采用增量加载模式,定期地将增量数据加载到数据集市中。

关于数据加载的触发问题,本系统将操作型环境中的主题业务活动产生事件作为触发事件。基于教师教学质量评价工作的特点,在前期工作基础上[2],扩展评价事务处理系统的功能模块,增加数据加载触发模块,用于保证在生成细节数据之后,触发数据加载事件。

另外,针对本系统而言,数据集市的操作型数据源具有单一性(即评价事务处理系统的后台数据库)和规范性(即降低了数据转换的复杂度),因此,为进一步降低存储空间消耗,避免不断增长的细节数据冗余问题,本文采用“操作型数据”和“分析型数据”之间独立存储模式,即数据集市不负责存储细节数据集。同时,针对上述模式,本系统通过与评价事务处理系统之间的接口,实现历史数据的访问需求。

4 系统实现

本文利用Visual Basic 6.0可视化程序设计和Microsoft SQL Server 2000企业版,实现了本系统。

系统的主界面包括工具栏和分析操作区。工具栏用于实现数据加载、数据分析、数据导出、结果打印、数据查询、系统管理、系统帮助等功能。分析操作区由“维度和度量”选定区和“分析结果”显示区组成,如图3所示。其中,“分析结果”显示区包括“维度”按钮子区、“多维数据表”显示子区和“图表”显示子区。

系统的分析操作基本流程为:在工具栏中,单击【数据分析】按钮→在“维度和度量”选定区中,选定维度和度量→单击【执行】按钮,调用“维度显示顺序设置”界面,确定多维数据表的维度显示顺序→单击【返回】按钮,系统将在“分析结果”显示区中展示分析结果,如图3所示。

在“分析结果”显示区中,用户可以在现有的分析结果基础上,进一步地获取分析结果。例如,在多维数据表中,双击级别值的前面“-”(或“+”)标识符,进行上卷(或下钻)操作。另外,在“维度”按钮子区中,本系统提供“手动拖放”式的添加/删除维的功能,实现上卷和下钻操作。例如,在图3所示的上方“维度”按钮子区中,若在【性别维】的添加按钮上按下鼠标,将向上的箭头图标移动到多维数据表中某个维后方,图标将会变成一个向下的箭头图标,抬起鼠标,则所选定的维将被添加到相应位置,且【性别维】按钮将变为“不可用”状态。反之,若在多维数据表中的特定维度上,按下鼠标,并将该维度拖至“维度”按钮子区,则降低多维数据表的维度数,且该维度按钮将变为“可用”状态。

图3 分析操作区Fig.3 Analysis operation area of the system

为提高分析结果的可读性,本系统提供了结果数据整合功能,即右击多维数据表,在快捷菜单中选定“整合表”命令,系统将依据多维数据表的结果,进行数据整合,便于用户查阅分析结果,如图4所示。

图4 分析整合表Fig.4 Analysis integration table

针对需要特别关注的分析结果 (如:“学历=博士 and职称=正高以下”)情况,选定度量值(如:90.36)单元格,单击工具栏中的【数据查询】按钮,系统将依据维度和级别值组合,自动形成查询条件,从“评价事务处理系统”的后台数据库中,获取细节数据,供用户查阅,进一步地获取更为重要的信息。

5 结 论

为了快速、便捷地实现教师教学质量分析,提高教学质量评价工作的决策支持能力,本文提出了基于数据集市和OLAP的高校教师教学质量分析解决方案。通过系统体系结构和功能模块的设计以及多维数据模型的构建,本文利用可视化程序设计语言,实现了高校教师教学质量联机分析处理系统。本系统不仅能够为管理层提供有价值的决策支持信息,更为未来的评价数据挖掘提供了低耗、综合的分析型数据环境。

[1]商娟叶.基于AHP的教学质量评价系统的设计与开发[J].电子设计工程,2013,21(5):1-3.SHANG Juan-ye.Design and development of teaching quality evaluation system based on AHP[J].Electronic Design Engineering,2013,21(5):1-3.

[2]闫朝升,张承江,李丹.基于Web的教学质量评价系统的设计与实现[J].计算机工程与设计,2010,31(4):893-897.YAN Zhao-sheng,ZHANG Cheng-jiang,LI Dan.Design and implementation of teaching quality evaluation system based on web[J].Computer Engineering and Design,2010,31(4):893-897.

[3]余俊丽.高校教师课堂教学质量评价系统的设计与实现[D].长沙:湖南大学,2012.

[4]贺超波,陈启买,刘海.数据仓库与OLAP在高校教学决策中的应用研究[J].计算机应用与软件,2009,26(6):93-95.HE Chao-bo,CHEN Qi-mai,LIU Hai.On applying data warehouse and OLAP in universities teaching decision[J].Computer Applications and Software,2009,26(6):93-95.

[5]武彤.基于数据仓库技术的教学质量分析与评估系统[J].计算机工程与设计,2009,30(6):1545-1547.WU Tong.System of teaching quality analyzing and evaluating based on data warehouse[J].Computer Engineering and Design,2009,30(6):1545-1547.

[6]Inmon W H.数据仓库[M].4版.北京:机械工业出版社,2006:60,83-86.

[7]张承江,闫朝升,马英.联机分析处理前台工具设计技术的研究[J].黑龙江大学自然科学学报,2006,23(3):409-412.ZHANG Cheng-jiang,YAN Chao-sheng,MA Ying.Research on the technology of designing OLAP tools[J].Journal of Natural Science of Heilongjiang University,2006,23 (3):409-412.

猜你喜欢
数据表数据仓库集市
基于数据仓库的数据倾斜解决方案研究
热闹的集市
湖北省新冠肺炎疫情数据表(2.26-3.25)
湖北省新冠肺炎疫情数据表
基于数据仓库的住房城乡建设信息系统整合研究
探访于山“相亲集市”
基于列控工程数据表建立线路拓扑关系的研究
探析电力系统调度中数据仓库技术的应用
基于数据仓库的数据分析探索与实践
热闹的集市