高等职业院校数据中心建设研究

2019-11-07 07:59赵国庆饶钦焕张云徽
教育教学论坛 2019年36期
关键词:数据交换数据中心

赵国庆 饶钦焕 张云徽

摘要:数据中心具有收集、处理、存储的功能,可以为学校提供信息共享服务。以云南国土资源职业学院为例,对学校的数据中心平台建设内容进行探究,并实际应用开发的两个系统,取得了较好的成效。

关键词:数据中心;信息标准;异构数据;数据交换

中图分类号:G712 文献标志码:A 文章编号:1674-9324(2019)36-0240-03

一、引言

隨着物联网、云计算、大数据等信息技术进入高校,学校逐步从“数字化校园”进入到“智慧校园”阶段。智慧校园的实现需要各类业务应用的支撑,并产生大量的数据作为分析决策应用。如何对一定规模的应用系统所产生的大量数据进行收集、处理、存储直至共享?数据中心平台的建设十分重要。本文以“云南省地质矿产勘查开发局科技创新基金项目(编号2016JJ03)”的课题一“现代信息技术环境下高职学生学情的调查及分析”的研究成果为例,提出数据中心建设的主要内容,并对建设过程中应注意的问题加以阐述。

二、数据中心Data Center定义

国际第一部以数据中心为对象的技术规范标准ANSI/TIA 942-2005将数据中心定义为:数据中心的主要功能是容纳一个计算机房和它的支持区域的一个建筑物或一个建筑物的部分。国内数据中心的定义:有从物理地域范围出发,仅仅是建筑物及建筑物内的设施和设备的统称,称为物理数据中心;有从数据和应用范围出发定义逻辑数据中心,包括操作型数据存储区数据库ODS(Operational Data Store)、数据仓库DW(Data Warehouse)、数据转换ETL(Extraction、Transformation、Loading)、商务智能应用、元数据管理等;第三种情况为物理和逻辑定义结合的定义,是一种广义数据中心定义。本文从逻辑角度出发,研究高职院校数据中心的建设内容。

三、数据中心建设总体目标

高校的共享数据中心是收集、存储、处理学校各业务应用系统间的数据和部门间的交换数据并共享给系统,进而为全校师生提供信息共享服务的平台。共享数据中心平台将各类异构数据有效管理起来,并提供数据访问的方法,为系统集成和系统间的数据共享提供平台,保证数据的及时性、完整性、一致性。其总体目标是:(1)实现数字化校园统一信息编码,数字化校园建设内容为实现统一身份认证、建立一个门户、创建一套数据,而信息编码的统一是基础。(2)实现共享数据中心的数据“谁产生、谁维护”,保证数据只有唯一的维护者。(3)实现业务系统间数据共享,通过调用共享数据中心发布的Web服务、数据总线以及API接口等,实现业务系统中公共数据的共享。(4)实现通过共享数据中心获取和更新部门需要的公共数据和交换数据信息。

四、数据中心整体框架

业务应用系统要求数据共享中心提供的数据必须是权威的、最新的,以满足数据共享和数据交换的需求。通常共享数据中心由统一信息标准库、中心数据库、异构数据消除模块和数据同步交换模块四个部分组成,整体结构如下:

(一)统一信息标准

信息标准指在信息的产生、传输、交换和处理时采用的统一规则、概念、名词、术语、传输格式、表达格式和代码。信息标准化是数字化校园建设中一项重要的基础性工作,是实现数据库合理设计、信息有效共享、数据高效交换、信息系统成功建设的保证。只有统一学校范围内的信息标准,才能实现信息系统的数据按照统一标准进行存储,才能消除对数据的重复管理,才可能真正解决“信息孤岛”问题。同时,建立统一的信息标准,以保证数据的唯一性,做到数据“谁生产、谁维护”,让数据真实准确地反映整体情况,进而提供决策管理依据。

依据教育部2012年发布的《教育信息化行业标准》,以及2015年发布的《职业院校数字校园建设规范》,学校的共享数据中心信息标准参照国家标准、教育部标准、行业标准,按职能域分为13个数据集(图2)。

(二)共享数据中心

校园共享数据中心是统一的数据资源共享与交换应用服务平台,是对数字化校园中的各种结构化数据进行统一管理的平台,是与各类应用系统进行数据交换的平台,是实现数字化校园数据共享,并提供深层次数据挖掘、数据分析的重要基础。共享数据中心的建设从分析现有业务系统、分析业务系统或部门间的数据交换、分析数据储存三个方面着手。

1.业务系统分析。高职院校的目的是培养具备职业应用能力的高技能型人才,多数学校都建设了相关的业务系统使用。学校经过几年的数字化校园建设,引入了多个业务部门工作相关的应用系统,包括:招生管理系统、数字迎新系统、学生工作管理系统、电子离校系统、就业管理系统、人力资源管理系统、国有资产管理系统等。

2.数据交换分析。通常,学校信息化建设引入的业务系统是异构的,异构来自计算机体系结构、操作系统以及数据库管理系统,共享数据中心通过异构数据消除模块抽取、清洗、整理异构数据再存储,整个过程存在着很多数据交换关系。首先,我们要分析数据来源的权威部门,在支撑这些部门使用的业务系统交换获取权威数据到数据中心,再用同步模块交换其他业务应用。学校管理的对象是人、财、物,学校的业务应用离不开这三项,图3展示学校部门之间、应用系统之间有关学生基本信息、学籍信息的数据交换关系。

3.数据存储原则。数据库中心库存储数据时应遵循以下原则:(1)权威性:数据中心库的数据是业务部门的应用系统经过数据交换得到的,数据应具有权威性,否则失去共享的意义。(2)正确性:保证共享数据中心的数据是正确的,而要达到这个目标必须采用统一的标准、统一的编码和统一的代码。(3)公共性:数据中心库存储的数据是公共数据,数据由权威部门生产并维护,供其他部门使用,在此过程中,部门的特殊数据不必保存到数据中心。(4)交换性:数据中心库存储的数据是需要交换的,数据由权威部门交换进来,其他部门可以从中心数据库获取这些数据,从而实现部门之间数据的交换。

(三)数据中心库

学校的数据共享中心库可以涵盖学校人、财、物直接相关的信息,还包括网络安全行为、消息、一卡通、门禁、办事事务,以及人和物的全生命周期等主题库(图4)。

(四)异构数据

1.异构数据类型。系统异构:业务应用系统数据源所依赖的操作系统、数据库管理系统、业务系统的应用模式之间的不同构成了系统异构。如学校的教务管理系统是基于Windows系统,以Oracle作为数据库,采用C/$和B/$混合结构开发。其他系统多数基于Linux系统,以OracIe作为数据库,采用B,s结构。

模式异构:即数据源在存储模式上的不同。存储模式主要包括关系模式、对象模式、对象关系模式和文档嵌套模式等几种,其中关系模式(关系数据库)为主流存储模式。而且,即便是同一类存储模式,它们的模式结构可能也存在着差异。例如不同的关系数据管理系统的数据类型等方面并不是完全一致的,如Ora-cIe、DB2、Sybase、Informix、SQL Server等。

语义异构:如果各业务系统间没有使用统一的编码标准,而由软件开发者或系统用户自定义代码,容易导致代码不一致。代码不一致是语义异构的一种,指同一实体在不同业务系统中使用不同的代码表示。语义异构的其他两种表现是:第一,命名不一致,指实体命名的差异,包括同义异名和同名异义;第二,数据类型不一致,指相同的数据在不同业务数据库中的取值不同。

2.异构数据消除。系统异构和模式异构可以通过建立共享数据中心解决。对于不同的数据库管理系统、不同的业务系统的应用模式,主流软件开发工具都提供了成熟的框架解決。如微软的.NET Framework提供不同的.NET数据提供者连接相应的DBMS:.NETData Provider for SQL Server、.NET Data Provider for or-acle、.NET Data Provider for OLE DB、.NET Data ProviderforODBC。

建立信息标准,在共享数据中心和业务系统间建立映射关系是消除语义异构数据的一种解决办法。映射关系主要包括数据中心数据库和各业务系统数据库之间字段的名称、类型、长度、取值的对照,当业务系统和数据中心有数据交换时,数据交换程序按照映射关系交换数据,从而消除语义异构。

五、数据中心建设应注意的问题

(一)信息编码的标准规范化

建立数据中心,目的是服务于学校的多个部门及部门的业务应用。由于各部门的系统设计具有单一性,在系统建设时采用不同的编码方式,这是产生“信息孤岛”的原因之一。

(二)数据源产生问题

数据中心存储的数据来源于部门的业务应用系统,如果系统产生了“脏”数据,势必影响其他与数据中心交换的系统,因此数据权威部门务必正确使用业务系统。而在数据交换功能上,数据中心需要考虑建立数据源质量监控体系,先做质量监控,再执行数据交换。

(三)信息化体质问题

学校信息化的建设是“一把手”工程,是相当长时间的建设周期,需要各个相关部门的配合才能顺利开展,需要建立一系列的信息化制度,并严格实行,以此来保障数据中心的正常运行。

六、结语

数据是信息系统产生的最有价值的东西,将数据按规范存储并共享,是提供决策依据、实现智慧校园的首要工作。本文依托笔者申报的云南省地矿局科技创新基金项目,对信息标准建设进行研究与探索,提出共享数据中心库的建设。所开发的“信息中心数据交换系统V1.0.0”(软著登字第2923604号)和“共享数据中心系统(V1.0.0)”(软著登字第2388360号)两个平台应用于学校的多个异构应用系统,取得了较好的成效。下一步将继续研究大数据分析技术,挖掘共享数据中心的数据,实现数据价值。

猜你喜欢
数据交换数据中心
酒泉云计算大数据中心
数据中心制冷节能技术及应用
民航绿色云数据中心PUE控制
XBRL在财务报表网络数据交换中的应用
基于云计算的交通运输数据中心实现与应用
Overlay Network技术在云计算数据中心中的应用