关于港口数据仓库设计的相关研究

2016-10-21 06:04叶艳霞
电子技术与软件工程 2016年5期
关键词:数据仓库数据模型星形

摘 要 当前,信息化技术已经广泛的应用到港口工作中,如电子数据的交换、电子商务、全球定位以及地理信息系统等,在一定程度上促进了港口生产以及管理水平的提升,实现港口资源的优化配置,使港口经营的竞争力得到增强,为港口经济发展创造了良好的环境氛围。港口业务涉及到船舶进出港、集装箱的装卸、运输等诸多环节,每天需要处理的信息数据十分庞大,因此需要设计港口数据仓库,满足港口工作需要。本文就港口数据仓库设计的问题进行分析和研究。

【关键词】港口 数据仓库设计

数据仓库是一个新的概念,数据仓库的设计能够明确任务的主题,对港口的数据进行统一全面的概括,保证数据的更新、可靠。能够实现当前与历史数据的联机处理以及报表处理,依据不同的角度对数据进行分析,明确数据中的隐藏信息,使港口经营管理决策能够有科学的依据。

1 港口数据仓库概述

对港口的业务流程进行分析主要是对港口数据仓库的概念模型进行明确,这对于港口数据仓库建设的效果有着至关重要的影响。港口生产是港口企业生存发展的重要活动,处于核心位置,因此港口数据仓库的实施要先从港口生产开始。

1.1 分析生产业务

港口生产主要是为了提高港口人力、设备的使用效率,高效、安全、优质的实现陆运以及航运网络中的货物以及旅客的转运。

1.2 分析数据源

港口生产业务是多个部门进行开展的,不同部门有各自的数据库,在港口信息化建设快速發展的今天,数据库中数据数量逐渐增多,面对大量的、复杂的数据,如果不能科学高效的利用,就会使得信息资源被浪费,进而造成数据灾难,为了更加科学合理的使用港口数据资源,需要明确港口的具体情况,建立完善的港口数据仓库,实现数据的获取、储存以及输出工作。港口的原始数据主要有业务数据以及遗留的数据,这些数据被保存在信息管理系统的数据库中和单独的平面文件中。数据仓库设计中,需要明确其关键技术以及目标,实现多维数据模型,为管理层提供科学的决策依据。

2 港口数据仓库设计分析

2.1 明确任务主题

在港口管理人员看来,工作中关心的主要维度和指标有时间、地点、货物号、船号、货主号、货物的重量、吞吐量、金额、以及交易的次数等。在明确数据仓库主题以及模型构建过程中需要以这些内容作为出发点,详细了解管理人员的需要以及港口业务的流程,明确港口数据仓库的运营分析、客户分析、船舶进出港分析、货物进出港分析、设备资产管理等主题。其中港口的经营是港口工作中最基本的活动,也是各项分析工作开展的前提和基础,因此本文主要以经营分析主题进行数据仓库的设计。

2.2 建立数据模型

进行港口数据仓库设计建设一般需要3级数据模型的方法,主要有概念模型、逻辑模型以及物理模型。这3级数据模型分别与数据仓库中的信息包图设计、星形图设计以及物理数据模型设计相对应。

首先是设计概念模型,也就是分析需求,在和用户的交流中,了解建立数据库的数据源,使建立后的数据模型容易被理解,并且能够实现数据的查询以及映射,能够为数据仓库使用者的决策提供依据。根据当前港口生产的实际情况,需要数据仓库能够提供一定的功能,主要有比较分析不同时间、地点、货主的生产情况;交易中,哪些货主以及货物的数量大,并且港口获利较多;货主通常使用何种船只、运输的货物种类以及存放地点等。

数据仓库具有多维性,原有的数据流程图已经不能满足分析的需要,而超立方体的直观性不强,数据的采集以及表示都有一定的难度。因此可以使用信息包的方法进行多维数据的表示,根据用户需要建立信息包,通过二维表格对信息需求的多样性进行表示。

其次是设计逻辑模型,完成了信息包表的建设后,需要将信息包表转化为星形图。首先对指标实体进行定义,主要包括数据和逻辑指标。星形图中的数据指标是信息包图中的指标对应,信息包表中,不同维度的最低级类别能够被归入逻辑指标中,得到的数据、逻辑指标共同组成了星形图中的指标实体。然后是维度实体,与信息包图中的维度对象相对应。设计完指标以及维度实体后就需要对二者的关系进行设计,他们是一对多的关系。

最后是设计物理模型,上述工作完毕后,需要对数据仓库中的事实表以及维度表的物理结构及关系进行明确。

逻辑设计后的星形图能够更加便利对物理数据结构进行定义,实现指标实体与维度实体向事实表以及维度表的转化。事实表主要包括星形图中心的指标量和星形图角上的维度实体中的主码值。不仅要建设物理数据结构,还需要明确数据标准,了解命名的约定,其数据种类、限制条件等。定义实体,星形图能够对面向主题的数据仓库的共享实体进行明确,对其属性进行完整定义。还需要明确实体的特征,有值的长度、种类。

3 数据仓库的生成

完成数据仓库模型建设后,就需要将原有的信息数据导入到数据仓库中,利用数据转换服务实现异种数据源之间的转化,进行数据的抽取、处理以及装载。依据主题从原始数据库中抽取出与主题相适应的数据,对于不一致的数据要进行转变,达到数据仓库的统一规定,并将数据按照数据仓库的格式进行载入。

4 结束语

在长期的信息化作业中,港口企业积累了大量的数据,怎样将这些数据转化为实用的知识,作为管理人员的决策依据就是当前需要解决的重要问题,数据仓库的设计与建设能够为港口企业的发展提供良好的环境氛围,充分挖掘数据了解潜在内容,促进港口企业实现良好的发展与进步。

参考文献

[1]韩蕾.数据仓库和OLAP在港口物资管理中的应用[J].电脑知识与技术,2014,18:4117-4120.

[2]黄晓颖,李亚芬,王普.基于数据仓库的学科建设决策支持系统的设计[J].计算机工程与设计,2010,23:4995-4998.

[3]刘益江,毛宁,陈庆新.一种评估数据仓库设计质量的方法[J].计算机技术与发展,2012,09:161-165.

作者简介

叶艳霞(1983-),女,河北省廊坊市人。硕士学位。现供职于天津港信息技术发展有限公司。

作者单位

天津港信息技术发展有限公司 天津市塘沽区 300456

猜你喜欢
数据仓库数据模型星形
星形诺卡菌肺部感染1例并文献复习
带有未知内部扰动的星形Euler-Bernoulli梁网络的指数跟踪控制
基于数据仓库的住房城乡建设信息系统整合研究
面板数据模型截面相关检验方法综述
加热炉炉内跟踪数据模型优化
分布式存储系统在液晶面板制造数据仓库中的设计
探析电力系统调度中数据仓库技术的应用
基于数据仓库的数据分析探索与实践
一类强α次殆星形映照的增长和掩盖定理
线形及星形聚合物驱油性能