分布式异构数据集成系统的研究与分析

2018-10-10 11:11周莹
数字技术与应用 2018年7期

周莹

摘要:本文首先简要分析了异构分布式数据库系统,指出了异构数据库的差异与分类,最后探讨了异构分布式数据库系统的具体设计思路,望能为此领域研究有所借鉴。

关键词:异构分布式数据库;全局数据字典;查询优化

中图分类号:TP311.13 文献标识码:A 文章編号:1007-9416(2018)07-0220-01

受各因素影响,许多大中型企业当中的各个职能部门,均会使用满足自身实际需要的不同数据库系统,即使是一个事先有着严密安排,尤其是有着全面信息规划的企业部门,其无论是在人事变迁方面,还是在时间推移上,均会造成不同程度,甚至多样性的异构数据库并存状况。针对那些普通用户而言,他们希望把充斥于各个层次的异构特性均屏蔽掉,他们不需要去深入了解各物理数据库系统当前的分布状况,同时也不需要明白其基础结构构成;除此之外,也不需要自己去汇总结果及转换数据,在实际操作中,仅需经简单操作,有目的性的进行全局查询,便能从中得到比较满意的结果。针对此种技术来讲,其实为一个能够与各种数据库之间,构建更为紧密的关系,还能根据实际需要,与各种数据库间进行准确、细化的区分。本文就分布式异构数据集成系统及其设计思路作一探讨。

1 异构分布式数据库系统浅析

异构分布式数据库系统实为一个拥有相同或不同数据模型,逻辑完整,并且还具有比较典型的站点自治性,在物理层面上,有规律的分散于几个台,且彼此均与计算机当中的数据库系统有着紧密关联。需要指出的是,在异构分布式数据库系统中,在各节点处分布的数据库系统,其拥有诸多特性,如拥有分布透明性、自治性与独立性,用户对数据库的操作,类似于在本地进行操作,不需要太过注重具体细节,比如物理位置等;除此之外,它在逻辑与物理上,能够根据实际需要,以一种合理、妥当的方式,屏蔽掉各数据库之间所存在的差异,因此,能够较好的帮助、引导用户,以一种科学方式,借助数据操作语言(DML),对各种数据库展开操作与处理。

当前,在达成此数据库系统的体系结构方面,有2种比较可行的操作方法:(1)对于不同类型的异构型数据库,都设置有比较实用且有效的用户交互接口,不需要进行集成处理与分析。此方法可行且简便,但是对于用户而言,则难以比较透明的去对数据进行访问,且当增加新的异构数据库时,需使用户接口增加,因而较为繁琐。(2)基于各成员数据库上,能够形成一个具有全局性质的操作模式,最终达到对该系统实施有效控制的目的。针对此全局模式来讲,其由诸多数据库构成。当将此模式建好之后,便可根据实际需要,实时或有选择性的访问各数据库。

2 异构数据库的差异及分类分析

2.1 异构数据库的差异

对于异构数据库而言,在其内部往往充斥着各种类型的数据库,如同数据模型不同厂商的同质异型数据库及不同物理模型的数据库,从根本上来讲,要想把异构数据库借助于网络而连接起来,使其数据资源共享,便需将其差异找出来。当前,许多因素均会数据库差异,比如系统控制方式、计算机硬件、网络结构与操作系统等。

2.2 异构数据库的分类

基于传统层面来考量,异构数据库在划分上,主要是依据数据共享的广度以及模式类型来开展的,此外,还借助于各种能够访问数据的工具来划分。(1)对于充斥于异构数据库的相关模式而言,主要有两种,其一为全局模式,其二是局部模式。(2)针对异构数据库系统当中的数据共享而言,其层次有2种,其一,在整个组件数据库架构体系当中,连接特定的或有针对性的数据项,其二,在整个组件数据库体系中,与模式之间存在紧密关联的数据项。针对那些密切相关与模式的数据项,要想实现数据的连接,便需要时刻保持与此些模式约束方面的一致性。(3)数据访问方式的划分:查询多数据库系统;查询一个集中的数据仓库;在组件数据库中浏览数据。

3 异构分布式数据库系统的设计

3.1 系统总体结构

在实际操作中,针对异种数据库而言,要想达成彼此之间的访问,数据集成为其关键所在。针对数据集成来讲,就是根据实际需要,以多个异种数据库为对象,将其当作一个比较典型且实用价值高的逻辑数据库,并用此来处理各类数据。针对虚拟数据库集成技术来讲,其便是一个比较实用且高效的解决方法;针对此方法来讲,其将指针设置于中心位置,而针对数据而言,则仍设置在原先指定的位置。针对此种新路径、新途径而言,可以比较好的解决掉传统数据所存在的存储问题。

对于全局数据字典来讲,其在整个数据集成架构当中,往往处于中心位置,发挥着关键作用。而在全局数据字典体系中,可以获得一个以分布数据为对象且应用价值高的逻辑视图,针对其作用而言,即把所存在的语义差异较好的解决掉,并根据实际需要,为异构数据流提供所需要的支持与服务,因而不仅有SQL能力,还具有较好的分布查询优化功能。

3.2 异构分布式数据库系统集成实现

针对整个集成环境而言,其核心即为调节器。针对本文所设计的调节器来讲,其就是一个基于人工智能技术,所开发出的实用性软件模块,其内嵌了知识模块,因而能够更好的处理各种信息源。在问题空间中,其核心任务便是搜索,其借助于以组件数据库为基础的元数据及信息源,对与之相关的库、表加以明确,并进行有针对性的分解查询,使之成为数据库的子查询。在实际操作中,尤其是在明确数据源时,在选择调节器时,需选择那些已经得到相应优化的数据源;在此过程中,需考虑如下内容:其一,在物理上,需尽量减少数据流量;其二,基于逻辑层面,将与查询有关联的数据库等考虑在内,并对执行的序列进行查询。

针对调节器来讲,从基础层面来分析,其即为用问题空间,有选择性与目的性的描述用户所提交的查询任务。对于问题空间来考量,从根本上来讲,其就是一个比较典型的状态集,用于明确或阐述任务的当前情况及状态。对于一个操作符而言,其所代表的实际就是完成任务所需要采取的具体手段。比如以某个状态为对象,根据当前情况及现实需要,对其进行一次算符操作,且形成一个全新的、目的明确的状态。

4 结语

综上,针对异构数据库的联合使用来讲,其除了在数据库原先应用中起到至关重要的作用外,还是未来新应用领域核心部分。针对其领域来讲,不仅有数字出版、电子商务,而且还有地球观测系统等。而以异构数据库为典型代表,且作用日渐凸显的异构信息源,其在实际应用中的互用与集成,有力推动着其在数据库未来应用中的作用发挥。

参考文献

[1]郗海龙,杨延双.基于XML的分布式异构数据库数据同步系统应用研究[J].沿海企业与科技,2009,(2):38-40.

[2]高玉兰,姚世军,江澜.基于ontology的分布式异构数据库集成研究[J].计算机工程与设计,2008,29(19):4906-4909.

[3]郑南,郑扣根.支持分布式异构地理数据共享与集成的GIS设计与实现[J].计算机应用研究,2004,21(8):200-202.