分布式异构数据集成系统的研究与分析

2018-10-10 11:11周莹

数字技术与应用 2018年7期

周莹

摘要：本文首先简要分析了异构分布式数据库系统，指出了异构数据库的差异与分类，最后探讨了异构分布式数据库系统的具体设计思路，望能为此领域研究有所借鉴。

关键词：异构分布式数据库；全局数据字典；查询优化

中图分类号：TP311.13 文献标识码：A 文章編号：1007-9416（2018）07-0220-01

受各因素影响，许多大中型企业当中的各个职能部门，均会使用满足自身实际需要的不同数据库系统，即使是一个事先有着严密安排，尤其是有着全面信息规划的企业部门，其无论是在人事变迁方面，还是在时间推移上，均会造成不同程度，甚至多样性的异构数据库并存状况。针对那些普通用户而言，他们希望把充斥于各个层次的异构特性均屏蔽掉，他们不需要去深入了解各物理数据库系统当前的分布状况，同时也不需要明白其基础结构构成；除此之外，也不需要自己去汇总结果及转换数据，在实际操作中，仅需经简单操作，有目的性的进行全局查询，便能从中得到比较满意的结果。针对此种技术来讲，其实为一个能够与各种数据库之间，构建更为紧密的关系，还能根据实际需要，与各种数据库间进行准确、细化的区分。本文就分布式异构数据集成系统及其设计思路作一探讨。

1 异构分布式数据库系统浅析

异构分布式数据库系统实为一个拥有相同或不同数据模型，逻辑完整，并且还具有比较典型的站点自治性，在物理层面上，有规律的分散于几个台，且彼此均与计算机当中的数据库系统有着紧密关联。需要指出的是，在异构分布式数据库系统中，在各节点处分布的数据库系统，其拥有诸多特性，如拥有分布透明性、自治性与独立性，用户对数据库的操作，类似于在本地进行操作，不需要太过注重具体细节，比如物理位置等；除此之外，它在逻辑与物理上，能够根据实际需要，以一种合理、妥当的方式，屏蔽掉各数据库之间所存在的差异，因此，能够较好的帮助、引导用户，以一种科学方式，借助数据操作语言（DML），对各种数据库展开操作与处理。

当前，在达成此数据库系统的体系结构方面，有2种比较可行的操作方法：（1）对于不同类型的异构型数据库，都设置有比较实用且有效的用户交互接口，不需要进行集成处理与分析。此方法可行且简便，但是对于用户而言，则难以比较透明的去对数据进行访问，且当增加新的异构数据库时，需使用户接口增加，因而较为繁琐。（2）基于各成员数据库上，能够形成一个具有全局性质的操作模式，最终达到对该系统实施有效控制的目的。针对此全局模式来讲，其由诸多数据库构成。当将此模式建好之后，便可根据实际需要，实时或有选择性的访问各数据库。

2 异构数据库的差异及分类分析

2.1 异构数据库的差异

对于异构数据库而言，在其内部往往充斥着各种类型的数据库，如同数据模型不同厂商的同质异型数据库及不同物理模型的数据库，从根本上来讲，要想把异构数据库借助于网络而连接起来，使其数据资源共享，便需将其差异找出来。当前，许多因素均会数据库差异，比如系统控制方式、计算机硬件、网络结构与操作系统等。

2.2 异构数据库的分类

基于传统层面来考量，异构数据库在划分上，主要是依据数据共享的广度以及模式类型来开展的，此外，还借助于各种能够访问数据的工具来划分。（1）对于充斥于异构数据库的相关模式而言，主要有两种，其一为全局模式，其二是局部模式。（2）针对异构数据库系统当中的数据共享而言，其层次有2种，其一，在整个组件数据库架构体系当中，连接特定的或有针对性的数据项，其二，在整个组件数据库体系中，与模式之间存在紧密关联的数据项。针对那些密切相关与模式的数据项，要想实现数据的连接，便需要时刻保持与此些模式约束方面的一致性。（3）数据访问方式的划分：查询多数据库系统；查询一个集中的数据仓库；在组件数据库中浏览数据。

3 异构分布式数据库系统的设计

3.1 系统总体结构

在实际操作中，针对异种数据库而言，要想达成彼此之间的访问，数据集成为其关键所在。针对数据集成来讲，就是根据实际需要，以多个异种数据库为对象，将其当作一个比较典型且实用价值高的逻辑数据库，并用此来处理各类数据。针对虚拟数据库集成技术来讲，其便是一个比较实用且高效的解决方法；针对此方法来讲，其将指针设置于中心位置，而针对数据而言，则仍设置在原先指定的位置。针对此种新路径、新途径而言，可以比较好的解决掉传统数据所存在的存储问题。

对于全局数据字典来讲，其在整个数据集成架构当中，往往处于中心位置，发挥着关键作用。而在全局数据字典体系中，可以获得一个以分布数据为对象且应用价值高的逻辑视图，针对其作用而言，即把所存在的语义差异较好的解决掉，并根据实际需要，为异构数据流提供所需要的支持与服务，因而不仅有SQL能力，还具有较好的分布查询优化功能。

3.2 异构分布式数据库系统集成实现

针对整个集成环境而言，其核心即为调节器。针对本文所设计的调节器来讲，其就是一个基于人工智能技术，所开发出的实用性软件模块，其内嵌了知识模块，因而能够更好的处理各种信息源。在问题空间中，其核心任务便是搜索，其借助于以组件数据库为基础的元数据及信息源，对与之相关的库、表加以明确，并进行有针对性的分解查询，使之成为数据库的子查询。在实际操作中，尤其是在明确数据源时，在选择调节器时，需选择那些已经得到相应优化的数据源；在此过程中，需考虑如下内容：其一，在物理上，需尽量减少数据流量；其二，基于逻辑层面，将与查询有关联的数据库等考虑在内，并对执行的序列进行查询。

针对调节器来讲，从基础层面来分析，其即为用问题空间，有选择性与目的性的描述用户所提交的查询任务。对于问题空间来考量，从根本上来讲，其就是一个比较典型的状态集，用于明确或阐述任务的当前情况及状态。对于一个操作符而言，其所代表的实际就是完成任务所需要采取的具体手段。比如以某个状态为对象，根据当前情况及现实需要，对其进行一次算符操作，且形成一个全新的、目的明确的状态。

4 结语

综上，针对异构数据库的联合使用来讲，其除了在数据库原先应用中起到至关重要的作用外，还是未来新应用领域核心部分。针对其领域来讲，不仅有数字出版、电子商务，而且还有地球观测系统等。而以异构数据库为典型代表，且作用日渐凸显的异构信息源，其在实际应用中的互用与集成，有力推动着其在数据库未来应用中的作用发挥。

参考文献

[1]郗海龙，杨延双.基于XML的分布式异构数据库数据同步系统应用研究[J].沿海企业与科技，2009，（2）：38-40.

[2]高玉兰，姚世军，江澜.基于ontology的分布式异构数据库集成研究[J].计算机工程与设计，2008，29（19）：4906-4909.

[3]郑南，郑扣根.支持分布式异构地理数据共享与集成的GIS设计与实现[J].计算机应用研究，2004，21（8）：200-202.

数字技术与应用2018年7期

数字技术与应用的其它文章: 基于RST数字控制器的直流电机调速系统仿真设计; 通信机房电力和温度检测的集散控制系统; 一种连接器自动插针机控制系统设计; 基于Zigbee的智能环境控制系统; 基于单片机的步进电机控制系统设计研究; 顺序控制设计法在PLC编程中的有效利用