信息模型构建在基于SOA服务架构的云计算中的重要性

2015-08-14 22:48马淑俊
中国高新技术企业 2015年26期
关键词:数据数据结构云计算

摘要:当架构师和系统设计师学习或使用新技术和新概念时,如云计算、SOA服务,常常会忽略系统架构的基本要素,包括数据。数据作为信息的基本单位,如果不能掌握这些底层基本单位,就会面临架构的风险,甚至扩展到云计算系统失败的风险。只有将底层单元定义成需要的信息模型,才能帮助人们将系统在基于SOA服务架构向云计算移植。

关键词:信息模型构建;SOA服务架构;云计算;数据;数据结构 文献标识码:A

中图分类号:TP393 文章编号:1009-2374(2015)29-0080-02 DOI:10.13535/j.cnki.11-4406/n.2015.29.040

将基于SOA架构的服务延伸到云计算的方法一般有五个步骤:(1)定义数据;(2)定义服务;(3)定义流程;(4)定义管理;(5)定义应该放在云计算平台的数据、服务和流程。只有对信息、服务和流程模型理解得更好时,我们需要向云计算转移的服务才会做得越好。

1 数据为要的理念

定义数据是将基于SOA架构的服务延伸到云计算的第一个步骤,这也是服务转向云计算之前,近距离勘查架构底层信息的重要步骤。这样做的好处有:首先,在转移服务之前,不管是用什么样的架构、模型或者系统,理解底层的信息都是必须的,这样可以判断哪些信息是可以转移到云计算中,哪些不适合;其次,数据到服务,再到流程的方法具有很强的灵活性,还可以根据检查的需要,沿着流程到服务,再到数据的方向进行。

2 信息模型

通常我们把事件的集合称为数据,数据通常被看作用于创建信息和知识的最低级别的抽象。数据包括数据字典和数据目录。《IBM计算机专业字典》中这样解释数据字典:“集中存储的数据信息,包括含义、与其他数据的关系、来源、用法以及格式等。”“信息是将具有意义的数据模式,即按照有意义的方式组织的数据。”为数据编目,将我们收集到的数据形式化,它包括数据字典,二者的区别是数据字典往往是针对特定的单一系统或者应用,数据目录则可以应用到所有系统中。

信息模型是以数据为基础创建并应用到架构层,按照一定意义的方式组织数据。信息模型是架构的解决方案或目标任务。信息模型作为主数据跨越整个架构,它是通用的中心参考点。

3 定义信息模型

一旦项目建立就需要选择相应的问题域,并转入核心数据的分析。定义数据模型是一个难度较大的工作,因为数据可能是过去的,也可能是私有的,甚至二者兼备,但是它们的分析过程却是一样的。成熟的定义信息模型流程如图1所示,我们会逐一解释。

图1 创建信息模型的流程

3.1 理解本体

根据维基百科:“在计算机科学和信息科学中,主体是对一个领域的一组概念以及它们之间的关系形式表达,它通常用于推理该域中的属性,也可以用于定义域。”在本文中我们使用本体的目的是使用它定义关系能力。使用本体的好处是,不论信息位于何处都可以理解该信息,并将它映射到基于SOA之中的云计算服务中。为了收集某个特定实体的信息,需要使用不同的资源来表示个别实体,即使个体差距可能存在差距。以关系数据库为例,实体是通过主键标识的,不同的信息系统中,用于描述属性的方式也不尽相同。本体和支持本体的WEB标准并非新技术,如W3C队本体语言的贡献之一是OWL,使用OWL作为WEB本体和云计算的起点,可以使数据实现自动化。它为云计算提供了创建和共享本体的中心地点。

3.2 理解数据

理解数据是信息模型过程中最繁重的一步,该步骤中我们必须检查信息和数据的细节,创建出传统的可交付件,对于计算需要理解数据的位置在哪里,收集数据的信息并确定数据在流程中的流向问题。一句话,云的解决方案需要定义信息的流动性以及信息与核心服务业务流程的关系是什么。

3.3 标示数据

3.3.1 创建数据字典。现在你需要创建一个数据字典,用于存放要分析的数据和其他信息,但是由于系统千差万别,所以很难找到一组共同属性,因此在对数据创建字典时需要跟踪的信息有以下内容:特定数据元素存在的原因;数据的所有者;数据的格式;数据的安全属性;逻辑数据结构和物理数据结构的作用。

3.3.2 理解一致性问题。一致性是云计算数据库中常见的问题,为了解决此类问题,数据使用的规则和逻辑是至关重要的。虽然有些数据库通过内建设置存储过程或者触发器来解决一致性问题,可是这些都依赖逻辑关系,因此还需要建立应用的规则,防范出现数据不一致的问题。

3.3.3 理解数据延迟。数据延迟是数据实时性的特点,这也是云计算过程中必须明确的数据属性之一。虽然数据延迟有很多种,但是主要关注以下三类:(1)实时数据,为了接近0延迟,云计算实现需要不断回到数据库、应用程序以及其他系统,在这样的要求中,数据库本身的性能也需要考虑在其中。一个进程更新了数据,另一个进程也必须同时取得更新的信息;(2)接近实时数据,接近实时数据是按照固定时间段来更新数据,虽然不能实时更新,但在较短的单位时间完成数据的更新访问就已经很及时了;(3)不定时数据,不定时数据是在单位时间进行更新,如客户的地址和账号信息就属于这类内容。

根据上面三种数据延迟类型,我们需要确定数据的更新属性、它们分别适用什么方案、什么频率、随时间迁移数据怎样变等。

3.4 数据目录

数据目录是对我们在前面收集的数据进行形式化。一个好的数据目录应该包括系统应用的所有数据元素,如所有者、系统、各式、安全属性、一致性属性、依赖关系等。

4 结语

数据是系统应用的基础,也是进行系统移植到云计算的根本,本文所谓新的地方在于确立了以数据为导向的开发方向,特别是需要解决数据结构、数据间的关系、一致性、安全以及数据与数据之间的其他要素,最终明确如何建立数据管理在本地系统和云计算之间管理的目标,就像数据存放在本地系统内,这是我们研究的目标。

参考文献

[1] 马国耀.云计算与SOA[M].北京:人民邮电出版社,2010.

[2] 周洪波.云计算:技术、应用、标准和商业模式[M].北京:电子工业出版社,2011.

[3] 余水清.大数据管理:数据集成的技术、方法与最佳实践[M].北京:机械工业出版社,2014.

[4] 祁伟,等.云计算:从基础架构到最佳实践[M].北京:清华大学出版社,2013.

[5] Dong Yuan,Yun Yang,Xiao Liu,Jinjun Chen.A data placement strategy in scientific cloud workflows[J].Future Generation Computer Systems,2010,(8).

[6] Michael Cusumano.Cloud computing and SaaS as new computing platforms[J].Communications of the ACM,2010,(4).

[7] Luis M.Vaquero,Luis Rodero-Merino,Juan Caceres,Maik Lindner.A break in the clouds[J].ACM SIGCOMM Computer Communication Review,2008,(1).

作者简介:马淑俊(1978-),女,甘肃人,拉萨市气象局工程师,研究生,研究方向:气象服务。

(责任编辑:秦逊玉)

猜你喜欢
数据数据结构云计算
浅谈计量自动化系统实现预购电管理应用
实验云:理论教学与实验教学深度融合的助推器
“翻转课堂”教学模式的探讨——以《数据结构》课程教学为例
TRIZ理论在“数据结构”多媒体教学中的应用
《数据结构》教学方法创新探讨