基于ITIL驱动的可用性服务等级协议研究

2018-09-21 05:28陈颖聪陈智明丘美景
机电信息 2018年27期
关键词:可用性应用程序定义

陈颖聪 陈智明 丘美景

(广东电网有限责任公司梅州供电局,广东梅州514542)

0 引言

在当前互联网运行环境下,任何以算法结构设施和软件应用程序为运行基础的公司,皆需要保证在用户和客户对网络有操作请求时其相关系统和应用程序是可用的。但是在过去的几年里,系统常被设置为仅可以在规定运行时间内对请求做出应答;也就是说操作请求倘若发生在规定运行时间以外,其相关用户和客户的请求便无法被受理,继而无法进行有效操作。然而,由于地域的不同,一个城市或国家所设定的有效运行应答时间可能在另一个城市或国家的某项时间段内为无效应答时间。

因此,在不同的市场区域内,用户和客户对系统供应的要求一直在增加,此外,对计算可用性以及正常运行时间的需求也在不断上升。而且由于世界各地的主要Web站点皆为全天候可用,同时没有任何停机时间限制,所以现有的需求已经迫使互联网公司自己寻求提升,继而适应更大的发展空间。

对于国外IT公司来说,这些关于系统和应用程序可用性的需求与以往并没有什么不同。

在过去的10年中,国外IT公司在网络工程可用性维护、系统过程支持和团队力量方面进行了越来越多的投资,以此来满足和管理在其投资组合中每个应用程序所定义的SLA(服务等级协议)。而且从2008年开始,国外IT公司便开始通过对网络系统中的实践、工具、过程、工程、通信和组织方法进行优化来提高整体协议的可用性,同时研究发现,其针对协议的相关工作已经超过了现有的SLA[1]。当然,依据目前掌握的互联网技术,其中的部分优化已然可以有效实现。基于以上分析,在本文中,将对国外IT公司所提出的优化过程中关于可用性SLA的研究作出详细介绍。

当前国外IT公司所使用的网络操作环境主要包括面向公众的基于Web的应用程序和内部使用的ERP(企业资源计划)系统。同时在整体业务运行过程中,网络服务供应商主要对网络运行环境进行服务管理,IT公司则从终端客户的角度负责对系统的开发以及运营进行可用性检测。

本文主要介绍的SLA便是以该类服务分工框架为运行基础,从而为系统提供可被用户和客户接受的正常运行时间以及问题响应时间,继而直接使客户受益。而且该协议还可通过隔离故障干扰来帮助研究人员提升技术开发进度,从而满足网络发展需要,并使得用户以及客户的操作得到最有效的保障。

本文的其余部分组织如下:第1节对可用性的背景进行简单叙述;第2节对国外IT公司所提出的可用性SLA(服务等级协议)进行简要说明;第3节对可用性SLA(服务等级协议)中的DevOps转换进行分析阐述;第4节对国外IT公司的运营经验进行简单说明,并由此对本文所介绍的SLA具有的部分特点进行验证;最后在第5节对全文进行总结。

1 可用性背景

在互联网运算过程中,有一些与IT系统和应用服务的一致交付相关联的核心术语。例如,“可用性”被定义为在计划运行中窗口或调度区间的正常运行时间百分比;而“驱动可用性”则是对系统及其支持操作过程可靠性的定义说明,当然其可以进一步分解为组合应用程序或组件的可靠性。

为了对其中一些术语进行具体说明,我们提出了一些基本的定义。根据以上所述,“可用性”被正式定义为计划操作窗口内正常运行时间的百分比,其计算方法[2]如下:

由公式(1)可知,互联网系统操作的计划时间以及其相关窗口内实现的停机时间对于可用性的计算非常重要。但是由于影响可用性的一个关键因素是程序及其相关组件的可靠性,因此将“可靠性”正式定义为给定时间段[3]内程序无故障运行的概率,表达公式如下:

在开发可用性SLA时,传统方法是先构建一个正常运行时间目标,然后将其通过运算得到的结果作为计划操作窗口总数的百分比。但大多数系统并不能实现100%正常运行时间,因为有些组件最终会产生运行误差,除非每个组件都具有高可用性和冗余故障转移功能,而具备这种功能的设计经常出现在航天器、航空航天系统以及其他生命关键系统[4]上。基于此,大多数互联网系统通常需要考虑的是可用性占正常运行时间的百分比。

但在国外IT公司运行维护过程中,每个应用程序所用SLA的确定不仅需考虑可用性程度,而且还需要考虑包括产品方向、目标用户群体、相关设计维护以及经济学在内的许多因素。基于以上分析,在本文中将对国外IT公司所提的基于ITIL驱动的可用性服务等级协议进行介绍,并提供关于SLA目标本身的相关细节。我们相信此服务等级协议是合理的,并且可以在不同的网络环境中使用。

2 可用性服务等级协议

可用性的高低一直是服务等级协议合理性的关键衡量指标,但是由于以往设置利用的SLA通常致力于提供系统和应用程序的可用性框架,所以其对于可用性的关注并不是太高,因为只要相关协议具有可用性,则其便可以对所包括的系统程序进行操作服务。然而,随着当下互联网用户的激增以及相关技术产品开发对服务管理平台稳定性的要求提高,以往一直使用的SLA不再能够满足用户以及客户的需求。基于此,国外IT公司研究提出了一些包括ITIL驱动在内的新的产品技术。

分析发现,ITIL驱动[5]作为一种以互联网关键信息技术为操作基础的驱动技术,其可以对服务等级协议进行即时监测以及管理。在本节中,将分别从包括架构设计、监测报警以及发布管理在内的三个方面对所提出的基于ITIL驱动的可用性服务等级协议进行分析介绍。

首先对此服务等级协议的架构设计进行说明。为了满足用户以及客户的不同需求,国外IT公司在该协议的每个体系结构层上使用了冗余服务器[6],此服务器可以对一定级别的数据进行复制以及同步,因此该协议下几乎所有的系统架构都具有较高的可用性以及容错能力。而且为了保证现有可用性的稳定性,该协议通过使用Oracle的RAC(有效应用程序集群)等效技术来使系统架构具有实时故障转移能力。

除此之外,国外IT公司还开发了一些应用程序,这些应用程序可以在网络系统出现错误分析时提供智能管理。例如,如果主消息传递路径出现故障,则应用程序可以自动在连接可用时对操作请求进行排队重试,从而防止关键客户事务信息丢失。这种设计对于高可用性的获得是至关重要的。而且这些应用程序还可以将对设计方法的改进反馈到体系结构中,从而可以对未来可能出现的故障进行分析解决。

其次,对协议执行过程中的监测报警进行简要叙述。在整体操作体系结构中,每个系统、应用程序以及组件皆有相对应的监视和警报级别,从而保证给定SLA运行环境的安全性。例如,国外IT公司将自定义日志和警报机制内置到应用程序以及系统结构层中,以此为监视工具的即时应答提供自定义覆盖[7]。此外,国外IT公司还将应用程序组合构建在公共代码库上,从而使得该数据库在协议执行遇到故障时可及时分析相关应用程序页面的行为、性能,继而对所遇异常情况进行报警处理。

最后对SLA下的发布管理进行简单说明。发布管理主要构建在SLA的体系结构和监视领域之上,其可对生产环境中的具体变更进行部署。但是只有当数据集被有效发布及定义,协议结构层才会在生产环境中对这些集合或发布进行调度、测试以及生产执行。当然在这个过程中需要对存储配置、防火墙规则供应进行审查,从而保证数据集的质量以及服务管理的流畅性[5]。由于整个生产发布过程所用的数据集皆为高质量的,所以其可以有效保证计划内SLA的可用性。

3 DevOps转换

在ITIL驱动框架中,安全性是一个一直被广泛关注的关键性问题,因为其将直接决定所提协议是否可以有效运行。经过多年的研究,国外IT公司所定义的InfoSec程序已经可以满足所提协议对于安全性的需求,研究人员只需要将此程序扩展到统一的业务单元[8],继而将其合并到DevOps转换方法中即可。基于此,本文将对基于ITIL驱动的可用性服务等级协议中的DevOps转换进行简要分析介绍,并由此说明DevOps转换在所提协议发展过程中的重要性。

从2015年开始,国外的IT公司便开始深入研究DevOps转换对于互联网技术开发以及可用性SLA运行的意义。研究发现,DevOps转换的关键作用之一是可以实现协议结构框架构建以及部署的自动化,而这将涵盖互联网服务器的代码库以及数据库[9]。这一作用也将通过SLA部署时间的改变而显现,例如DevOps转换使得某些地区的协议部署时间从几小时下降到几分钟,这一特点将为互联网技术产品开发提供开发规划和操作方面的重要选项和敏捷性。

而且DevOps转换对于互联网一般性业务职能的执行也有显著的好处,例如其也可以将安全操作框架融入到具体的操作工作流程中,从而满足用户和客户的需求[10]。当然,以上过程要想有效实现,首先需要将IT服务目录转化为DevOps转换模型中的流程,继而围绕用户支持数据集实现计划内的SLA。换言之,协议内所涉及的部署时间以及操作工作流程等因素要想实现优化从而满足需求,首先需要在DevOps转换模型中进行重新塑造。

DevOps转换的应用为研究人员在解决IT系统开发以及协议构建所遇问题方面提供了一个崭新的视角;不仅如此,该转换方法对于当下所提的SLA可用性的提升有着关键性的作用;而且可以帮助研究人员在过程、技术和通信的广泛领域中对更多的目标进行定义。

4 运营经验

基于上述对DevOps转换的介绍,可以推断认为该转换方法的嵌入将使得本文所提协议具有较高的可用性以及广泛的适用性。在本节中,将通过介绍国外IT公司的相关运营经验来验证该推断是正确的。

国外IT公司对于该项目的研究是从2008年开始的,其最初的研究重点是对发布管理、变更管理以及事件管理进行构建,在此过程中,我们对相关流程以及工具进行了调整及定义。但是由于不同地域互联网用户的激增以及用户对操作需求的提升,其现有的协议可用性已然不能够满足网络系统的运行需要。因此,研究人员在2009年对系统行为和支持操作进行了量化控制,从而建立了足够的人员覆盖计划[11]。

但是研究人员在可用性提升方面仍面临着一个关键挑战,即缺乏对未知结构流程的了解。因此在对应用程序及运行环境进行服务管理时,系统往往需要对其进行反复分析,从而了解未知结构流程的目的以及定义。虽然这样可以保证运行应答的稳定性,但是其本身的不足直接导致管理过程繁琐以及反应时间太长,当然这也为研究人员开发新技术提供了方向。

随着技术的发展,国外IT公司的研究人员通过利用实时可用性指示板[12]来对可行性报告以及安全性进行显示,由此便可以对已定义SLA的生产结果进行可行性反馈。只是该过程同样面临着挑战,即问题管理以及能力规划的不稳定运行,虽然以往针对该现象已经提出了许多方案,但其仍然不能满足IT系统以及SLA可用性的需要。

DevOps转换的提出则为以上所述问题的解决带来了希望,因为该转换方法中所用的转换工具以及流程可以将IT系统中包括开发、运营支持和维护在内的所有应用程序以及组件联系在一起,且可以将未知流程转化成为现有掌握的流程来进行分析,从而有效缩短了分析应答时间,同时DevOps转换也可以通过定义最佳的类方法来对SLA可用性进行维护,而且由于其可以确保所有用户以及客户的充分参与,所以该转换方法的嵌入将会使得本文所提协议具有较高的可用性以及广泛的适用性。换言之,本节开头的推断是正确的。

5 结语

本文主要对国外IT公司所提的基于ITIL驱动的可用性服务等级协议进行了分析介绍,该协议可以对数据事件进行稳定有效的管理转换,从而有效解决了用户和客户在操作请求方面所遇到的问题;同时对服务等级协议内所用的DevOps转换进行了简单的介绍,并证明了DevOps转换对于可用性服务等级协议的重要性;最后通过对运营经验的介绍验证了基于ITIL驱动的可行性服务等级协议具有较高的可用性以及广泛的适用性。

猜你喜欢
可用性应用程序定义
基于辐射传输模型的GOCI晨昏时段数据的可用性分析
删除Win10中自带的应用程序
从可用性角度分析精密空调的配电形式
谷歌禁止加密货币应用程序
医疗器械的可用性工程浅析
成功的定义
黔西南州烤烟化学成分可用性评价
修辞学的重大定义
山的定义
三星电子将开设应用程序下载商店