某水电企业信息化运维管理的实践与思考

2020-09-29 07:54宿建波李志飞滑飞
科学与信息化 2020年25期

宿建波 李志飞 滑飞

摘 要 近年来,随着国内ITSS标准的出台和普及,企业信息化运维管理逐渐被国内企业重视,本文详细梳理了国内某水电企业的信息化运维及服务现状,并以ITSS服务成熟度标准为参照,找出企业信息化运维管理的差距与不足,给出具体的提升建议。

关键词 水电企业;信息化运维;ITSS;提升建议

21世纪以来,国内电力行业信息化建发展迅速,除传统的生产自动化和办公电子化外,企业的人、财、物等核心资源,以及生产经营、工程基建、售电配电等主营业务也相继实现信息化管理[1]。但一些企业在大力推进信息化建设的同时,对信息化应用和维护重视不足,导致企业花费大量资金建立的信息系统应用水平不高,未能充分发挥信息化价值[2]。直到近年来,随着国内ITSS标准的出台和普及,国内企业开始逐渐重视信息化运维管理。本文研究的水电企业从2014年起开始着手信息化运维的研究与探索,并开展了大量的实践工作。

1信息化运维行业标准

ITSS(Information Technology Service Standards)是在工业和信息化部、国家标准化委的指导下,编制的一套成体系和综合配套的信息技术服务标准库。该标准全面规范了IT服务产品及其组成要素,覆盖了IT服务咨询评估、系统集成、运行维护和服务运营等各类IT服务类型,是充分适合我国IT发展现状的先进IT服务管理理论。

从ITSS运行和维护的标准要求来看,ITSS标准是在ISO20000和ITIL基础上,为国内企业定制的中国特色实践[3]。ITSS包含4个组成要素和5个生命周期,4个要素即人员、流程、技术和资源,简称PPTR。5个周期即规划设计、部署实施、服务运营、持续改进和监督管理,简称PIOIS。

2企业信息化运维现状

通过实地调研发现,该企业自2013年开始着手建立运维服务体系,建立了运维组织团队、运维管理流程和制度,并组建了IT运维办公室、运维服务台和呼叫中心。

2.1 运维组织体系

运维组织体系由公司信息管理部、业务部门和运维服务商共同组成。运维服务商分为一线、二线和三线人员,其中一线运维人员即服务台座席人员,负责受理用户问题,并解决大部分简单问题;二线人员负责后台技术支持和代码开发;三线人员主要提供原厂支持,并对重大问题进行会诊。公司在业务部门设置关键用户,负责对需求进行审核和确认,并对开发的功能进行测试确认;信息管理部设置系统管理员,负责管理各系统的日常维护和优化。

2.2 运维管理制度

企业制定了《信息系统运维管理制度》,明确了运维工作的职责分工、业务流程、考核管理等机制,对运维服务工作进行了规范。

2.3 服务台和呼叫中心

企业在总部设立了IT运维办公室和呼叫中心,运维服务商统一在此提供服务,企业员工遇到的信息系统问题均可拨打呼叫中心,根据语音提示快速找到对口的服务人员。

2.4 运维管理平台

企业基于ITIL框架,采用IBM Tivoli软件建成了信息系统运维管理平台,实现了5大运维服务流程:事件管理、问题管理、服务请求管理、变更管理和发布管理,但未能覆盖配置管理、安全管理、硬件资源管理等业务领域。

3存在的问题

通过调研分析,比照ITSS的服务能力成熟度模型,发现当前最主要的问题是IT运维服务的能力不均衡、覆盖业务范围不完善,导致ITSS的服务能力成熟度不够。

(1)整体运维管理维度:一是缺少完整的服务目录和服务级别SLA,运维过程中缺少量化管控;二是各专业组之间“竖井化”严重,缺乏清晰的协作方式;三是网络安全工作重点主要还在依靠设备实现技术防范。

(2)组织与人员维度:一是运维服务人力资源紧张,许多关键岗位未能落实到人;二是岗位职责定义和岗位胜任力的定义不合理,无法满足当前新技术爆发式增长背景下的运维管理需要;三是现有的服务台座席服务范围局限在应用系统级,未能充分发挥用户界面统一入口和7×24小时专人值守的功能优势。

(3)管理流程维度:一是流程管控不完善,上线流程对运维工作覆盖面偏小;二是现有流程老化,各专业组之间协同少,尤其是信息安全管控不足;三是现有流程工具对流程运转过程的监管能力较弱,数据对服务报告支撑也不足。

(4)技术和资源维度:一是没有专门的准生产环境,复杂操作难以开展验证测试,IT运维的风险控制受到较大局限;二是现有的监控平台、流程平台、知识库采购时间较早,监控采集能力和监控策略的优化都存在灵活性、扩展性方面的不足;三是CMDB建库及支撑工具流于形式,没有真正发挥支撑运维体系的作用。

4提升建议

根据企业現状调研评估的结果,按照ITSS服务能力成熟度的要求,针对发现的问题提出改进路线图,对企业运维架构与模式提出相关优化建议,分为近期和远期两个阶段进行整改,以打造优质IT运营能力,并提升公司形象。

近期目标是提升IT运维管理水平,管理成熟度达到ITSS的3级(拓展级)的要求,为后续的改进提升夯实基础。在此基础上稳定运行一段时间后,IT运维管理成熟度将持续深化演进,最终达到ITSS的2级(协同级)的水平。

4.1 整体运维管理维度

(1)全面梳理IT运维业务,完善运维管理流程,实现业务全覆盖。厘清各专业组间工作界面和协作关系,建立清晰的协同机制,消除“竖井化”。

(2)从IT服务能力角度梳理并建立完整的服务目录,指导运维能力的配置,并针对每个服务项制定清晰的服务水平协议(如工单的及时完成率、回退率等),以此作为运维服务质量考核标准。

(3)现有服务台座席从应用系统的专用服务台升级为企业IT运维服务台,作为信息化统一服务窗口和值班中心。

4.2 组织与人员维度

(1)梳理并优化运维人员职责,根据服务目录、依照流程角色和职责划分工作项,并分配至确定的岗位,对应到具体的人员。为各个流程指定流程管理员和关键角色,对各流程具体执行过程进行协调和管理。

(2)为各个流程指定流程管理员,对各流程具体执行过程进行协调和管理,并按流程增加关键角色(如问题专家、知识专家、配置管理员等)。

(3)加强一线运维工程师在服务和技术方面的专业培训,对业组和外包商运维管理人员进行必要的管理理念导入和规范化培训;落实关键岗位的A/B岗制度,并对B岗进行充分培训以保证其可用性。

4.3 管理流程维度

(1)推行全面“工单化”,新梳理的流程在新的运维管理平台上运行,不仅界面更合理,功能更灵活,而且可以统计相关指标数据,并进行SLA和OLA的时效性告警;启用“通用任务工单”,填补传统流程的管理空白,以便统计工作量和工作绩效。

(2)梳理并优化完善运维各流程设计,实现闭环管理和基于SLA的过程管控;适当考虑对流程环节超时的告警/催办;

(3)梳理运维活动中的信息安全控制点,注重运维服务工作的安全风险评估。

4.4 技术和资源维度

(1)为核心系统搭建“准生产环境”,在变更方案正式投用前验证有效性、安全性,以降低生产环境下的操作风险。

(2)排查IT系统风险,对重要系统和设备调整或补充监控点及告警策略,并加强应用监控和日志监控;优化监控及告警策略,清理监控配置数据,减少“垃圾告警”。

(3)对主要系统、核心设备的“正常状态”建立配置基线,作为巡检、故障恢复的参照基准;总结、完善常见问题的排查、处置和预防的方案,逐渐形成标准操作规程库。

企业IT运维服务体系的改进提升,是一项长期而复杂的工作,需要循序渐进地开展。根据企业战略发展目标和IT运维管理现状,本着“急用先行、易达先行”的原则,尽快弥补当前运维体系中的关键性短板,在此基础上,以“ITSS服务成熟度2级”为目标,持续开展IT运维服务体系的优化工作。

参考文献

[1] 张文.水电企业信息化管理初探[J].经济师,2010(2):226-227.

[2] 施向强,谢莹.探讨中国水电企业信息化管理模型的建立[J].水电厂自动化,2005(3):53-57.

[3] 中国电子技術标准化研究所. IT服务管理标准理解与实施GB/T 24405.1(IDT ISO/IEC 20000-1)实用指南[M].北京:电子工业出版社,2011:109.