基于Python语言的智能信息化运维管理平台的应用

2022-04-27 08:00尹周军
天津冶金 2022年2期
关键词:运维故障智能

尹周军

(唐钢国际工程技术有限公司,河北 063100)

0 引言

唐钢国际工程技术有限公司(简称“唐钢国际”)创立于1973 年,是以绿色智能冶金技术研发为核心的高新技术企业,注册资本1 亿元人民币。作为中国冶金工程技术领域的中坚力量,唐钢国际着力整合产业链资源,提供全流程服务,形成了集工程总承包、咨询、设计、研发、监理、信息化、智能化于一体,业务覆盖至国内外钢铁、环保、市政、建筑工程等领域的创新型国际化工程科技公司。唐钢国际随着信息化系统的发展建设,先后投入并运行了办公OA、协同设计、出图管理、档案管理、防水坝等一系列信息系统平台。信息化系统的推进及发展,对企业提高经济效益、提升管理水平、降本增效上起到了至关重要的作用,是公司迈入企业高质量发展的新起点的标志。

信息化系统平台的点检工作是各信息系统稳定运行的关键,设备运行情况决定了出图、制图、管理等方面的有序进行。长期以来,信息设备的点巡检工作一直采用人为记录的方式,大量的点巡检任务及结果依靠人工的记录与处理,难以保证数据的有效性及信息的传递;同时部分业务数据存在于单独信息系统之中,数据查询方式复杂,无法实现数据共享,不能有效的提高工作效率。本文阐述了基于Python语言的智能信息化运维管理平台开发的必要性,介绍了智能信息化运维管理平台的主要功能,总结分析了智能信息化运维管理平台的开发过程和应用效果。

1 基于Python 语言的智能信息化运维管理平台开发必要性

1.1 提升信息化管理水平的内在需求

唐钢国际目前信息化系统点巡检工作主要靠传统的人工巡检模式,巡检工作往往流于形式,服务器硬件不出问题即没有问题,对于巡检数据没有进行记录管理,往往导致小的故障日积月累后形成大的隐患,隐患发展成业务故障无法使用时,故障原因查找不容易,并且抢修时间会大大增加,因此加强设备点巡检不仅可以提高设备使用寿命,也可以减少故障维修时间,保证了信息化系统运行稳定,提高企业经济效益。同时,以往对于运行中的系统及设备故障往往是被动叫修,故障出现时不能及时查找问题本质原因,延误了信息系统的恢复,影响了正常的办公及系统使用。

1.2 智能化时代的智能需求

随着智能化时代的来临,我们可以借助智能化、信息化手段实现内在需求的解决方案,让一些重复性、固定性强的工作,由机器或者程序来取代,彻底解放人的双手,对于这部分工作来说,机器往往比人更可靠,更准确。智能化的到来,大大提高了劳动生产力,降低了运维人员的劳动强度,运维人员可以将节省的精力放在智能化的推进与完善,不仅提高了信息化系统运行稳定性,也大大提高了运维人员知识技术水平,同时也促进了运维管理人员的思维提升。

1.3 智能信息化运维管理平台系统目标

唐钢国际根据公司现代化管理的需求,提出了智能信息化运维管理平台的研发。目标为利用信息化手段,实现管理创新、技术创新的现代化管理体系,同时利用智能信息化实现各信息系统之间的信息传递,从而实现各设备及系统运行情况及时准确的传递,减少设备故障时间,提高信息化管理水平,为公司实现先进技术从“跟跑”到“领跑”转型奠定基础。

2 智能信息化运维管理平台开发过程

2.1 运维管理平台需求分析

智能信息化运维管理平台的研发人员主要围绕在系统服务器日志、性能(内存、CPU、存储等)、应用服务、网络监控等方面进行沟通论证,暂定运维平台主要围绕以下几点功能开发搭建:

(1)围绕交换机设备日常管理功能。平台需要将每日交换机点检信息自动保存,并对异常信息即时进行提示,以便网络运维技术人员尽快查找异常信息并解决。

(2)围绕服务器设备日常管理功能。平台需要将每日服务器设备(Windows系统、Linux系统)点检信息自动保存,并对异常信息分级提示,以便主机运维技术人员尽快查找异常信息并解决。

(3)围绕信息化设备在线运行监管功能。平台需要设备出现断电、故障等问题时,及时提示给运维人员,尽快处理异常故障。

(4)针对运维过程,平台具备快捷查找信息设备及运维相关信息,具有消息发布机制,用于故障提醒、信息查询等功能。

(5)办公OA 系统中会议管理有相关接口具有快捷便利展示会议信息功能。

(6)平台具有巡检数据存储功能,即保存于数据库中,用于二次开发形成报表图表。

2.2 运维管理平台功能设计

(1)交换机设备。交换设备主要点巡检内容为设备状态、CPU、内存、风扇、温度、在线时间等参数,实现巡检内容保存到数据库中,并且生成Excel文件,自动更新到办公OA 系统的交换机巡检记录中。同时,对交换机设备配置信息实现每周一次自动备份任务。

(2)服务器设备。服务器设备主要点巡检内容为内存、CPU、硬盘使用率、服务状态等参数,实现巡检内容保存到数据库中,并且生成Excel 文件,自动更新到办公OA系统的服务器巡检记录中。

(3)消息发布。针对巡检过程中的异常参数以及设备运行时异常状态,及时发布异常消息提醒,运维技术人员及时处理消息;鉴于信息主要是基于OA系统中相关运维信息台账,查询数据库信息并通过消息反馈,消息发布主要采用飞秋、微信手段。

(4)会议管理。采用B/S结构实现在办公OA系统中进行实时会议展示和会议预约功能。

(5)数据展示。采用HTML5 网页展示各信息化系统设备性能曲线、图表等。

智能信息化运维管理平台详细结构如图1所示。

图1 智能信息化运维管理平台基本架构图

2.3 运维管理平台编程语言选型

智能信息化运维管理平台开发语言选择Py⁃thon,选用Python 语言的主要原因是简单、快速、灵活,俗称“胶水语言”[1]。

(1)网页部分采用Flask:Flask 是一个轻量级的可定制框架,使用Python 语言编写,较其他同类型框架更为灵活、轻便、安全且容易上手。它可以很好地结合MVC 模式进行开发,开发人员分工合作,短时间内就可以完成功能丰富的中小型网站或Web 服务的实现。另外,Flask 还有很强的定制性,用户可以根据自己的需求来添加相应的功能,在保持核心功能简单的同时实现功能的丰富与扩展,其强大的插件库可以让用户实现个性化的网站定制,开发出功能强大的网站。

(2)智能信息化运维平台研发主要用到的Py⁃thon库有[2]:

Paramiko:用于建立SSH2 连接(客户端或服务器)的库。重点是使用SSH2 作为SSL 的替代方法,以在python 脚本之间建立安全连接。支持所有主要密码和哈希方法,也支持SFTP 客户端和服务器模式。

xlsxwriter:主要用来生成excel表格,插入数据、插入图标等表格操作。

Subprocess:主要用来生成子进程,并可以通过管道连接他们的输入/输出/错误,以及获得他们的返回值。

Pythoncom:提供了使用windows com组件的能力。

Pyodbc:ODBC 的一个python 封装,它允许任何平台上的python 具有使用ODBC API 的能力,用于数据库连接。

Flask:Flask 是一个使用Python 编写的轻量级Web 应用框架。

(3)会议、数据展示使用HTML5、CSS、JavaS⁃cript 等相关知识;数据库方面采用的是Sqlserver 2008R2。

3 智能信息化运维管理平台投入使用效果

鉴于Python 快捷、简单、易学的特点,唐钢国际信息化团队迅速成立研发攻关小组,根据信息化运维方面的需求及痛点,迅速开发出了智能信息化运维管理平台,降低了运维技术人员劳动强度,大大提高了运维水平,减少了运维时间,提高了信息化管理水平。

(1)智能信息化运维管理平台的搭建,大大减轻了技术人员点巡检时间,取消了纯人工手动记账模式的运维方式。从点检、备份等工作内容来看,以前的纯人工点检时间为每天2 小时左右,现在智能点检时间为每天12 分钟左右。同时对于信息系统故障的处理模式由被动运维改为主动运维,实现了从0到1的过程。

(2)智能信息化运维管理平台的搭建,对锁定信息系统故障、信息设备点巡检、信息设备运行监控起到了决定性的作用,使运维人员管理水平、思维水平都得到了巨大进步,同时使公司信息化系统运维管理模式逐步从人工向自动化、智能化迈进。

4 结语

实践表明,唐钢国际基于Python 语言的智能信息化运维管理平台的研发,使得信息化系统的设备运维方式由被动改为主动,降低了运维技术人员的劳动强度,实现了提高智能信息化平台的管理和运维水平的既定目标。

智能信息化运维管理平台的投运,标志着唐钢国际信息化管理水平迈上新的起点,在该平台基础上,还会继续进行深度开发,根据功能需求扩展平台内容模块,同时对公司今后业务流程系统的管理提供了先决条件。随着智能信息化运维管理平台的深度研发与使用,对公司提高工作效率、管理水平、创新意识也起到了推动作用。

猜你喜欢
运维故障智能
高速公路智能运维平台
故障一点通
运维技术研发决策中ITSS运维成熟度模型应用初探
智能前沿
智能前沿
智能前沿
智能前沿
配电线路的运维管理探讨
奔驰R320车ABS、ESP故障灯异常点亮
基于一体化的变电标准运维模式