故障管理在维护计算机信息系统中的应用*

2011-08-15 00:54李旭军
湖北科技学院学报 2011年10期
关键词:计算机信息服务器监控

李旭军

(安徽经济管理学院 计算机工程系,安徽 合肥 230051)

故障管理在维护计算机信息系统中的应用*

李旭军

(安徽经济管理学院 计算机工程系,安徽 合肥 230051)

维护计算机信息系统的目的是要保证信息系统可靠正常地运行,并在系统不断的提高与改善中,发挥充分的作用。故障管理即信息系统异常情况下的管理操作,通过动态地网络维护,来维持一定服务水利的正常运转。故障管理在维护计算机信息系统中的应用是有组织、有计划的一系列活动,从而保障计算机信息系统中各个要素始终处于正确的、最新的工作状态。下面,本文就对故障管理在维护计算机信息系统中的应用进行分析,从而对故障管理效用加以明确。

故障管理;计算机信息系统;维护;应用;分析

维护对于保障计算机信息系统连续平滑的运行是十分重要的,维护的理由主要包括:管理者或风险承担者提出新的要求、软件版本更新、错误或故障、性能要求提升、硬件或技术问题等等。计算机信息系统运行中,故障因素十分普遍,是维护活动中重要的针对目标,在维护计算机信息系统的应用中融入故障管理十分必要。

一、计算机信息系统内涵

(一)计算机信息系统概念

随着计算机技术的不断发展,因特网技术已得到了广泛的应用,计算机单纯作为一台文字处理机的时代已经不复存在。现代的计算机同网络密切相关,已经成为制造、收发、处理信息的信息处理机。当前,政府机关和各企、事业单位均已淘汰了过去的单机时代,而是由服务器(WEB服务器、文件服务器、邮件服务器、打印服务器等)、个人计算机、局域网和外设(扫描仪、打印机、摄影机、数码摄像机、数码照相机等)及软件(单机操作系统、网络操作系统、各类应用软件)构成一个办公或工作系统,由于这一系统主要通过计算机来完成对于信息的采集、共享、收发及处理的,故将其称作计算机信息系统。

(二)计算机信息系统功能

当前,计算机信息系统在各企事业单位应用广泛,其主要功能应用包括以下几个方面:第一,信息共享功能。由于单独的个人电脑,均是通过局域网的形式连接的,因而,使得计算机同计算机之间、服务器同计算机之间都可通过网络的发送、传递和相互访问,来实现信息资源的共享;第二,设备资源共享功能。计算机信息系统中,所有人员均可通过网络,来实现系统内硬件资源和共享服务器中软件资源的共享;第三,网上办公功能。计算机信息系统是网络互连的形式,只需要进行网上办公软件的加装,就可实现无纸化办公、网上办公,办公效率提高的同时,办公成本进一步降低;第四,网格计算或集中计算功能。在将进行对大量数据的处理时,如单个计算机运算能力不足时,可通过网络计算或集中计算软件,将计算任务发送至空闲计算机上进行计算,设备得到充分的利用,计算效率大大提升;第五,因特网共享功能。在互连局域网中,只要一台计算机通过ADSL或MoDEM或AdsL同因特网相连,系统内的所有计算机均可通过代理服务器(ProXv seⅣer)软件来全部链接因特网。上网经费大大节约,上网规模进一步扩大。

二、计算机信息系统故障分析

对于计算机信息系统故障的孤立与分析是故障管理在维护应用中的关键,其基本方法可归纳为:系统—设备—部件—器件—故障点的故障检查范围层层缩小的顺序。针对于计算机信息系统的故障,首先应明确是个性故障还是共性故障。个性故障只会发生在单一的设备上,而共性故障则会同时出现在几台相同设备或所有工作站上。如存在共性故障则说明在计算机信息系统公共部分如网络、交换机、服务器等公共设备出现了故障,而对于个性挂账,则只需要对故障设备作出怀疑即可。通过以上对于计算机信息系统的故障分析,我们可以作出一个计算机信息故障分析流程图,以此流程作为故障排除的依据,从而有的放矢、少走弯路,达到是事半功倍的效果。从表现形式上来看,计算机信息系统故障又可分为硬件故障和软件故障,其中,软件故障占据了信息故障率的80%以上,将软件故障作为故障管理在维护计算机信息系统应用的重点内容,利于计算机信息系统维护效率的明显提升。

三、故障管理在维护计算机信息系统中的应用

(一)维护的流程

故障管理对于计算机信息系统的维护是一个方法化、系统化的过程。一个良好的维护顺序十分必要,维护顺序即一项维护要求所引发的系列事件顺序。如在系统维护中,软件维护工作是重点内容,其维护工作的开展应首先通过维护申请单,来对维护请求进行提出,再由专业维护队或开发队进行认可变更。维护申请单是一种规范化、且经准许程序修改的文档,其对系统管理员工作轨迹加以记录,便于责任的明确和对系统管理员做出业绩评价。

(二)维护的原则

故障管理在维护计算机信息系统的应用中,面对着庞杂和多样的设备,诸多用户的要求纷至沓来,通常会使得维护管理者一脑浆糊、眼花缭乱。人们从实践应用中,总结出一些通用的原则:清晰、简单、交流、自动、概要、由简入繁。

(三)维护的内容

1.系统内应用程序的维护

对于系统内程序的维护主要是通过改写全部或部分程序来加以实现、以原程序为基础来进行修改的。对于原程序的修改应注意以下两个方面:第一,在程序首部序言进行注释语句的说明,对修改人员、日期加以指出;第二,注意对程序修改登记表的填写,填写的内容应包括:程序名、系统名、修改内容、修改理由、修改日期、修改人和批准人等。

2.对于代码和数据的维护

对于数据的维护应当专人负责,主要负责数据库的完整性、安全性及其控制,对数据字典文件进行定期的生成,并在数据库工作恢复之后,能够对硬件故障加以排除。对代码的维护则包括添加、删除和新设计等内容,当代码必须变更时,则应由计算机相关人员和现场业务经办人组成专门讨论小组,并组织相关使用者进行学习,采用书面的形式,将计算机代码体系进行输入,其维护的关键在于对新代码的贯彻实施。

3.对于文档的维护

在实施对于应用程序、代码、数据的维护之后,应以维护变化为依据,对相应的文档加以修改,并确保同系统的一致性。维护基础打好之后,应对维护的相关内容进行记载,主要包括:维护工作的执行人员、时间、情况、内容等。

4.对于硬件设备的维护

对于硬件设备的维护应包括对打印机、计算机、服务器、网络设备的日常维护和管理。由专门人员进行负责维护工作,对设备开展定期的检查、杀毒和保养工作,同时还应进行设备检修登记表和设备故障登记表的设立,从而便于设备维护工作的开展。此外,还应通过定期检查,来对潜在故障隐患进行及时的解决,从而保障各设备稳定性、安全性等都处在良好状态。

(四)故障管理在维护计算机信息系统中的具体应用

1.监控

计算机信息系统的良好运行是以恰当的硬软件平台支持系统运行为前提。日常的计算机信息系统运行过程当中,应通过监控来确保良好的系统运作,经迅速检修来对故障源加以确定,及时进行修复,从而获得信息系统性能相关的评估数据,便于对日后故障的预测和应对。

(1)历史监控

所谓历史监控,即指的是在预定时间间隔内轮询系统从系统各个组件的统计数据和使用视距加以收集,并对系统服务提供的工作情况进行检查。对于系统的使用情况和可用性进行历史监控,对长时间的运行统计数据进行记录,以做图示分析之用。

(2)实时监控

所谓实时监控,即指的是轮询整个系统状态和监视其他系统向监控系统发送及时的故障提醒。通常情况下,实时监控检查服务是否响应、计算机是否停机、网络是否堵塞等。通过实时监控可将发生故障及时地通知信息系统管理员。实时监控包括两个组件,即用来报告故障的报警组件和用来发现故障的监控组件,监控的目的在于使系统管理员能在用户之前将故障发现,将停机时间尽可能地缩短,并在用户观察之前将故障尽快地进行修复,从而促进服务质量的提升。实时监控部不应当仅限于面向用户的故障报告,而应进行精确故障信息的提供。

2.提供用户支持

用户支持的提供主要是对用户请求的接受和处理,并做好故障问题的跟踪。一般情况下,企业应进行帮助平台的建立,这可以是虚拟的,也可以是现实的,用户可在这里报告问题来请求新的服务。帮助平台的界面应该友好且有足够人员的业务支持、有具体的职员步骤流程、有预定期的覆盖范围、有相应的升级流程及跟踪呼叫软件。

3.合理调试

合理调试是发现、解决系统故障的基础,亦是故障排除的主要手段。调试的前提是明确用户的问题所在,找出故障的元凶并加以维修。表面或暂时的维修是不能从根源上来解决故障的,如果故障没有从根本上解决,类似故障还会继续发生,甚至进一步严重。调试应当使用正确的工具,有物理设备,也软件工具,可以下载,也可以自己制作。一般来讲,常见的调试方法有两种:逐次改进法和排除法。逐次改进法是增加系统的新组件,对每一步是否发生预期结果加以验证。排除法则是将系统中不同部分移走,直至问题消失。对于硬件故障的调试通常采用排除法,例如进行内存条的替换或将板卡拔掉直至系统能够启动。在软件的应用程序上,排除法亦可采用,比如排除应用程序或驱动程序的潜在冲突,直至故障得以消失。有些操作系统配备有自带工具,可对可能故障进行搜索或测试模式的提供,从而缩小故障调试范围。

4.变更管理

变更管理是对计算机信息系统的变更进行分析、计划,并保证其有效实现的过程。是满足系统维护的核心内容。通过此类机制,管理员在实现变更之前,应对变更的不同方面进行仔细的考虑,从而减少问题或故障的发生。变更管理同时也是一种通信工具,它能够保障发生变更时,所有人都保持同一步调。这样可以使变更发生时混乱减少,并作出尽快的处理。

5.计划维护窗口

维护窗口是维护信息系统应用中的一部分,就同许多人每月或每月的定期扫除一样,十分必要。应将系统电源冷却、关掉,放完电后再将其充满。在服务器间对大量数据进行移动,整理凌乱的电线,从而为优化系统性能提供增长空间。主要网络和系统的工作维护窗口应进行调度,根据企业大小,定期对窗口进行维护。

四、总论

故障管理在维护计算机信息系统中的应用是一系列的过程,以故障维护为出发点,积极地实施,从而使得计算机信息系统良好地运行,应有作用得以充分发挥。随着计算机技术的不断发展,故障管理在维护计算机信息系统的应用中必将日益完善。

TP31

A

1006-5342(2011)10-0174-02

2011-08-30

猜你喜欢
计算机信息服务器监控
BIM时代计算机信息技术在建筑工程中的应用
The Great Barrier Reef shows coral comeback
计算机信息技术在食品质量安全与检测中的应用
上海万欣计算机信息科技有限公司
通信控制服务器(CCS)维护终端的设计与实现
你被监控了吗?
Zabbix在ATS系统集中监控中的应用
浅析维护邮政计算机信息系统的策略
中国服务器市场份额出炉
得形忘意的服务器标准