校园网常见故障及快速排查

2017-04-18 16:19江坚
电脑知识与技术 2016年35期
关键词:故障类型故障原因校园网

江坚

摘要:校园网网络大、业务多、故障问题定位复杂,网络的安全性差、管理难度大,一旦发生网络故障,涉及面广而且损失严重。校园网络故障是不可避免的,关键是如何建立一套系统地处理故障的思路及流程,尽快找出故障点及其原因。该文以河源技师学院校园网为缩影,基于校园网的应用特点,指出当前校园网的故障类型,剖析导致故障发生的原因,研讨如何快速地查找和处理网络故障。

关键词: 校园网;故障类型;故障原因;快速查找

中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2016)35-0036-03

第一代校园网起源于 1996 年,以10/100Mbps以太网技术为分布的PC提供了一个便利的连接通道,满足PC的大规模部署给学校用户带来的内部联网的需求,其典型特征是资源共享。从2000年开始, 1000Mbps以太网技术使校园网发展到第二代,带宽的提高给校园网的建设带了新的生机,促进了应用的发展,出现了多媒体教学、办公自动化、网络图书馆、流媒体下载等应用,使网络成为现代职业教育的一个不可或缺的平台。2006年,校园网进入第三代,称之为服务型多任务校园网,能保证多业务安全、稳定、高速的运行,适应和满足用户增添的不同应用,使学校的管理者不再关注增加一个新应用是否需要重建新网络。图1是校园网拓扑结构参考原型。

教育的不断进步,对校园网提出了更高的要求,行政管理、图书资料管理、资源信息等局域网应用加大;通过与广域网的互联,实现校际间的信息共享及与因特网(INTERNET)的连接。通过与宽带数字卫星相联,实现远程教育。此外,校园网还要为学校的教学、管理、日常办公、内外交流等各方面提供全面、切实的支持。使校园网规模的逐渐扩大、系统应用的不断深入,网络环境越来越复杂。

校园网的完善带来了便利,随之而来的是校园网的故障问题,网络系统在运行中会经常不断出现网络不通、网速缓慢、登录失败、安全漏洞、电脑病毒等故障,影响了校园网的正常使用,成为阻碍高校校园网进一步深化和发展的瓶颈。校园网常见故障种类如下表1所示。

2 校园网常见故障的快速排查

校园网覆盖范围大、拓扑结构复杂,其故障率一直居高不下。高校日常教学和事务越来越依赖校园网,一旦网络发生故障又不能快速修复,其损失严重甚至是灾难性的。如何快速查找故障对网络管理员来说是个挑战,除了对网络及其技术有着深入的理解,还必须结合一定的实战经验,掌握一套快捷实用的故障查找及处理方法。

3 流程步骤分述

步骤一:故障判断、范围

1)收集故障信息,包括用户主机的状态、路由器的接口状态、交换机的端口指示灯、进程命令、服务器的内存剩余值、CPU利用率、日志提示等。初步判断故障性质以及故障表现特征。

2)根据故障表现,通过最基本的检查方法和实战经验,判断故障所涉及的范围。若一个或多个子网的用户访问服务器失败,就涉及全网的各结构层;若同一子网中不同用户之间共享失败,属于单个子网故障;同一子网中只有一个用户访问服务器失败,那是单用户问题。从而判断该故障只涉及单用户?某个子网?还是全网?

步骤二:查找故障点

1)全网故障的查找步骤:

(1)检查相关应用服务器的工作状态(是否被攻击或感染病毒、服务软件系统是否正常)、网络连接、服务设置等;

(2)检查路由设备(三层交换机或路由器),包括端口IP地址、VLAN匹配、路由表等;

(3)检查汇聚层交换机是否存在软硬件故障;

(4)检查主干传输链路(汇聚层到核心层、汇聚层到接入层)有否物理故障。若在故障查找过程中优先使用网络测试仪器和测试软件,可大幅提高排查速度。

2)子网故障的查找步骤:

(1)检查该子网所在的接入层交换机是否有软硬件故障,例如端口接触不良、配置文件丢失或被修改、VLAN设置出错等;

(2)检查相关用户的节点传输链路有否物理故障;

(3)检查故障用户的IP参数设置,例如工作组名、网段号等;

(4)检查本子网共享资源的设置状况,例如权限或软件防火墙的设置。

3)单用户故障的查找步骤:

(1)检查用户主机是否有硬件故障;

(2)检查操作系统是否有感染病毒或死机现象;

(3)确认主机系统正常之后检查网卡的连接,包括网卡状态及其IP参数设置、双绞线和接入层交换机端口;

(4)检查客户端应用程序是否有问题。

步骤三:确认故障点并找出故障原因

在排查的过程中不要单凭一次的检测或分析就急于下结论,应该通过分步排查,不断地缩小搜索范围,经过反复测试和检验才确认,最终能够圈定故障点。对于一些由多个故障构成的综合型故障,必须边排查边处理,直到完全解决问题为止。此外,确认故障点后还要找出故障原因。例如最终排查结论是用户计算机网卡故障,那么到底是网卡本身硬件质量问题?扩展槽接触不良?还是無故丢失了相关的IP参数?又例如代理服务器故障,到底是主机的硬件故障还是服务软件出错?

步骤四:实施故障处理

故障查找完成之后,制定合理的故障排除方案。依照快速处理的原则,什么措施最快完成故障处理就用什么措施。例如网络广播风暴或计算机病毒初现时,首先就应该切断相关的病患子网干路,防止故障进一步蔓延,而不是急于查找故障病源;处理交换机的端口问题应马上转接备用端口,而不是更换交换机;已查实某段线缆时通时断,应首先考虑重接水晶头,而并非沿线普查或更换线缆等。总之,什么措施最快完成故障处理就用什么措施。

4 故障查找案例

我校园网所属的教学管理区的拓扑简图如下图3-1。当前的故障现象有两个:一是A、B子网的用户与日志服务器之间的FTP通信都很慢,大约只有0.6Mbps;二是将日志服务器的数据集中到B子网的备份服务器时,FTP 传输速度也很慢,大约只有0.8Mbps,严重影响了工作效率。

按上述故障查找流程,具體排查的步骤如下:

第一步:根据在现场收集到的有关信息,该故障性质可描述为网络访问缓慢故障。通过基本测试,发现B子网的用户与备份服务器之间的FTP 传输速度约为10Mbps,属于正常范围;另发现A子网的客户机因教学需要而数据量不断在增长。以当前故障的属性和测试结果进行分析及判断,故障范围涉及两个子网,即上述流程的全网区域。

第二步:①检查备份服务器和日志服务器。鉴于B网段用户访问备份服务器的速度正常,可判断备份服务器无问题。在非网络连接状态下,利用操作系统自带的性能监视器测试日志服务器的各项静态指标,再检查系统应用程序和职能服务项目,结论是一切正常。由此可排除服务器的影响。②检查路由器。在A、B子网的两个路由器之间直接采用tracert命令测试网关的响应,探测报文返回时长仅为9ms,表明路由状态正常。③检查汇聚层交换机。由于B子网内用户与备份服务器的通信正常,可判断B子网的汇聚层交换机无故障,只须检查A子网的汇聚层交换机。采用OptiView网络综合协议分析仪直接测试交换机的传输性能,发现交换机输出大量的广播包和多播包,应该是这个故障点了,因为日志服务器需要花费大量资源来处理如此多的广播和多播包,其传输速度必然减慢。

第三步:确认故障点并找出故障原因。为了证实判断,断开A子网的汇聚层交换机后,在B子网的客户端访问A子网的日志服务器,测得FTP 传输速度约为8.5Mbps,增加了10多倍,果然是网络负载的影响,即A子网中广播包太多了。经了解,由于教学上的共享需求,每个用户在交互操作中必需发送大量的广播包和多播包,这是难以避免的客观应用事实,不能因此而停止A子网的工作,只能在网络配置上作适当的调试。

第四步:实施故障处理。将日志服务器移到B子网,用路由器隔离A子网的用户群,使它与日志服务器不在同一广播域,日志服务器就不必面对大量的广播包和多播包,减少了服务资源的浪费,故障就较少出现了。

日志服务器移位之后重新测试两个子网的传输性能,B子网完全正常,用户与服务器之间、服务器与服务器之间均为10Mbps左右;但A子网访问日志服务器的速度虽比原来快,却只有1.3Mbps左右,达不到应有的标准,测试结果说明A子网还有未知故障。

第五步:依照故障查找流程,A子网还差主干传输链路尚未检测。断开路由器A到汇聚层交换机之间的线缆端口,采用线缆测试仪检查该干路线缆(多模光纤)的传输性能,发现传输衰减系数比较大,初步分析可能传输介质发生故障。检查该线路经过的路线,发现在五楼暗角转弯处,线缆弯曲度太大,致使多模光纤已断裂了几芯。修复之后再重新测试整段链路的传输特性,各项指标均达到要求。再测试A子网访问日志服务器的速度,约为6Mbps,已满足访问需要。

至此,上述故障全部排除。

5 总结

如何快速诊断及处理校园网故障,一直困扰着不少网络管理员,因为校园网规模大、信息点多、拓扑结构复杂和可管理性差,而且故障排查难度大,有时一种故障表现会由多种故障原因引起,加之人手少和缺乏排障经验。

传统的故障查找基本上依赖实战经验,而实战经验需要长时间的历练和积累,因此传统的排障方法显然跟不上飞速发展的校园网。本文提出的流程型快速查找校园网故障的方法,是基于故障的属性判断它发生在哪个范围并分列不同的流程,然后再按照一定的经验和规律,例如先硬件后软件、从核心层到接入层、或从网络层到物理层,结合一些常用的网络测试工具,分步及循环地反复排查,可以快捷地查找出校园网常见的故障。

参考文献:

[1] 黎连业.网络综合布线系统与施工技术[M].机械工业出版社,2006:158-266.

[2] 刘晓辉.网管从业宝典:故障排除经典案例分册[M].重庆大学出版社,2003:33-86.

[3] 王竹林.校园网组建与管理[M].清华大学出版社,2006:52-136.

[4] 谭珂,全惠民.局域网组建与管理实用手册[M].中国青年出版社,2005:69-129.

[5] 许文胜.局域网故障排除[M].上海科学技术出版社,2002:165-191.

[6] 武程凯.中国远程教育与校园网建设实务全书[M].银声音像出版社,2006:68-125.

[7] 符水波,童爱红.校园网系统维护与故障诊断[M].清华大学出版社,2003:82-156.

猜你喜欢
故障类型故障原因校园网
试论最大匹配算法在校园网信息提取中的应用
NAT技术在校园网中的应用
高压输电线路故障类型与防范举措研究论述
关于电气控制与机床电路检修实训教学的初步探索
VPN在校园网中的集成应用