AP“吊死”现象探讨与分析

2011-06-09 07:23张延彬杜潘峰邢庆文
电信工程技术与标准化 2011年11期
关键词:网线网管交换机

张延彬,杜潘峰,邢庆文

(中国移动通信集团设计院有限公司山东分公司,济南 250001)

1 前言

WLAN(Wireless Local Area Network, 无线局域网)是计算机网络和无线通信技术结合的产物,是固定局域网的一种延伸,WLAN具有组网灵活、成本低、扩容方便、随时随地使用等特点,目前WLAN主要采用的是802.11a/b/g/n的协议。

目前运营商的WLAN网络的基本组成主要包括如下设备:AC(Access Controller,接入控制器)、AP(Access Point,无线接入点)、BRAS(Broadband Remote Access Server)、汇聚交换机、POE交换机等,网络示意图如图1所示。

2 “吊死”现象

随着大规模进行WLAN网络建设以来,部分AP在运行过程中出现吊死现象,吊死是指AP设备在运行过程中的挂起、死机等情况,主要表现形式:在网管中查看AP的状态是正常的,没有发现异常的告警,但是在实际使用过程中无法连接AP并且获取IP地址,导致用户无法进行正常上网,给用户带来极差的上网体验及大量的用户投诉。

根据某省客服投诉和网管统计的数据显示,“吊死”现象占所有故障比例的5%左右,是仅次于“用户多上网慢”、“POE交换机故障”、“覆盖弱”等之后的又一主要故障类型。

图1 WLAN网络示意图

3 典型“吊死”现象场景分析

通过对大量出现“吊死”现象的AP进行分析,总结了以下几个典型场景AP“吊死”现象,通过探索提出了AP“吊死”现象的解决办法。

3.1 场景一

AP指示灯状态为蓝色,能搜索到AP的SSID,但是用户获取不到IP地址,终端显示连接受限或无连接,在AC上查看,AP的运行状态为run,通过对AP的进程进行分析,发现AP的WTPD进程丢失,该WTPD的进程主要作用是管理用户信息。

AP指示灯状态为蓝色时,搜索不到AP的SSID,在AC上查看,AP的运行状态为quit,也通过对AP的进程进行分析,发现AP的BS进程丢失,该BS进程主要作用是管理射频信息。

解决办法:由于是软件问题,可通过断电重启AP或者远程重启AP,使失效进程生效,但这种故障远程重启往往不起作用,对用户的使用及维护都带来较大的麻烦,最根本的解决办法是通过升级AP的软件版本来解决。

3.2 场景二

具体表现为AP的指示灯状态为蓝色,但是AP在一段时间内工作正常,又在一段时间内工作不正常,在AC上查看AP的运行状态都是正常的,但是如果电源电压不稳定时,AP的状态指示灯会出现红蓝交替的现象,通过分析发现主要是由于AP供电不足或者数据传输异常等问题造成的,而造成的供电不足原因是由于网线水晶头未按照568B或568A的标准线序进行制作,数据传输异常是由于AP的射频接口松动或者弯曲,造成AP与馈线连接不好,导致AP发射或者接收信号不正常,从而导致用户获取IP地址困难。

解决方法:加强提高施工质量及施工工艺,规范验收环节验收内容。施工和验收时对网线长度、网线达到的性能、水晶头达到的性能,施工注意事项落实情况都纳入验收环节,施工队伍在施工时也需要按照施工要求进行施工。

3.3 场景三

由于部分场景的AP功率大于12W,POE交换机端口最大输出功率为15.4W,这就存在以下情况,网线长度过长或者网线质量问题,会使交换机端口输出功率与AP的功耗临近一个阀值,很容易导致交换机下AP供电不足,触发交换机POE端口保护,关闭该端口POE功能。

解决办法:检查 POE交换机是否具备这样的功能,如果交换机的POE端口自动关闭并重新检测PD设备,检测成功后POE功能会自动打开。如果具有此功能此时AP就会重新启动并恢复运行。如果没有可对POE交换机的软件版本进行升级。

4 通过网管协助解决设备吊死问题

在网管系统对AP的管理中,对如下的指标进行分析有助于及早发现AP设备吊死现象。

(1)设备上线时长:对某一个AP来讲,设备上线时长数据应是逐步增大的,如果在一个较小的数值范围内波动时,就有可能是频繁离线造成的。

(2)AP与AC的关联状态:AP与AC关联,而业务数据量与正常业务使用时间(如学校的晚上时间)相比,较长时间没有数据量或数据量较小,结合历史数据判断,就有可能出现了设备吊死现象。

(3)当前与AP关联的终端数:在热点区域,与AP连接的终端数长时间为0,结合历史数据判断,也有可能出现了设备吊死现象。

(4)关联失败总次数:关联失败较多,说明设备不能正常接受用户请求,有可能是设备吊死造成的。

(5)使用该信道的终端数、终端连接时长:在一个AP上的终端数或连接时长长时间为0,有可能是设备吊死导致终端无法连接。

(6)硬件模块故障告警、无线链路中断告警、AP无法增加新的移动用户告警:可能出现管理通信正常而业务处理模块故障,虽然网管数据正常,但不能提供用户服务。

(7)AP重启告警、AP下线告警:通信模块出现故障,管理数据上传不正常,也可以怀疑是设备吊死出现的告警。

5 总结

伴随着中国移动坚持快速、优质、低成本打造WLAN网络建设的不断推进,各种新的网络难题不断涌现,为确保网络建设质量,增加网络覆盖,形成网络竞争力,需要我们针对WLAN本身技术的弱点,研究更加高效、安全的网络方案,提高WLAN电信级的运营能力。

猜你喜欢
网线网管交换机
修复损坏的交换机NOS
给水网管的优化布置研究
使用链路聚合进行交换机互联
加强配网线损管理 提高企业经济效益
“五制配套”加强网管
PoE交换机雷击浪涌防护设计
改进等效容量法在含风电配网线损计算中的应用
罗克韦尔自动化交换机Allen-Bradley ArmorStratix 5700
网管支撑系统运行质量管控的研究与实现
从网管系统到网管云:论网管集约化的建设思路