基于PS域纵向推进式故障诊断系统的研究与应用

2011-06-09 07:23张文勋
电信工程技术与标准化 2011年11期
关键词:话单网元核心网

张文勋

(中国移动通信集团山西有限公司,太原 030009)

随着通信网络规模的不断扩大和运营商之间的竞争格局加剧,网络通信质量和网络可靠性成为市场竞争中非常关键的环节。网络维护工作重点要求从“面向网络”转化为“面向用户”。基础维护工作要从用户业务感知出发,针对故障处理应提前于客户发现问题,快速、准确定位故障原因,及时、有效解决问题。但与此同时,由于3G业务的快速发展,使得PS域网络规模扩大,网络拓扑变得复杂、系统设备不断增加,采用传统的故障定位方法工作量大,效率较低,已无法满足维护要求。本文针对目前维护现状,研究了一种基于PS域的纵向推进式故障诊断系统,并应用于某移动数据业务网,取得了良好效果,提高了系统维护人员故障处理效率。

1 系统分析

1.1 传统故障定位方法分析

传统的故障定位方法主要采用网管系统监测,日志采集,报表查看,抓包分析,业务拨测等手段,存在一定缺陷,具体如下。

(1)数据核心网网络拓扑复杂,设备间耦合度较高,一个设备故障后,周边关联设备也会同时发生告警,网管系统将会出现较大范围的告警,极大干扰维护人员的判断,影响故障定位的准确性、及时性;

(2)目前日志采集、报表查看、抓包分析需要人工操作,维护人员为确保分析数据的完备性,需要大范围采集数据,这将增加故障定位时间和难度;

(3)传统的业务拨测只能进行数据业务的可用性监测,无法准确定位故障源。另外,业务拨测需占用过多无线资源,测量准确性受无线网络和终端因素影响较大,拨测速度慢、强度低;

(4)传统的故障定位人工参与较多,极大增加了维护人员的工作量,降低了故障处理效率;

(5)传统的故障处理均为事后处理,不能提前于客户感知发现问题,及时排除隐患。

1.2 基于PS域纵向推进式故障诊断系统

1.2.1 系统概述

该系统将动态仿真、纵向推进式故障定位、智能故障诊断、话单分析等技术有机结合,实现对数据核心网网络质量的主动监测,实现对故障及故障隐患的快速、准确、智能定位。

系统主要分为数据库、话单分析、故障诊断、任务管理、故障告警、故障定位、仿真拨测七大模块组成,如图1所示。

图1 系统功能模块图

数据库用于存储话单数据、仿真拨测任务列表、故障诊断经验等数据。

话单分析模块主要实现话单解析,统计入库,向故障诊断模块发起网元故障诊断请求。

故障诊断模块主要完成:

(1)故障网元诊断,根据话单分析提供的故障网元信息,向数据库提取故障诊断经验,并向任务管理模块发起故障诊断任务;

(2)根据故障定位模块返回信息判断故障原因,并向故障告警模块发出告警请求。

任务管理模块主要完成向仿真拨测模块下发业务测试任务和故障诊断任务。

故障告警模块输出故障网元的告警信息。

故障定位模块主要完成:

(1)采集各拨测设备话单;

(2)针对话单错误码,采用纵向推进式排查方法定位故障网元;

(3)采集故障网元诊断结果,反馈故障诊断模块。

仿真拨测模块包括仿真PCU/RNC、仿真SGSN、仿真GGSN以及仿真WAP网关设备,主要完成:

(1)业务仿真拨测并生成系统话单;

(2)故障网元诊断测试。

1.2.2 智能故障诊断方法

智能故障诊断方法主要从数据库获取专家诊断方法,采用故障检测方法(如附着、激活、radius鉴权、网络连通性等)定位故障网元的具体故障信息。

1.2.3 纵向推进式故障诊断方法

定义:仿真PCU/RNC测试结果为RNC/PCU(i,task[j])=True or False,其中RNC/PCU为仿真测试方法,i为测试网元序号,如:SGSN1 SGSN2, SGSN3,…SGSNm,task[j]为测试项,如task[0], task[1], task[2], …task[n],Ture为测试成功,Fasle为测试失败。同理,仿真SGSN测试为SGSN(i,task[j])=True or False;仿真GGSN测试为GGSN(i,task[j])=True or False;仿真WAP网关测试为WAPGW(i,task[j])=True or False。

当仿真网元测试结果出现False时,启动纵向推进式分析法排查故障网元,然后针对定位网元进行故障诊断,确定具体设备故障信息。具体方法如下。

步骤1:获取仿真WAP网关测试结果WAPGW(i,task[j]),结果为True进入步骤2,否则定位故障网元为SPi,通过智能故障诊断方法进行SP网元故障诊断,并将诊断结果通过故障告警模块输出,如图2所示。

步骤2:获取仿真GGSN测试结果GGSN(i,task[j]),结果为True进入步骤3,否则定位故障网元为WAPGWi,通过智能故障诊断方法进行WAPGWi网元故障诊断,并将诊断结果通过故障告警模块输出。如图2所示。

步骤3:获取仿真SGSN测试结果SGSN (i,task[j]),结果为True进入步骤4,否则定位故障网元为GGSNi,通过智能故障诊断方法进行GGSNi网元故障诊断,并将诊断结果通过故障告警模块输出。如图2所示。

步骤4:获取仿真PCU/RNC测试结果PCU/RNC(i,task[j]),结果为True则结束,否则定位故障网元为SGSNi,通过智能故障诊断方法进行SGSNi网元故障诊断,并将诊断结果通过故障告警模块输出,如图2所示。

图2 纵向推进式故障诊断方法

2 系统应用情况及效果分析

目前,该系统已应用于某移动公司数据核心网,共计60多台设备实现与该系统的对接,已下达测试任务1000多项,总测试数达18000余条。测试中共发现核心网故障及隐患15起。在“数据产品质量提升”活动中,利用该系统发现并解决多起SGSN、GGSN、WAP、MMSC网元设备缺陷及故障,有效提高了各项考核指标。根据实际应用情况,系统具有以下特点。

2.1 采用全网元不间断仿真拨测实时监测设备故障

系统测试流程完全在核心网中流转,可以实现24h不间断测试,并发任务可达300条,测试频度大,测试速度快,极好地保证了业务实时监测,确保故障及时发现。表1为系统测试与传统测试方法的效率对比。

2.2 基于客户感知排查故障隐患,及时发出故障预警

系统上线至今及时发现WAP网关RADIUS服务器异常、SNSN设备单板异常、WAP网关防火墙缺陷等隐患15起,使维护人员提早排除故障隐患,避免引发用户投诉,极大提高了维护人员的故障处理及时率,提高了网络维护质量,提升了客户满意度。下面以某公司WAP网关RADIUS服务器异常故障举例说明。

表1 传统测试与系统测试效率对比

故障现象:登陆梦网首页时延较大,出现访问页面失败情况。

故障诊断:采用纵向推进式排查方法,定位某公司WAP网关为故障网元。通过仿真GGSN进行RADIUS鉴权、Pull业务测试、网络连通性测试,交叉分析定位为某公司WAP网关RADIUS服务器异常。如图3所示。

诊断效果:由于该系统是基于业务感知的故障诊断系统,在RADIUS服务器性能异常时及时、准确发出告警,使维护人员尽早地排除故障隐患,避免了业务受损,此次故障未造成一起投诉,故障处理实现了提前发现,及时处理,避免用户投诉,提升客户感知的效果。

图3 某公司WAP网关故障定位图

2.3 故障诊断自动化

该系统实现多业务、高频次、并发式自动拨测,并对核心网元进行实时主动监测,对于测试中发现的各种问题能够自动、快速、及时、有效的定位原因,并发出告警,无需人工参与,极大地减轻了维护人员的工作量,提高了维护效率。

3 总结

本文针对当前维护质量要求提高,传统故障定位手段效率低下的情况,研究了一种基于PS域的纵向推进式故障诊断系统,通过对该系统功能结构,运行机制的论述,以及系统应用情况及运行效果的分析,说明了系统在故障诊断方面及时性,准确性、智能性的特点,能够有效规避了传统方法的各种缺陷,成为维护人员故障诊断的重要支撑工具。

[1] 中国移动通信集团.移动业务监测系统开发需求规范[S].2010.

[2] 李世鹤.TD-SCDMA第三代移动通信系统标准(第二版)[M].北京:人民邮电出版社,2003.

[2] 中国移动通信集团.WAP网关接口规范[S].2008,4.

[3] 中国移动通信集团.标准WAP网关设备规范[S].2008,5.

[4] 中国移动通信集团.中国移动TD-SCDMA系统核心网分组域设备规范-SGSN分册[S].2007,6.

[5] 中国移动通信集团.中国移动TD-SCDMA系统核心网分组域设备规范-GGSN分册[S].2007,6.

猜你喜欢
话单网元核心网
河北大名话单元音韵母、单字调及双音节非轻声词连调的实验语音学初探
GSM-R核心网升级改造方案
一种全网时钟同步管理方法
5G移动通信核心网关键技术
核心网云化技术的分析
VoLTE核心网建设方案
Java EE平台在综合网元管理系统中的应用研究
S1字节和SDH网络时钟保护倒换原理
GSM-R移动交换机ASN.1话单的解码
GPRS按时长计费模块的优化与应用