关于提升VoLTE网络接通率的方法讨论

2019-12-11 03:48
数字通信世界 2019年11期
关键词:信令差错消息

(中国移动通信集团甘肃有限公司,兰州 730070)

所谓“打电话”,电话可以“打得通”是用户对网络质量是否优秀的第一感知。网络接通率就是对这一用户感知的直观反映。VoLTE是全球基础语音业务的演进方向,是实现全IP网络结构优化调整的核心,是推动多媒体通信的基础。但现网VoLTE呼叫也面临着流程复杂,经过网元类型和数量多,业务触发复杂,信令交互多,如何能够实现“打得通”这个与用户感知密切相关的问题,是网络维护的关键。

本文结合VoLTE网络接通提升专项优化工作,按照端到端的呼叫流程,将呼叫过程分为不同的阶段,以EPC、IMS两大域的失败原因为抓手,深入分析呼叫在其域内失败时所呈现的规律,总结差错原因对应的场景,提供各场景的解决方案进行相应优化。

1 分域失败分析法

1.1 统计错误码分布

利用信令分析系统,对接通失败问题进行跟踪分析,总结差错原因及占比:

表1 差错码统计

1.2 确定主要场景

通过对各类错误码的归类、统计分析可以看出现网的主要错误场景为:

(1)503:Service Unavailable

(2)500:Server Internal Error

(3)408:Request Timeout

1.3 错误场景映射至EPC、IMS域

将503、500、408三类错误映射至EPC、IMS两大域:梳理出EPC失败响应错误码及cancel中携带异常原因,定位具体失败场景,如表2。

2 503差错主要原因值分析及优化

2.1 not-supported-QCI-value原因值

信令流程分析:VoLTE呼叫建立时,MME通过下发E_RABSetupRequest消息给eNodeB请求建立QCI=1的e-RAB,eNodeB回复E-RABSetupFailure给MME,携带原因值notsupported-QCI-value。

图1

原因确定:eNodeB VOLTE功能开关未打开。

优化措施:(1)提取失败消息为not-supported-QCI-value的eNodeB ID,根据问题eNodeB ID查找对应的分公司,分公司根据问题eNodeB ID进行开关核查;

(2)优化开站模版,从根本上杜绝该问题再次出现。

2.2 radio-connection-with-ue-lost原 因 值、tx2relocoverallexpiry原因值、Temporary failure原因值

2.2.1 radio-connection-with-ue-lost原因值的信令流程分析

(1)在呼叫建立阶段,eNodeB上发UEC on text Release Request,携带原因值radio-connection-with-ue-lost,表明eNodeB认为UE失联。

表2 分域失败原因归类

图2

(2)在呼叫建立阶段,eNodeB上发UE Context Release Request,携带原因值interrat-redirection,表明UE重定向到了2/3G。

图3

2.2.2 tx2relocoverall-expiry原因值的信令流程分析

在呼叫建立阶段,eNodeB上发UEContextReleaseRequest,携带原因值tx2relocoverall-expiry,表明发生了X2切换请求,但是X2切换计时器tx2relocoverall超时,MME指示eNodeB释放了UE上下文,并通过S11接口把承载失败问题传送给SAEGW,SAEGW通过Gx接口告知PCRF,PCRF通过Rx接口通知SBC,随后SBC通过Gm接口给UE发送了503 SIP错误码,造成呼叫失败。

施工要点:(1)模板沿墩身周边方向始终保持顺向搭接。每一节模板安装前进行打磨,整修并涂刷脱模剂。脚手平台、接料平台、拆模吊篮的荷载要保持平衡,不得超载。施工过程中经常检查中线和水平情况,有偏差及时纠正。(2)混凝土顶面距模板顶面大于5cm。使用插入式振捣器捣固时应避免接触模板、对拉螺栓、钢筋或空心支撑。浇筑混凝土后,强度必须达到2.5MPa以上方可拆模翻倒。(3)拆模后及时用水泥砂浆堵塞对拉螺栓孔及修补表面缺陷。

图4

2.2.3 Temporary failure原因值值的信令流程分析

此种场景为VOLTE用户和CS域用户互通经MGCF,在资源预留阶段因为MGCF等待后续消息超时,产生SIP 500错误码,携带Q.850原因“41 Temporary failure”。主要为SBC向终端发送消息后,因上行干扰小区或质差小区原因,网络侧没有收到后续消息引起。

图5

原因确定:弱覆盖、X2切换切换失败、上行干扰小区和质差小区。

优化措施:一是定期梳理干扰小区和质差清单,流转分公司现场排查;二是形成月度MR弱覆盖小区清单,下发分公司进行整治;三是对X2口切换请求次数为0次的小区,由平台自动发现,派发一线逐个核查。

3 500差错主要原因值SIP Internal Server Error分析及优化

信令流程分析:主叫为VOLTE终端,被叫为VOLTE彩铃用户,进行视频呼叫,当彩铃AS收到后向的180 RING,向主叫域更新彩铃的SDP,主叫终端收到更新彩铃SDP的UPDATE消息后,回复了UPDATE 200 OK,表明主叫终端和彩铃交互的资源预留已经完成,按规范终端无需发送UPDATE消息,但是问题终端接连发送了两次UPDATE消息,SBC收到第二条UPDATE消息后,因为第一条UPDATE消息的确认消息UPDATE 200 OK未传送过来,SBC就针对第二次UPDATE向主叫终端发送了500错误码,终端发起了Cancel,终止了本次呼叫建立过程。

图6

原因确定:终端版本BUG

选取目前市面上的主流终端进行测试,根据测试结果发现异常发送两次UPDATE的终端主要为“中国移动”终端。

表3 终端测试分析统计表

优化措施:联系集团终端公司提交错误码流供终端侧分析,根据规范要求进行SDP协商,若第一次回复200 OK且本端和远端均为强制的情况下,无需再发出UPDATE请求。集团终端公司通过推送新版本解决了该问题。

4 408差错主要原因值Request Timeou分析及优化

信令流程分析:被叫SBC收到S-CSCF的invite消息的字节数超过1个MTU(1500字节),在Gm接口选择TCP协议替代默认的UDP写来来传送,被叫SBC尝试和终端建立TCP连接传送,连续发送三次,因无线原因终端未回,TCP连接建立5秒后超时,SBC向S-CSCF回复了408错误码。原因确定:UE起呼时Invite消息的长度为2979字节,消息经过贝尔VoLTE域的各个网元后长度达到了 4713 字 节“UE->SBC(2979)->SCSCF->SCCAS(3952)->SCSCF->VoLTE AS(3923)->SCSCF-> 彩印 AS(4004)->SCSCF(4107)->MGCF(4713)。具体分析消息,会发现Invite消息经过贝尔SCSCF后,Invite消息中增加了9个127.0.0.1(环回地址)、6个169.x.x.x(内部单板地址),这就导致Invite消息超过了SBC的最大处理长度(4096字节)。

图7

优化措施:屏蔽Invite消息中添加的额外地址,保证Invite消息的长度在1个MTU内。屏蔽额外地址后Invite消息中不再添加环回地址和内部单板地址,长度大幅缩小。

图8

5 总体效果检查

(1)统计2017年12月1日-30日的VoLTE网络接通率,全部在99.7%以上:

表4 2017年12月VoLTE网络接通率统计表

对优化结束后的2018年1月至2018年2月每月跟踪发现,各月VoLTE网络接通率也均在99.7%以上。

(2)对策实施完成后,利用信令分析系统,对接通失败问题进行跟踪分析(数据取自2017年12月份19:00-20:00均值),总结差错原因及占比,导致VoLTE接通率低的主要错误原因值503号、500号、408号的次数和占比均已大幅下降,不再是主要原因。

表5 优化后差错码统计

6 结束语

打得通电话,是用户“高清VoLTE品质体验”的第1个环节,是稳定VoLTE用户群和持续发展用户的保障。本文的目的,就是想通过提升VoLTE网络接通率来提升用户对VoLTE网络使用的感知,同时形成分域失败分析法,供VoLTE网络接通率优化人员参考。

猜你喜欢
信令差错消息
直升机防差错设计
一张图看5G消息
SLS字段在七号信令中的运用
新阅读环境下报纸差错的有效防范对策
移动信令在交通大数据分析中的应用探索
基于信令分析的TD-LTE无线网络应用研究
差错是习题课的有效资源
LTE网络信令采集数据的分析及探讨
消息
消息