基于信令定位解决多次换卡导致的用户VoLTE 功能异常问题

2022-07-29 11:58潘平
广东通信技术 2022年7期
关键词:重置信令号码

[潘平]

1 问题背景

VoLTE 全称叫Voice over LTE,是一项基于IMS(IP多媒体子系统)的语音业务,采用SIP 协议进行端到端的呼叫控制。VoLTE 的语音作为IP 数据传输,无需2G/3G 网,全部业务承载于4G 网络上,可实现数据与语音业务在同一无线网络下进行传送[1]。

VoLTE 语音编码包括AMR-WB 和AMR-NB 两种语音编码方式,最大编码速率23.84 kbit/s。其中AMR-WB有9 种编码速率:23.85 kbit/s 至6.6 kbit/s;AMR-NB 有8 种编码速率:12.2 kbit/s 至4.75 kbit/s。而2G 语音编码编码速率13 kbit/s 至6.5 kbit/s,VoLTE 最大编码速率高于2G,故能提供相比2G 网络更清晰的语音通话质量。

用户(188*****000)(见表1),使用HUAWEI Mate 40 Pro 全网通版终端进行业务拨打测试,该终端支持VoLTE 高清语音功能,但在日常测试中发现该号码语音质量出现异常下降。通过测试软件导出通话测试数据分析,发现7 月6 日晚上开始,该测试号码未能正常使用VoLTE进行高清语音通话业务,而是通过CSFB 回落到GSM 网络进行通话。因GSM 语音编码速率最大13 kbit/s,相比VoLTE 的23.85 kbit/s 低很多,在语音编解码技术上本身存在明显差距[2],同时近年运营商GSM 网络运维资源大量减少,相比LTE 网络质量差距较大,导致测试号码的语音质量指标明显下降。

表1 测试号码通话记录

2 问题排查分析

通过排查测试号码所在位置信号强度、干扰底噪和基站故障等无线网络情况,结合分析信令平台异常错误码,关联问题时段测试号码的相关业务操作记录等,找出问题方向,逐步深入定位和排查问题。

2.1 无线网络问题分析

测试号码在室内进行拨测,信号强度RSRP=-82 dBm,SINR=23 dB,上行底噪-112 dBm,无线信号强度和质量均良好,同时核查占用基站无故障,基本排除无线网络问题。

2.2 信令平台分析

由于IMS 负责VoLTE 呼叫的端到端控制,因此号码如果要正常使用VoLTE功能,前提条件是需要在IMS 网络成功注册,流程包括初始注册或重注册,两者之一成功都表示号码在IMS 网络正常注册[3]。

从前述测试号码的通话测试数据可知(见表2),测试号码在7 月6 日14:34 以前可正常使用VoLTE,之后才出现异常转为CSFB 进行通话。故从信令平台查看7 月6 日测试号码IMS 注册情况,发现从7 月6 日15:01 开始,测试号码发起IMS 注册一直失败,导致VoLTE 不可用。注册失败错误码均为:Querysdbnouserifcdata,提示未查询到号码ifc数据。故问题排查方向指向测试号码IMS 数据存在异常。

表2 测试号码7 月6 日IMS 注册情况

2.3 VoLTE 用户数据存储网元和查询机制

归属用户服务器(HSS)设备是IMS 用户归属网络中存储用户号码信息的核心数据库,主要用来存储IMS 域内与用户和业务相关的信息。应用服务器(AS)提供业务逻辑处理功能,为用户提供IMS 多媒体业务[4]。

AS 通过Sh 接口与HSS 交互[5]。Sh 接口采用Diameter协议,通过Diameter Request/Answer消息传递用户数据、业务数据[6](见图1)。Sh 接口操作有:

图1 VoLTE 用户数据存储网元和接口协议

(1)数据处理流程,包括:

①AS 从HSS 中下载数据(Sh-Pull);

②AS 更新HSS 中的数据(Sh-Update);

(2)订阅/通知流程,包括:

①AS 订阅HSS 关于数据变更的通知(Sh-Subs-Notif);

②HSS 通知AS 数据发生变更(Sh-Notif)。

AS 通过Sh-Update 流程,基于每个IMPU 或者PSI,更新HSS 中保存的用户透明数据。AS 可以通过Sh-Update流程更新HSS 中的PSI 的激活状态。AS 可以通过Sh-Update 流程更新HSS 中的DSAI。

该流程中使用的Diameter消息有Profile-Update-Request(PUR)和Profile-Update-Answer(PUA)。其中Profile-Update-Request 用于AS 向HSS 发起数据更新请求,请求消息中通过User-Data AVP 携带最新透明数据。Profile-Update-Answer 用于HSS 向AS 返回请求执行结果。

由于号码数据存储在HSS 中,故重点排查异常号码所在的HSS 网元问题。

2.4 关联测试号码问题时段操作记录

排查7 月6 日测试号码业务办理记录,发现在7 月6日15:00:36秒,也就是IMS初始注册失败前1分钟,做了“空白卡补卡”业务(更换USIM 卡),怀疑该换卡操作导致IMS 数据出现异常,引发VoLTE 功能不可用(如图2 所示)。

图2 测试号码问题时段操作记录

为进一步确认是否换卡操作导致出现该问题,选取其它测试号码进行验证,发现在多次办理换卡业务后,会出现同类问题。以另一测试号码188*****995 为例:

该测试号码在8 月4 日和8 月5 日做了2 次补卡操作,8 月5 日15:12 补卡后,15:16 开始就一直IMS 注册失败,原因为Query sdb no user ifc data,跟前述测试号码现象完全一致(如图3、4 所示)。

图3 同类问题测试号码业务办理记录

图4 同类测试号码IMS 注册情况

由此确认,该问题与更换USIM 卡(换卡不换号码)业务操作存在明显相关性。联合爱立信设备厂家排查,最终定位为HSS 网元在换卡过程中,存储和清理用户透明数据的机制存在缺陷。在同一号码多次换卡后,VoLTE 相关数据出现异常,导致IMS 注册失败,VoLTE 业务不可用。

HSS 存储清理透明数据详细机制:目前HSS 只会对处于IMS 注册(reg)、IMS 去注册(unreg)两种状态下的IMSI 号码附着IMS 网络时,会清理透明数据字段ImsRestdata旧的IMPI(IP Multimedia Private Identity,用于用户号码接入IMS 网络的注册,鉴权,认证和计费,由归属网络运营商定义的用户身份标识,具有全球唯一性),然后写入新的IMPI。而对从未附着IMS 的号码(not reg),则不会清理这个字段。当号码办理换卡业务后,新SIM 卡对应一个新的IMPI,因此每次换卡后首次注册都是崭新的未附着IMS 的状态(即not reg),从而会将新的IMPI 写入ImsRestdata 字段,而旧的IMPI 数据一直堆积在ImsRestdata 中,导致ImsRestdata 越来越长。由于ImsRestdata 最长4 000 byte,每换一次卡会增加600 byte,同一号码第7 次换卡会导致200 byte 的IMPI 数据溢出,导致IMPI 数据不完整,触发IMS 注册失败(如图5 所示)。

图5 号码换卡时HSS IMS 数据存储机制

针对测试号码188*****000 进一步核查,发现该号码从2010 年3 月1 日开始到本次出问题的2021 年7 月6 日15 点,刚好出现 7 次换卡操作,与理论分析吻合(如图6所示)。

图6 测试号码换卡记录

最终定位问题原因是号码换卡业务触发HSS 存储IMPI 数据更新机制问题:每次换卡有新的IMPI 数据写入透明数据字段ImsRestdata,但是不清除旧数据。换卡达到7 次后,透明数据字段ImsRestdata 溢出,用户IMPI数据异常,导致测试号码附着IMS 失败,无法正常使用VoLTE。

3 解决方案和规避措施

3.1 问题解决方案

测试号码188****000在8 月10 日09:59:30,通过重置用户数据(HLR重置),清理ImsRestdata字段,解决数据溢出问题。观察信令,在10:05,测试号码IMS注册成功,恢复VoLTE功能(如图7、8 所示)。

图7 重置测试号码数据(HLR 重置)

3.2 后续规避措施

本案例发现多次更换SIM 卡导致的用户VoLTE 功能不可用问题,通过在换卡流程中增加重置用户数据环节,即在每次换卡业务后都做一次重置HLR 数据,可以清除用户透明数据字段ImsRestdata,避免堆积溢出。

图8 测试号码在10:05 分开始正常注册IMS 网络

4 全网同类问题排查和调整优化效果验证

通过信令平台筛选出“SIP 首拆Warning 警告正文:Querysdbnouserifcdata”类型的初始注册失败用户号码,找到204 个同类失败号码(172 个4G,32 个5G)。

在8 月18 日对该批问题用户进行用户数据重置(HLR重置)。对比8 月17 日和8 月19 日注册失败统计,该类注册失败错误码问题从17579 次下降至739 次,问题基本得到解决,效果明显(如图9 所示)。

图9 全网同类问题处理效果

5 经验总结与分享

本文通过研究用户无法使用VoLTE 高清语音的问题,结合信令平台分析该号码语音业务使用异常变化的时间点(VoLTE、纯2G 或者CSFB),找出问题对应的错误码,进一步关联触发问题的相关操作记录,最终找到问题症结所在。同时总结单个问题号码的信令特征,通过信令平台找出全网同类问题进行统一优化处理,有效改善全网用户语音感知。整个案例定位过程循序渐进、抽丝剥茧,解决方法由点及面,可为行业工程师提供类似问题排查经验和参考方法。

猜你喜欢
重置信令号码
重置系统微软给你“双料”选择
说号码 知颜色
一个号码,一个故事
系统重置中途出错的解决办法
猜出新号码
重置人生 ①
使用朗仁 H6 Pro大师版重置雷克萨斯发动机记忆
移动信令在交通大数据分析中的应用探索
基于信令分析的TD-LTE无线网络应用研究
LTE网络信令采集数据的分析及探讨