4G移动VPDN业务故障分析及维护建议

2019-03-07 06:17张科锋李红振刘彦君中国联通河南省分公司河南郑州450005
邮电设计技术 2019年1期
关键词:信令号码分配

郭 威,张科锋,李红振,刘彦君(中国联通河南省分公司,河南郑州450005)

0 引言

相比传统的固定VPDN(Virtual Private Dial-up Networks)接入方式,移动VPDN接入方式由于接入简便灵活,不受地域和物理线路限制等优点,被越来越多的企业客户采用。通过移动数据业务方式,企业不仅可以快速实现业务的接入和办理,而且能够大幅提高企业运营生产效率,常见的应用有移动办公,移动电力抄表,移动执法,移动视频监控等。伴随4G网络的大规模部署,借助4G网络制式的高速率和扁平组网优势,移动VPDN可以为企业提供更快速的接入和更优的业务感知。

通常企业的移动VPDN业务接入使用的是专门标识的APN(Access Point Name),由于企业采用的终端设备存在多样性,在4G网络下实现业务时,某些硬件设置不合理可能导致业务触发失败。本文通过对某驾校考场使用4G上网卡进行考试视频接入失败的案例,详细分析了故障的定位过程,并给出移动VPDN业务维护保障的建议。

1 4G移动VPDN业务基本流程

现网中,4G移动VPDN连接过程中主要经过终端、无线网络、移动核心网、移动VPDN管理平台、企业网5个环节,如图1所示。

图1 现网移动VPDN基本网络架构

其中移动VPDN平台位于移动网络和企业网之间,用于企业用户接入的管理,主要包括以下2个功能。

a)管理分配用户的地址,可以实现动态地址和静态地址的分配(将MSISDN号码或IMSI与地址绑定)。

b)通过VPDN平台与客户网络进行连接的统一管理,根据不同用户的需求采取专线方式或MPLS VPN方式。

1.1 现网4G移动VPDN业务触发过程

终端开机后通过无线网络先后发起“附着”和“激活”的请求,首先通过MME完成鉴权认证,完成“附着”流程,接着发起“激活”流程,向MME发起PDN连接请求并携带用于接入的APN参数,该请求的目的是建立终端与业务网络之间的数据连接,创建一个默认承载通道。MME将“激活”请求指示给SGW,再由SGW依次传递给PGW和移动VPDN平台,平台为终端分配接入的IP地址,并在响应消息中依次传递下去直到终端,终端用获得的地址,通过无线网络经过SGW、PGW和移动VPDN平台,与企业网络建立连接。

1.2 4G网络中PDN连接和承载的概念

根据4G网络规范,1个特定的PDN(Packet Data Network)连接里包含有1个APN和1个IPv4地址,1个PDN里面可以有多个承载,承载的标识Bearer ID由MME分配,Bearer ID的范围为5~15。1个UE最多有11个承载,每个承载的Bearer ID是不能重复的,1个UE可以有多个PDN连接,不同PDN连接通过APN和IP地址的组合来区分,无论有多少个PDN,1个UE所有PDN连接里合计的承载数量是不会超过11个(见图2)。

1.3 企业APN与普通通用APN的区别

普通手机终端上网一般不需要设置APN,通常在手机终端中的配置文件里已经保存有全球多家运营商的常用APN,放入SIM卡后手机会自动适配相应的运营商APN,比如选择中国联通的SIM卡,那么终端里的APN设置项里自动显示出3gnet。移动VPDN企业网用户使用的是标识该企业的特殊APN,并不是常见通用的APN,一般情况下需要在终端上手动输入。

图2 PDN连接和Bearer的关系

在实际网络中,不同企业的接入需求不尽相同,接入终端类型也存在多样性,在触发业务的过程中,不同类型终端的规范存在一定差异,在某些场景下会导致业务不能正常使用,从而影响业务感知,下面来分析一个典型的终端问题导致的4G移动VPDN业务触发失败的复杂案例。

2 4G移动VPDN业务触发失败案例分析

2.1 故障现象

某地(市)驾校用移动VPDN将考试视频实时传送给考试中心,视频采集设备通过上网卡接入4G网络,企业使用的APN为aygajjzdjgk.spjk.haapn,出现问题前终端采用动态分配地址的方式,业务使用正常。期间驾校更换某款新上网卡,并提出将动态地址分配改为固定地址分配,实施后出现业务无法正常使用的情况。而同地区其他没有更换终端、使用动态地址分配方式的驾校,业务均能正常使用。

2.2 故障分析定位

从故障现象初步判断,造成业务无法使用的原因有2个方面,一个是终端问题,另一个是移动VPDN平台分配地址问题,经平台侧检查分配地址机制正常,未有异常现象,且未更换终端前业务一直能正常使用,没有出现无法使用的情况,所以重点考虑终端的问题。

2.2.1 检查故障号码的签约信息

通过MME查询故障号码的当前签约信息(限于篇幅,只列出与问题有关的主要信息),如表1所示。

该号码签约只有一个企业APN,其序号EPS Sub⁃scribed Num为1,即在HSS里签约的第1个APN为该企业APN。通常情况下,MME上可以设置自动纠错功能,如果触发的APN是未签约的,可将APN改为指定的APN或者签约的第1个APN,用来防止终端发起的APN无效造成业务激活失败,现网里采取的是无效APN更改为签约的第1个APN的策略。结合本案例,用户签约的第1个APN为企业APN,一旦请求无效,MME将自动将其纠正。同时用户的签约信息能在MME上查询到,表明该号码不存在鉴权失败的问题,排除开卡的问题。

表1 故障用户签约信息

2.2.2 检查正常号码会话状态信息

通过MME查询正常号码的签约信息,跟故障号码一样,都是只签约了企业APN,再来查询一下正常号码的会话状态信息,如表2所示。

表2 业务正常号码的会话信息

从会话信息中看到正常的号码出现了2个PDN连接(红色框),2个PDN连接里包含的APN名称(黄色框)是相同的,都是aygajjzdjgk.spjk.haapn,2个PDN的IP地址没有重复(绿色框)。正常号码的会话信息里虽然APN名称相同,但IP地址不同,所以出现2个PDN连接是没有问题的。

故障号码与正常号码的签约信息相同,都只签约了1个企业网APN,区别在于上网卡和地址分配机制,那么正常号码为什么能触发2个同样名称的PDN连接,是如何实现的?更换的上网卡是导致失败的原因吗?带着疑问,对正常号码的信令做进一步的分析。

2.2.3 正常号码信令分析

首先分析一下MME侧的信令,如表3所示。

表3 正常号码MME侧的信令

通过①②号信令的详细解码(见图3),可以看到首个PDN请求使用的是企业网APN,该APN为用户输入的接入点名称,Bearer ID为5,IP地址为10.33.39.101,该地址是企业网平台分配的,激活承载的请求成功。

图3 首个PDN连接请求成功

图4 第2个PDN连接请求及纠错

而在④信令里(见图4),MME接收到了第2个PDN连接的请求,使用的APN为3gnet,前面已提到过该号码只签约了企业网APN,并没有签3gnet,所以可判断此请求应该为上网卡设备自身发起的请求。紧接着在⑤信令里(见图4),MME向SGW发起的创建会话请求里,APN的属性变为了企业网APN,说明MME已成功进行了APN纠错,将3gnet改为了企业网APN,并分配了新的Bearer ID为6。

在⑥⑦信令里,可以看到第2个PDN连接请求成功,在详细信令里携带的APN名称为企业网APN,Bearer ID为6,IP地址为10.33.39.128。

再来看一下PGW侧的信令,如表4所示。

表4 正常号码PGW侧的信令

信令中RADIUS消息是PGW与移动VPDN平台之间的信令交互,在业务的实现过程中,当PGW接收到创建会话的请求后,通过RADIUS消息向移动VPDN平台发起接入请求,移动VPDN平台鉴权完成后会分配给用户地址。在交互过程中PGW先后建立了Bear ID为5(红色框)和Bear ID为6(蓝色框)的2个不同承载,它们的APN名称相同,均为aygajjzdjgk.spjk.haapn,IP地址不同,分别为10.33.39.101和10.33.39.128,因此2个承载归属于不同的2个PDN连接。

综合MME和PGW的信令,我们可以得出正常号码的连接过程:UE首先以用户输入的企业APN的发起连接请求,请求成功后,UE又触发一个3gnet的PDN连接,这个APN应该是上网卡设备硬件里自动拨号的,由于签约里没有该APN,被MME自动纠错;虽然APN相同,但IP地址不同,所以2个PDN连接不同的,2个PDN连接各有1个默认承载。

2.2.4 故障号码信令分析

在整个过程中MME信令里呈现建立承载、删除承载、去附着、又附着、建立承载、删除承载的循环,截取其中的一部分,如表5所示。

表5 故障号码的MME信令

红色框内的信令里MME针对终端请求的3gnet的PDN连接请求进行了纠错,将其变更为签约的第1个APN即aygajjzdjgk.spjk.haapn;紧接着在蓝色框内的信令里,MME接收到PGW下发的删除Bearer ID为5的指示,随即发起去附着流程并指示UE重新附着。问题集中在以下2点。

a)为什么PGW向MME下发了删除承载的请求。

b)与正常号码的触发场景一样,为何故障号码在纠错APN建立的PDN连接后,要删除Bearer ID为5的首个PDN连接,随后触发去附着携带的原因值为“reattach required”。

针对上述疑问,进一步对PGW侧信令进行分析,发现出现了与MME类似的信令循环,相比正常号码的PGW信令(参看表4),在红色框和蓝色框信令之间多了删除会话的过程,整个过程可以概括为3个方面。

a)信令呈现建立会话,删除承载,再次建立会话,再次删除承载的循环,即创建Bearer ID为6的会话,就删除Bearer ID为5的承载,然后再创建Bearer ID为5的会话,再删除Bearer ID为6的承载,依次循环下去。

b)MME侧接收到的删除承载的请求,是PGW侧下发的,经过SGW传递给MME。

c)无论Berar ID为5或6的PDN连接,其使用的APN名称和分配的地址(10.33.39.238)都是一样的。

2.2.5 故障定位

将故障号码的PGW和MME的信令结合,再对比正常号码的信令,基本可以确定导致失败的原因为PGW创建会话过程中连续出现2个相同PDN连接,从而引起业务触发失败,具体分析如下。

a)故障号码和正常号码之间的差别在于地址分配的方式,正常号码采用动态方式,故障号码采用静态方式,故障号码连续2次PDN连接分配的都是同一个地址。根据“一个PDN连接=APN+IP”的原则,故障号码的2次PDN连接的APN名称和IP地址都相同,导致PGW认为出现的这2个PDN连接是冲突的,会保留刚新建的PDN连接,删除旧的PDN连接。

b)本案例关键点在于UE发起的2个PDN连接请求。UE附着后发起第1个PDN连接请求是用户输入触发的,使用的是合法签约APN(aygajjzdjgk.spjk.haapn);第2个PDN连接请求的APN(3gnet)是上网卡出厂固化设置好的,始终自动触发,恰巧UE并没有签约,经过MME纠错,加上静态分配地址方式对同一号码始终分配同一个地址,从而引起了PGW侧冲突。即便重新附着,删除了旧PDN连接,上网卡始终不停触发新的PDN连接,陷入了“删除→建立→再删除→再建立……”的重复循环模式。

c)业务正常号码的上网卡并非没问题,只是采用了动态地址分配,规避了问题的发生,如果改为固定地址分配,仍然会出现无法使用业务的情况。

通过上述分析可以看出,采用动态分配地址方式或更换终端硬件可以避免故障产生。最终为满足静态分配的业务需求,选择更换有问题的终端。

3 移动VPDN业务维护建议

相对于公众手机终端,企业为了实现业务所采用的移动终端种类繁多,包括上网卡、无线插卡路由器、专用设备(如抄表终端)、车载设备等,终端出厂设置的多样性可能造成业务触发的混乱,本案例就是典型例子。有的企业虽然使用手机作为接入终端,但手机本身并没有修改APN的功能,需要安装专用的APP来触发,如果专用APP的程序出现问题也会导致业务失败。结合日常移动VPDN故障处理的经验,本文给出以下几点移动VPDN业务维护建议供参考。

a)移动VPDN企业用户的APN签约做到统一规范。不同批次或不同时期开的卡应做到签约信息一致,如同一种业务,有的卡签约只有企业APN,有的卡签约既有企业APN,又有公网APN,有可能导致计费问题。一般情况,企业APN的费用是固定收费,并不涉及公网,假如用户不小心触发公网,可能会引起高额的费用,从而引起投诉。

b)如果有多个APN,尽量将企业APN作为第1个签约APN。这样的设置的好处是,当触发的APN有误时,通过MME的纠错功能保证企业APN优先使用。

c)企业采购的移动VPDN业务使用的特殊终端,在大批量使用前要测试确认能否正常触发业务。

d)实时监控和定期统计移动VPDN的业务指标,如激活成功率、鉴权成功率、地址利用率等,做好业务质量变化的预判和跟踪。

e)设置业务开通上线的确认环节,运用流程管控来确保各环节的数据制作准确及时,上线前通过模拟业务测试验证确保业务正常使用。根据现网经验,90%以上的故障是外部原因造成,做好上线前的测试验证,有利于后期故障定位。在此基础上,对于移动VPDN的故障定位,依从先外后内的原则,先从终端、开卡、客户网络侧排查。

4 结束语

作为运营商为企业提供的接入方案,移动VPDN因其接入便捷快速被广泛采用,其业务的发展已成为运营商移动业务增长的重要组成部分。企业接入的多样性和复杂性,对运营商移动VPDN业务的运维提出了更高的要求,能否保障和支撑企业的移动VPDN业务,树立良好的客户感知口碑,成为企业选择运营商的重要衡量标准,作为网络的提供者,运营商需要业务前台与维护后台之间共同协作,形成有效的快速响应体系。

猜你喜欢
信令号码分配
说号码 知颜色
应答器THR和TFFR分配及SIL等级探讨
一个号码,一个故事
SLS字段在七号信令中的运用
猜出新号码
遗产的分配
一种分配十分不均的财富
移动信令在交通大数据分析中的应用探索
基于信令分析的TD-LTE无线网络应用研究
LTE网络信令采集数据的分析及探讨