锁网终端分析模型的研究与应用

2015-07-03 09:42刘苑明黄志豪
电信工程技术与标准化 2015年2期
关键词:分析模型信令中山

刘苑明,黄志豪

(中国移动通信集团广东有限公司中山分公司,中山 528400)

通过近年来的3G/4G网络建设和G3手机营销,截至2014年7月,中山的3G/4G网络覆盖率已达到98%,而3G/4G终端用户已超过156万(其中3G/4G终端132.61万、LTE终端23.57万),但无论从网络侧还是话单侧进行统计,GSM网络负荷仍然严峻,GSM网络的GPRS流量持续飞涨,而3G/4G网络的利用率和3G/4G流量都仍比较低,如何引导客户使用3G/4G网络,充分利用3G/4G网络,提高客户的数据业务感知成为移动市场经营的一个重点课题。

为解决该问题,通过对3G/4G终端用户和GSM高流量用户进行定位跟踪分析得出,除部分镇区由于3G/4G覆盖漏洞原因外,有部分3G/4G终端用户在有3G/4G覆盖的2G小区产生较多的GPRS流量。经过详细分析,主要是由于用户对3G/4G终端进行了锁GSM网使用。

由此,引导锁网终端的用户解锁并使用3G/4G网络,提高网络体验质量就成了流量经营的重点工作之一。其中如何精确定位锁网终端的用户成为解锁营销活动的主要难点和重点,本文利用大数据理论,结合CS域信令、PS域信令和话单数据,层层剖析,研究锁网终端分析模型精确定位锁网用户。

1 研究原理

1.1 基于PS域数据的分析基础

PS域数据即指移动用户进行手机上网行为时通过的GPRS移动核心网络设备所产生的话单、信令、日志等数据。从图1可以看到一个客户进行数据业务行为时,流量和信令所经过的核心设备:BSC—Gb口→SGSN—Gn口→GGSN—Gi口→WAP Gateway。PS域的分析数据基础为:

SGSN话单:其包含成功上网的通过SGSN设备的流量数据,包含用户号码、每次上网的流量、发起上网业务的小区信息、用户终端IMEI信息。

(1) Gn口信令信息:包含所有用户附着、激活PDP的信令数据,包括失败信息,能够获取用户号码、用户分配到的IP地址、用户上网请求的上网目标地址、上网所在的小区信息、终端信令。

(2) WAP Gateway业务日志信息:包含通过CMWAP上网的客户的用户号码、用户上网的目标地址、用户失败的原因代码、用户上网时操作系统的UA信息。

总括以上信息,从PS域的数据中,能够获取用户上网终端信息(品牌型号、终端制式、操作系统等)、用户上网所在区域信息(是否是3G/4G覆盖区域等)、用户的上网流量信息(GSM产生的流量、3G/4G产生的流量)、用户的上网喜好信息(喜欢聊天或音乐等)。

基于该数据基础,能够确定以下基础分析条件:

(1) 根据上报的IMEI信息和UA信息,确认用户使用的终端品牌型号,以该品牌型号所具备的功能确定是否为3G/4G终端;

(2) 使用该终端的客户是否在有3G/4G覆盖的小区使用过GPRS网络;

(3) 用户是否有使用3G/4G的流量。

1.2 基于CS域数据的分析基础

CS域数据是指移动用户进行通话、短信、位置更新等行为时在移动网络核心设备中产生的信令等数据。广东移动CS域移动网络的信令采集的位置主要位于核心网络MGW和MSC之间的IP承载网设备CE的入端口,该接口在移动网络中也被称为Mc口。从该接口采集的信令经过采集、筛选和解释后将送往信令采集系统的服务器,其系统架构如图2所示。

图1 GPRS网络组网图

图2 移动采集系统架构图

Mc接口中的A接口过程可以分为CM(呼叫管理)、MM(移动性管理)、RR(无线资源管理)、SS(补充业务)和SM(短消息)5类。其中:SS和SM都属于用户应用层面;RR是无线资源管理层面;CM是处理呼叫的过程;MM是移动性管理。

(1) CM呼叫管理信令和SM短消息主要依靠于用户的主动操作,或通话或接发短信,从信令中均可以精确获取相关用户的操作时间和所在位置(以移动网络最小定位单位“小区”)。

(2) MM移动性管理信令主要包括位置更新信令和切换信令,本专利主要使用位置更新信令。移动网络中的位置更新是指网络为了解用户位置以快速完成被叫操作目的,定期的网络与用户手机终端的交互。一般来说,在现有的移动网络内是以30 min为时间间隔,定期与手机终端进行交互,确认手机终端所在的位置。

利用CM、SM和MM信息能够准确判断用户是否出现过在3G/4G覆盖的区域,是否曾经使用过3G/4G网络。

1.3 解决伪锁网用户问题的Gb口信令数据分析基础

通过大量的网络调查,发现网络中存在一种伪锁网终端,该终端将影响我们锁网终端分析模型的准确率。伪锁网是一种复杂的情形,诸如用户刷机,山寨机随意编IMEI等情形皆可导致伪锁网。伪锁网终端的存在是由于“是否为3G/4G终端”的判断依据来源于对用户所持终端IMEI的前8位TAC的识别,以及后续WAP日志中UA字段的匹配的双重判别,但是,往往判别过后的某些终端并不如实代表该终端的实际参数(如某终端实际为山寨机,其TAC随意编撰为某品牌终端,而UA上传缺失或比较大众),则可能导致对于锁网用户判断的不准确。因此,衍生出“伪锁网用户注 ”问题,该类用户涉及的相关终端为“疑似问题终端”。伪锁网用户的存在严重混淆了现网对于锁网用户统计的真实性与准确性,极大影响了相关专业人员对于市场3G/4G使用情况的判断,直接导致了相关市场决策制定的必要性与有效性。

为精确剔除伪锁网用户,我们引入Gb数据为分析基础,通过精确定位终端芯片上报3G/4G支持参数,实现对于伪锁网用户的识别。

在Gb口信令BSSGP层的下行方向上(SGSN→ MS)携带了表征终端对于3G/4G支持能力的两个参数:UMTS 3.84 Mcps 3/4GD Radio Access Technology Capability、UMTS1.28 Mcps 3/4GD Radio Access Technology Capability。若参数取值为1,表示支持3G/4G网络;若取值为0 ,表示不支持3G/4G网络。由于该参数来源于底层芯片信息,因此,能够准确反映终端对于3G/4G网络的支持能力。

为形成便于统计和分析的XDR表,在对相关信令的拆解包过程中,为便于理解,UMTS 3.84 Mcps 3/4GD Radio Access Technology Capability、UMTS1.28 Mcps 3/4GD Radio Access Technology Capability 两个参数被重命名为umts_1283/4Gd_1800与umts_1283/4Gd_e两个属性。属性取值为“1”表示支持3G/4G网络,取值为“0”表示不支持3G/4G网络。

1.4 大数据分析工具

本研究使用Oracle数据库进行数据存储,使用NavicatPremium进行关联查询,使用SPSS和DI V-integra进行数据建模与分析,将CS域和PS域信令数据相结合,配合“移动集团公司终端数据”和“资管系统覆盖区域信息”进行关联分析,通过交叉关联进行数据定位,结合随机分布的数理特性进行锁网终端用户的汇总分析。

2 研究成果

基于PS域、CS域和Gb口信令数据基础分析,建立精确的锁网终端分析模型,该模型分析流程如图3所示。

最终模型具体说明如下:

以一个月为周期,统计满足以下条件:

(1) 基于PS域数据上报的TAC与UA相符,确认为使用3G/4G终端。

(2) 基于CS域数据和PS域数据,进行汇总确认,确定使用该终端的用户曾经出现过在有3G/4G覆盖的区域,但只使用GSM网络。

说明:理论上仅使用PS域数据中的路由区信息是否与3G、LTE的路由区重叠覆盖能够获取用户是否活动在有3G/4G覆盖的区域。但在研究过程中发现,由于部分用户仅使用CS网络或者仅在无覆盖区域使用PS业务的行为特征,将造成仅用PS域数据判别锁网终端的准确率偏低,为提高判别的准确率,故最终采用CS域与PS域数据双数据重复确认机制,整合用户曾出现过的区域,进行判别用户是否进入过3G/4G覆盖范围。举例:2013年6月中山地区的数据为例,CS域用户为500万,PS域用户为392万,而使用PS域数据判别是否3G/4G覆盖,其中判别为无在3G/4G网络覆盖范围的用户有12.3万,使用CS域数据和PS域数据进行重复认定后,无在3G/4G网络覆盖范围的用户为9.1万,故仅使用PS域用户的锁网终端判别准确率仅为65.18%。

(3) 基于PS域数据,确定使用该终端的客户有使用GPRS服务,即产生GSM流量,从未产生3G/4G流量。

(4) 基于Gb口信令数据剔除终端芯片上报不支持3G/4G网络的用户。

通过使用最终的3G/4G终端锁网分析模型,对中山公司6月的数据进行了总体分析,确定中山公司共有3G/4G终端锁网用户9.1万,占中山本地总体3G/4G终端的12%,其中精确定位伪锁网用户共710人,可识别IMSI用户647人,中山本地用户505人,故伪锁网终端对准确率的营销为1.02%。由于伪锁网终端的判别使用了大数据量的Gb口信令,而该信令仍未为集团统一要求的信令采集端口,故最后的模型将次优化作为可选方式,如果本地条件不允许的情况下,可以暂跳过该判断条件。

图3 最终分析模型流程图

3 应用和本省推广情况

3G/4G网络的使用依赖于网络的建设完善、终端的支持和用户的使用习惯,本研究通过移动公司内部网络线条与市场线条的紧密合作,基于信令、话单和规划等多种大数据联合分析,建立了精确的3G/4G终端锁网分析模型,广东中山公司于2013年使用该模型进行了锁网用户专项营销活动。

通过3G/4G终端锁网分析模型精确定位了锁网用户(中山地区锁网终端用户的分析数据如图4所示),并将锁网用户(包括用户号码、终端类型、用户活动范围等)提供给数据业务中心和市场部后,数据业务中心和市场部开展了一系列的营销活动,主要有:

(1) 分终端解锁引导:数据业务中心对用户分布较多的终端,挖掘解锁步骤,通过10086短信下发解锁引导,以及解锁赠送流量优惠,引导用户主动解锁。

(2) 精准定位点对点引导:将疑似锁网用户下发到各个服营中心,由服营中心点对点进行解锁引导。

(3) 对伪锁网用户提供换机优惠套餐,建议其更换正版的G3终端,能够得到更好的业务体验。

通过两个业务部门开展的营销活动,3G/4G锁网用户积极参加,“解锁”效应得到充分体现,主要有以下几个方面。

(1) 截至10月底中山累计解锁用户数达到8.27万。

(2) 解锁后流量大幅提升:用户解锁前人均流量63.75 M,解锁后人均流量144.30 M,流量提升达126.35%,其中3G流量82 M。

(3) 解锁后流量收入有效提升:用户解锁前用户人均流量收入13.79元,解锁后人均流量收入17.24元,收入提升25.03%。

2013年9月,广东省公司引入了中山公司的3G/4G终端锁网分析模型,并固化到省建“集中性能管理系统”,并将分析出来的3G/4G终端锁网用户推送到省数据业务中心和21个地市,由省数据业务中心在全省利用智能管道3G/4G引导策略进行用户引导和地市个性化营销活动。

图4 中山市试用3G/4G终端锁网分析模型所得锁网用户分析图

猜你喜欢
分析模型信令中山
基于BERT-VGG16的多模态情感分析模型
比深圳离前海更近 3年超500亿打造中山“前海”
SLS字段在七号信令中的运用
中山君有感于礼
中山靖王的动物园
移动信令在交通大数据分析中的应用探索
基于信令分析的TD-LTE无线网络应用研究
历史上的“中山人”
层次分析模型在结核疾病预防控制系统中的应用
LTE网络信令采集数据的分析及探讨