一种基于网格聚类的4G覆盖价值区挖掘方法

2015-06-23 16:27许景渊张振荣
无线电通信技术 2015年5期
关键词:网络覆盖聚类网格

许景渊,张振荣

(1.广西大学 计算机与电子信息学院,广西 南宁 530004; 2.北京中网华通设计咨询有限公司,北京 100070)

一种基于网格聚类的4G覆盖价值区挖掘方法

许景渊1,2,张振荣1

(1.广西大学 计算机与电子信息学院,广西 南宁 530004; 2.北京中网华通设计咨询有限公司,北京 100070)

传统基于覆盖场景的规划方法已难以适应4G网络精细化规划的需求,结合4G网络需求分析及工程实践,提出了一种基于网格空间聚类的4G网络覆盖价值区挖掘的评估模型及分析方法。从逆向视角出发,运用网格聚类的方法,理清4G网络规划中“用户”、“网络”、“业务”及“投资”四者的内在关系,盯紧4G目标用户的消费行为轨迹,建立了各层指标评估体系及评估模型,并在工程实践中予以验证,从而为后期4G网络精细化规划提供有益参考。

网格聚类;4G网络;价值模型;挖掘评估

0 引言

近年来,随着用户对移动高速数据业务需求的日益旺盛以及4G网络的大规模部署,“如何优选项目,聚焦投资效能,发现价值区域,提升用户感知”成为4G网络规划面临的重大难题和课题[1-3]。从需求分析角度来看,作为高速数据业务承载网的4G网络,其规划方法有别于传统基于场景颗粒度的规划方法,在理清2G/3G网络现状的基础上,应更为精细化规划和部署,同时,还应综合分析“用户行为”、“网络覆盖”、“业务密度”及“投资效能”等数据,盯紧4G目标用户的消费行为轨迹,从而进一步搜寻和挖掘网络覆盖价值区域,最终做到聚焦投资效能和提升用户感知。

然而,从海量用户行为、网络指标、业务分布等电信大数据中找寻4G网络覆盖价值区域也面临数据繁杂、高维度、难归约等技术困难[4,5],“物以类聚,人以群分”,使用基于网格空间聚类方法进行数据挖掘和分析不失是一种行之有效地解决思路。该方法常用于组织高维度数据分析,并能有效实现高维数据的局部化分析,其核心思想是将高维数据空间划分为若干互不相交且具有层次结构的网格单元集,将每个指标对象映射到合适的网格单元中,进而识别和计算每个网格单元中的指标密度,并由指标值大于指定阈值的稠密网格单元形成簇,从而最终进行网格排序和发现网格价值指标及价值区域[6-9]。为此,本文从逆向视角出发,理清4G网络“用户”、“网络”、“业务”及“投资”等四个要素的内在关系,紧盯“用户感知”、“业务能力”、“投资效能”、“价值区域”等主要目标,提出了一种基于网格空间聚类的4G网络覆盖价值区挖掘的评估模型,从而有效地解决了这个问题。

1 价值模型构建及评估

1.1 价值模型构建

从4G网络覆盖需求角度分析,4G网络定位为高速数据业务承载网,可考虑从“用户”、“网络”、“业务”和“投资”4个关联层次来进一步定义网络的覆盖价值区域,其主要体现为“用户卓越体验”、“网络超越引领”、“业务丰富多元”、“成本高效产出”等多层面。紧盯“聚焦投资效能,发现价值区域,提升用户感知”的目标,逐层理清和划分出“用户层”、“网络层”、“业务层”和“投资层”等层次结构,对分层指标进行多维度量化、加权叠加和逐级映射,并将相关价值属性映射和聚类到网格系统中,从而挖掘和发现4G网络覆盖价值区域,构建价值模型如图1所示。

图1 4G网络覆盖价值区域层次模型

1.2 价值模型评估

进行4G网络覆盖价值模型评估主要抓住“用户”和“网络”2条主线,紧盯用户行为分析,即不同特征的用户群体,在何时、何地(如基站位置、地理区域等),使用何种终端类型(如4G倾向型终端、非4G倾向型终端等)和资费套餐(如高、中、低价值资费套餐等),发生了何种业务行为(如语音、浏览网页、下载、IM等),产生了多少业务量(如话务量、数据流量等);与此同时,重点关注不同用户群体分布对应区域的网络覆盖及业务能力(如2G/3G基站分布等),即重点挖掘“用户分布聚集”、“4G倾向型终端密集”、“高资费套餐集中”及“业务量高发区域”等高价值覆盖区域对应基站的网络覆盖、质量及业务能力,从而构建分层次、分梯度、关系对应的4G网络覆盖价值区,最终根据价值网络分布、覆盖目标来确定投资规模及投资节奏,评估流程如图2所示。

图2 网格聚类分析及价值模型评估流程

由图2可见,价值模型评估流程主要包括“确定分层评估指标体系”、“构建关键指标映射关系”、“指标集数据预处理”、“单维度指标叠加分析”、“综合指标网格化映射及聚类”和“网格化排序及价值区域发现”等主要步骤,对各关键流程进一步分析如下。

1.2.1 确定分层评估指标体系

遵循分层次、分梯度、逐层映射的评估思路[10],对应演绎和形成了“用户指标”、“网络指标”、“业务指标”、“投资指标”的分层指标体系,以“用户”和“网络”为主线,紧盯“用户号码”、“基站LAC+CI号”2个关键映射值,从而确定分层评估指标体系。涉及的指标应统一口径并从网管系统、营帐系统等等指标系统中提取,形成的主要分层评估指标结构如表1所示。

表1 各主要分层评估指标结构划分表

1.2.2 构建关键指标映射关系

构建一致的关键指标映射关系是对相关指标集进行网格化处理和地理化呈现的前提。理清“用户在何种网络下发生何种业务”、“网络在何处提供何种业务能力”及“提供何种覆盖水平所需投资成本”等关键指标映射关系,从而形成“坐标系”、“用户号码”、“基站LAC+CI号”等指标一一对应的映射关系,使得每个指标对象都落入一个网格单元中,网格单元对应的属性区间包含该对象的值,构造出清晰的网格化处理关系网,为后期指标集数据预处理打下良好基础。

1.2.3 指标集数据预处理

通常,从网管系统、营帐系统等异种数据源中获取的指标数据很容易受到噪声、缺失值和不一致数据的侵扰,进行指标集数据预处理是获得准确、完整和一致的基础数据[11],提高数据质量及数据挖掘效率的重要步骤,主要流程包括数据清理、数据集成、数据规约、数据变换和数据离散化等。

首先,对网管系统、营帐系统等异种数据源中获取的指标数据进行数据清理,清除数据噪声,纠正不一致数据,然后,根据关键指标映射关系将不同数据源统一集成为一个关系对应的指标集,接着,通过诸如聚集、删除冗余值或透视等数据规约手段来降低数据的规模,最终,通过数据变换和离散化处理使得数据更易归一化处理,自动产生数据的概念分层,并构成准确、完整和一致的分层指标评估体系。

1.2.4 指标叠加、网格化映射及聚类

经过上述流程的处理,可获得较为有效的指标数据,接着将进行各层指标的单维度叠加、归一化处理、网格划分、网格化映射及数据聚类等操作。结合地理化特征及城市功能区分布等因素,并综合考虑“用户层”、“网络层”、“业务层”、“投资层”等指标数据,将目标覆盖区在场景颗粒基础上进一步细化划分为互不相交的网格单元,对同维指标进行横向加权、异维指标进行纵向归一化相结合的方式进行网格指标量化和叠加,最终将各层次指标值映射到网格单元,并以地理化方式进行呈现和网格聚类分析。

1.2.5 网格化排序及价值区域发现

综合上述各环节中“用户行为”、“网络能力”、“业务分布”、“投资效能”等指标的统一分析、叠加加权、网格映射及网格聚类,形成了以网格综合得分形式的网格排序体系,并根据投资能力和投资节奏将网格进一步划分为“价值网格”、“赶超网格”及“潜力网格”,其中价值网格即为4G网络“用户卓越体验”、“网络超越引领”、“业务丰富多元”、“成本高效产出”的覆盖价值区域。

2 应用案例

以某市应用为例,使用MapInfo软件进行网格划分、指标叠加、网格映射及网格聚类等应用实践,分析如下。

2.1 网格划分

合理的覆盖区域划分可以有效促进投资资源的最优化配置[12]。网格颗粒度介于覆盖场景与站点之间,对点、线、面覆盖场景的进一步精细化划分是进行网格化聚类及价值模型挖掘的前提,其中网格划分思路如下:

①关注网络覆盖价值区域,需将覆盖区域划分为有效覆盖区域和无效覆盖区域,将人迹罕至的高山、河流、湖泊等区域剔除于网格之外;

②对有效覆盖区域,网格应考虑地形地貌、功能特征、人口分布、建筑分布等特征,将无线网络传播环境类似的区域划分为同一个网格,以方便网络覆盖、网络质量、网络容量等指标的分析;

③网格边界应与现有行政区划边界、城市功能区边界、覆盖场景边界、市场营销网格、网络优化网格等现有网格单元相关联,原则上,上级网格应包含下层网格,网络网格应为上述网格中最小的划分单元;

④网格应充分考虑面、线、点覆盖需求,市区、县城及乡镇镇区等面覆盖区域应充分考虑市政规划功能区定位来进一步细化和裂变。

2.2 网格聚类分析

应用上述的价值模型评估流程,对覆盖区域的“用户层”、“网络层”、“业务层”及“投资层”等指标数据进行多维度的叠加处理、网格映射、聚类分析及网格排序,最终获得4G网络覆盖价值区域。其中,以2/3G网络业务层数据分析为例,2G网络和3G网络属于不同制式的网络,承载能力及评价指标各不相同,可通过对2G业务和3G业务的同维指标加权处理、异维指标归一化处理,将不同的指标量化并转换业务密度,使得每个对象能对应映射到网格中,方便进行网格聚类及地理化呈现处理。以网格A为例:

首先,进行单维度数据叠加分析,分别计算2G/ 3G网络业务密度指标,计算方法如下:

接着,考虑2/3G网络业务密度指标评估体系不同且采用单位不一致,应归类为异维指标,为方便进行数据统一评估分析,采用归一化处理手段将相关业务密度指标转换为对应的网格业务密度分值形式,以百分制为例,计算方法如下:

然后,通过上述步骤,可获得各网格统一的指标评估数据,并对2/3G网络中的同维指标进行加权处理,并考虑4G网络作为承载高速数据业务的发展趋势,侧重对数据流量指标评估,进一步定义2/3网络业务密度指标权重,计算方法如下:

最终获得各网格业务密度综合得分,并以百分制进行降序,计算方法如下:

网格业务综合得分=2G业务密度得分×对应的权重+ 3G业务密度得分×对应的权重。

2.3 价值网格发现

综合分析网格聚类结果,将综合指标密度综合得分进行排序,将网格排序中TOP 30%、30%~60%,60%~100%分别对应划分为“价值网格”、“赶超网格”和“潜力网格”,划分结果如表2所示。

表2 某市网格空间聚类的分析结果

由此可见,经网格空间聚类分析,共挖掘和发现332个价值网格,占网格总数的32.02%,其中网格的人口和面积占比仅为14.50%和0.67%,却承载着某运营商40.51%话务量和68.00%的数据流量,说明该网格覆盖区域具有重大发展前景和投资收益,是4G网络覆盖价值区域,也是4G网络优先规划和部署的重点区域。

3 结束语

4G网络覆盖价值区域的定义、挖掘及发现是网络规划的重要工作,本文紧抓“用户行为”和“网络能力”两条主线,应用网格空间聚类分析方法,构建了“用户”、“网络”、“业务”和“投资”逐层映射的价值模型及对应的评估流程,并得到了工程实践的检验,为4G网络覆盖价值区域发现及后期网络规划提供了一种有效的解决方案。

[1]陈建刚,肖清华,汪伟.基于客户感知的无线网络选址评估方法[J].移动通信,2012,36(13):36-39.

[2]刘辉,贺肖荣.TD-SCDMA PS域业务用户感知模型的构建与应用[J].电视技术,2013,37(7):68-71.

[3]牛宪华,曾柏森.基于用户感知的WCDMA网络深度覆盖评估研究[J].移动通信,2013,38(8):5-8.

[4]霍成义.面向数据提供者的隐私保护访问控制模型[J].无线电工程,2014,44(2):5-8.

[5]员建厦.基于动态存储策略的数据管理系统[J].无线电工程,2014,44(11):52-54,62.[6]Han J W,Kamber M,Pei J,等.数据挖掘:概念与技术[M].范明,孟小峰,译.北京:机械工业出版社,2012.

[7]闫光辉,何瑞春.基于神经网络、网格和密度的聚类方法的设计[J].兰州铁道学院学报(自然科学版),2003,22(1):94-97.

[8]杨毅.一种基于网格优化的空间数据访问与存储研究[J].无线电通信技术,2014,40(6):43-46.

[9]陈慧萍,王煜,王建东.子空间聚类算法的研究新进展[J].计算机仿真,2007,24(3):6-10,34.

[10]鲁凯,王远军.基于AHP的基站站址资源储备评估研究[J].邮电设计技术,2010(12):43-48.

[11]李军,刘匡虎.一种现代移动通信网络话务场景划分方法[J].移动通信,2012,36(9):41-44.

[12]程鸿雁,朱晨鸣.LTE FDD网络规划与设计[M].北京:人民邮电出版社,2013:302-309.

A Data Mining Method for 4G Value Coverage Region Based on Grid Clustering

XU Jing-yuan1,2,ZHANG Zhen-rong1
(1.College of Computer and Electronic Information,Guangxi University,Nanning Guangxi 530004,China; 2.China Comm Design&Consulting Co.Ltd.,Beijing 100070,China)

The needs of fine planning in 4G network exceeds the capacity of conventional division method based on coverage scene.Based on an analysis of 4G network's requirement and engineering practice,an evaluation model and analysis method for 4G network's value coverage region based on Grid Subspace Clustering are proposed.From the perspective of reverse thinking and by using the method of grid clustering,the internal relationship among user,network,service and investment is clarified;the consuming behavior track of target users is closely observed,then a layered index evaluation system and evaluation model are established;at last,they are verified in an practical engineering project.The proposed method is helpful for discovering the value coverage region in 4G network,and it will play an important role in fine planning.

Grid-based Clustering;4G network;value model;data mining and evaluation

TN929.53

A

1003-3114(2015)05-11-4

10.3969/j.issn.1003-3114.2015.05.03

许景渊,张振荣.一种基于网格聚类的4G覆盖价值区挖掘方法[J].无线电通信技术,2015,41(5):11-14.

2015-06-10

许景渊(1985—),男,硕士研究生/工程师,主要研究方向:3G无线网络规划及网络优化。张振荣(1976—),男,教授,博士,主要研究方向:光网络与光通信技术。

猜你喜欢
网络覆盖聚类网格
用全等三角形破解网格题
基于K-means聚类的车-地无线通信场强研究
反射的椭圆随机偏微分方程的网格逼近
TD-LTE网络覆盖质量评估浅谈
重叠网格装配中的一种改进ADT搜索方法
基于高斯混合聚类的阵列干涉SAR三维成像
基于曲面展开的自由曲面网格划分
结合同频载干比综合评价GSM-R网络覆盖质量方案研究
浅析并线区段的GSM-R网络覆盖调整
TD-LTE网络覆盖的分析方法研究