手机运营商数据挖掘

2019-03-29 12:01刘萍
商情 2019年7期
关键词:聚类分析影响因素

刘萍

【摘要】随着手机技术的发展,手机已经成为大多数人不可或缺的一部分,但是对于手机资费的关注还较少,本文对手机运营商客户相关数据进行分析,首先利用聚类分析对数据进行分类处理,再基于此对相关性较大的指标进行逐步回归分析,最终找出了通话费的主要影响指标为WLAN、主叫次数、漫游费。

【关键词】聚类分析;逐步回归;影响因素

一、引言

手机资费在通讯发达的今天己经成为人人关心的一个话题,了解自己的个人通讯开销的具体情况与资费高低的主要指标是很重要的。但是,大部分用户并没有了解到自己的话费使用情况,很容易导致资费浪费或者分配不合理的情况。因此本文将根据聚类分析以及逐步回归,基于手机资费数据研究话费的影响因素,为个人资费业务选择、话费控制提供参考。

二、方法介绍

本文首先利用聚类分析观察数据各个指标关系;然后利用多元回归进行分析。基于层次的聚类算法又称为树聚类算法。该方法使用数据的联接规则,通过层次式架构方式反复将数据进行分裂或聚合,以形成一个层次序列的聚类问题的解。由于并不是所有解释变量都能够对因变量有显著的影响,因此在多元回归的过程当中,需要挑选对因变量影响较大的自变量,这就需要求出所有可能的2m-1个回归方程进行比較,进而确定最终的回归方程,在解决该问题的各个方法中,逐步回归最受推崇。

(三)多重共线性检验

对最终的模型方程进行多重共线性检验,检验得到的VIF值为48.65,说明存在较小的多重共线性,若此时为了消除多重共线性进行变量的删减,可能会影响各个自变量与因变量的真实关系,因此不作处理,方程(3)即为最终方程。

四、总结

本文运用运营商数据进行聚类、回归分析。经过各项检验,最终得到了最为符合实际的线性回归方程作为最优方程。由最终方程(3):WLAN对通话费影响最大,且是呈负相关的,主叫次数、漫游费对通话费的影响较大,且是呈正相关的。由此手机用户可以根据自己的实际消费情况进行套餐倾斜,以此来降低通话费用;对运营商而言,也可以据此制定合适的消费套餐,进而更准确的满足手机用户的需求,加大自身的品牌竞争力。

猜你喜欢
聚类分析影响因素
农村居民家庭人均生活消费支出分析
突发事件下应急物资保障能力影响因素研究
基于省会城市经济发展程度的实证分析
农业生产性服务业需求影响因素分析
村级发展互助资金组织的运行效率研究
基于系统论的煤层瓦斯压力测定影响因素分析
基于聚类分析的互联网广告投放研究
“县级供电企业生产经营统计一套”表辅助决策模式研究