面向大数据的电信客户细分模型研究与展望

2018-04-12 11:45张小敏王小丫左小雪
数字通信世界 2018年3期
关键词:细分数据挖掘聚类

张小敏,王小丫,左小雪

(安徽财经大学 管理科学与工程学院,蚌埠 233030)

1 引言

21世纪以来,数据的快速增长使得电信行业面临着巨大的机遇与挑战。随着移动互联网的快速发展,电信运营商主营业务由传统的语音业务逐渐向移动数据业务转变。作为大数据的生产者,电信企业拥有极有价值的用户数据,如何利用这些大数据实现客户的价值分析、产品的高效营销以及市场的领先地位,成为决定企业未来发展的关键。移动通信高速发展的同时也带来了电信市场激烈的竞争,对电信运营商提出了更加严酷的要求。现有研究表明,电信运营商想要保持市场的相对领先,就必须善于利用客户数据进行客户细分,提高客户价值,并针对不同的客户群实现精准市场营销[1]。

2 客户细分方法演进及现状

客户细分的目的是为了将有潜力的客户与无潜力的客户区分开,以此对不同的客户群进行不同的针对性营销策略。自Smith(1956)首次提出客户细分的概念以来,客户细分方法经历了一系列的变化[2]。

传统的统计法主要是以客户基本属性特征的简单统计来进行细分,包括诸如年龄、性别、家庭、种族、职业、教育状况等客户基本信息。但由于该方法不具备定量分析的功能,统计细分得出的结果往往带有较强的主观性,不能反映出真正的客户价值。

经过多年的研究和探索,营销学者们提出了一种基于客户价值的细分方法,由于不同的客户对企业的价值不同,通过分析客户的盈利能力及公司的利润贡献率将客户进行细分,再针对不同价值的客户群采取精准营销策略,从而实现企业的利润最大化。

为了动态的对客户的行为特征进行划分,随后提出了基于数据挖掘的客户细分方法,也是现在电信企业实现客户细分重点关注的研究领域[3]。基于数据挖掘的方法主要是运用聚类算法对客户进行细分,通过客户的历史数据来分析未知的客户行为特征,大致可分为两类客户细分方法:1)多元统计分析,如K-means方法;2)神经网络模型,如自组织神经网络SOM算法。

目前,国内外学术界比较关注的是对于数据挖掘技术的优化与改进,以提高细分结果的准确性和可靠性,为企业界提供一定的理论结果和方法创新。而国内学者对客户细分的研究起步较晚,相关理论主要来源于国外,没有与中国企业的现状很好地结合起来。随着市场的不断发展,相信客户细分解决方法的需求会越来越强烈,在一定程度上会加快客户细分理论的研究进程。

3 电信客户细分模型构建

目前,数据挖掘已经逐渐被应用到国内外电信业的生产和经营中,而数据挖掘建模方法是数据挖掘顺利开展的先决条件,由欧洲委员会和相关行业的四大公司提出的行业标准过程CRISP-DM[4],是目前业界权威的标准流程方法。CRISP-DM将数据挖掘过程看作一个商业过程,提供了一个数据挖掘项目生命周期的全面描述,如图1所示。

CRISP-DM参考模型大致可分为6个阶段:商业理解、数据理解、数据准备、模型建立、模型评估和结果部署,最终构成一个统一的循环周期。在整个过程的每一个阶段,如果发现某个阶段产生的结果和预想的结果有偏差,则需要用户重复以前的工作。本文将从这6个过程对电信客户细模型进行详细阐述。

3.1 商业理解

根据数据挖掘的流程,对客户细分进行商业理解主要是从商业角度理解项目的目标和要求。对于积累了大量客户数据的电信行业来说,商业目标可概括如下:利用系统化的方式组织和分析庞大的数据量,从中发现有价值的规律;把有相近交易行为的客户归到一个客户群,深入了解每一客户群组的客户消费行为特征;从而为发展新业务、挽留高价值客户打下基础,实现利润最大化、提升企业竞争力。

3.2 数据理解

移动通信企业拥有计费、账务、欠费、宽带上网等系统,而这些系统数据库中存储了大量的客户消费及行为数据。通常情况下电信运营商会以消费样本数据作为研究对象构建模型,主要包括客户基本数据、消费数据以及行为数据。主要收集的用户数据清单如表1所示。

图1 CRISP-DM参考模型

表1 数据收集清单

3.3 数据准备

获得客户的消费样本数据后,还需要对数据样本进行充分的准备与分析。数据准备过程的关键步骤是数据检测、属性约简及数据转换[5]。对电信企业来说,数据检测主要是指缺省值和异常值的检测,一般采用值分析、统计分析和频次分析等方法来进行检测。在客户所有的属性中,许多属性对客户细分的意义不大,甚至还会影响结果,因此,需要进行属性约简将冗余的属性清除。此外,电信企业数据仓库包含大量不同数据类型的数据,需要根据建模的要求,对数据加以变换,以消除量纲不同可能引起的数据差异。

3.4 模型建立

聚类算法在客户细分模型构建中得到了大量的应用,本文针对适合大数据分析且效果较好的K-means聚类算法进行详细阐述。K-means[6]算法的基本步骤可表述如下:

(1)随机或按照某种先验知识选择一个K值,用来确定簇的总数。

(2)在数据集中任意选择K个样本,作为初始聚类中心c1,c2,…,ck。

(3)依据样本{xi,i=1,2,…,n}到聚类中心的距离,将其赋给最近的中心cj的簇Xj,即若

则x∈Xj。

确定好数据挖掘算法之后,才能建立挖掘模型。从整个流程来看,建立模型是一个反复的模型调优过程,不仅涉及不同算法的选择,也取决于属性参数的设置,确保建立最合适的电信客户细分模型。

3.5 模型评估

建立好模型以后,评估是重要的环节。模型评价标准就看其是否有效,能否正确反映前期定义或假设,结果是否存在偏差。对于聚类、关联规则挖掘等无监督学习系统来说,模型的评估是困难的,因为结果的好坏很大程度上取决于使用工具的特定环境。

3.6 结果部署

结果部署,即对挖掘结果进行解释分析,对其尽可能使用统计工具和可视化方法来刻画属性特征,如表格或图形的形式,最后根据挖掘结果提出相应的决策方案和建议。

4 面向大数据的电信客户细分方法未来展望

大数据背景下电信客户细分方法也会有所转变,笔者将基于大数据对电信客户细分方法进行展望,同时也为进一步研究客户细分方法提供相关依据。

(1)基于技术不断发展的大背景下,电信客户细分模型中数据网络型用户已经取代了电信传统的话务型客户,电信客户细分模型应该趋于面向数据业务的分群分析,企业逐渐培养客户使用数据的习惯。

(2)近年来,中国电信与互联网公司开始进行产业融资合作,在迅速增强其竞争优势的同时,在客户细分过程中充分利用互联网企业的网络资源、网络平台、客户服务与营销渠道,达到需要的细分效果,可大大提高企业的获利。

(3)在大数据时代,获取信息的途径更为丰富,可以通过社交网络获取客户之间的联系信息,增加个体客户对所在群体内其他客户的影响力指标,这样客户的价值不再仅是个体客户消费体现的价值,营销效率将会有很大的提高。

5 结束语

本文首先详细描述了客户细分方法的发展历程并对其现状进行分析,其次介绍了数据挖掘过程参考模型CRISP-DM,并依据其6个过程对电信客户细分模型进行阐述与构建,重点介绍了K-means聚类算法。最后,就大数据时代背景,对未来电信客户细分方法进行展望,为进一步研究客户细分方法提供相关依据。

[1]贺仁龙,叶宇航,赵晓康.电信企业客户细分模型构建与应用研究[J].情报杂志,2011,30(S1):148-151.

[2]杨茜.基于大数据的客户细分模型及精确营销策略研究[D].南京邮电大学,2015.

[3]陈治平,胡宇舟,顾学道.聚类算法在电信客户细分中的应用研究[J].计算机应用,2007(10):2566-2569+2577.

[4]薛薇.SPSS Modeler数据挖掘方法及应用(第二版)[M].北京:电子工业出版社,2014:270-290.

[5]陈金波.面向电信CRM的数据挖掘应用研究[D].东南大学,2006.

[6]Survey of clustering algorithm.XU R,WUNSCHLL D.IEEE Transactions on Neural Networks.2005.

猜你喜欢
细分数据挖掘聚类
探讨人工智能与数据挖掘发展趋势
深耕环保细分领域,维尔利为环保注入新动力
基于K-means聚类的车-地无线通信场强研究
基于并行计算的大数据挖掘在电网中的应用
基于高斯混合聚类的阵列干涉SAR三维成像
基于Spark平台的K-means聚类算法改进及并行化实现
1~7月,我国货车各细分市场均有增长
基于改进的遗传算法的模糊聚类算法
一种基于Hadoop的大数据挖掘云服务及应用
整体低迷难掩细分市场亮点