基于灰聚类方法的我国银行信用卡客户细分

2018-09-10 06:05崔永生
中国商论 2018年21期
关键词:精准营销数据挖掘

崔永生

摘 要:3D(大数据、数字化、发展中经济体)背景下金融行业领域的竞争日益加剧,优质客户成为金融企业争夺的焦点。如何有效地、精确地运用客户细分的理论和方法,定位标识自己的核心客户群,是企业实现精准营销盈利目的的唯一有效途径。RFM模型是衡量客户价值和客户创利能力的重要工具和手段,K-means聚类结合RFM模型是一种目前企业客户细分应用中普遍采用的组合方法。如果K-means聚类结合传统的RFM模型来做客户细分,由于RFM指标取值范围通常具有灰性,需要人为经验判断,所以在指标取值上具有强主观性,会影响客户价值评价结果的准确性。为此本文针对这一问题,采用灰聚类分析技术,依据我国某商业银行信用卡客户个人信息和卡消费交易统计数据,构建了基于灰聚类的RFM两阶段细分模型,并作了实证分析。分析结果表明,此模型解决了RFM指标灰色属性取值难以度量的问题,同时对银行客户细分简单有效,结果可以为营销决策提供参考依据。

关键词:数据挖掘 精准营销 RFM模型 灰聚类 客户细分 K-means聚类

中图分类号:F713.50 文獻标识码:A 文章编号:2096-0298(2018)07(c)-131-07

3D(大数据、数字化、发展中经济体)背景下金融行业领域的竞争日益加剧,高质量的客户成为银行业争夺的焦点,不同类型的客户带给银行不同的销售利润。客户细分是成功管理客户关系的基础,也是有效实施市场策略的第一步[1]。银行只有通过定性和定量相结合的方法,运用现代技术的方法和手段,精准地把握客户的消费心理和消费行为特征,实施有真对性的客户细分的营销策略,进行市场产品、服务和管理资源合理的配置,才能达到少投入多产出。

从客户价值细分的维度上,国内外学者研究的较为深入。大多数针对电信和零售企业提出了RFM指标分析评价方法并构建了相关的客户细分模型,但对银行信用卡客户消费行为特征结合价值细分的研究还不多见。另外传统方法的RFM指标在取值范围常具有灰性,需要人工经验界定,因此带有强主观性。针对这一问题,本文依据银行信用卡客户的消费行为数据,采用灰色系统理论中的灰聚类分析方法,来解决具有灰色性RFM指标其取值难以度量的问题,构建了改进的RFM两阶段聚类细分模型,并进行了实证分析,结果表明该模型对银行信用卡客户细分简单有效。

1 相关研究评述

采用数据挖掘的技术对企业客户细分,目前已成为国内外专家学者研究的热点,并取得了丰硕的成果。就研究成果来看,普遍地应用了CRM理论中客户细分策略并结合各种数据挖掘技术手段加以实现。现将国内外近3年来研究现状总结,如表1所示。

就目前国内外专家学者对企业客户细分的研究成果来看,普遍采用了FRM模型结合K-means聚类技术,这种组合方法可以观测客户的消费行为和评估客户生命周期的价值。从行业应用上看,多数集中在电信、零售行业;从数据挖掘的技术应用上看,多数集中在综合运用各种聚类算法来提高客户细分的准确性和稳定性,但对客户细分指标的选择和取值合理性的研究并不多见,这一领域的研究需要进一步的深化和探讨。

2 相关概念

2.1 FRM模型

RFM分析模型最早是由Hughes(1994)提出,它根据客户的交易历史记录,用于分析客户的消费行为,标识出差异化的客户,进而评估客户价值。RFM模型由三个重要的指标变量构成,其定义如下。

(1)最后一次购买产品的时间间隔(R)。R代表最近的一次购买产品时间和目前的时间间隔。R间隔越短,R代表的客户价值越大。(2)采购的频率(F)。F表示频率,指客户在某一时间段的购买产品的活动频率。例如,一年几次,一个月几次。F值越大,F代表的客户价值越大。(3)购买产品的货币价值(M)。M代表货币价值,指客户在某一时间段购买产品的消费金额。M值越大,M代表的客户价值越大。

RFM模型被应用于许多行业领域的客户细分,经典的RFM模型可作为市场营销产品的客户价值评分模型。客户购买产品的消费记录被RFM的三个细分标量指标排序,并将三个标量指标值依次分成五个等级,如R变量,设最近购买产品的20%的客户等级为5,前一个最近购买产品20%的客户等级为4,以此类推到等级为1,这样客户记录按照这三个变量指标本分成125的等级组。拥有最高评分等级的客户则是最有价值的客户。

2.2 指标定权灰聚类

常用的距离有:闵可夫斯基(Minkowski)距离、兰式(Lance和Williams)距离、马哈拉诺比斯(Mahalanobis)距离、欧式(Euclidean)距离等。K-means的划分数据集的方法是:给定一个有N个元素组成的数据集,分裂法将构造K个分组,每一个分组就代表一个聚类,K(1)每一个分组至少包含一个数据记录。

(2)每一个数据记录属于且仅属于一个分组。

对于给定的K,算法先给出一个初始的分组方法,以后经过反复迭代的方法改变分组,使得改进后的分组都优于前一次,即同一分组的记录距离越近,而不同分组的记录距离越远。

3 模型的构建

目前我国商业银行客户信用卡的使用率相比于国外银行使用率相对低下,造成大量的信用卡开户后闲置,这主要与银行只注重客户信用卡的市场份额,而忽略客户的信用卡使用情况和消费习惯的记录有关,进而没有了解和掌握客户信用卡的消费需求,降低了信用卡客户的对银行的忠诚度,难以提供个性化的服务。

本文基于信用卡客户的消费行为,构建灰聚类RFM两阶段客户细分模型,如图1所示。

构建灰聚类RFM模型的步骤如下。

第一步:抽取银行信用卡客户交易记录,对交易数据统计并预处理。

第二步:对客户交易数据统计,选择客户消费行为指标变量。

第三步:依据客户交易数据统计,选择RFM指标变量。

第四步:对客户消费行为指标变量进行PCA降维处理。

第五步:采用灰聚类,对RFM指标数据进行第一阶段聚类,生成信用卡客户价值评级记录组。

第六步:采用K-means聚类,将客户统计消费记录联合信用卡客户RFM价值评级记录进行第二阶段聚类,生成客户信用卡消费细分组。

4 实证分析

4.1 数据的来源与预处理

4.1.1 信用卡客户和交易记录的来源与统计

信用卡客户账户数据来源于我国某商业银行数据中心数据库,数据包括客户个人信息(性别、年龄、职业、文化程度、婚姻状态、个人收入、信用额度、失信情况等),总计31129条。信用卡客户交易数据来源于2015—2016年这些账户的交易信息数据库,总计10,101,098条。统计剔除在一年中没有任何消费的或有失信情况的客户,最终选取27129个客户及其消费记录作为本文研究的指标数据。客户账户信息及交易数据统计描述如表2所示。

4.1.2 信用卡客户细分指标的选取

依据客户的消费记录和客户账户信息的分类属性,选择客户细分的数据指标,如表3所示。

4.2 客户消费数据指标的PCA降维处理

通过PCA降维处理,可以大大提高维模型数据指标变量的分类有效性。本文通过对客户信用卡消费百分比数据运用SPSS统计分析软件作主成分分析,即将表3中14个消费指标进行降维处理,从中选出显著的消费指标因子作為聚类输入指标。首先采用因子旋转法,提取特征值大于1及因子载荷大于0.7的指标,通过滤掉交叉落在不同因子上或虽然落在某个具体因子上但显著性<0.7的指标,分析得到8个因子如表4所示,主成分累计方差贡献率为84.678%,到达降维的效果。

将上述8个因子总结归类,可以得到以下的客户消费细分指标变量,如表5所示。

4.3 定权灰聚类白化权函数和指标权重的选择

确定定权灰聚类白化权函数和灰聚类指标权重一般是根据以往专家经验和定性分析结论给出[12],本文参考Ravasan A Z, Mansouri T(2015)[14]德尔菲法,选取银行信用卡业务专家库中10个工作年限超过10年的专家,请他们对RFM指标灰聚类白化函数和权重值给出参考意见,经过五轮评测,最后对各专家意见结果进行变异系数法综合。其计算第j方案评价标准差σj公式如下所示:

4.4 第一阶段灰聚类的结果分析

本文采用灰聚类建模软件GTMS3.0,对第一阶段客户RFM数据进行灰聚类分析,聚类结果如表7所示。从表7的聚类结果可以看出,所有客户记录被聚类为五个灰类,即所有客户被细分成五个等级组(优、好、中、差、劣)。其中优质客户占总体15%,好的客户占总体21%,普通客户占总体21%,差的客户占总体20%,劣质客户占总体23%。客户数量和数量百分比,如图2所示。

优、好的信用卡客户占总客户百分比为36%,中、差、劣的客户数占客户总数64%,优质客户数占客户总数约1/3,普通和差的客户占总客户约2/3,说明大多数客户信用卡使用率不高。针对所有客户如果在五个等级组的基础上,结合他们消费行为和习惯,进行进一步实施客户细分,可以有效地展开个性化的营销策略活动。

4.5 第二阶段K-means聚类的结果分析

由第一阶段的灰聚类分析,得到了客户RFM指标的五个等级细分组,在此基础上,为了进一步分析客户的信用卡的消费行为特征及客户性别、年龄段、婚姻状态对信用卡使用率的影响,本文采用软件IBM SPSS Modeler 16.0,对信用卡客户进行了第二阶段K-means聚类分析。取K值为9,得到9个聚类,大小如图3所示,最大的聚类6包含5812条客户记录,最小的聚类9包含1551条客户记录。9个聚类的中心分布如图4所示,整理后如表8所示。由表8可以看出,按照5个质量等级基础上,每个等级又包含一到两个子细分聚类组。每个子细分聚类组客户由于性别、年龄段和婚姻状态个人属性的差异,在消费行为和习惯存在较大差异。RFM普通客户等级组中包含最大的消费聚类组6,包含5812个客户,其他的等级组中包含相对较少的客户。为了更清楚分析各子聚类组客户的消费习惯和偏好,按照FRM价值聚类等级,画出各聚类组的条形如图5~图9所示。依据客户的消费倾向,划分以下客户群体。

时尚一族。在图5优质客户等级组中,包含聚类1和9,客户是年龄在25~44岁之间的中青年女性,婚姻状态是年轻单身、离异和中年已婚。他们信用卡消费着重在时尚消费和旅游消费,百分比分别为35.68%和24.32%。这部分客户注重生活品质及爱好旅游,针对这部分群体消费特点,银行适时推出时尚一族优惠卡,会得到他们的认可和欢迎。

旅游一族。在图6好的客户等级组中,包含了聚类10和4,客户是年龄在35~54岁之间的中年已婚男性。他们的消费特点是旅游消费百分比为31.28%,高于其他的消费百分比。时尚消费和医疗保险占百分比分别为20.35%和20.18%,可以看出也占有比较大的比例。针对这部分群体的消费特点,银行适时推出旅游一族优惠卡,会得到他们的认可和欢迎。

实用一族。在图7普通客户等级组中,包含聚类6,最大的聚类组。客户是35~44岁之间的中年已婚男性,这部分客户群体医疗消费、日用消费、通讯消费分别为29.35%、27.16%和25.68%,消费比例平均,其他方面也占有一定比例,可以看出他们的消费特点是注重实用性。针对这一部分客户,银行适时推出实用性优惠卡,会等到他们的认可和欢迎。

生活一族。在图8差的客户等级组中,包含了聚类2和7,客户是35~44岁之间的已婚中年群体。他们的消费特点是在日用消费占有很高的比例,相比于其他的消费群体,信用卡使用率不高。针对这一部分消费群体,银行如果采用适当的营销策略,培养引导他们的消费倾向从日用消费向更多的消费方面如时尚消费和旅游消费,可以提高客户价值。

盲从一族。在图9劣质客户等级组中,包含聚类8和3。客户是35~44岁和55岁以上的中老年男性,这部分消费群体消费倾向比较平均,信用卡的使用率低下。可能是银行为了追求客户账户的保有率,盲目优惠客户开卡。客户在信用卡使用目的上,并没有明确的需求。针对这一消费群体,银行已有的客户,适时回访,展开信用卡消费引导,提升客户价值。同时在没有明确客户消费需求情况下,减少信用卡开卡量,减少不必要资源浪费。

5 结语

目前FRM模型结合数据挖掘方法,是实现企业客户细分普遍采用的技术方法,本文基于FRM模型,提出了灰聚类RFM两个阶段聚类模型,对银行信用卡客户细分进行了理论和实证分析。分析结果表明,该模型可以解决传统FRM模型中具有灰色属性的指标数据不能直接处理的不足,同时结合数据挖掘K-means聚类的方法,可以有效地对银行信用卡客户的消费习惯特征进行细分。在本文的实证分析中,通过两阶段的聚类方法,根据客户的消费交易记录,被细分成时尚一族、旅游一族、实用一族、生活一族、盲从一族,从而给银行的销售人员针对不同的消费群体制定下一步相应的营销策略提供决策依据。

参考文献

[1] 刘英姿,吴昊.客户细分方法研究综述[J].管理工程学报, 2006(1).

[2] Chen Y,Liu Z,Wang Y,et al.Research on User Segmentation based on RFL Model and K-means Clustering Algorithm[C].International Conference on Lo gistics,Engineering,Management and Computer Science(LEMCS 2015).Atlantis Press,2015.

[3] Yuliari N P P, Putra I K G D,Rusjayanti N K D. Customer Segmentation Through Fuzzy C-Means and Fuzzy RFM Method[J].Journal of Theoretical and Applied Information Technology,2015,78(3).

[4] You Z,Si Y W,Zhang D,et al.A decision-making framework for precision marketing[J].Expert Systems with Applications,2015,42(7).

[5] Gü?demir H, Selim H. Integrating multi-criteria decision making and clustering for business customer segmentation[J].Industrial Management&Data Systems,2015,115(6).

[6] Dullaghan C,Rozaki E.Integration of Machine Learning Techniques to Evaluate Dynamic Customer Segmentation Analysis for Mobile Customers[J].2017.

[7] 蔡淑琴,蔣士淼,GDOLLEOLLE,等.基于在线客户评论的客户细分研究[J].管理学报,2015,12(7).

[8] 郭崇慧,赵作为.基于客户行为的4S店客户细分及其变化挖掘[J].管理工程学报,2015,29(4).

[9] 张虎,王国华,郑文芳.基于MaxDiff和潜在类别分析的移动支付客户细分研究[J].数理统计与管理,2017,36(3).

[10] 宋华,云俊.基于客户感知价值的客户细分研究[J].工业工程, 2015,18(4).

[11] 邓聚龙.灰色系统理论教程[M].武汉:华中理工大学出版社, 1990.

[12] 刘思峰,等.灰色系统理论及其应用(第八版)[M].北京:科学出版社有限责任公司,2017.

[13] 卓金武,周英.数据挖掘技术与实践(MATLAB版)[M].北京:电子工业出版社,2015.

[14] Ravasan A Z,Mansouri T.A Fuzzy ANP Based Weighted RFM Model for Customer Segmentation in Auto Insurance Sector[J].International Journal of Information Systems in the Service Sector,2015,7(2).

猜你喜欢
精准营销数据挖掘
基于数据挖掘探讨慢性肾衰竭处方规律
数据挖掘技术在内河航道维护管理中的应用研究
数据挖掘综述
软件工程领域中的异常数据挖掘算法
大数据技术之一“数据标识”
新疆电信大数据在移动增值业务推广中的应用研究
浅谈大数据时代的精准营销
场景:大数据挖掘的新标准
基于R的医学大数据挖掘系统研究
一本面向中高级读者的数据挖掘好书