改进RFM模型在房地产客户细分中的研究及应用

2018-11-01 03:04杜科邓佳雯陈继红
电脑知识与技术 2018年19期

杜科 邓佳雯 陈继红

摘要:随着房地产销售市场的火爆,房地产销售企业如雨后春笋般涌现,房地产企业之间的竞争也不断加剧。本文结合客户特定的购房行为特点,在传统的RFM模型的基础上,通过属性分析构建了含购房总面积在内的RFMA模型,并使用K-means聚类算法对客户群体细分,最终形成可抛弃客户、低价值客户、中段客户、高价值客户和会员客户五类客户群体,并详细剖析不同客户群的特征和价值。

关键词:RFM改进;房地产销售;K-means聚类算法;客户细分

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2018)19-0243-03

Abstract: With the booming real estate sales market, real estate sales companies are springing up and the competition between real estate companies is also on the rise. In this paper, based on the characteristics of customer-specific purchase behaviors, on the basis of the traditional RFM model, an RFMA model including the total area of purchase is constructed through attributive analysis,and uses K-means clustering algorithm. The segmentation of customer groups eventually formed five groups of customers: disposable customers, low-value customers, backbone customers, high-value customers, and member customers, and the characteristics and values of the customer group were analyzed in detail.

Key words: RFM Improvement; Real Estate Enterprise; K-means clustering algorithm; Customer Segmentation

美国学者温德尔·史密斯(Wendell R·Smith)首先提出客户细分,客户细分就是指企业根据市场需求按照客户属性将客户群体分为若干个子客户群体,并实现细分后不痛客户群体之间的差异最大化,每个客户群体尽可能得相似[1]。随着房地产销售市场竞争日益激烈,各个房地产销售企业都汇集了大量的客户信息和业务数据,这些数据背后隐藏着客户的行为偏好和消费潜力。应用数据挖掘中的聚类算法可以有效地实现房地产销售客户的细分,从而发现不同客户群的行为偏好和未来的购买偏好。

本文针对房地产销售客户数据的特征和客户分析目标,提出了基于属性分析和改进RFM模型的客户细分模型,并使用南通市商品房备案系统中的真实数据对提出的模型进行了客户细分。

1 细分变量提取

细分变量选择是建立客户细分模型首先需要解决的问题。考虑到房地产销售客户数据一般包含许多属性,并且不同的属性之间存在一定的相关性,本文将客户细分变量的提取分成两个主要阶段:数据预处理阶段和属性分析阶段。

1.1 數据预处理

可以通过删除法来进行数据清洗,比如在房地产销售数据中可以将存在NULL值、零值、身份证号错误的客户进行删除,避免这些数值对以后的聚类分析产生影响,也避免这些数值对最终的客户细分结果产生影响,但是删除法可能删除有价值的数据,让一些隐含的原始信息被掩盖。那么可以通过插补法来进行数据清洗,删除法仅仅是把存在缺失的属性值进行删除,但是不能因为一个属性值的缺失而放弃大量的数值,所以可以通过均值插补、回归插补和极大似然估计进行数据清洗。需要注意到的是,数据的缺失并不意味着数据是错误的,比如在房地产销售数据中,有些客户购买了一套商品房,但是购买了两套车库,在数据库中则会产生两条合同记录,但是第二条合同记录上的购房面积与购房金额都为零,这个合同中的主要信息购房金额与面积是缺失的,但是并不表示这部分数值是有错误的,而是在产生合同的时候就会产生两个合同号。对于噪声的过滤可以通过回归法、均值平滑法、离群点分析以及小波去噪法对数据中存在的随机数据误差进行过滤。

1.2 属性分析

通过属性分析可以把相关性较小的属性提取出来。

1) 客户性别分布

由图1可以看出男性客户的购房意向比女性客户高,也可以看出在南通男性购房人数要比女性多,但女性的购房数也并不低。

2) 客户年龄分布

由图2可知,南通市购房客户的年龄集中在30-59岁之间,说明南通市的主要购房者为中年群体。

3) 客户购房用途分布

由图3可知,大部分客户购买的是住宅用房,少部分客户购买的是商业与办公用房,说明南通市的客户更加偏向于购买住宅用房,对于商业用房、办公用房以及其他用房的购买率都比较低。

4) 客户购房性质分布

由图4可知,将近一半的客户购买的是商品房,另外一半的客户购买的是低价位商品房,说明南通市的客户偏向于购买商品房和低价位商品房,对于解困房以及保障性(限价)房的购房率很低,可能是因为数量较少,也有可能是因为对这方面的了解较少。

5) 客户购房地区分布

由图5可知,客户购房地区没有一定的偏好,说明南通市客户购房可能比较分散,并没有集中在某一个地区购房。

2 房地产客户RFM模型改进

传统的RFM模型中的R值是指上次购买距今的时间,但是这类客户中会包含着没有转化过来的客户与首次转化的客户;F值是指购买的频率,也能用来代表客户的忠诚度或活跃度,但是F值没有办法衡量客户使用该商品的时间长短,使用时间的长短也可以用来衡量一个客户的忠诚度;M值是指客户的购买总金额,但也不能完全代表客户的现在价值,客户在以前购买的最大金额以及客户在企业历史低迷期所购买的金额也是对客户价值的体现。而且对于企业来说,基于传统的RFM客户分类营销效果不如基于客户画像的营销响应模式{2},因此特征的选取才是客户细分的最主要要求,而传统的RFM模型仅仅只包含了三个维度的变量,在不同的领域中这三个维度往往是不够的,所以在不同领域中使用时,需要根据各个领域的特征属性值来对传统的RFM模型进行改进。由于房地产企业的商品房能够重复购买并且有一定的间歇,所以房地产企业可以使用传统的RFM模型来进行客户细分,但是在客户细分的同时需要结合自身的属性特征来进行适当的改进。原因如下:本文的数据是关于南通市商品房备案系统的客户行为数据,客户在购买房地产时产生的购房面积、购房金额和购房时间,购房金额高的客户不一定是优质客户,有可能这部分客户购房频率很低,给企业带来的价值不大,购房金额低的客户不一定是劣质客户,很可能这部分客户购买的是低价位商品房,但是这部分客户购买的总面积很大,购房频率也比较高。那么可以看出客户的购房总面积属性对于客户价值是存在一定影响的,因此,本文将客户的购房面积属性考虑到传统的RFM模型当中。

3 实证研究

本文实证数据来源于南通市商品房备案系统中房地产销售备案数据,总共有260742条记录,选择每条记录的4个属性值,四个变量分别为R(上次购房距今的月数)、F(时间段内购房的次数)、M(时间段内购房的总金额)和A(时间段内购房的总面积)。

3.1 细分结果

本文使用python实现K-means聚类算法,设定聚类数为5类。最后获得的客户聚情况如表1所示。

经过K-means聚类算法之后,最终将总体样本分成5类客户群,R、F、M、A四个变量在这5类客户群中也存在不同的差异。本文从R、F、M、A四个变量的均值、中位数、标准差、变异系数四个方面来观察这四个变量在不同群体中的差异性。具体描述如表2所示:

⑴ 变量R(上一次购房距今月数):第3类与第5类客户上次购房距今的月数平均为52个月,可以看出第3类的客户与第5类的客户平均有52个月左右没有购房,相比于其他客户群,这部分客户的R值是偏小的,但是这部分客户的R值的离散性比较高,说明这部分客户中大部分客户都是比较活跃的,但是也存在一些将要流失的客户。第1类与第2类客户的上次购房距今的月数平均比第3类与第5类客户大,可以看出这两类客户平均5年左右没有再购过商品房,说明第1类与第2类客户大部分都是将要流失的客户,同时也存在一些已经流失的客户。第4类客户的上次购房距今的平均月数最大,有111个月,可以看出第4类客户已经很长一段时间没有购买商品房,也没有购房的意向,说明这部分客户已经是流失客户。

⑵ 变量F(这段时间内的购房次数):第2类与第4类客户在这段时间内的平均购房次数为1次左右,可以看出这两类客户的购房次数很少,说明这两类客户在这段时间都对企业的忠诚度很低,几乎与企业没有什么联系。第1类客户在这段时间内的平均购房次数为5次左右,可以看出这类客户对于企业的有一定的忠诚度,但购房意向较一般。第3类客户这段时间内的平均购房次数最高,可以看出这类客户这段时间内在企业内购房的次数很多,说明这类客户对企业的忠诚度非常高,对企业有一定的依赖性。

⑶ 变量M(这段时间内的购房总金额):第4类客户在这段时间内的平均购房总金额为60万左右,可以看出这部分客户的平均购房总金额是最小的,说明这部分客户总体对于企业是没有什么价值的。第2类客户在这段时间内的平均购房总金额为78万左右,可以看出这类客户的购房总金额比较小,说明这类客户的价值比较小。第1类客户在这段时间内的平均购房总金额为820万左右,可以看出这类客户的购房金额较高,说明这类客户的价值较大。第5类客户在这段时间内的购房总金额较第1类客户有所上涨,在这段时间内的平均购房总金额达到了1亿左右,可以看出这部分客户在企业内的消费是偏高的,说明总体对企业有很高的价值。第3类客户在这段时间内的购房总金额最高达到了4亿左右(第3类客户主要购买的是商业与办公用房,所以购买总金额会很高),可以看出这部分客户有一定的经济能力,对于企业来说这部分客户有非常高的价值。

⑷ 变量A(这段时间内的购房总面积):第2类和第4类客户在这段时间内的平均购房面积为130平米左右,可以看出这两类的平均购房总面积是最小的,说明这两类客户购买的商品房面积都偏小。第1类客户在这段时间内的平均购房面积相对于第2类与第4类客户较高,平均购房总面积为745平米,可以看出这类客户购房次數多或是经常购买大面积商品房的客户。第3类与第5类客户在这段时间内的平均购房面积最大,这段时间内平均购房面积为10万平米,说明这两类客户经常购房商品房或者经常购买面积较大的商品房。

4 结论

根据以上的分析,可以看出这5类细分群体在各个属性变量上都具有特点:第1类客户上一次购房距今的平均月数较大,平均购房次数偏中等,平均购买总金额较大,平均购买总面积较大。第2类客户上一次购房距今的平均月数较小,购买次数较小,购房总金额小,购房总面积适中。第3类客户上一次购房距今的平均月数较小,购买次数很大,购房总金额很大,购房总面积很大。第4类客户上一次购房距今的平均月数较大,购房次数较小,购房总金额小,购房总面积适中偏大。第5类客户上一次购房距今的平均月数较大,购房次数大,购房总金额大,购房总面积大。

参考文献:

[1] 赵萌,齐佳音. 基于购买行为RFM及评论行为RFMP模型的客户终身价值研究[J]. 统计与信息论坛,2014(09):91-98.

[2] 刘浩. 客户关系管理中的动态客户细分方法研究[J]. 企业改革与管理,2015(22).

[3] 潘晓靖. 大数据时代下房地产行业的客户生命周期管理[J]. 财经界(学术版), 2015(3):125-125.

[4] 郑茜茜. 基于数据挖掘的客户细分研究[D]. 重庆:重庆交通大学,2013:8-10.

[5] 刘英姿,何伟. 基于不同视角的客户细分方法研究综述[J]. 商场现代化,2007(1):271.

[6] 夏维力,王青松. 基于客户价值的客户细分及保持策略研究[D]. 陕西:西北工业大学,2006.

[7] Haley R. L.Benefit. Segmentation:A Decision-Oriented Research Tool[J]. Journal of Marketing,1968(32): 30-35.

[8] Hughes AM. Strategic Database Marketing[M]. Chicago:Probus Publishing Conmpany,1994.

[9] 李斐. 基于客户价值的客户关系管理策略[J]. 管理观察,2015,571(8):56-57.

[10] 孙长虹. 基于客户价值的客户忠诚管理对策[J]. 卷宗,2014(9):173-173.

[11] 刘朝华,梅强,蔡淑琴. 基于RFM的客户分类及价值评价模型[J]. 技术经济与管理研究,2012(5): 33-36.

[12] 叶志龙,黄章树, YEZhi-long,等.基于新三维客户细分模型的线上会员客户价值研究[J]. 统计与信息论坛,2016,31(5):96-101.

[13] 邓程,杨壮英,古军杰,等. 改进的K-means算法及其在铁路客户细分中的应用[J]. 铁路计算机应用,2014(6).