大数据时代中小型零售企业客户细分实证研究

2020-03-25 11:39季芳

湖南工程学院学报（社会科学版） 2020年1期

季芳

(福建船政交通职业学院管理工程系，福建福州 350007)

大数据时代，来源于多平台的数据飞速增长和累积。这些数据形态各异、种类繁多，数量巨大，利用价值率低。企业能够获得产品销售数据和运营数据以及客户行为数据和购买数据等多维数据。[1]如何通过对数据进行分析、挖掘出庞大的客户群，建模细分客户，进行准确定位，达到精准营销是企业面对的难题。目前，“大数据”成为研究的热点和关注的焦点，在零售、金融、医疗、电信和制造等各个行业都在进行“大数据”的收集、分析和应用。张勇(天猫前CEO)讲到“未来任何一个企业的商务活动都离不开大数据”。[2]对于目前占市场主体超过90%的中小型零售企业，数据的价值在于经过采集、处理、分析以后成为有效的数据才能给企业带来商业价值。中小型零售企业大多缺乏科学的客户价值评估体系和客户细分方法，客户细分通常依靠业务人员的主观判断，正确性未免受到个人主观意识和情感因素的影响。有些中小型零售企业根本没有进行客户细分和客户价值的评估，同等对待每位客户，没有针对客户的不同特点和需求采用不同的营销策略，在进行营销活动时，只是随机的或者挑选部分客户发送微信、短信或者邮件，触达客户。[3]本文着眼于中小型零售企业，基于大数据对客户进行分类。将客户进行分类管理能帮助中小型零售企业优化资源配置，对中小型零售企业进行高效、精准营销意义重大。

一基于大数据客户细分文献综述

客户细分是指将属性特征相同的客户群划分为同一群组，它能有效识别客户需求，有助于企业最终实现精准营销。[4]国内外学者研究发现客户细分方法主要基于人口统计、购买行为、生活方式和利益等四类。[5]基于购买行为的客户细分方法目前采用的比较多，它以信息技术为支撑，以数据为基础。RFM模型是最典型的基于客户购买行为的细分方法。[6]它是由Hughes提出，由最近一次购买时间(Recency)、购买金额(Monetary)和购买次数(Frequency)三个维度组成，每个维度只有一个指标。[3]而客户的消费行为是非常复杂的，三个指标不能完全反映客户的购买和价值。整理相关的文献综述发现，国内外学者基于RFM模型进行客户细分时，通常细化RFM指标或者对RFM模型进行拓展和延伸。吕斌和张晋东利用RFM模型对商业银行客户细分时，把每个指标细化为三个级别，另外最近购买时间由交易间隔天数替代。[7]曾小青通过深入研究传统RFM模型，构建了3个维度10个细分指标的新RFM模型，并选取某大型纸巾生产企业进行实证研究，说明了多指标客户细分方法的科学性。[8]赵萌针对企业客户线上评论所带来的价值，改进了传统的RFM模型，提出RFMP模型。[9]徐翔斌在RFM模型的基础上，增加了商品总利润指标，提出了RFP模型，并选取某电子商务企业进行实证分析，结果显示比原始RFM模型对客户细分更加准确。[10]

不同的客户细分指标重要程度不同，所以要对指标赋予不同的权重。梳理国内外学者对于客户细分指标的权重的研究结果显示，指标权重的赋予有两类：以熵值法为代表的客观评价赋值法和以层次分析法为代表的主观评价赋值法。[11]马玉芳和王扶东、熊兰和高炳采用层次分析法确定指标权重。[12]赵萌[9]、蔡玖琳[11]采用熵值法确定各指标的权重。主观评价赋值法易受评价者的判断能力的影响，评价结果可能产生随意性；客观评价赋值法注重应用数学理论，不受评价者主观因素的影响。综合已有研究，很少涉及利用大数据指导中小型零售企业的经营活动。本文基于大数据背景下，着眼于中小型零售企业，构建客户分类指标体系，提出一种改进的RFM模型与K-Means相结合，并应用熵值法确定各指标权重，得出客户细分模型，为中小型零售企业决策提供参考。

二客户细分模型的构建

(一)客户分类指标体系的构建

传统的RFM模型每个维度只有一个指标，指标的划分标准过于宽泛。而客户的购买行为非常复杂，传统的RFM模型不能全面体现客户的购买行为，无法体现客户交易的变化趋势。因此本文结合中小型零售企业的特点，对传统的RFM模式进行改进，拓展维度并细化指标，构建多指标的客户分类指标体系(见表一)。用客户的本身指标值与全体客户对应的指标均值的比值来反映客户在这个属性上的相对位置。而客户已经购买商品种类数目也在某种程度上体现了客户的潜在价值，和购买多种相关产品的可能性。客户保持时间在一定程度上体现客户的忠诚度。

表一客户细分指标体系

细分指标说明：

R1：最近一次交易距离实验指定时间节点的时间间隔。

R2：R2的值越小，表明客户对企业越依赖，流失概率越小。

F1：客户在样本数据时间段内的交易频率。

F2：F2越小，说明客户的忠诚度越低，其能间接反应客户对企业的忠诚度和依赖性。

M1：客户平均交易金额，其能反映客户对企业的贡献，M1值越大，说明给企业贡献的利润越大。

M2：如果M2大于1，说明该客户对企业的贡献高于平均水平。M2越大客户对于企业的贡献越大。

T:体现顾客忠诚度的指标，T越大忠诚度越高，反之，忠诚度越小。

C:交叉销售量，C越大说明对该类客户交叉销售的可能性越大，更容易促进他们购买品类繁多的商品。

(二)客户细分指标赋权

由于每个细分指标对确定客户类别的影响程度不同，需要对客户细分指标赋权。熵值法是一种客观赋权法，是根据每项指标观测值所提供的信息的大小来确定指标权重，避免了人为因素的影响[4]。因此本文采用熵值法对各指标赋予权重。假设原始数据集存在m个客户，n个指标，Xij表示第i个客户的第j个指标的取值。分为以下五个步骤：

1.原始数据标准化处理，本文构建的客户分类指标体系存在正、负向指标，需对它们分别处理。[13]

值越大越好的正向指标：

值越小越好的负向指标：

2.计算第i个客户第j个指标的比重：

3.计算指标j的信息熵：

4.计算指标j的差异系数：

dj=1-ej

对于指标j，特征值差异越大，其所起的作用就越大，熵值ej就越小，由公式可知dj越大的指标越重要。

5. 计算每个指标的权重:

(三)客户细分聚类方法的选择

K-Means算法简单、快捷，被广泛应用于科学研究和企业处理大规模数据聚类分析中。K-Means算法是定量方法，具有“理论上可靠，应用上高效”等优点。任何算法都没有十全十美，K-Means算法的不足在于确定聚类数目K对初始类质心的依赖，解决此问题可以通过多次聚类进行优化，确定初始类质心和聚类数目。[3]另外，K-Means算法对数据比较敏感，均值受到孤立点数据和噪声数据的影响很大，解决此问题通常通过数据的选择、清理和整理以及对数据进行标准化处理。[14]鉴于K-Means算法的优缺点，本文采用K-Means算法对中小型零售企业客户进行聚类分析。

(四)客户细分流程

改进RFM模式和采用K-Means聚类分析方法，提出中小型零售企业客户细分方法(见图1)。

图1 基于大数据客户细分流程图

三实证分析

(一)数据的获取与预处理

为了验证以上所提出的客户细分方法的有效性，选取某中小型零售企业的会员客户的消费数据进行测试(由于本文所采用的数据涉及商业机密，所以不便指出该中小型零售企业的名称和列出大量的客户数据)。数据的特征维度有会员客户基本信息，如会员编号、年龄、职业、性别、住址、入会时间等；交易信息，如商品编号、商品名称、交易数量、交易时间、单价、交易金额，等等。本文选取该中小零售企业的所有会员的交易行为进行研究，交易数据共451 745条。首先对数据进行预处理，对存在噪声、缺失值和不一致的数据进行清理，最终保留了38 672条会员客户信息和421 631条交易信息。本文只考虑与客户分类指标相关的属性，因此最终确定会员的入会时间、消费时间、消费商品编号和消费金额等属性。

(二)指标值计算并赋权

经过数据准备阶段，对本文所构建的客户分类指标体系中各指标值计算并进行标准化，得到各项指标值特征描述(见表二)。其中前两项为负向指标，其余为正向指标。

表二指标值特征统计表

应用熵值法对各指标进行赋权，通过计算各指标的权重为(0.041 266 15，0.045 584 16，0.116 868 89，0.079 890 16，0.358 031 16，0.044 814 16，0.282 545 16，0.031 000 01)，通过计算得到加权后的新的数据集。

(三)K值的确定

1.K值的确定在使用K-Means聚类方法中非常重要，对聚类结果有很大的影响。聚类数目K不易过多，一般经验取值范围在2到8之间。因此本文按照上述权重调整后得到的数据集进行聚类，并采用多次聚类来确定K值。在聚类结果中，通过类内平均距离和泛化能力来观测聚类质量。[4]K-Means聚类要求类内平均距离尽可能小，而泛化能力尽量大。根据表三可知，随着聚类数目的增加，类内平均距离越来越小，但当K=4时开始减小的幅度越来越少。泛化能力也随着聚类数目的增加越来越大，但当K=5时泛化能力大幅增加，此后增长忽略不计。所以K取值为5时最合适。

表三改进RFM模型聚类数目结果

2.对相同的数据集采用传统的RFM模型进行聚类，聚类结果如表四所示。

表四传统的RFM模型聚类数目结果

与表三对比说明，改进的RFM模型的聚类结果，在泛化能力上及类内平均距离都优于传统的RFM模型。

(四)K-Means聚类实现及结果分析

聚类数目K=5,采用改进的RFM模型对新数据集进行聚类，经过K-Means算法得出聚类结果如表五所示。

表五 K-Means聚类结果

第一类，VIP顾客(C1)。VIP顾客的特点是其交易频率高于平均交易频率，平均消费金额远高平均水平，而且消费的产品种类繁多，保持时间也远高于顾客平均保持时间。这类顾客人数占总顾客的比例不到4%，却是企业的购买主力。因此，中小型零售企业应高度关注并与该类顾客保持良好的顾客关系，为该类顾客提供优质服务，提供良好的顾客体验，提高满意度。

第二类，忠诚顾客(C2)。忠诚顾客的特点是其平均消费金额略高于整体顾客平均交易金额，但不及VIP顾客，消费的产品种类与平均水平持平，但是其交易频率和保持时间均高于整体顾客水平。该类顾客消费金额不高，交易频率比较高，保持时间比较长，属于忠诚度比较高的一类顾客。这类顾客对企业非常信任，为企业带来了很大的收益，是企业必不可少的。因此，中小型零售企业应高度重视此类顾客，激励此类顾客并把他们逐步发展成为高忠诚度的VIP顾客。

第三类，一般顾客(C3) 。一般顾客的特点是其平均消费金额、交易频率、保持时间及消费产品的种类接近整体顾客的平均水平。一般顾客数量占整体顾客的比例非常高，达到30%左右，属于比较稳定的顾客，有潜力进一步发展的顾客。针对此类顾客,中小型零售企业可以加强促销攻势,刺激其购买欲望，以提高其消费金额。

第四类，易流失顾客(C4)。易流失顾客的平均消费金额远远低于顾客整体平均，交易频率和保持时间也低于整体顾客的水平，购买产品的种类比较少，该类顾客属于流动强，易流失的顾客，该类顾客占全部顾客的比例达到30%。易流失顾客给企业带来的经济效益比较少。针对此类顾客，中小型零售企业可以适当降低对他们的投入，或者选择部分产品适当采用低价策略去稳定此类顾客，以此带动其他产品的销售。

第五类，徘徊顾客(C5) 。徘徊顾客的平均消费金额接近顾客整体的平均消费金额，但交易频率远远低于整体顾客的平均水平，而且保持时间也低于顾客整体平均保持时间。针对此类顾客，中小型零售企业无需投入太多资源，维持现状即可。

五结语

在大数据时代背景下，中小型零售企业如果能从大数据中挖掘出有价值的信息，并加工处理，对客户进行精准营销，对提高客户的满意度和企业的效益意义重大。[4]传统的RFM模型不能全面体现客户的购买行为，指标划分标准过于宽泛，本文提出了一种改进的客户细分方法，对传统的RFM模式进行改进，拓展成5个维度并细化为8个指标，构建多指标的客户分类指标体系，通过熵值法为各指标赋权，并采用K-Means聚类将客户分成5类。针对5类客户采用不同的经营策略。对某中小型零售企业客户细分的实证研究说明，该客户细分方法在类内平均距离和泛化能力上都优于传统的RFM模型，说明方法可行、有效。