基于RFM及线性回归的商场会员活跃度研究

2020-08-25 02:47高汝林郑春华吕海侠
广西质量监督导报 2020年7期
关键词:时间段活跃商场

田 恬 高汝林 郑春华 刘 楠 吕海侠

(陕西工业职业技术学院 陕西 咸阳 712000)

引言

在零售行业中,会员是销售额和利润的主要贡献者。但电商产业的迅猛发展使传统零售业受到冲击,商场许多会员失活,造成巨大损失;并且发展新会员的资金投入又太高。因此,如何激活会员,让更多的非活跃会员变为活跃会员,就成为商场决策者关注的主要问题,也是零售运营商制定策略的主要参考依据。

基于此,本文以2018年全国大学生数学建模竞赛专科组C题[1]的附件数据为基础,对会员消费行为进行分析。构建了基于RFM[2]的会员消费状态分类模型,将会员分为活跃会员和非活跃会员;建立了激活率与促销系数的回归模型,揭示了非活跃会员激活率与商场促销活动呈线性关系,为传统零售运营商决策者激活失活会员提供重要依据。

一、基于RFM的会员消费状态分类模型

会员的状态和激活非活跃会员是本文需要解决的问题。在此之前,必须选择合适的时间窗口。考虑到在时间窗口内购买行为必须具备延续性和稳定性,对原始数据经过预处理后[3],得到2015年1月—2018年1月商场每月的会员购物次数,如下图1。

图1 商场每月会员购物次数

由图1可知,2015年8月—2016年1月会员几乎没有在商场购物,因此2015年1月—2016年1月这段时间不适合选为时间窗口;又考虑到商场一般以年(或12个月)为单位处理会员状态或积分,因此本文选取2017年1月—2017年12月为时间窗口。

结合相关文献[4-5]以及实际生活经历可知,会员活跃度是可以通过会员购物行为体现的。长时间不购物,活跃度就会下降;而频繁的购物,活跃度就显著提升。因此,认为会员在时间窗口消费时间越连续、消费频次越高,会员状态越活跃。本文选取RFM模型中的‘R’最近一次消费时间和‘F’消费频率作为对会员状态进行划分的依据。通过最后一次消费时间(R)描述会员消费时间的连续性;消费频率(F)描述会员购物总频次。构造如下RF会员消费状态分类模型。

X(i)=Rt(i)*Ft(i)

(1-a)

Rt(i)=f(Ri),Ft(i)=φ(Fi)

(1-b)

这里的Rt(i)和Ft(i)分别代表会员i以R、F为分类依据的相应变量评分。Rt(i)在1~2之间变化,Ft(i)在1~3之间变化,两个指标相乘得到消费状态X(i)的变化区间为1~6,评分越高,说明会员越活跃。本文定义X(i)在1~3之间会员状态为非活跃,在4~6之间为活跃。

其中Rt(i)和Ft(i)的评分标准如下:

①Rt(i)的构建

若会员的R处于时间窗口的首月(即1月),则Rt(i)=2,否则Rt(i)=1;若R处于时间窗口的次月至末月(即2-12月),会员上个月也发生购买,则Rt(i)=2,否则Rt(i)=1。即会员最后购物时间越连续,Rt(i)越大,会员越活跃。

②Ft(i)的构建

(2-a)

(2-b)

其中Fi(j)表示会员i在第j个月是否发生消费,若消费,则为1,否则为0。Fi表示时间窗口内消费月频次(Fi可随具体的时间窗口变化,如时间窗口是一个月的话,Fi表示消费周频次),特别的,若Fi=0,即整年没有一次消费,则为僵尸会员,则将该会员当作非会员处理。当会员消费时间越持续,Ft(i)就会越大,则会员越活跃。

本文对选取的商场会员消费数据进行处理,利用消费状态分类模型得到2017年不同状态的会员数据如表1所示。

表1 2017年不同状态的会员数及对应比例

由表1可知,非活跃会员和活跃会员对应占比分别为95%和5%,说明会员群体中绝大多数处于不活跃状态,活跃会员较少。由此可见,开展针对性的营销策略,引导非活跃会员消费,转为活跃会员,刻不容缓。本文针对一点,继续探索。

二、激活率与促销系数回归模型

(一)激活率——状态转移概率矩阵模型

本节欲研究非活跃会员激活率,并试图探究其与商场活动的内在机理。故先对商场会员状态变化概率进行研究。

在上节的基础上,建立消费人员状态转移概率矩阵[6],表示会员状态的动态变化。现有商场消费人员状态可分为三大类:活跃会员、非活跃会员和非会员。其中非活跃会员转变为活跃会员的概率,就是非活跃会员的激活率。

统计出时间段ti内的非会员、活跃会员和非活跃会员的总量Pi、Ii和Ni,同理可以得到时间段ti+1内的Pi+1、Ii+1和Ni+1。建立如下的状态转移概率矩阵模型:

Si+1=Ti,i+1Si

(3-a)

(3-b)

(3-c)

其中,Si,i+1表示三种状态相互转化的状态转移概率矩阵;NIi表示由时间段ti变为ti+1时,非活跃会员转为活跃会员的概率,即非活跃会员激活率(Si,i+1中的其他8个元素意义类似,表示由前一状态转变为后一状态的概率值)。

针对上述状态转移概率矩阵模型,继续选取2017年消费数据(以每月为一时间窗口),共计12个时间段,计算出11组激活率,结果如下表2所示。

表2 2017年1月至2017年12月每月会员激活率

由表2可知,会员在1月的激活率最高,为0.32,这说明有近3成的非活跃会员在2月份转变成活跃会员,这与春节正好处于2月份吻合;7-8月的激活率都保持较高水平,这与暑假时间相吻合;9月的激活率最低,仅为0.049,这可能是因为现在“旅游热”,会员10月转为活跃的可能性就会减少。除了这些外在因素,思考非会员激活背后的原因,本文认为,这与商场是否促销,促销程度大小有一定的关系。

(二)基于激活率与促销系数的线性回归模型

本文将商场促销力度简化为会员消费金额与对应商品总标价的比值,即在同一时间段ti内,αi表示商场的促销系数,公式如下,

(4)

其中,Costi表示时间段ti内会员总消费金额;Pricei表示时间段ti内会员消费商品总标价。αi=1表示商场无促销,αi<1表示商场有促销活动。且促销程度越大,αi越小。

经计算可以得到2017年1月到2017年12月的激活率与促销系数,并画出散点图,结果如图2所示。

图2 激活率与促销系数散点图

观察散点图,可以看出激活率与促销系数基本呈线性关系,因此,可以建立如下的激活率与促销系数的线性回归模型[7],

NIi=b0+b1αi+ε

(5)

利用上述模型对激活率与促销活动进行线性回归拟合,剔除异常数据后的拟合曲线如下图3。

图3 拟合曲线

拟合曲线为:

NIi=1.0555-1.0151αi,R2=0.88

(6)

图3表明,拟合效果良好。并且可以看出,随着促销活动力度的加大(αi减小),非活跃会员的激活率也在逐渐增加。因此,商场管理可以利用打折等促销活动来激活非活跃会员,为商场带来更多利润。

三、小结

本文从某大型百货商场的消费数据出发,构建了基于RFM的会员消费状态分类模型,对商场会员评分,最终将商场会员分为2类:非活跃会员和活跃会员,发现非活跃会员比例高达95%,与现实情况相符;通过观察激活率与促销系数的散点图,发现激活率与促销系数呈线性关系,最终建立了激活率与促销系数的线性回归模型。为决策者激活失活会员提供重要依据。

猜你喜欢
时间段活跃商场
夏天晒太阳防病要注意时间段
脏物是如何被带出商场的
活跃在抗洪救灾一线的巾帼身影
这些活跃在INS的时髦萌娃,你Follow了吗?
发朋友圈没人看是一种怎样的体验
香港ifc商场 本季好FUN乐
香港ifc商场
不同时间段颅骨修补对脑血流动力学变化的影响
不同时间段服用左旋氨氯地平治疗老年非杓型高血压患者31例
数据分析