基于EM聚类和用户评分的产品营销与推荐策略研究

2017-01-07 06:38
重庆理工大学学报(社会科学) 2016年12期
关键词:物品聚类个性化

李 琴

(重庆理工大学 MBA教育中心,重庆 400054)

基于EM聚类和用户评分的产品营销与推荐策略研究

李 琴

(重庆理工大学 MBA教育中心,重庆 400054)

网络技术的发展,特别是最近几年来“互联网+”和大数据的发展,给企业产品营销带来了极大的机遇和挑战。相较于传统的通过简单粗暴的价格战来达到营销目的,一些企业通过对数据的充分利用和挖掘而在商战中获胜。利用数据融合技术从互联网大数据中挖掘用户的行为信息,通过分析消费者的个性化需求,利用EM聚类算法构建基于模型的协同过滤推荐算法,给消费者推荐可能喜欢的产品,开展个性化主动营销服务;制定相应的个性化产品营销策略,从而提高产品销售的数量及产品推荐的成功率。利用从亚马逊网上书城获取的数据进行实验,验证了综合EM聚类和用户评分方法具有较好的推荐效果。

产品营销;产品推荐;EM聚类;用户评分

伴随着互联网技术的发展,网络营销已成为产品销售的重要方式,也是企业商战的必争之地。网络的出现打破了传统企业产品对销售模式的限制,对传统产品的营销策略造成了极大冲击[1]。传统的企业产品营销方式建立在大量的人力物力资源耗费和中间环节上,网络营销则是利用互联网技术实现产品的交易,中间环节和渠道的减少极大地降低了企业成本,提高了交易效率,优化了企业间的资源配置。

2015年5 月7日,国务院发布《关于大力发展电子商务加快培育经济新动力的意见》,明确指出要大力发展电子商务,同时降低电子商务准入门槛,并争取在2020年基本建成统一开放、竞争有序、诚信守法、安全可靠的电子商务大市场。在电子商务环境下,企业通过网络营销可以为消费者提供更加富有个性化的产品,甚至是定制式产品。随着云计算和大数据技术的兴起,企业管理者甚至可以从大量的用户购买行为数据中挖掘数据的潜在价值[2]、了解客户的需求、从而把握市场规律并制定行之有效的营销策略[3-4]。本文构建的营销策略从信息服务的角度看,通过分析用户的习惯、偏好等行为,能够及时跟踪用户的需求变化,进而主动调整信息服务的内容与方式,并向用户定制推荐其感兴趣的信息和服务;从产品的角度看,可以更好地发掘物品的长尾[5]。

一、产品营销与推荐策略研究

传统的企业营销模式主要利用报纸、电视等媒体进行推销,并且把主要竞争注意力放在实体市场。但随着网络的飞速发展以及知识经济的到来,特别是电商平台及 “互联网+”的发展,网络营销模式已逐渐在现代产品推荐与营销中占据越来越重要的地位,甚至成为产品营销的主流。在网络营销模式中,企业和用户面临的最重要问题是:在这个网络信息超载的时代,企业如何让自己生产的产品在众多产品中脱颖而出是一件十分困难的事情,产品消费者如何从大量的产品中获取自己感兴趣的产品也不是一件容易的事情。解决上述问题的办法就是公司发展智能推荐系统,为客户提供个性化的产品推荐服务[6]。张光前等从消费者的购物记录中分析出其消费习惯,据此判定某一商品是否符合其消费需求,进而实现对新商品的推荐和营销[7]。张德鹏等对顾客的口碑和推荐意愿展开研究,并探讨顾客心理感知因素在口碑和推荐意愿产生过程中的影响作用[8]。冯娇等分析了用户间关系强度对用户购买意愿的影响,并从社会化媒体的信息流动角度对比分析了在用户间关系强度的协调作用下不同用户产生信息对接收信息的差异性影响以及对用户购买意愿的间接作用[9]。

(一)产品的个性化推荐服务

目前比较常见的产品营销推荐策略可以分为3种:基于内容的产品推荐、基于协同过滤的产品推荐、混合产品推荐[10]。基于内容的产品推荐是依据用户喜爱的物品内容信息找到相似物品进行推荐[11];协同过滤的产品推荐是基于用户的历史信息分析用户间的相似度,从而根据相似用户具有相似偏好的机理进行推荐[12];混合产品推荐较为常见的是基于内容的推荐和协同过滤推荐的混合[13]。

当前的产品推荐服务利用相似用户的兴趣偏好,或用户喜欢的相似物品作为推荐的依据[14],而在消费者的个性化需求方面,基本上还是粗犷式的,即产品推荐系统把所有用户当作一个(类)人。这种基于粗犷式的推荐结果,将带给潜在用户非常负面的用户体验,如在电商环境中,用长期不相关的占用大量篇幅的邮件占领用户的邮箱,将会引起用户的极大反感,而对他们的惩罚可能是既简单而又残酷的,鼠标轻轻一点便将他们的邮箱地址送到垃圾邮箱,从而再也无法给这个潜在的客户推送促销信息。因此,根据用户行为信息对推荐结果进行筛选、过滤和个性化分析十分必要。特别是在大数据时代,为获取极其丰富的用户行为信息成为可能,本文将对用户行为进行深度分析与挖掘,利用EM聚类算法(期望最大化算法,Expectation Maximization Algorithm)构建基于模型的协同过滤推荐系统,从而实现对产品推荐的个性化分析和过滤,提升产品营销的准确性。

(二)用户行为偏好获取

在大数据时代,很多企业都可以通过分析自己的数据,获取对企业和用户有价值的信息。大数据研究表明利用数据融合技术对不同数据源的用户数据进行分析,可以获得价值更大的信息。用户行为信息越丰富,越有利于对推荐结果进行个性化过滤。

用户行为信息是指用户在互联网上发生的所有行为,如搜索、浏览、打分、点评、加入购物筐、取出购物筐、加入期待列表、购买、使用减价券和退货等,甚至包括在第三方网站上的相关行为,如比价、看相关评测、参与讨论、社交媒体上的交流、与好友互动等。与实体店通常能收集到的购买、退货、折扣、返券等和最终交易相关的信息相比,在互联网上可以收集到大量用户在购买前的行为信息。

具体而言,利用多源数据融合进行用户行为分析可分为3种思路与方法:

一是数据层融合:通过对各模态的数据进行简单组合形成新的特征向量,然后进行后续的常规分类或识别等过程。

二是特征层融合:通过从单模态数据中提取有效互补的特征,利用时间尺度等规则将这些特征有机结合在一起,作为统一的多模态数据特征。

三是决策层融合:从不同模态的数据中分别提取特征,通过模式识别过程获得识别结果与权重,再通过融合策略获得最后的判别或识别结果。

二、产品个性化推荐与营销策略

(一)用户行为特征向量构建

用户行为信息是用户在互联网上发生的所有行为,其表现形式多种多样,如购买前的行为信息可以深度地反映出潜在客户的购买心理和购买意向。通过对这些行为信息的分析和理解,制定对用户的贴心服务及个性化推荐。如在电子商务中,这样的个性化推荐服务往往会起到非常好的效果,不仅可以提高用户购买的意愿,缩短购买的路径和时间,通常还可以在比较恰当的时机捕获用户的最佳购买冲动,也减少了传统的营销方式对用户的无端骚扰,还能提高用户体验。

本文利用用户行为数据挖掘用户的个性化需求,从而实现产品推荐与营销的个性化服务。将用户过去的点击行为、购买行为等以及对用户购买的物品价值、购买频率、最近的购买时间等属性进行量化,并产生用户的行为空间向量,从而利用EM聚类算法实现构建协同过滤推荐模型,实现相似用户的聚类分析;同时也对物品原价、折扣金额、能否退款、风格等等分别打分、统计、归类,对候选推荐物品在当前阶段受偏爱情况进行评分。通过对这两方面因素得到的推荐结果赋予不同的权重因子,并进行权重计算从而得到最终的推荐结果。综合计算用户行为和产品属性的推荐流程如图1所示。

图1 综合计算用户行为和产品属性的推荐流程

(二)基于EM聚类和用户评分的推荐策略

EM算法是一种基于模型的聚类方法,在概率(probabilistic)模型中寻找参数最大似然估计或者最大后验估计。假设数据实例分布符合高斯混合模型,算法的目的是确定各个高斯部件的参数,充分拟合给定数据并得到一个模糊聚类,即每个实例以不同概率属于每个高斯分布,概率数值将由以上各个参数计算得到。

在基于用户行为的聚类分析中,给定训练数据集{x1,…,xm},其中x的每一列是一个用户行为的特征向量,将隐含类别标签用ci表示。这里假定每一个高斯函数的先验分布ciMultinomial(φ)(其中φj=1,ci有k个值{1,…,k}可取)。并且在给定ci后,xi满足多值高斯分布,即xi|ci=jN(μj,∑j)。由此可得到联合概率分布p(xi,ci)=p(xi|ci)p(ci),从而对这些数据进行建模。

对于高斯混合模型每个实例xi,可以先从k个类别中按多项式分布抽取一个ci,然后根据ci所对应的k个多值高斯分布中生成一个实例xi,整个过程称作高斯混合模型。基于用户行为的EM聚类模型描述如表1所示。

表1 EM聚类算法描述

p(ci=j|xi;Φ,μ,∑)=

在公式中,p(xi|ci=j; μ,∑)的值是利用高斯密度函数计算得来,

P(xi|ci= j, μ,∑ )=

P(ci=j; Φ)=Φj

利用用户对物品原价、折扣金额、能否退款、风格等的打分、统计、归类信息,实现对客户的可能兴趣点进行“预测”,从而得到用户对候选物品j的评分。

ruj=∑i∈N(u)∩S(j,k)sim(j, i)rui

其中,N(u)是用户喜欢的物品的集合,S(j,k)是和物品j 最相似的k个物品的集合,sim(j, i)是物品j和i的相似度,rui是用户u对物品i的兴趣。

通过对用户特征向量进行构建,利用基于EM聚类的协同过滤模型中对物品聚类分析输出的聚类概率p(i)。通过对这两个因素得到的推荐结果赋予不同的权重因子,进行权重计算每一推荐物品的评分,从而得到最终的推荐结果。

三、实验结果与分析

(一)实验数据

本实验采用从亚马逊网上书店抓取的数据作为实验数据集,数据集中包含543个用户、2 682本购书记录、100 000 次评分( 1~5)。 每个用户至少对5个购书记录或感兴趣的书籍进行标记和进行评分,每本书至少被1位用户评分。数据集中提供训练集和测试集分别占80%和20%,使用训练集进行训练,预测未知书籍的评分,与测试集中用户对书籍的实际评分进行比较和实验。

(二)评价标准

(三)实验结果与分析

在本文中,物品的推荐依据是由基于用户行为的协同过滤和用户评分两部分构成,平衡因子α用以计算这两部分比重。设定α的取值范围为[0,1],每次增加0.1,比较其对MAE的影响如图2所示。

图2 平衡因子α对MAE的影响

从图2中可以看出,当α=0.2时,MAE最小,推荐效果最佳。这说明用户对书籍内容信息的影响较大,与实际情况也相符。现实生活中,用户对书籍内容具有偏好性,所购买或感兴趣的书籍种类也较相似,即使用户可能对该类别的某些书籍评分不高,但是选择书籍时还是存在倾向性。

基于EM聚类分析和用户评分的方法与基于用户行为的协同过滤方法、基于物品内容的相似度计算方法进行分析比较,根据图2中的结论,设定α=0.2,得到的实验结果如图3所示。

从图3中的实验数据来看,本文中提出的综合EM聚类分析和用户评分的方法较传统的协同过滤方法取得了较好的产品推荐效果(具有较小的MAE值)。同时,当用户的邻居数量增加时,模型的MAE值更小(即推荐效果更好),但图3中的折线也有一个趋势,当用于计算的相邻用户数量不断增大时,模型的MAE值渐趋近平稳,即当相邻用户的数量接近50时,再期望通过简单地增加相邻用户的数量来提高模型的性能收效甚微。

图3 综合EM聚类和用户评分方法比较实验

四、结束语

本文根据当前电子商务环境下企业经营的处境,探讨网络产品推荐与营销的新出路,特别是近几年来 “互联网+”和大数据技术的发展给企业产品营销带来了极大的机遇和挑战。相较于传统的通过简单粗暴的价格战来达到营销目的,利用数据融合技术从互联网大数据中挖掘用户的行为信息,更有利于分析消费者的个性化需求,向消费者推荐其可能喜欢的产品,开展个性化主动营销服务,同时更有利于制定相应的个性化产品营销策略,从而提高产品销售的数量及产品推荐的成功率。

[1] 江晓东,桂辉.比较型网上产品评论的说服效果研究[J].经济管理,2015(11):74-82.

[2] 冯芷艳,郭迅华,曾大军,等.大数据背景下商务管理研究若干前沿课题[J].管理科学学报,2013,16(1):1-9.

[3] 杨善林,周开乐.大数据中的管理问题:基于大数据的资源观[J].管理科学学报,2015,18(5):1-8.

[4] 张俊杰,杨利.基于大数据视角的营销组合理论变革与创新[J].商业经济研究,2015(6):54-55.

[5] 王馨.互联网金融助解 “长尾” 小微企业融资难问题研究[J].金融研究,2015(9):128-139.

[6] 王茜,钱力.大数据环境下电子商务个性化推荐服务发展动向探析[J].商业研究,2014(8):150-154.

[7] 张光前,白雪.基于消费性格的新商品推荐方法[J].管理科学,2015,28(2):60-68.

[8] 张德鹏,林萌菲,陈晓雁,等.顾客参与创新对口碑推荐意愿的影响研究:心理所有权的中介作用[J].管理评论,2013,27(12):131-140.

[9] 冯妖,姚忠 基于强弱关系理论的社会化商务购买意愿影响因素研究[J].管理评论,2015,27(12):99-109.

[10]扈中凯,郑小林,吴亚峰,陈德人.基于用户评论挖掘的产品推荐算法[J].浙江大学学报(工学版),2013,47(8):1475-1485.

[11]YAO L,SHENG Q Z,NGU A H H,et al.Unified collaborative and content-based web service recommendation[J].IEEE Transactions on Services Computing,2015,8(3):453-466.

[12]CAI Y,LEUNG H,LI Q,et al.Typicality-based collaborative filtering recommendation[J].Knowledge and Data Engineering,IEEE Transactions on,2014,26(3):766-779.

[13]LIAN D,GE Y,ZHANG F,et al.Content-aware collaborative filtering for location recommendation based on human mobility data[C]//Proceedings of the 2015 IEEE International Conference on Data Mining (ICDM).2015:261-270.

[14]李梁,张海宁,李宗博,等.融合用户属性的协同过滤推荐算法在政府采购中的应用[J].重庆理工大学学报(自然科学),2015,29(1):76-81.

(责任编辑邓成超)

The Research of Product Marketing and Recommendation Strategy Based on EM Clustering Algorithm and User Rating

LI Qin

(MBA Center,Chongqing University of Technology, Chongqing 400054, China)

The development of network and Internet technology, especially the development of the “Internet +” and big data has brought great opportunities and challenges to the enterprise product marketing in recent years. Compared to the traditional way of simple and crude price war to achieve marketing objectives, some enterprises win in the battle by leveraging on the data and mining. In this paper, we use data fusion technology to mine user behavior information from the Internet big data, and analyze the individual needs of consumers to recommend consumers their possibly favorite products. Then EM clustering algorithm is used to build model-based collaborative filtering recommendation algorithm. We take the initiative to carry out personalized marketing services, and develop appropriate personalized products marketing strategy to improve the quantity and recommendations of the success rate of the product sold. In this paper, we obtain experimental data from the Amazon online bookstore, and verify the proposed method that integrated EM clustering and user rating has better recommendation results.

product marketing; product recommendation; EM clustering; user rating

2016-03-10

李琴(1973—),女,重庆人,会计师,研究方向:财务管理。

李琴.基于EM聚类和用户评分的产品营销与推荐策略研究[J].重庆理工大学学报(社会科学),2016(12):59-63.

format:LI Qin.The Research of Product Marketing and Recommendation Strategy Based on EM Clustering Algorithm and User Rating[J].Journal of Chongqing University of Technology(Social Science),2016(12):59-63.

10.3969/j.issn.1674-8425(s).2016.12.009

F253

A

1674-8425(2016)12-0059-05

猜你喜欢
物品聚类个性化
称物品
“双十一”,你抢到了想要的物品吗?
坚持个性化的写作
基于K-means聚类的车-地无线通信场强研究
谁动了凡·高的物品
新闻的个性化写作
基于高斯混合聚类的阵列干涉SAR三维成像
上汽大通:C2B个性化定制未来
基于Spark平台的K-means聚类算法改进及并行化实现
基于改进的遗传算法的模糊聚类算法