基于情感分析的用户痛点量化研究

2020-04-07 11:41王召义薛晨杰刘玉林
宿州学院学报 2020年1期
关键词:词典痛点小米

王召义,薛晨杰,刘玉林

安徽商贸职业技术学院经济贸易系,安徽芜湖,241002

痛点营销是互联网界非常热的一个营销术语。互联网企业和借助互联网的传统企业都期盼找准痛点,采取相应的策略,给企业带来巨大的市场回报或者高度的品牌黏度。所谓找痛点就是在发现消费者需求的基础上,满足需求,以获得青睐。要了解消费者的需求,就要先了解消费者,因为购物的主体是他们。找用户痛点是一个长期观察、分析、挖掘的过程,不可能一蹴而就。基于此,为了帮助企业准确、便捷的发现痛点、应用痛点,本文尝试从用户评论中挖掘有关因素,并借助情感分析方法,提出用户痛点量化模型。

1 用户痛点

在营销学中,用户痛点是指用户在体验产品或服务过程中原本的期望没有得到满足而造成的心理落差或不满,这种不满最终在用户心智模式中形成负面情绪爆发,让用户感觉到痛[1]。这是目前被众多学者所接受的概念描述之一,但不断有研究者在此基础上对用户痛点的概念进行补充和拓展。卢蒙从用户体验角度出发,把用户在体验过程中遇到的问题称为痛点,即消费者在使用产品或享受服务过程中因期望没有得到满足而造成的心理落差或不满[2]。张亮以供需矛盾为切入点,强调用户痛点就是用户多样化的需求,呼唤个性化、精确化的服务,传统纸媒,难以满足这样的要求[3]。高星妍等认为痛点指的是用户使用后就无法跳脱的、极具黏性的点,比如微信的朋友圈,相对而言,痛点可能更偏重功能性需求一些[4]。

借鉴美国的行为科学家弗雷德里克·赫茨伯格(Fredrick Herzberg)提出来的双因素激励理论[5],把用户痛点归纳两个方面:保健痛点和激励痛点。保健痛点(Hygiene Customer Pain Points,HP)是指用户的期望没有得到满足而造成的不满或心理落差的痛点,表现为令用户感到失望、抱怨,从而出现给予差评、投诉等行为,此刻,用户的情绪是消极的、负面的,是随着失望、抱怨程度增加而反向加强的。激励痛点(Motivation Customer Pain Points,MP)是指已经被产品或服务化解或弱化的痛点又或者是为了获得满足感而承受的痛点,表现为令用户感到惊奇、愉快和满足,从而出现网络晒单、好评、炫耀等行为,此刻,用户情绪是积极的、正面的,是随着满足程度增加而正向加强的。

情绪是用户把痛点充分表达出来的最简单有效的手段。用户表达情绪的方式有语言、行为、文字等。但在电子商务活动中,用户大多是通过文字表达情绪的,例如淘宝的累计评价模块、京东商城的商品评价模块等。评价内容往往包含了用户满意点和不满意点,例如“衣服收到了,试穿了尺码很合适,衣服面料手感也好,穿着舒适,下水后不缩水就掉点浮色,长度在长点就更好了”,其中尺码、面料和不缩水是用户满意点,令用户感到舒心、消费体验佳,即激励痛点;掉色和长度就是不满意点,没有满足用户的期望,即保健痛点。这就给本文提供了解决问题的思路:通过分析用户商品评论,判断用户情感倾向并量化痛点,情感强度越强烈,痛点值就越大,痛点值越大,越可能是商品关键点。

2 研究模型

由前文分析得知,解决问题的思路是以情感分析为基础,所以构建用户痛点量化模型,应从用户情感倾向判断入手,再结合情感词典计算情感值。研究过程的关键处理环节有:数据采集、数据处理、指标提取、情感分析和量化分析等。

2.1 数据采集

使用数据采集软件或Python爬虫程序,选择电子商务平台的商品评论模块,抓取目标商品的商品评论。采集的评论数据至少包括:商品名称、评价内容等。

2.2 数据处理

对采集到的数据进行清洗,删除无效语句。采用Python的结巴分词,对评价内容进行分词、词性标注、词频统计等预处理,为后续研究提供基础。

2.3 指标提取

用户对某项特征指标的关注表现为其在评论中对该产品某些功能或特征的提及或评价,某项特征指标在评论中出现的次数越多,其成为用户关注点可能性越大[6]。考虑到有一些常见的关键词频繁出现,但却无任何意义,拟采用TF-IDF自动提取关键词。然后,人工筛选这些关键词,并结合词性归纳出若干个指标。每个指标都包含多个关键词。

2.4 情感分析

本文借鉴刘玉林、王召义等设计的一种新的情感分析方法[7],具体步骤如下:

步骤1:构建情感词典,情感词典包括正面情感词语集合、负面情感词语集合、否定词集合和程度词集合。情感词典主要由基础情感词典和拓展情感词典构成。基础情感词典包括知网(Hownet)情感词典和台湾大学简体中文情感极性词典(NTSUSD)。把知网(Hownet)里面的正面评价词语、正面情感词语和ntusd的positive词典消重之后组合在一起,成为基础积极情感词典。把知网的负面评价词语、负面情感词语和ntusd的negative词典消重之后组合在一起,成为基础消极情感词典。而拓展情感词典其实就是把基础情感词典通过同义词词典(哈工大同义词词林拓展版)找到情感词的同义词,这样就拓展了基础情感词典。最后把两个词典与常见的否定词集、程度词集结合起来,形成了完整的情感词典。

步骤2:对评论文本进行预处理,对文本分段分句得到句子,通过标点符号将句子划分为句子单元,然后对句子单元中的文字进行分词,形成词组。

步骤3:对步骤2中得到的词组进行n-gram处理,利用n-gram中的2元语法对句子单元中的词组组合形成2元词组,结合情感词典计算句子单元的情感基本值p。

步骤3.1:2元语法对句子单元中的词组进行组合,形成2元词组,处以前面位置的称为前位词,处以后面位置的称为后位词。

步骤3.2:后位词结合情感词典中正面情感词语集合和负面情感词语集合进行情感值p的计算判断;前位词结合否定词集合判断情感值p是否*(-1),前位词结合程度词集合判断情感值p是否*(-1);结果对于每个2元词组均获得一个情感值pi。

步骤3.3:将整个句子单元中2元词组的情感值pi相加汇总后得到句子单元的基本值p。

步骤4:评论文本被切分为句子,句子又被切分为句子单元,故每个商品评论根据每个句子单元的情感基本值p,生成一个情感值p列表即p-list。

步骤5:根据p-list,找出对应关键词所在单元句的情感值。

2.5 量化分析

(1)构建指标词集合

对用户评论进行指标提取操作,构建指标词集合K。

kij表示第i个指标的第j个关键词。

(2)构建TF-IDF集合

针对每一个指标词,计算其TF-IDF值,即该词在全文中的权重,得到TF-IDF集合W。

wij表示第i个指标的第j个关键词的TF-IDF值。

(3)计算情感值

计算每一个指标词所在单元句的情感值。情感值有三种情况:正数、负数和0,负数表示消极,0表示中性,正数表示积极。

设每个指标词,会出现在h个单元句内,就有h个情感值。则指标词K所在单元句的情感值集合S,sh表示指标词K在第h个单元句的情感值。

S集合有这样两个子集:正数集合Splus、负数集合Sminus。

其中a+b≤h。

分别取Splus和Sminus的算术平均值作为指标词最终情感值,计算公式如下:

(4)量化痛点

根据前文所述,指标词的痛点(P)包括两个方面:已满足痛点(SP)和未满足痛点(UP)。

公式中出现的负号,是为了保证痛点值为正数。

照此计算每一个指标词的痛点值,得到痛点集合C。

cij表示第i个指标的第j个关键词的痛点值。

第i个指标的痛点值为:

根据公式易知:用户情感反应越强烈,用户痛点越高;痛点越高,该指标越有可能成为商品的关键点。

3 实证研究

3.1 数据来源

京东是中国电子商务领域深受消费者欢迎和具有影响力的电子商务网站之一,选择京东的手机类商品的商品评价为实证研究的数据来源。同时,考虑到手机品牌影响力、手机发行时间、手机销量以及商品评论数量等因素,选取华为手机(京东商品名称:华为HUAWEIP10 Plus6 GB+64 GB草木绿移动联通电信4 G手机双卡双待)、小米手机(京东商品名称:小米8全面屏游戏智能手机6 GB+128 GB黑色全网通4 G双卡双待)、OPPO手机(京东商品名称:OPPO A57 3 GB+32 GB内存版 玫瑰金色 全网通4 G手机 双卡双待)作为研究对象,采集商品评论数据。数据采集时间为2018年6月27日,采集华为、小米、OPPO手机评论数分别为:1 120、1 000、1 499条,内容包括会员名称、会员级别、评价星级、评价内容、评价时间等11项。

3.2 数据处理

原始商品评论数据中存在着不完整、有异常的数据,严重影响到数据挖掘建模的执行效率,可能会导致挖掘结果的偏差。因此,借助python的“结巴”中文分词包对商品评论内容进行过滤、分词、词性标注和词频统计,并计算每一个关键词的TF-IDF值。再从名词、感叹词、形容词中筛选出具有情感倾向的词语,构建华为、小米、OPPO手机产品情感词集合。情感词典包括正面情感词语集合、负面情感词语集合、否定词集合和程度词集合[8]。

3.3 指标提取

分别选择TF-IDF值排名前1 000的关键词,在数据处理的基础上,分别筛选出名词和动词。人工对这些名词和动词进行筛选,排除非描述手机功能或特征的词语,得到一个描述手机功能或特征的关键词集合。人工再对这些关键词进行识别归类,最后得到5个指标类别:价格、性能、电池、外观、拍照。具体归类情况见表1、表2、表3。

表1 华为手机特征指标分类表

表2 小米手机特征指标分类表

表3 OPPO手机特征指标分类表

3.4 痛点量化

采用2.4情感分析方法,计算商品评论单元句的情感值。按照2.5中的量化公式,计算3款手机5个指标类的痛点量化值,详见表4。

表4 3款手机的痛点值

3.5 结果分析

从表4分析每款手机各指标类之间的联系与区别,再横向比较各款手机之间的联系与区别。

(1)华为手机(P10 Plus)。价格指标类痛点值最大(0.055 7),其它四类痛点值均比较小,说明价格是华为手机的关键点。再看价格指标类的HP(0.157 3)和 MP(0.232 9)值,激励痛点值较大,表明大部分价格痛点被弱化或化解,痛点已转化为惊奇、愉悦等积极态度。但是,保健痛点依然大量存在,会强化消费者的消极态度,出现差评、投诉等行为,痛点会更痛。

(2)小米手机(小米8)。价格指标类痛点值最大(0.117 9),远大于其它四类值,且 HP值为0.311 1,MP值为0.160 3。表明虽然价格是其销售关键点,但因保健痛点值占主要方面,故大部分价格痛点没有被弱化或化解,即用户认为价格太高,不符合消费需求。另外,华为手机与小米手机虽然都把价格作为销售关键点,但两者有本质上的区别,华为价格被认可,而小米手机价格认可度不高。

(3)OPPO手机(OPPO A57)。拍照指标类痛点值最大(0.079 0),且保健痛点值(0.267 1)和激励痛点值(0.286 1)基本相当,说明OPPO手机吸引用户的关键点是拍照,但做的还不够好,还有很大的发展空间。

(4)横向比较。通过图1的雷达图,可以直观的看到:价格指标类和性能指标类中,小米手机最“痛”,且“远”大于其它手机,这与小米的产品概念“为发烧而生”相吻合的;在电池指标类中,三种手机“痛”的程度差不多,再一次证明了“手机技术发展的再快,电池始终是软肋”;外观指标类中,小米手机和OPPO手机最“痛”,这两款手机的外观设计更符合年轻人的“高颜值”需求;在拍照指标类中,OPPO手机最“痛”,OPPO手机更适合喜欢拍照的消费者。

图1 痛点雷达图

3.6 有效性验证

为了验证痛点量化值的大小能否体现商品的关键点,以当前最受欢迎的拍照指标类为例进行有效性验证。表5是摘抄3款手机拍照指标类的宣传广告语以及品牌理念。

从以上宣传资料就可以发现OPPO把拍照功能作为一个核心卖点来宣传的,且秉承“为自拍和颜值而生”的理念,专注于手机拍照领域的技术创新,开创了手机自拍美颜时代,而年轻人最喜欢的手机就是拍照手机,恰恰OPPO最擅长做拍照手机,迎合了青年消费者喜好,特别是女性消费者;小米同样把拍照功能作为一个非常重要的卖点来宣传,以此吸引年轻消费者,但强调的是“发烧”即价格低、性能高;华为在宣传卖点时,仅有一句话“后置双摄像头,莱卡前置镜头”,略显单薄,再看摄像头的像素,都比小米、OPPO低很多。这与计算出来的拍照指标类痛点值大小排序相一致。其它方面也可以采用此类方法进行有效性验证,不再赘述。

表5 手机广告语

综上所述,以情感分析为基础,构建的痛点量化模型,识别出了华为、小米、OPPO的产品关键点,并计算出保健痛点和激励痛点,得到的结果与实际情况相吻合。

4 结 语

找准用户痛点可以帮助企业改良产品提供决策依据,也为制定更完善的营销策略提供了支持。本文在已有的用户痛点理论基础上,提出用户痛点应包括保健痛点和激励痛点两个方面的内容,并以情感分析为基础,构建用户痛点量化模型。为验证模型的有效性,以京东的3款手机产品的商品评论数据为数据源,分别计算机出各款手机指标类的痛点值,并进行了有效性验证,结果表明该模型具有一定的实用性和有效性。但是研究过程仍然存在一些不足:一是商品评论负面信息量少,正面信息量多,对实验结果有何影响,需要进一步论证;二是仅用手机商品进行了模型验证,有待进一步验证其它类型产品,以进一步确定模型的适用性和效果。

猜你喜欢
词典痛点小米
传递
“快递进村”还有哪些堵点、痛点?
聚焦学前教育 破解民生“痛点”
米兰·昆德拉的A-Z词典(节选)
米沃什词典
词典引发的政治辩论由来已久 精读
杜小米的夏天
读《幸福的小米啦:小米啦发脾气》有感
各种模式都有痛点
解决食材配送痛点