电商在线评论排序模型研究

2019-03-02 02:35邓新洁唐观根龚礼春吴国华
现代计算机 2019年2期
关键词:特征词排序购物

邓新洁,唐观根,龚礼春,吴国华

(1.杭州电子科技大学计算机学院,杭州 310018;2.杭州电子科技大学网络空间安全学院,杭州 310018)

0 引言

随着互联网时代的到来,网络购物在生活中日益普遍。中国互联网络信息中心(CNNIC)针对中国网络购物市场的调研报告显示,中国电子商务购物市场未来3年增速将逐渐变缓,市场日渐趋于成熟。至2020年,中国网络购物的市场规模最高可能达到4.2万亿元,与目前美、日、英、德四国的市场规模之和相当[1]。

与网络购物日渐火热相伴而生的,是呈指数级态势增长的电商在线评论。在线评论是由消费者自主填写并发布在平台上,以文字形式传递商品主观评价的文本信息,同时也是网络口碑的一种重要形式。发表在电商平台的在线评论可供消费者免费阅读[2]。在线评论本身由已购消费者发布,对商品的潜在购买者具有重要参考意义。当下主流电子商务网站普遍采用将“有用性投票”及“评论发布时间”作为评论排序的指标。这类排序方式的指标选取过于片面,且并未对评论具体内容进行筛选,容易导致低可信度或者无意义评论出现在靠前位置,进而扰乱消费者判断,拉低消费者购物体验,影响电商购物市场的良性发展。

基于此,本文从实际应用角度出发,分析影响在线评论有用性的多重因素,对在线评论有用性指标进行属性量化计算,结合模糊层次分析法建立电商在线评论排序模型,对纷繁复杂的在线评论进行重新排序,筛选出对消费者更有参考价值的评论,对消费者做出购物决策有很好的辅助作用,同时也为电商平台的评论管理提供了一种筛选排序方法。

1 在线评论排序模型构建

1.1 概念模型

EK Clemons[4]等认为,消费者阅读在线评论主要有两个目的,分别是获取商品相关信息及降低购买决定中的不确定性。本文基于此构建关于评论有用性的指标体系。根据指标特征,将评论指标体系分为评论形式特征和评论内容特征两类。其中,形式特征是可以从网站直接抓取的已量化特征;内容特征需要对评论文字部分进行文本挖掘才能获得,又称为语义特征。评论形式特征借鉴文献[5]的设置方法,设置评论长度、评论时效性、有用性投票、图片数量四项特征;评论内容特征根据信息种类,分为商品核心信息和商品辅助信息两类,一共包括商品属性、物流运输、商家服务三项特征。如图1所示。

1.2 排序指标分析

(1)评论形式特征

①评论长度指标反映的是评论文本内容长短,大部分学者认为长评论一般更详细,包含的信息更全面丰富。我们通过计算评论中包含的有效信息量来测算评论有效长度,有效信息具体表现为评论中包含的属性词和情感词总数。

②评论的时效性指标反映了评论和阅读者的间隔时间大小。一般来说,时间越靠近阅读时间的评论内容越具有参考性。同时,考虑到消费者阅读时间的多变性,利用当前评论和初始评论发布时间差值来衡量评论的时效性。

③有用性投票指标能反映其他消费者对这条评论的认可程度。目前主流的购物网站,如淘宝、京东、亚马逊等都有设置一项类似点赞的有用性反馈指标,根据网站不同,一些购物平台还支持消费者对评论进行公开回复。总体来看,获得消费者认可的评论会获得更多有用性投票,这代表了这些评论的具体内容更贴近消费者需求,对消费者的决策更有帮助作用。

④评论图片是商品信息的直观反映,比文本信息更为直接。适量的图片有助于消费者提高商品认知。在一定阈值范围内图片数量越多代表评论所包含信息越多,对消费者做出购买判断也更有帮助。当图片数量超过阈值后,图片包含的信息存在冗余,同时也会对消费者的浏览造成负担。

评论形式特征可从网站直接抓取,获取相对简单,参照文献[6]进行量化。

图1 电商在线评论排序指标图

(2)评论内容特征

①核心信息由商品属性特征词组成,一般为名词或名词性短语,主要反映了商品的质量、价格、外观、防护四个方面的相关信息。评论文本中所含的商品属性特征词越多,则该评论对商品的客观性描述更具体,与商品的相关度也更高,对其他消费者的辅助决策作用也更好。

②辅助信息由物流运输特征词和商家服务特征词两项特征组成,一般为名词或名词性短语。物流运输特征词主要反映了商品的包装、物流两方面信息;商家服务特征词主要反映了商家的售前、售后服务水平。消费者在购买某一商品时会在几家店铺间比较,此时物流运输和商家服务作为购物体验的重要组成部分,也是影响消费者购买决策的影响因素。

评论内容特征的量化需要依靠构建对应的特征词表。以商品属性特征词为例,量化需要依靠商品属性特征词表。当评论中出现商品属性特征词表中的词汇时,其商品属性特征词数量加一。通过统计每条评论中商品属性特征词出现的次数来计算量化值。

2 关键技术步骤的实现

2.1 完整排序模型框架

本文的排序模型框架主要由以下三个步骤构成:首先,从电商网站获取初始评论数据;其次,通过评论获取特征词表集,并对评论排序的各项指标进行信息提取和量化,生成特征矩阵;最后,借助模糊层次分析法输出新排序。具体流程图如图2所示。

图2 电商在线评论排序模型流程图

2.2 特征词表的提取

特征词表的提取方式有人工提取和计算机自动提取两种方式。人工提取需要相关领域的专家手动提取,准确度高但具有工作量大,可移植性差的缺陷;计算机自动提取和人工提取相比,提取速度快,工作量小,但提取精度和人工提取存在一定差距。本文使用计算机和人工提取相结合的方式。首先从评论库中选取一定数量的评论作为样本评论数据集。通过去重、分词等对样本评论数据集进行预处理,筛选出评论中的名词或名词性短语,随后利用TF-IDF确定由高频词汇组成的候选特征词集。最后通过人工筛选降噪,将得到的特征词分别归类为商品属性特征词表、物流运输特征词表、服务态度特征词表。

2.3 基于模糊层次分析的评论排序算法

模糊层次分析法是一种将模糊数学与层析分析相结合的系统分析方法[7],本文选用该方法来确定权值,并基于此实现对评论的排序。其主要步骤如下:

(1)建立排序层析结构模型

本文采用的层次结构模型见图1。

(2)确定指标权重和排序

借助矩阵表达个指标相对评论排序的重要性,采用0、0.5、1标度法确定因素值。该方法有简单易行、便于简化矩阵计算的优点。

(3)电商在线评论排序

量化后的各项指标在量纲和数量级上存在差异,通过无量纲化处理得到指标值T=(t1,t2,…,t6)。依次计算各条评论分值Rj,并按照分值高低实现评论排序。排序总分计算公式如下:

3 模型试验

3.1 排序模型实验

(1)数据收集及预处理

以淘宝网iPhone 8手机评论为例,使用Python编写爬虫抓取在线评论,从两家热销店铺下共抓取有效评论5312条,从中随机选出1500条构成样本评论数据集。另外,在每家店铺抓取的评论中选取前500条评论,分别作为A组和B组,作为待排序评论数据集。本文使用哈尔滨工业大学语言处理平台(LTP)对评论逐条进行分词和词性标注,分析结果以XML形式导出。

(2)特征词表的提取

对获得的XML文件进行分析,提取出其中所有的名词或名词性短语,借助TF-IDF进行筛选。将选出的高频词汇作为候选特征词集。经过手工降噪和分类后,获得商品属性特征词表、物流运输特征词表、服务态度特征词表。

3.2 实验结果分析

将排序模型得到的排序结果与淘宝网站原始排序相比较。淘宝网站原始评论的排序主要基于评论时间、有用性投票等便于直接量化的因素。和本文排序结果的对比可以看出,评论中其他因素尤其是评论内容特征也会对评论有用性产生很大影响。从本文根据模糊层次分析法得到的权重来看,评论的属性特征词和情感特征词指标权重均大于评论时间和有用性投票。这也说明,仅仅依靠易于量化的因素对评论进行排序,会导致评论排序不够全面,一些对消费者更有帮助的评论排名下降,这也说明了网站的初始评论排序存在弊端。限于篇幅,此处选取测试商品中排序前15名的评论进行对比,如表2和图3所示。

表2 网站默认排序与本文排序前15名名次比较

图3 排序前15名评论排序得分比较

观察上述结果可知,网站原始排序由于选取指标存在片面性,其排名靠前评论的排序得分存在较大波动,本文模型排序靠前评论的排序分值呈稳定缓慢下降趋势。从消费者浏览效的角度来看,淘宝网站的排序存在一定缺陷,排名靠前的评论有用性差异较大,一些包含丰富信息的评论被排在后面。本文模型对评论进行重新排序,将排序得分高的评论排在前面,这些评论往往信息量丰富,对消费者做出潜在购物判断更有帮助。

4 结语

电商在线评论排序模型是有关提升消费者购物体验,提高购物效率有辅助作用的研究,也是在线评论有用性领域研究的重要组成部分。本文从评论形式特征和内容特征两方面进行分析,将评论内容特征分为核心信息和辅助信息两类,综合考虑了物流运输、商家态度等因素。结合TF-IDF算法对影响在线评论有用性的7项指标进行分析和量化,结合模糊层次分析法建立排序模型。选择淘宝网iPhone 8手机的在线评论作为研究对象,验证了该排序模型的有效性。该模型能对特定商品的在线评论进行全面的筛选,缩短了消费者筛选有效评论信息的时间,能辅助消费者做出购物决策。

同时本文也存在一些局限,电子商务网站中存在相当数量的追加评论,这些评论和初次填写有一定的时间间隔,内容往往反映了评论使用商品一段时间后的新的体验,是重要的排序判断依据。依靠句法依存关系提取的属性特征词表对网络新词汇的识别容易出现误判。这些也是笔者后续进一步的研究方向。

猜你喜欢
特征词排序购物
基于Simhash改进的文本去重算法
基于类信息的TF-IDF权重分析与改进①
作者简介
我们为什么选择网上购物?
恐怖排序
一种面向财务文本分类的TF-IDF改进算法
节日排序
圣诞购物季
快乐六一,开心购物!
不可错过的“购物”APP