基于爬虫技术的网络口碑对汉服女绣花鞋线上销量影响研究

2020-09-08 08:38石文奇程凡刘静陈志军周云鹏
皮革与化工 2020年4期
关键词:绣花鞋气量成交量

石文奇 ,程凡 ,刘静 ,陈志军 ,周云鹏

(1.丝路文化创意产业研究中心陕西国际商贸学院,陕西西安712046;2.武汉纺织大学,湖北武汉430073)

随着互联网传播的极速发展,电商、社会化媒体为消费者的购物消费和社交带来了深刻的变革。网络信息交流、获取以及营销决策的方式,使得更多的消费者愿意分享自身的体验。

而消费者对所需产品做出正确的购买决策,需要对线上平台所需的各类信息进行收集整理和评估,而网络口碑成为引领其做出购买意愿的重要信息源之一。口碑因不受时空限制,传播速度快等特点,很多学者研究认为网络口碑对潜在的消费者影响比广告作用显著。为此,如何利用互联网派生出来的大数据,及时准确搜索掌握网络口碑情况,对于服饰类产品的销售至关重要[1,2]。

而随着近些年来新时期知识性女性消费者崇尚文化的传承复兴,针对出现的“汉服热”等现象,研究汉服女绣花鞋网络口碑影响文化女性消费的意愿决策就显得非常有意义。对此,本文以电商平台天猫为例,借助网络爬虫软件爬取女装汉服的配饰——女绣花鞋的数据和信息,从汉服女绣花鞋的人气量、累积评价、价格、库存量、送积分值、描述分值、服务分值、物流分值等方面研究其网络口碑对线上女绣花鞋月销量的影响,进而分析影响女绣花鞋销售的主要因素,挖掘消费者关注的焦点,为电商商家和企业研发相关的鞋类产品提供参考依据[1]。

1 研究综述

郭晨[3]借助TAM、ELM 模型相关变量,从前因变量、中介变量和条件变量出手,分析了网络口碑对女性消费者服装购买意愿的影响效果,发现网络的口碑质量、可靠性来源对销量有正向促进作用,感知特性具有重要的中介作用。黄莹[4]等人研究也证实了网络口碑质量的相关性、全面性2 个维度对消费者的购买决策有正相关关系,通过2 个变量的计算可预知推测消费的意愿程度。廖翼[5]等人以在校大学生为例,分析网络口碑对其消费意愿的影响。发现口碑接受倾向越高,其产品的口碑信息量越丰富,有助于销量的上升。

由此可见,针对服饰的网络口碑研究报道较多,但对鞋类的网络口碑对其销售的影响未见报道,且报道大多数主要集中在网络口碑对消费者的意愿决策之间的关系[6,7],与产品的销量是否有关系以及各个口碑之间的影响变量(因素)之间显著相关或者无关没有报道。对此,本文凭借URL 网络爬虫程序和后裔爬虫软件爬取天猫平台女绣花鞋月销量的网络口碑各变量在线数据,进而探讨其各变量之间的相关关系,同时分析各个变量与女绣花鞋月销量之间的关系。

2 研究假设与数据的挖掘

2.1 研究假设

现阶段针对网络口碑中线上产品销售量与各个维度变量之间的关系研究较多。顾大石[8]从网络口碑的方向、数量、趣味性、时效性4 个方面分析了对消费者消费决策行为的影响程度,并对各维度进行了数据多元回归分析。李道和[9]等人以京东平台为例,通过挖掘在线评论数据,发现茶叶品质,品牌、价格和新鲜度正向促进消费者满意度,而配送服务、茶叶外观和发货速度对其影响较小。胡媛荣[10]等人对京东商城电器、图书和食品三类在线评论的数据进行词本词频分析,筛选出识别速度、包装、快递员态度和退换货服务4 个物流质量指标体系对其进行分析,发现快递员态度、退换货速度和态度、包装方面对消费者的购买意愿程度影响较高。李林红[11]等人以农产品收藏数量、评论数量、评论中图片的数量、评分和价格6 个影响因素分析网络口碑对其销量的影响,结果显示收藏数量、图片数量对网络销量影响显著,其他因素影响并不显著。基于此,课题提出以下的研究假设:

H1:女绣花鞋价格与其网络月销量呈正相关;

H2:女绣花鞋累积评价数量与其网络月销量呈正相关;

H3:女绣花鞋库存量与其网络月销量呈正相关;

H4:女绣花鞋送积分值与其网络月销量呈正相关;

H5:女绣花鞋人气量与其网络月销量呈正相关;

H6:女绣花鞋店铺描述分值与其网络月销量呈正相关;

H7:女绣花鞋店铺服务分值与其网络月销量呈正相关;

H8:女绣花鞋店铺物流分值与其网络月销量呈正相关。

2.2 数据挖掘

因天猫平台主要是旗舰店,商家企业入驻较多,可信度相对较高。因此课题借助URL 网络爬虫程序和后裔采集软件对天猫平台关于女汉服女绣花鞋数据信息进行挖掘采集,对数据整理筛选,剔除月成交、累积评价参赛为0 的店铺数据,最终形成数据库并进行实证分析。采集的数据如表1 所示。

表1 汉服女绣花鞋采集的数据汇总表Tab.1 Summary table of data collected from embroidered shoes of Hanfu

3 结果与分析

3.1 汉服女绣花鞋感官属性词频分析

借助爬虫程序和软件对天猫平台的汉服女绣花鞋的商家旗舰店店铺的名称、商品名称进行原始数据爬取采集。先对初步的词汇进行整理,然后利用微词云软件对其重复的词汇进行筛选,分析感官高频的描述性名词,得到图1 所示的店铺名称和商品名称的词云图。

由图1 经分析可知,汉服女绣花鞋消费者感官的天猫平台店铺名称和商品名称最高频的描述性名称分别为25、235 个。高频的店铺上描述词“服饰、鞋类、魅力、南国”容易引起消费者的眼光,“中学生、民族、古风、鞋子”等词语融入商品名称易引起关注。这为从事汉服女绣花鞋的平台商家在店铺命名、商品起名给予指导参考。

3.2 一元回归结果分析

为了更好地研究天猫平台汉服女绣花鞋网络口碑各影响变量之间以及各变量与女绣花鞋月销量之间的相关性程度,课题利用SPSS19.0 统计分析软件进行分析,得到彼此之间的相关系数,如表2 所示。

表2 分析可知,在8 个变量中,汉服女绣花鞋累积评价(0.747)、人气量(0.865)、店铺描述分值(-0.316)与其月成交量具有显著的相关性,但描述分值与其呈负相关。假设H6 不成立。其他变量与天猫平台汉服女绣花鞋月成交量没有显著的相关性。因此可以得到基本判断天猫平台汉服女绣花鞋网络口碑下,女绣花鞋的价格、库存量、送积分值、店铺服务分值和物流分值对其销售影响不大,其假设结论H1、H3、H4、H7、H8 不成立,H2、H5 假设成立。

图1 天猫平台汉服女绣花鞋消费者感官店铺名称(1)、商品名称(2)词云图Fig.1 The cloud diagram of name of sensory store for consumers of embroidered shoes of Hanfu(1)and product name(2)on Tmall

为了探索实证分析汉服女绣花鞋网络口碑各变量维度与月成交量理论数据和真实数据之间的差异,加快为天猫平台电商企业研发产品提供思路,课题借助曲线估计的方法(研究两个变量之间非线性关系)进行模型方程拟合,如果模型可以进行拟合,说明显著性关系高,反之显著性不高。依次与汉服女绣花鞋月成交量呈现正向关系各维度变量进行拟合,结果如图2 所示。

表2 各口碑变量之间及与女绣花鞋月成交量相关矩阵系数表Tab.2 The matrix coefficient table of the correlation between the variables and the monthly turnover of embroidered shoes

图2 累积评价(a)、人气量(b)、服务分值(c)、物流分值(d)与汉服女绣花鞋月成交量关系曲线估计模拟图Fig.2 The curve estimation simulation diagram for cumulative evaluation(a),collections(b),service score(c),logistics score(d)and monthly turnover of female embroidery in Hanfu

由图2 可知,汉服女绣花鞋的月成交量与累积评价、人气量可以进行方程拟合,曲线和线性的拟合度相对较高,说明这2 个变量与女绣花鞋的销量具有显著的相关性,而服务分值、物流分值变量的曲线模拟图无法拟合,说明与女绣花鞋网络销量没有相关性。由此可见,天猫平台网络口碑评价体系中,对汉服女绣花鞋进行评价,更易引起追求汉服消费者对配饰女绣花鞋的关注,随着评价数量的增多,有利于购买意愿者对女绣花鞋产品信息更多的了解,促进购买行为的发生;同时,随着女绣花鞋人气量(收藏数量)的增多,表明消费者对该产品的购买意愿程度高,消费行为的发生几率也越高,且二者呈现正相关;而服务分值、物流分值在店铺产品信息的左上角,且天猫平台设置的字体本身较小,不易引起消费者关注,实际中采集数据时发现评分值本身差距较小(4.7~4.9 分之间,满分 5 分),因此对女绣花鞋的月成交量影响不是很显著。

3.3 多元回归分析

因选取了8 个网络口碑的变量维度,各变量彼此之间可能存在多重共线性问题引起误差,课题结合前面提出的研究假设,采取逐步多元回归的方法分析各个变量之间的线性关系,全面分析网络口碑对汉服女绣花鞋月成交量影响,对此建立如下模型:

其中,α1~α8为待估计参数;α0为常数项;e i为误差项;X1~X8则分别代表汉服女绣花鞋的价格、累积评价数量、库存量、送积分值、人气值、描述分值、服务分值和物流分值。利用PSS19.0 软件进行多元回归分析,将X1~X8采取逐步方式增加到模型(1)中,其回归结果如表3 所示。

表3 模型汇总Tab.3 The model summary

由表3 可知,随着各变量维度的逐步进入增加,其R(复相关系数)、R2(决定系数)、调整R 方(校正决定系数)都在增加,各模型拟合度都比较好(R2>0.4),这表明模型构建合理,可以看出第3 个模型是最优模型。由此得出逐步多元回归分析的系数,如表4 所示。

依据文献[11]认为如共线统计量方程膨胀因子VIF>10 和容差值<0.1,表明存在多重共线性。由表4 可知,X1(价格)、X2(累积评价)、X5(人气量)这3 个变量Sig.值均小于0.05,由此判断,彼此之间不存在严重的共线性,虽X4(送积分值)变量Sig.值小于0.05,但VIF 值>10,表明存在共线性;其他自变量的显著性Sig.值均大于0.05,表明对因变量月成交量影响不显著。可以看出累积评价数量、价格对汉服女绣花鞋的月成交量有显著的负向影响,而人气量对汉服女绣花鞋的月成交量有显著的正向影响。其最终的标准化模型如下所示:

表4 系数Tab.4 Coefficient table

由多元回归方程模型(2)可知,天猫平台的库存量、送积分值、描述分值、服务分值、物流分值对汉服女绣花鞋的月成交量影响并不是很显著。但价格、累计评价和人气量对其月成交量的影响显著,可以看出,用户对汉服女绣花鞋的价格数量每增加1 个单位,其月成交量减少0.131 个单位,累计评价数量每增加1 个单位,月成交量减少0.453 个单位,但人气量每增加1 个单位,月成交量增加1.294 个单位。相比较而言,消费者对汉服女绣花鞋人气量较为敏感。

事实上,随着知识、文化的代名词95 后、00 后成为对中国优秀传统文化传承的“复兴一代”,汉服女绣花鞋承载更多的是寻根回归与文化传递——东方文化精神。在汉服女绣花鞋的背后,有着中华民族特有的思维、表达和文化底蕴的传播[12]。因此,随着“汉服热”流行,对配饰女绣花鞋的关注度也呈现上升趋势,其人气量越多(高),群体效应越容易出现,越容易促进销量的上升。同时,累计评价量越多,对汉服女绣花鞋产品信息了解更多,负面的评论也逐渐增多,其负向作用影响程度也上升。价格也对女绣花鞋销量呈现负向作用,这表明女绣花鞋定价程度高影响其成交量,这需要电商企业采取适当的定价策略。

4 结论和建议

本文借助网络爬虫软件对天猫平台汉服女绣花鞋在线爬取数据,以人气数量、累积评价、价格、库存量、送积分值、描述分值、服务分值、物流分值8 个网络口碑变量对其月成交量进行实证研究。通过研究得出以下结论:

(1)对各变量之间及与女绣花鞋月成交量之间进行一元回归分析研究发现,累积评价、人气量、店铺描述分值3 个变量对女绣花鞋月成交量具有显著相关性,描述分值与其呈负相关。其他变量不具有显著的相关性,曲线模拟图表明服务分值、物流分值不能与月成交量进行方程拟合,表明没有相关性。

(2)通过对多元回归模型进行研究,表明库存量、送积分值、描述分值、服务分值、物流分值对女绣花鞋销量影响不是很显著。而价格、累计评价和人气量对其影响显著,且价格、累计评价对销量呈现负向作用。

(3)综合上述结论,本文提出提升汉服女绣花鞋月成交量的建议措施:首先,质量是产品永恒的话题。企业研发需要不断提升女绣花鞋质量,增加用户深度体验;其次随着“社交”模式的出现,平台商家要想方设法采取各种措施增加产品“爆款”、“热款”人气,可以通过好评返现、返券、信息流推送“汉服搭配”等信息进行用户引导,聚集眼球,增加好的评论,特别要对“民族、古风、中学生”女绣花鞋的产品信息进行有效整合;同时,平台旗舰店商家要注意充分调研,确定符合消费者特别是“复兴一代”消费者能接受的女绣花鞋心理预期价格。

猜你喜欢
绣花鞋气量成交量
做人要有气量,交友要有雅量
气量可以学习吗
精美“中国鞋”
一周成交量大幅增加前50只个股
一周成交量大幅增加前50只个股
一周成交量大幅增加前50只个股
王旦的气量
开满茶花的脚
开满茶花的脚
气量三层次