结合商品标题文本的淘宝防脱发产品分析

2020-07-02 11:57
福建质量管理 2020年12期
关键词:省份销量商家

程 纯

(安徽大学经济学院 安徽 合肥 230039)

近年来,关于80、90后加入脱发大军、佛系养生等网络热词层出不穷,身边越来越多的人开始苦恼于如何坚守发际线,这也为各种防脱发产品的热销提供了宝贵的商机。据阿里健康联合阿里数据发布的《拯救脱发趣味白皮书》显示,在2017年购买植发、护发产品的消费者中,90后以36.1%的占比即将赶超38.5%占比的80后,成为有脱发烦恼的主力军。由此可见,未来防脱发商品销售的市场前景一片大好。

随着Web技术和移动端应用的普及,越来越多消费者倾向于线上消费。这使得淘宝等电商平台中含有大量的可用信息,阿里巴巴团队也基于NLP技术开发了一系列的应用场景[5],如商品标题的查询、语料库建设、评论情感分析等。本文将主要研究对象设定为商品标题,相关的研究主要集中在短文本分析领域,常用的方法包括TF-IDF、Word2vec、神经网络等[1]-[4]。Python语言的天然优势帮助我们轻松获取目标数据,同时围绕其展开做进一步的数据分析。

一、数据准备和数据清洗

本文的分析目标包括:(一)分析防脱发产品标题中的高频关键字;(二)分析商品的销量区间分布和价格区间分布;(三)分析高频关键字与商品价格和销量的关系;(四)分析商家的地域分布情况。

通过Python爬虫获得淘宝网以“脱发”为关键字的共2369条原始数据集,每件商品包括5项商品属性:商品标题(title)、售价(price)、销量(sales)、店铺名称(shop)和店铺地址(location)。由于在淘宝上购买处方药需要提交需求后才可购买,因此商品页不显示销量信息,sales列含有部分缺失值。

另外,在销量属性中,很多爬取下来的数据形式诸如:7.5万+人付款,需要将其转换为整型数据75000。店铺地址属性中,多为省份+城市的组合形式,考虑到后续分析仅保留省份。基于以上需求做数据清洗,得到2171条商品信息,另存为新的数据集。

二、商品价格与销量分析

(一)防脱发商品价格及销量区间分布

图1 防脱发商品价格区间柱状图

图2 防脱发商品销量区间饼图

首先分析全体防脱发商品的价格区间和销量区间,浏览数据集后按照分布情况人工划分区间,然后对数据集进行切分、统计和排序,生成图1和图2。从图1中可以看出,定价在51-100区间的商品最多,大部分商品售价在200元以内。也有价格低于20元的商品,对于其功效笔者持怀疑态度。另外,高于1000元的商品多为淘宝平台提供的一些植发、脱发检测等服务。

就全体防脱发商品销量而言,销量在一百内的最多,占比约74%。且爆款较少,销量过万的商品一共仅有7款,占比仅为0.3%。

(二)商品价格与销量关系分析

通过分析价格与销量的关系,可以帮助卖家更好地为商品定价。使用Pandas自动分区功能将全部商品价格划分为10个分区,对每个分区内的销量求平均值。

图3 防脱发商品价格分区与平均销量柱状图

图3表明定价在59-69区间的商品平均销量最高,销量最好的商品定价集中在60-90区间。说明消费者在选购商品时并非完全考虑价格因素,而是结合产品功能、品牌、口碑等多方面因素。对于防脱发产品而言,好的功效意味着较高的成本,价格低廉的商品似乎不太让人信服。合适的价格加上切实的功效才是吸引消费者的关键。

三、基于商品标题数据的文本分析

(一)商品标题高频词词云图

使用jieba内置词典对商品标题列进行分词,同时根据实际情况更新停用词表,禁用“包邮”、“官网”、“现货”等高频词汇,便于之后的分析。基于TextRank 算法对每条商品标题进行关键词抽取,显示排行前50的词频。利用得到的词频列表绘制词云图,输出结果如图4所示。

图4 防脱发商品标题Top50词云图

从整体来看商家在编辑商品名称时通常直击消费者要害,“增发”、“生发”等词汇十分醒目且目标明确。“生姜”、“植物”、“草本”等商品特征也位列榜上,说明大家在选购防脱发产品时往往也会考虑到商品成分,以天然取材为成分导向的商品更得人心。此外,海外厂家也试图在中国市场分一杯羹,“进口”、“日本”、“韩国”等词汇预示着防脱发产品市场的竞争激烈性。

(二)标题高频词与商品销量和价格的关系

从词频列表中取最高频的20个关键词,其在一定程度上代表了商品特征。遍历所有商品标题看其是否包含选出的20个关键词,若包含则将该商品的销量/价格数据放在关键词的value中。统计后对每个关键词的value求平均值,再根据平均销量排序得图5、6。

图5 商品特征与平均销量Top20

图6 商品特征与平均售价Top20

“止痒”、“去屑”、“控油”等基本洗护功能平均销量最高,“增发”、“发际”、“增长”等功能次之。说明消费者在选购防脱发产品时首先看重其基础功能,商家列出的强功效有一定增色效果。专业的种植、植发服务售价最高,“脂溢性”、“修复”、“产后”等具有特定功效的产品售价也较基础功能产品高。即大家如果真有脱发困扰,不要贪图便宜购买一般商品,建议寻求专业治疗。

四、全国商家分布及销量分析

图7 前两千商家数量全国分布图

图8 前两千商家平均销量全国分布图

对比图7和图8,可以发现沿海省份在防脱发商品卖家中名列前茅,广东省更是一枝独秀,浙江区居第二;说明沿海省份是我国防脱发产品的主要生产和出品商。但在平均销量方面,较图7的商家数量分布有了大规模洗牌:广东省依然高居榜首,而湖北卖家的业绩似乎也表现不俗;四川、吉林、云南等省份也进入消费者视野。假设卖家所在地就是商品的原料供给地,笔者不由猜测:以上省份会不会拥有某些特殊的成分优势?或是其他的地理因素?这还有待进一步探究。

五、结论和建议

通过以上数据分析,笔者得到了一些有趣的结论:

(1)绝大部分商品的售价在300件以内,定价在60至90元区间的商品最受消费者欢迎。总体来看爆款商品较少,多数商品销量平平。

(2)商品标题方面,商家在取名时通常言简意赅,目标明确;而消费者在选购防脱发商品时多选择基础功能商品,对于商家吹嘘的强功效不完全相信。

(3)沿海省份为我国防脱发产品的主要生产和出品商。除广东省外,湖北、四川、吉林等内陆省份在商品销量方面同样表现不俗。

综合以上分析结果,当笔者面对一位即将进入市场的防脱发商品卖家时,将建议他设置商品标题为“基础功能+加强功效”组合,同时重视商品本身的性能;定价方面,结合具体成本将价格设置在60-90元区间。最后,建议他在初期确定商品配方时去广东、湖北、四川、吉林等省份做下调研,这样也许会使其商品更加畅销。

猜你喜欢
省份销量商家
中国人不骗中国人
同比增长130%!剑指3万吨销量,丰华黄颡料迎来大爆发
商家出售假冒商品,消费者获十倍赔偿
No.4 快手电商:已帮助至少50万线下商家恢复生意
谁说小龙虾不赚钱?跨越四省份,暴走万里路,只为寻找最会养虾的您
盘点2018年车企销量
2016年度车企销量排名
上汽通用172万销量下的阴影
春节黄金周陕西省商家揽金二百一十亿元
因地制宜地稳妥推进留地安置——基于对10余省份留地安置的调研