百度外卖平台数据价值分析

2019-11-27 05:52张子衿
中国新技术新产品 2019年18期
关键词:文本分析

张子衿

摘   要:2014年5月起,百度推出了外卖平台,现平台注册用户量已经达到了3 000万人以上,至今积累了大量的数据。然而这些数据具备很高的实际应用价值。为此,该文随机抽取了百度外卖平台上五家外卖餐馆的数据,分别从商家订餐量、订餐用户、用户评价和订餐时间4个维度进行了数据分析,从而找出百度外卖平台数据的价值,引发大家对数据使用的思考与关注。

关键词:百度外卖;数据价值;文本分析

中图分类号:TP399                   文献标志码:A

0 引言

2014年5月百度推出了外卖平台,现平台注册用户量已经达到了3 000多万人,在白领外卖市场实现份额第一,且平台上积累了大量的数据。如何合理使用这些数据,是外卖平台、平台商家以及外卖用户值得思考的问题。为此,该文随机抽取了百度外卖平台上5家餐馆数据,并进行了分析。

1 研究思路及方法

1.1 研究思路

研究按如下思路展开:1)数据采集;2)数据分析,分别从商家订餐量、订餐用户、用户评价、订餐时间4个维进行分析;3)数据价值,通过分析结果找到数据价值。

1.2 研究方法

研究主要使用了数据统计分析方法,在用户评价的文本分析中,使用了社会网络分析软件ROST CM 6对数据进行分析,并对用户评价的文本信息进行自动分词、高频词统计、云图生成、共词社会网络及语义分析。

1.3 数据采集

利用国内网络爬虫制作工具——八爪鱼软件获取数据。从百度外卖平台上,随机抽取上海中山公园商圈的5个外卖商家的数据,商家在百度外卖的ID分别为:1645228165、1557526832、15280021074、1439935781、1835243683。

2 数据分析

2.1 商家订餐量

数据一显示了2017年5家商家所有订餐量。由全年数据可以看出,ID号为1439935781的商家经营情况最好。平均年订餐量为2 160份。按平均每份20元计,一年该商家的外卖营业额在43 200元。如果按行业平均利润20%计量,平均每家外卖利润仅为8 640元。由此可见,虽然百度外卖平台有较大的影响力,但外卖餐馆如果仅依托一个百度外卖平台的销量,是难以生存的。

数据一。

2017年五家外卖餐馆的订餐量(共计10 841)。

商家ID号:1835243683;订餐数量:613商家ID号:1645228165;订餐数量:2438。

商家ID号:1557526832;订餐数量:2932商家ID号:1557526832;订餐数量:2932。

商家ID号:1528021074;订餐数量:1090商家ID号:1439935781;订餐数量:3768。

2.2 订餐用户分析

百度外卖平台上95%以上的用户是以手机号作为用户名注册的。订餐用户的分析得出以下2个结论。

2.2.1 发现外卖餐馆的核心用户

如数据二所示,可以看到用户尾号831、814、013、557、521为餐饮1439935781最忠诚的客户,了解这点,便于餐馆维护核心客户,并从核心客户进行调研及分析,研发更适合客户需要的菜品及服务。

2.2.2 進行商圈竞争对手的分析

如某用户在某个时间段内在A餐馆订餐了18次,而在B餐馆中订餐16次,且餐馆A与B的用户重叠度较高,说明A、B餐馆具有较大的竞争关系,可以帮助商家了解竞争对手,提升自己的竞争力。

数据二。

订餐用户一年订餐次数。

用户ID:1391****831/订餐63次/订餐餐馆ID:1439935781

用户ID:1391****210/订餐48次/订餐餐馆ID:1645228165

用户ID:1391****814/订餐36次/订餐餐馆ID:1439935781

用户ID:1391****013/订餐33次/订餐餐馆ID:1439935781

用户ID:1861****557/订餐26次/订餐餐馆ID:1439935781

用户ID:1381****631 /订餐25次/订餐餐馆ID:1645228165(1次),1439935781(24次)

用户ID:1381****521 /订餐24次/订餐餐馆ID:1439935781

用户ID:1560****050 /订餐21次/订餐餐馆ID:1557526832

2.3 用户评价文本分析

通过分词发现高频词,是文本分析最重要也是基础的研究。该部分利用ROST CM6软件,对5家外卖餐馆的点评数据进行分词,得到用户评价的高频词(如数据三所示),从排序表可以看出,与配送相关的词:配送、服务、保存等都是高频词,对于外卖来说,外卖的及时到达是消费者特别关心的问题;其次是食品本身的质量,如味道、好吃等。

数据三。

用户评价高频词。

配送快:336次;服务态度好:311次;保存完好:261次;味道赞:172次;风雨无阻:154次;分量足:128次;味道:122次;很好:117;包装精美:105次;好吃:100;价格实惠:85次。

通过共词进行语义分析可以进行文本信息的进一步挖掘,共词是对每一条点评信息进行分词后,发现同一条点评信息共同出现的词,如这家炸鸡太难吃,分词后分出来的结果是炸鸡、难吃。通过ROST CM6的社会网络及语义分析模块,可分析出炸鸡难吃的语义,同时,将炸鸡与难吃建立一条连线,连线的粗细表示共词次数的多寡。对样本数据中的点评信息进行社会网络及语义分析。通过分析可以得出,“味道”与“很好”,“外卖”与“小哥”,“态度”与“很好”线条比较粗,说明用户点评中,评价认为味道很好、态度很好,对外卖小哥的评价比较多。

2.4 订餐时间分析

百度外卖中显示了从用户下单时间、用户收到外卖的时间以及两者相减所用的订餐时间。但是系统显示的时间信息有错误,在该研究样本数据中显示,最高的订餐时出不一致的信息,如显示订餐时间是308分钟的用户在抱怨:三刻钟才送到,说明系统显示的部分订餐时间并不准确。而用户收到外卖的时间与用户下单时间相关得到的数据,有时与系统显示的订餐时间也不一致。

3 百度外卖数据价值

通过以上分析可以看到,百度外卖的数据具有极高的应用价值,对于外卖平台来说,数据能帮助其了解平台上外卖餐馆运营及服务的情况及变化。对于外卖平台上的商家来说,能了解用户反馈和需求以及竞争对手的情况;对于普通订餐用户来说,能了解商家的排名、推荐菜品、性价比、和配送情况。但目前大多数餐馆还没有真正认识到数据的价值并利用起来。不过相信随着人们利用大数据的意识以及能力的提高,该数据的价值将会得到更为充分的重视和应用。

参考文献

[1]蔡溢,杨洋,殷红梅.基于ROST文本挖掘软件的贵阳市城市旅游品牌受众感知研究[J].重庆师范大学学报(自然科学版),2015(1):126-134.

[2]马向阳,魏文文,白寅.老品牌餐厅感知真实性的线索类型及其作用机理[J].华东经济管理,2017(8):176-184.

猜你喜欢
文本分析
投资者情绪短期对股票市场的影响研究
文本情感计算系统“小菲”的设计及其在教育领域文本分析中的应用
初中英语听说课教学实践探索
经合组织成员体教师队伍现状、特点及发展趋势
以符号矩阵理论浅析《鬼魅丹青》
《化学:概念与应用》专题作业设计分析及启示
论20世纪初期刊中的科学观念