新冠疫情下生鲜电商的交易情况预测分析

2020-10-12 14:14李宇何跃吴中霞唐琪雨郑灏键
商场现代化 2020年16期
关键词:生鲜电商预测模型可视化

李宇 何跃 吴中霞 唐琪雨 郑灏键

摘 要:2020年春节以来,新冠疫情的逐渐恶化在很大程度上影响了消费者的生鲜购买习惯,实现从农贸市场向连锁超市和生鲜电商平台的转变。因此,本研究利用Python语言抓取京东生鲜平台生鲜商品销量及新冠确诊人数,对数据进行处理、存储及可视化,将疫情指数、商品评论的数据进行了展现和分析。据此提出“预测模型”,通过分析以上数据的变化与分布特点为生鲜电商平台提供适当的销售、供应方案,以期在将来某次应急事件中能缓解平台受到的冲击,并使平台从中发现商机。

关键词:疫情;生鲜电商;预测模型;交易;python;可视化

一、文献综述

华南理工大学研究了生鲜电商产品特征对消費者感知风险与购买意向的影响关系,通过实惠性、推介性、新奇性、便利性四方面构建理论模型,得出其对生鲜销售的影响关系;中国地质大学研究了生鲜电商中冷链物流需求预测,通过灰色预测模型,根据各影响因素的变化趋势的共同点或不同点,从而检测各个影响因素之间的关联性;南京林业大学汽车与交通工程学院的姜晓红曹慧敏,基于ARIMA模型的电商销售预测及R语言,通过对未来的全国和区域性需求量进行预测,能对产品的补货安排提供理论指导,对生产销售的安排具有指导意义;而本次的研究,将目标定位于销量与疫情指数之间,具有现实意义,也为帮助平台在疫情期间的良好发展贡献了自己的价值。

二、背景

2020年突如其来的疫情打破了很多人的生活节奏,也改变了许多行业的结构与发展方向。与2019年同期相比,今年春节期间,生鲜类APP的平均日活增幅及新用户增幅达到2至3倍,疫情培养了用户在网上购买生鲜商品的习惯,实现了生鲜电商用户量和订单量的快速增长,也暂时将生鲜电商从低谷中拉出。

通过对生鲜电商平台疫情期间进行PESTEL分析,了解平台的外部宏观环境,本文将有针对性地为平台的发展做出预测、提供建议。使平台实现精准运营并明确规划其发展战略。法律方面,为了促进我国生鲜行业的快速发展,我国政府制定了行业相关的产业政策和法律法规,如《电子商务法》等,明确了生鲜行业发展规划方向,为行业的发展创造了较好的政策环境,为买卖双方提供了保障,但也不可否认还有一些售后的法律瓶颈需要解决;民生经济方面,疫情的暴发使得人们外出频率骤减,购买成问题的生鲜产品作为生活中的必要品,为生鲜电商平台带来了巨大的流量,伴随需求的增加,大多数人的购买行为也从线下转移到线上;科技方面,由于市场规模扩大、结构转变,对于行业相关技术的要求也相应提高。冷链物流技术快速发展、无人配送正式开放等,都是疫情下生鲜电商行业的外部科技环境;社会文化趋向方面,消费者对于饮食健康问题愈发关注,并且对食物的品质和新鲜度的要求更加严格。

因此,本研究旨在为平台提供一个预测模型,根据疫情的严重指数来量化影响生鲜电商平台的因素,预测平台发展方向并拟定供应、销售方案。

三、编程语言与技术介绍

该模型的设计主要是基于python语言的网络爬虫,并用pyecharts进行可视化分析。网络爬虫,通过一定的规则策略,自动抓取、下载互联网上网页,再按照某些规则算法对这些网页进行数据抽取,形成所需要的数据集。而基于爬虫,可以更准确地获取目标数据,再辅以MySQL数据库储存,python数据可视化展示与MATLAB拟合数据,使得模型更清晰具体。

四、模型分析

数据选取:根据艾媒咨询所统计的“疫情暴发前与暴发期生鲜平台食材销量对比”,蔬果类同比增长近100%,肉蛋类增长近120%,故选取蔬果肉蛋(由于水产品属于其中的肉类但有区别,故单独呈现),再选取其统计的具体食材销量在疫情前后同比增长高的食材,近20种。

而疫情暴发后,大年三十至正月初九,京东生鲜蔬菜获得销售和销量的双冠增长,销售同比增长近450%。猪牛羊肉和禽肉蛋品等基本食材的销售同比都超过了400%,猪肉同比去年春节增长超10倍。此外,饺子、包子、糕点等面点的全国销量也超过了2019年“京东双11”的规模,这一份答卷不仅为全国生鲜市场的供需稳定持续助力,也展现了其在生鲜电商领域的领先地位,再加上其网站代码较易爬取,故选取京东生鲜平台为数据爬取对象。

1.模型微观分析

(1)数据获取:本文的数据主要来源是京东生鲜网站,整个过程通过Python语言编写。数据爬取过程中,采用模拟请求登录、Web自动化工具selenium模拟浏览器和多线程等技术手段。数据爬取后进行采集分析,对数据进行了清洗和转换处理,并将其存入MySQL数据库,最后通过pyecharts可视化库对数据进行直观呈现与分析。

(2)框架构建:该预测模型分析所需数据由三个步骤获取,抓取生鲜品类——抓取各生鲜商品——抓取商品对应评论。最后再用pyecharts实现数据可视化,可视化结果为疫情指数-时间图和商品销量-时间图,matlab做回归方程曲线图。通过分析得出的图像,为商家提供销售预测模型,进而使商家在再次经历类似灾难时能制订出更具可行性的销售方案。

(3)抓取数据:首先,需要获取京东生鲜网站生鲜商品品类,其次才能抓取品类里的各商品的具体信息,确定各店铺该品类商品的评论数量,以此来估计商品销量。该过程为:导入模块—定义京东生鲜主页—抓取网页并解析—封装品类名及url。

其次,在各品类信息基础上,可进一步抓取商品信息,主要是商品名称和商品评论。在获取商品信息时,每页总共60个商品,但其中有30个商品是通过Ajax加载出来的。为了解决这个问题,我们使用selenium模块解决。selenium本质是通过驱动浏览器,完全模拟浏览器的操作,比如跳转、输入、点击、下拉等,来拿到网页渲染之后的结果。

获取商品店铺和评论数的部分代码如下:

该过程为定义品类url—定义浏览对象并访问url+解析源码,抓取url,评论数等。

最后,获取评论时间,确定消费者购买时间。当爬虫爬取速度过快或者次数过多,可能会出现被封IP的现象,导致抓取到的网页源代码为空。我们通过使用代理IP来解决这个问题,定义一个函数,每次运行这个函数都会通过API接口获取一个新的IP地址,并以这个IP地址去访问网址,这样解决了IP被封的问题。其部分代码如下:

该过程为获取代理IP—定义函数—访问评论页并储存

(4)数据存储

本设计采用MySQL数据库作为数据源存储,MySQL是一种关系型数据库管理系统,关系数据库将数据保存在不同的表中,而不是将所有数据放在一个大仓库内,这样就增加了速度并提高了灵活性。

MySQL所使用的SQL语言是用于访问数据库的最常用标准化语言。MySQL软件采用了双授权政策,分为社区版和商业版,由于其具有体积小、速度快、总体拥有成本低等特点,本模型使用MySQL数据库来存储目标数据。

该过程为导入驱动包—连接数据库—定义执行sql语句—关闭数据库最终MySQL中共收集存储了435402条评论信息数据。

2.模型宏观分析:

(1)组成部分:

①销量/时间图:选取20种不同类别的热卖商品,将其分为四类,以月份为横坐标,评论数为纵坐标。我们采取根据其评论数量反映销售数量的方法,并做累积,显示四大类的折线图。该图旨在帮助平台确定商品出售时间及所需供应的商品数量比例,稳定供需关系,同时对商家也有一定的借鉴作用。

②疫情指数/时间图:利用腾讯地图官网的疫情实时数据,以月份为单位,患者/全国人数为纵坐标,显示折线图,是用来联系疫情指数与销量的媒介。

③销量/疫情图及回归方程:利用时间为媒介,以累积感染人数作为衡量疫情严重程度的指数,将对应疫情下的评论数用更直观的图像显现出来,并设计方程,方便平台在相应疫情状况下大致估测自己的销量水平。

(2)购买力变化分析及产生的影响

根据上图我们可以得到:①在感染人数累计达到6万左右时,生鲜商品评论量开始明显上升;②蔬菜类的销量增速为所有生鲜商品中最快的;③根据20种商品评价数的累计分析,疫情后的销量(评价数为)约为疫情前的2倍左右。

疫情下外出频率急剧降低,加上各大平台通过自身商品、供应链、物流配送、品牌战略合作等优势,结合不定期发放优惠券、举办促销活动等优惠手段互相竞争,使得疫情期间消费者的购买力远大于往年同期。

另外,客观因素还有季节性滞销、社会交通发展程度、信息技术发展程度等。例如在冬季,消费者更倾向于选择各种肉类等可以补充能量的生鲜类产品,在春秋季节购买水果的群体占比就较大。社会交通发展程度是针对物流方面,随着社会经济的不断发展,公路、铁路、航空等运输方式的里程、货物量、吞吐量这类指标不断攀升,对中国电商的物流配送起到了直接重要的推动作用。信息技术是电商发展的命脉,没有互联网的普及,没有电商基础设施和网点的建设,也不可能有如今蓬勃发展的电商行业。

最后,生鲜电商的交易水平与平台自身发展相关性最大。创新和改进供应链,如永辉超市启动的“田间寻货源”方案,加大了供应链的协同程度;完善运营体系,如每日优鲜通过小程序与社交群,交易额度同比增长300%等;增强用户体验感,如永辉线下门店中,生鲜品旁的二次加工服务;除此之外,发达的物流体系,数字化技术,产品的质量等都是影响交易量的重要因素。

五、价值

当重大灾难事件来临时,各行各业将受到不同程度的冲击,因此,预判企业发展方向、提前制定应对方案与风险防范措施能有效缓解其带来的影响。本文将此次疫情的京东生鲜平台数据作为预测模型的数据基础,通过数据获取、处理、可视化等方式,為生鲜电商平台提供可作用于灾难事件下的预测模型。该模型描述了某疫情指数下对应的多类生鲜产品的销量,为平台解决了以下问题:

1.难以把控购入量和时间,由此导致仓库的积压或是不足。

(1)平台可根据不同疫情指数定位到相应销量区间,确定市场需求量的大致范围,进而根据市场需求量及企业内外部环境等因素来确定供应量并推测进货时间,在不同疫情指数时期有针对性地供应适量的产品,提高平台的供应链运转效率。

(2)根据销量曲线,合理调整成本,减少库存积压和亏本兜售的情况。

2.难以确定类似疫情来临之时的生鲜热销品。由于模型中样本的选取来自艾媒咨询中疫情前后同比增长率高的产品,平台可根据各品类生鲜产品的销量曲线以及季节等外部因素,利用销量与疫情指数的对应,在相应的疫情状况下进一步确定合理的货物购入、出售与存储方案,有利于制定切实可行的销售预案并将其应用于类似的市场情况中。

3.难以把控人员的在线数量及商品监管问题,造成平台运营成本增高

利用疫情指数/时间图确定平台商品的安全监管程度,及相应的运营物流措施,及时调整工作人员的工作安排(所需工厂在线员工/总员工数量、合理采用多平台的共享员工模式来进行短期人力输出)由于不同疫情指数下,销量不同,所需要的人员数量也不同,平台根据该模型可以适当的人员配置和准确的生产销售方案,提高企业内部的工作效率,维持企业内部的稳定运转。

六、不足之处

当然模型还有一定的不足之处:

1.操作性:构建非此次疫情的模型图,需要定期运行代码,并存入数据库做间断性记录,运行时间较长,需平台相关人员自行评估,操作较繁琐,但可以起到加强平台风险防范的作用。

2.准确性:由于京东平台对任何一家店铺的销量都是不公开的,所有销量数据均为店铺隐私,该模型只能利用评论数预测商品销量,又由于不同产品之间的评论与销量比值不一致(但由于针对的均为生鲜产品,幅度变化范围较小,所以有一定的借鉴意义),在高峰或低谷所对应的时间可能会有一定偏差。

3.兼容性:

(1)该代码当前产出的折线图及回归方程,只适合于类似“新冠肺炎”这种导致人们居家、无法外出的情况,且时间在春节前后,若非该种情况,平台只能通过定期运行代码,根据疫情指数进行预测。

(2)由于为了更准确地找到热销区间,样本选取是根据艾媒咨询披露的2020年疫情前后同比增长率较大的商品,所以销售产品也限于当期热销产品,商家的商品供应还应结合季节、温度、产量等因素作出合理预测。

4.其他影响因素:预测模型较片面地用此次疫情的数据进行可视化,未考虑季节、温度、平台等重要因素。季节决定了当季的时令水果以及消费者的购买倾向,温度会影响到生鲜产品的保存状况,对冷链物流技术的应用程度有较大的偏差。并且,鉴于本研究只抓取了京东生鲜平台的数据进行分析,无法准确地描绘其余结构与模式有别于京东生鲜的平台销售曲线,无法直接应用于各种生鲜电商平台。

七、结束语

本文提出生鲜电商平台预测模型,意在为平台发展规划、风险规避提出建议。然而,生鲜电商行业的发展还需要政府的大力支持和平台内部的创新与突破。岁末年初蔓延至全国各地的新型冠状病毒肺炎,显现了生鲜电商市场的巨大潜力。随着生鲜农产品流通领域政策环境以及电商环境持续向好,生鲜消费加速线上化,生鲜电商将完善在全国范围内的布局。

参考文献:

[1]疫情下生鲜电商成亮点:京东生鲜春节销售同比增长215%,卖出近15000吨生鲜产品[EB/OL].https://www.iimedia.cn/c460/68587.html.

[2]杨泽赟,谷励.疫情冲击下的商业模式嬗变——生鲜电商在疫情中的逆势而上[J].现代营销(经营版),2020(04):116-117.

[3]洪涛.2020上半年中国农产品电商发展报告[J].中国商论,2020(15):1-10.

猜你喜欢
生鲜电商预测模型可视化
数据可视化设计在美妆类APP中的应用
思维可视化
复变函数级数展开的可视化实验教学
复变函数级数展开的可视化实验教学
复变函数共形映射的可视化实验教学
复变函数共形映射的可视化实验教学
生鲜电商配送模式创新探究
生鲜电商冷链物流配送模式研究
基于神经网络的北京市房价预测研究
“互联网+”视角下生鲜电商发展探究