合肥市居民水产品购买偏好及影响因素研究
——以对虾为例

2022-10-17 12:08唐义杰
中国市场 2022年28期
关键词:鲜虾合肥市决策树

唐义杰

(安徽工商职业学院 会计学院,安徽 合肥 231131)

1 前言

近几年随着我国经济发展和人们对于高质量生活的要求,健康饮食观念逐渐影响人们的选购行为,对于营养丰富的水产品的消费也逐渐增加。水产品作为居民消费的主要膳食之一,其消费和生产主要还是在沿海省份。目前对虾养殖尤其是淡水养殖遍布全国,早在2003年我国产量就已是世界第一,但因各地自然条件不同,产量分布比较集中,东南部沿海地区的广东、广西、海南、江苏、浙江、福建、山东等7省份为主要生产基地,内陆地区逐渐开始养殖。在此背景下,国内外很多学者都做了大量实证研究。高金田等人利用面板数据对我国水产品市场的消费需求和供给进行了预测,结果显示水产品作为一种生活必需品,未来其消费市场会进一步增长。蔡孟沿等人选取了三座具有代表性的城市根据调查数据分析了2007—2012年三地区的消费变化。利用描述性统计方法分析了三地区的消费差异,并解释了变化的原因。上述研究都是基于时间序列数据,重点在于分析水产品消费发展变化过程及解释原因。刘瑞新等人将水产品安全问题引入了研究中,同样根据调查数据,分析了江苏省扬州市居民选购水产品时主要考虑安全性和鲜活度。杜卓君以青岛市为例,利用调查数据分析了水产品销售和消费情况后,认为水产品市场需要培养市场认知、强化渠道管理、保证产品质量和提供多元化产品形式。梅新芝以购买行为理论作为基础,通过Logistic回归模型对对虾消费行为数据做了细致的分析,结果表明消费者的个体特征、对产品的了解程度、购买场所及购买频率和购买目的都会对消费者的购买行为产生显著影响。

以上对我国水产品消费市场的研究分析,主要是运用了描述性统计和回归等方法;主要调查对象是沿海主要城市,少有研究内陆省份水产品消费市场。文章主要针对东部新一线城市合肥的水产品消费市场,选定对虾这一特定消费品种,利用设计好的调查问卷,分别走访了合肥市内4个市辖区的主要街道和小区,针对合肥市民进行了抽样调查。主要目的是分析消费者选购冷冻虾制品和鲜虾的行为特征和影响因素,利用R软件通过决策树模型分析了一些显性的影响因素。针对不可观测的潜在影响因素,文章通过因子分析结合聚类分析的方法,找出了5个潜在的影响因子,根据因子得分利用K-means算法将消费者大致分成了5个类别,并结合实际消费行为分析了这5类消费者的不同特征。对了解合肥市水产品消费者行为特点,进一步推动合肥市水产品市场可持续发展具有重要意义。

2 调查结果

本次调查共收集了500份问卷,剔除填写不完整样本后还剩349份调查问卷,回收率69.8%。

其中一个因变量选购种类,自变量围绕被调查者设计了基本信息、消费习惯和消费评价三个变量类型,共计19个自变量,如表1所示。

调查样本数据分布情况如图1、图2所示。可以看到本次主要调查的是30~40岁的青壮年人群,其中城镇人群各收入层级样本量差别不明显,农村户籍的人口中,较低收入人群占比较大。

表1 模型中变量定义

图1 样本数据年龄性别分布

图2 样本数据月收入户籍分布

3 消费者购买行为决策分析

合肥市市场上销售的水产品众多,这里主要研究合肥市居民在选购对虾时,选购鲜虾或冷冻虾的主要决策依据。对于消费者购买行为决策的分析主要选择机器学习中的CART决策树算法。决策树模型是基于树结构进行决策的,一般一棵树由根节点、状态节点和若干叶子节点构成。CART决策树是使用基尼指数计算纯度进而划分属性的。首先根据目标变量“购买种类”的不同取值,分别在不同类别中按照比例抽取调查数据的75%作为训练集数据,剩下的25%作为测试集数据。为了便于解释,决策树的深度设置为4,然后在训练集中训练出模型后应用于测试集中。分别检查训练集的预测错误率为19.847%,测试集的预测错误率为16.092%,说明决策树模型分类效果比较优秀。决策树分析结果如图3所示。

由决策树分析结果可以得出下列规则:①不常在外就餐的人群中,收入较低的女性在大型超市或者网上,一般购买冷冻虾,在海鲜市场或者农贸市场,一般购买鲜虾;②不常在外就餐的人群中,收入较低的男性,一般购买鲜虾;③不常在外就餐的人群中,收入较高者,一般购买鲜虾;④经常在外就餐的人群中,对于价格变化敏感者,在大型超市,一般买冷冻虾,在其他市场买鲜虾;⑤经常在外就餐的人群中,对于价格变化不敏感者,一般购买鲜虾。

图3 决策树分析结果

综合以上规则,消费频率、月收入、性别、购买场所和购买意愿这几个变量对消费者选购行为具有重要影响。决策树的一级决策根节点变量是消费频率,可见当前消费者的消费行为仍受到消费习惯的影响,消费对虾的频率直接影响消费者的购买行为。二级状态节点变量分别是消费者的月收入和购买意愿,可见当前对虾产品对于合肥市居民而言还是可选产品,购买需要综合考虑收入和价格等因素。三级状态节点变量是性别和购买场所,在选购商品中男性更易购买鲜虾,女性则需要考虑其他因素且很容易选择冷冻虾制品。而作为内陆城市——合肥,海鲜水产的购买行为与购买的场所直接相关,大型超市由于完备的冷链物流和保鲜技术,冷冻虾制品更受青睐,而其他海鲜市场人们更加倾向选择鲜虾。

就决策树最终的效果而言,模型最终将调查数据分成了七个组别。通过比较分类结果可知,分类最好的是第一、四、六、七组,占总体样本的64%;分类不是特别好的是第二、三、五组,占总体样本的36%。可见决策树模型输出的规则可以适用比较多的样本数据。就决策树最终分类的类别而言,决策树分析的结果中选择购买鲜虾【类别2】的规则数量有5条,选择购买冷冻虾制品的规则数量有2条,说明消费者在同等条件下选择购买鲜虾的可能性更大。就决策树最终分类结果的决策状态节点个数而言,购买鲜虾的平均状态节点数为2.5个,购买鲜虾的平均状态节点数为1.8个,说明消费者在选购时购买鲜虾的平均思考时间更短,更容易作出决策。综合而言,合肥市居民更偏好购买鲜虾产品。

4 消费者购买行为影响因素分析

为了研究其他影响消费者购买偏好的潜在因子,这里选择因子分析方法对调查数据进行分析。因子分析是一种数据简化技术,可以用少数几个假想变量表示原始数据基本的数据结构。这几个假想变量能够反映原来众多变量的主要信息,原始的变量是可观测的显性变量,而假想变量是不可观测的潜在变量,称为因子。通过图4,可以看到这里选择4个或5个因子对数据进行降维是比较合适的。还可以看出,第1个特征值较大,第2个特征值次之,减小幅度很大,形成一个“陡峭的山坡”,第4个特征值以后都很小,图形趋于平缓,因此选择5个公因子作为变量的降维结果。

图4 因子分析碎石图

这里的因子分析法选择回归方法计算因子得分,选择公因子数量为5,默认使用方差最大化对因子得分进行旋转。经过计算,得到5个公因子在所有19个变量上的因子载荷矩阵,如表2所示。

表2 因子载荷矩阵

通过因子分析,可以得到5个通过变量无法观测到的潜在影响因子,通过因子载荷可以将这5个因子分别命名为认知因子、行为因子、基本因子、习惯因子、爱好因子。进一步还可以根据各因子载荷和方差贡献率计算所有样本的因子得分。根据因子得分的结果,使用K-means聚类分析方法将因子得分矩阵数据大致聚类成了5个类别,如图5所示。

通过观察这5个类别分别在五个因子上的得分情况,其中类1人群在认知因子上最大,在基本因子上最小;类2人群在基本因子上最大,在行为、爱好因子上最小;类3人群在行为因子上最大,在爱好因子上最小;类4人群在基本、习惯、爱好因子上最大;类5人群在认知、行为因子上最小。这里定义最大或最小得分的因子为优势因子,其他因子为劣势因子。结果如表3所示。

图5 聚类分析各类别中心蜘蛛网

表3 消费人群特征描述

由上述消费人群特征描述表可以看出,第一类人群的类中心在认知因子上得分较高,说明这类人对虾制品有较清楚的认识,实际消费中对生鲜产品有明确的要求。但基础因子得分较低,说明此类人群一般收入较低或月收入不高,此类用户需要保持关注。第二类人群的类中心在基本因子上得分较高,说明其基本条件较好,有着较高收入和较好的教育背景。但其行为、爱好因子得分不高,说明此类人群没有养成消费虾制品的习惯和爱好,需要重点挽留。第三类人群的类中心在行为因子上得分较高,说明此类人群精通挑选和网购。但其在爱好因子上得分偏低,说明此类人群还没有形成消费虾制品的爱好,消费频率不高,需要重点发展。第四类人群的类中心在基本、爱好和习惯因子上得分都较高,说明这类人挑选虾制品时更看重自己的爱好和购买习惯,需要继续保持对此类消费者的关注。第五类人群的类中心在认知、习惯、行为因子上得分是最低的,说明此类消费者基本没有意识到虾制品的营养价值,所以在日常消费中几乎不消费虾制品。但是爱好因子得分较高,说明此类用户基本使用虾类即食产品,对鲜虾和冷冻虾几乎不选购。

最后,通过绘制分组堆积柱形图对比五类人群在不同选购人群中的分布情况,如图6所示。可以明显看出,就选购冷冻虾和鲜虾两种不同的选购行为而言,选购冷冻虾的人群更有特点。在选购冷冻虾的人群中,第一类的人群占有较大比重,其他四类人群占比不显著,说明购买冻虾的人群对对虾有更清楚的认知,更清楚自己的实际需求,低收入消费者占有较大比重,可能是相对于鲜虾,冻虾更具价格优势。而购买鲜虾的人群中第一类人群占比也是最大的,但第二、三、四类人群占比显著高于选购冷冻虾的人群,说明选购鲜虾的人群大多有吃鲜虾的习惯、爱好,或是精通网购挑选的人群。

图6 不同购买选择分组堆积柱形

5 结语

文章根据调查数据,首先运用机器学习算法——决策树模型,计算得出了两类选购人群的不同选购规则。其一,同等条件下,合肥市居民更偏爱购买鲜虾。选购冷冻虾制品的消费者需要思考更多的因素,购买鲜虾制品的消费者反而更容易做出选购决策。上述结果和合肥市居民的消费习惯有很大关系,人们普遍更喜欢消费新鲜虾。其二,文章研究发现消费频率、月收入、性别、购买场所和购买意愿五个变量对消费者选购行为起到了重要影响。消费频率直接影响人们的选购行为,可见培养用户消费习惯的重要性。另外收入和购买意愿也对选购产生了较大影响,这与合肥市居民的家庭收入关系较大。其次运用探索性因子分析找到了5个潜在的影响因子,分别是认知因子、行为因子、基本因子、习惯因子、爱好因子。最后根据因子得分数据运用聚类算法,大致将总体分成了5个类别。得出结论:挑选鲜虾的消费者中构成更加多样化,五类消费者相对于冷冻虾更喜欢鲜虾。选购冷冻虾制品的消费者多是因为其价格更具优势。购买鲜虾的消费者占相当大比重,是需要重点发展和重点挽留的人群。所以,合肥市场的鲜虾仍然需要加大宣传力度和宣传手段。

猜你喜欢
鲜虾合肥市决策树
鲜虾烧卖
一种针对不均衡数据集的SVM决策树算法
合肥市朝霞小学
简便快捷式早餐
决策树和随机森林方法在管理决策中的应用
基于决策树的出租车乘客出行目的识别
三只馋猫
基于肺癌CT的决策树模型在肺癌诊断中的应用
合肥市出城口道路设计招标探讨