基于文本挖掘的蚕丝被在线评论分析

2023-08-31 09:59刘佳锴李敏
丝绸 2023年8期
关键词:在线评论文本挖掘蚕丝被

刘佳锴 李敏

摘要: 为挖掘消费者在线购买蚕丝被时的关注因素,文章以京东商城为例分析了蚕丝被商品的品牌信息、价格区间分布、优惠信息和商品标签,使用文本挖掘方法对商品评论进行情感分析和共现聚类分析,并从行业和企业角度提出相关建议。研究结果表明:消费者具有较强的品牌意识,认可蚕丝被的较高价格定位,销量较好的蚕丝被大多带有自营、放心购、闪购和满减等标签;消费者在网络购买蚕丝被时,主要关注产品质量、价格和促销、包装和快递、客服服务四个方面。

关键词: 蚕丝被;文本挖掘;京东商城;在线评论;情感分析;聚类分析

中图分类号: F724.78; TS941.751 文献标志码:  A

文章编号: 10017003(2023)080011-10

引用页码: 081102 DOI: 10.3969/j.issn.1001-7003.2023.08.002

随着科技发展和居民可支配收入的增长,网络购物成为中国消费者习以为常的购物方式,消费者获取产品信息的途径也从传统的口碑传播转变成在线评论,超过75%的消费者在网购前会参考商品评论信息,90%以上的企业则相信评论意见会对消费行为产生决定性作用[1]。在线评论不受调研人员的影响,能真实地反映消费者的内心想法,既为消费者提供参考,也为商家提供优质的反馈信息。在此背景下,大数据逆向牵引的消费模式研究显得尤其重要。

蚕丝被在GB/T 24252—2019《蚕丝被》国家标准中被定义为填充物含蚕丝50%及以上的被类产品,2021年蚕丝被产量达1 340万条,同比增长21.31%,它因具有透气透湿、亲肤保暖等优良性能而受到广大消费者的认可和青睐,是中国丝绸行业发展的支柱产品[2-3]。蚕丝被在学术界也受到广泛关注,相关研究集中在国内,这与中国是茧丝绸的最大生产国及悠久的蚕丝文化密切相关[4],当前研究主要包括三大方向。

1) 以产品为中心,包括从材料生产到回收利用的全过程,如家蚕培育、产品研发和循环利用等。蚕丝性能的差异与结构有关,纤维直径越粗、长度越长、交错网络越多,其整体力学性能越好[5],学者们也通过杂交育种等方法培育出适合不同地区的蚕丝被用家蚕新品种[6-7]。近年来,智能型蚕丝被研发开始受到关注,有学者将温度传感器植入蚕丝被以实现幼童睡眠监护功能[8]。伴随需求增长,蚕丝被废旧弃物也随之增加,如何解决废弃物污染和资源浪费问题是可持续发展的重要议题,对此学者们尝试将蚕丝被废弃物制成再生纤维[9]和生物炭[10]等。这些研究为蚕丝被的研发、应用和再利用等方面提供了有益参考。2) 以质量探讨为重点,包括纺织品检验和标准解读。有纺织品检验工程师就市场抽检或日常检测结果总结了常见的产品问题,如标记不规范、含油率超标和回弹性不佳等[11-12];也有学者通过暖体假人实验或真人评价实验,探讨了不同被子的隔热性能差异和最佳舒适温度[13-14];亦有相关专业人士对国家标准进行解读并提出改进和实施建议[2]。此外,学者们对标准中的检验细节也进行了深入研究,如丝绵长度的鉴别定性方法[15]、含胶率检验装置的改进[16]、填充物纤维含量的取样方法[17]、含油率检测的影响因素[18]等。这些研究为蚕丝被的生产和质量控制提供了指导。3) 以市场分析为导向,通过一手或二手资料来分析消费者和市场。有学者从蚕丝被销售数据推算,认为茧丝绸外销占比下降而内销占比不断上升[19];也有学者基于百度指数分析了公众对蚕丝被的网络关注度变化趋势和消费者画像特征[20]。于永霞等[21]调研发现,与蚕业研究院和超市相比,消费者倾向于在商场和专卖店购买蚕丝被,但该研究只讨论了线下购买渠道。事实上,蚕丝被的电商成交量非常可观,早在2016年阿里巴巴蚕丝被网店的半年营业额就达803万元[22]。了解蚕丝被的消费趋势和消费者偏好对产业和企业规划未来发展和制定营销策略具有重要意义,但目前这方面的研究还相对较少,尤其是“大数据+蚕丝被”方面的研究。

通过文献梳理可知,目前还未有学者从电商大数据逆向牵引角度探讨消费者在购买和使用蚕丝被时的关注因素。因而,本文以京东商城为例采集蚕丝被的销售特征信息和商品评论数据,分析蚕丝被的销售特征并对商品评论进行文本挖掘,探讨消费者在线购买蚕丝被时的关注重点并提出相关建议,从而帮助商家更好地了解消费者需求和市场情况,为电商企业的战略决策提供参考,具有较强的创新性和实用意义。

1 研究方案设计

1.1 研究方法

文本挖掘是指对非结构化文本进行数据挖掘,如情感分析、词频分析和语义网络分析等,该方法被國内外学者广泛应用于评论分析[23-26]。林伟振等[27]分析了亚马逊平台上2款Fitbit产品的在线评论,通过LDA算法自动提取98个主题并人工归类成13个影响顾客满意度的中心主题。Kim等[28]先将42款骑行裤的电商评论按照评分归为正面评论和负面评论,而后通过词云图和共现聚类找到消费者对产品满意和不满意之处。与市场调研法和专家访谈法相比,文本挖掘法可以更方便快速地找出消费者的关注点和偏好,节省时间和人力物力[29]。

1.2 数据采集

京东商城是中国第二大电商平台,拥有广大的客户群体,其在线评论模块较为全面、精细且方便消费者阅读,具有较强的代表性[30]。本文使用Python3.8.5编写程序收集京东商城的蚕丝被数据,首先,以“蚕丝被”为关键词检索并按照销量从高到低排序,获取前500款商品的品牌、价格、优惠、标签、好评率等基本信息。由于蚕丝被的价格与填充蚕丝重量密切相关,且产品信息中通常更强调填充物净重而非被子总重,为后续探讨蚕丝被的单位质量价格,需要依据商品详情手动补充填充物净重数据。其次,为了解蚕丝被商品评论的满意度和关注因素,获取前20款产品的前50页商品评论,共收集评论数据9 264条,记为评论集A(包含正负评论)。经初步分析发现好评数量远多于差评,为后续了解差评原因,继续爬取销量前20名产品的所有差评,共获取数据2 504条,记为评论集B(仅负面评论)。评论集A和评论集B的部分原始数据如表1所示。

1.3 数据预处理

评论数据属于非结构化数据,其中存在大量冗余词汇、表情符号和无效评论,若直接进行分析会导致文本挖掘效果不佳,因而需要对文本进行数据去重、删除短评论、自定义词库、文本分词、去除停用词和同义词替换等预处理[1,31]。经过预处理后,评论集A的有效数据共6 910条,评论集B的有效数据共1 442条。

1.4 数据分析

在完成数据预处理后,本文对商品基本信息进行绘图分析,使用Text Mining 6.0软件(TM 6.0)对评论集A进行情感分析,基于TF-IDF算法分别提取评论集A和评论集B的特征关键词并进行共现聚类分析。

研究思路与技术路线如图1所示。

2 商品销售特征

为了解京东商城的蚕丝被销售特征,本文对销售排名前500款商品的品牌、价格、产品优惠和产品标签等数据展开分析。

2.1 蚕丝被品牌定位

对京东商城的蚕丝被商品进行调研,发现被列入的品牌有恒源祥、富安娜、太湖雪、南极人等超过400个。销量排名前100款商品分别来自31个品牌,各品牌蚕丝被的单位质量价格区间分布如图2所示。品牌内的价格区间跨度较大,主要因为蚕丝被的定价与填充蚕丝的品质紧密相关。品牌间的价格层级明显,蚕丝被品牌定位可分为平价型(150~700元/kg)、中高端型(400~2 500元/kg)、高端型(800~6 000元/kg)和奢华型(2 000~20 000元/kg)。销量排名前20款商品的评论量主要集中在2 000~50 000元/kg,分别来自南极人、水星、恒源祥、富安娜、京东京造、太湖雪、博洋、钱皇和罗莱等知名度较高的品牌,消费者选购蚕丝被时具有较强的品牌意识。

2.2 产品价格区间

如图3(a)所示展示了500款蚕丝被商品在不同价格区间的分布情况,分布数量最多的前4个区间依序为:1 000~1 500元/kg,500~1 000元/kg,1 500~2 000元/kg和2 000~2 500元/kg。图3(b)为该500款商品的价格散点图,可知单位质量价格平均值约为2 000元/kg,其中纯桑蚕丝被价格最高,纯柞蚕丝被次之,混合蚕丝被价格最低。混合蚕丝被仅仅占总数的10%,可见消费更倾向于购买纯蚕丝被商品;此外,销量排名在前300的纯桑蚕丝被价格明显高于300名往后的。由此可見,消费者认可蚕丝被的较高价格定位,相对于价格而言他们在购买时可能更关注产品质量或其他因素。

2.3 产品优惠情况

满减、商品券、会员价、赠送礼品和折扣是常见的优惠形式。在500款产品中,有155款可以满200减30元(因占比太高未呈现于图4(a),大多数满减条件低于1 000元,满减优惠在10~400元不等);大部分商品券的用券条件也在1 000元以内,但是优惠主要集中在5~200元(图4(b)),商品券的优惠力度低于满减;京东PLUS会员可享会员价,优惠5~150元;赠品主要有蚕丝眼罩、枕头、被子洗护服务等;折扣主要有单件9折、8折、6折或5折,两件9折或8.8折。

2.4 产品标签占比

本文分别统计销量前100和前500名蚕丝被商品的标签占比,以研究高销量商品和整体商品的标签差异,如图5所示。高销量蚕丝被的自营、放心购和闪购标签比例高于整体水平;满减、厂家配送、商品券、会员价、赠品和折扣标签比例与整体差别不大;免邮标签比例低于整体水平。总体来看,自营、放心购、满减和闪购对购买有一定的促进作用。京东自营店铺有较好的口碑形象,放心购提供运费险或闪电退款等服务,闪购促销及满减促销意味着价格优惠,此类标签可以满足消费者追求价格优惠的心理或降低感知风险进而促进购买。

3 文本评论分析

为进一步探索蚕丝被在线评论中所蕴藏的信息、了解网络消费者对蚕丝被的评价和关注点,本文采用情感分析探索消费者对现有蚕丝被商品的满意度,采用词频分析和共现聚类分析探讨消费者的关注重点。

3.1 情感分析

评论集A的情感分析得分如图6所示,情感得分在0到1之间,以0.5为分界点,越接近1表示评论越积极,越接近0表示评论越消极。情感得分高于0.5的评论约占95%,而相关商品在平台上的平均好评度为97%。由此可见,大部分消费者对热销的蚕丝被商品比较满意。

有学者认为负面评论比中立、正面评论更能影响消费者的决策,差评会增加感知风险和负面预期进而降低购买意愿[32]。聂爽爽等[23]使用语义网络关联法对跨境电商平台销量前60款连衣裙的所有评论和负面评论分别进行研究,挖掘了跨境电商消费者购买连衣裙时的偏好、关注因素及负面评论的主因。为了解消费者在线购买蚕丝被时的关注点和差评的主要影响因素,本文将分别对评论集A和评论集B展开分析。

3.2 特征关键词

本文在分词时使用的停用词表主要来源于哈尔滨工业大学停用词表和四川大学停用词表,并补充“蚕丝被”“被子”以及品牌名称等自定义停用词。通过停用词表可以去除大部分高频且研究意义不大的干扰词,但无法保证所有无意义的高频词汇都被剔除,对此,学者们通常会在文本挖掘时引入TF-IDF算法。TF-IDF(Term Frequency-Inverse Document Frequency)算法在词频的基础上考虑词汇的逆文本频率,能更好地衡量词汇在数据集中的重要性,保证提取的关键词能有效代表评论文本[1,27,33-34]。本文使用TM 6.0软件的TF-IDF算法分词功能提取评论文本的特征关键词,并基于分词结果绘制词云图,如图7所示。

评论集A存在较多“很好”“不错”“满意”和“喜欢”一类的情感词,可见消费者整体对所购产品和服务感到满意。消费者主要关注点集中在“包装”“做工”“柔软”“舒服”“京东”“品牌”“面料”“物流”“暖和”“子母被”等方面。评论集B的高频词主要有“味道”“客服”“京东”“差评”“蚕丝”“不好”“不是”“包装”“价格”“降价”等,其中“味道”和“客服”占比非常高。

3.3 聚类分析

词云图可以呈现消费者所关注的主要因素,但是无法展示因素之间的关联。为深入探索其中的主题分布,本文使用TM6.0软件对分词后的文本进行共现聚类,该聚类的原理是:两个关键词共同出现的频率越高则表示它们的关系越密切,更容易被聚成一类。

3.3.1 整体评论的聚类分析

评论集A的聚类结果如表2和图8所示,消费者的评论内容包括6个主题。1) 功能质量:消费者比较关注蚕丝被的保暖性、透气性和实用性等整体特征,其中子母被的设计颇受消费者喜爱,子母被由薄厚两条被子组成,可以根据季节和自身需求调节被子的厚度,方便且实用。2) 外在品质:消费者对蚕丝被的面料非常讲究,关注做工是否精细、款式是否好看、触感是否柔软舒适,对被套质量的预期较高。3) 内在品质:许多购买者会通过拉链检测口来观察内部填充蚕丝的味道和丝绵长度,从而判断填料质量好坏。4) 价格促销:京东商城上常有优惠活动,消费者虽然认可蚕丝被的高价格定位但在购买时仍会货比三家,倾向于选择既有品牌背书又物美价廉的产品。5) 快递服务:消费者整体上对京东购物的物流速度和服务态度非常满意。6) 满意度:不少消费者表示会回购,或者已经二次甚至多次购买,并乐意推荐给朋友、同事或家人。

整体而言,消费者在线购买蚕丝被时重点关注产品质量(面料填料的品质和整体的功能质量)、价格促销和快递服务,这些因素会影响消费者的购物满意度、回购意愿及推荐意愿。

3.3.2 负面评论的聚类分析

评论集B的聚类结果如表3、图9所示,差评内容包括8个主题。1) 功能质量:少数消费者认为所购蚕丝被的保暖性不好。2) 外在品质:部分消费者认为面料不佳且做工粗糙,产品质量缺乏保障。3) 内在品质:许多消费者表示蚕丝被里面散发浓郁刺鼻的味道,因而质疑蚕丝的品质和真假。实际上,异味可能是质量问题导致的,也有可能是正常加工工艺引起的,如柞蚕丝通常需要用氧漂工艺处理使得外观更白亮,酸味大多来自工业双氧水;桑蚕丝在加碱脱胶之后一般加入醋酸中和pH值,酸味来自醋酸。4) 价格促销:一部分消费者因为无法退差价而不满,这表面上是因为缺少保价服务,但本质上是由于商品的标价改动及促销活动过于频繁。5) 产品包装:有评论提及产品包装过于简陋、影响购物体验,包装与价格定位不匹配。6) 产品宣传:少数评论提到实物与图片不符,部分店铺可能夸大宣传。7) 客服服务:消费者同样表达了对客服的不满,因为部分客服回应态度冷漠而强硬、回复时间缓慢。8) 满意度:消费者认为自己遇到无良商家,表示再也不愿意购买该店铺产品并呼吁大家不要上当受骗。

总体上看,差评的影响因素包括产品质量(面料填料的品质和整体的功能质量)、价格促销、产品包装、产品宣传及客服服务。

4 蚕丝被网购满意度分析

对评论集A和评论集B的分析结果进一步归类,可将蚕丝被网购满意度的影响因素划分为产品质量、价格和促销、包装和快递、客服服务四个方面。1) 产品质量方面:包括功能质量(整体的保暖性、透气性和实用性)、外在品质(被套的工艺、款式和手感)和内在品质(填充物的气味和丝绵长度)。产品是品牌的物质基础,品牌应当严格做好质量管控,保证商品图文信息的真实性,同时也要注意向消费者普及“蚕丝被的酸味来源”“蚕丝被的洗护方式”“蚕丝被的使用温度”等基础知识。2) 价格和促销方面:主要关注产品折扣和保价服务,虽然消费者对蚕丝被的高价定位接受度很高,但他们在购买时仍非常注重促销折扣优惠,然而频繁促销加上没有保价服务容易让错失优惠的消費者感到不满。尽管降价可以提升短期销量,但不建议商家频繁地修改价格以免折损品牌形象。3) 包装和快递方面:消费者对快递速度比较满意但认为包装过于简陋,与价格定位不符,商家应当改进产品包装和快递包装细节。4) 客服服务方面:客服人员在网络购物过程中起着非常重要的作用,消费者在购买前通常会向客服咨询,在购买后可能因对产品不满意而联系客服退货,客服的回应方式不妥或不及时则会降低顾客的购物体验。因此,客服人员需要熟知产品信息和售前售后流程中潜在问题的应对方式,保证良好的服务态度和服务水平。

5 结 语

本文以京东商城为例对蚕丝被的品牌、价格、产品优惠和产品标签进行分析,总结了蚕丝被的电商销售特征,同时对商品评论进行情感分析和聚类分析,挖掘消费者的关注因素和差评原因,并提出相关建议。

1) 消费者有较强的品牌意识,认可蚕丝被的较高价格定位,但更青睐有优惠活动的商品。最常见的促销方式是满减和优惠券,同时销量较好的蚕丝被大多带有自营、放心购、闪购和满减等标签。

2) 大部分消费者对蚕丝被的网络购买体验感到满意,且良好的购买和使用体验可以促进回购和推荐意愿。消费者在购买时最为关注产品质量、价格和促销、包装和快递、客服服务四个方面,负面评论的原因包括产品异味、价格波动大且没有保价服务、包装简陋、保暖性欠缺、面料和做工差、图片和实物不符及服务态度不佳等。对此,企业仍需加强品牌建设,行业要进一步完善相关检测标准和监督规范。

3) 在线评论信息已成为消费者购买前了解和对比商品的重要途径,在传播信息透明化的时代,蚕丝被行业和相关企业要科学把握机遇与挑战。一方面,行业应当完善相关标准和监督体系,普通消费者作为非专业人员不一定能判断出蚕丝的品质是否合格,为保障消费者的权益及产业的可持续发展,行业应当完善蚕丝被检测体系并定期或不定期抽检,加强监督和管理,对信誉较差的企业和产品应给予严厉打击和限期整改,从源头上保障蚕丝被质量。另一方面,品牌应当注重品质把控和品牌建设,品牌信誉需要建立在产品和服务之上,企业应当做好品质把关、注重产品包装、避免夸大宣传、避免频繁的价格波动、加强对客服人员的培训等,为消费者提供良好的消费体验,从而增强品牌口碑和消费者黏性。

本文还存在不足之处,首先由于商品评论的自身特点和现有分析技术的限制,本文的分析结果中与产品质量相关的指标还不够细化;其次,本文仅以京东商城为例,未探讨不同电商平台之间的蚕丝被销售特征和消费者评论有何差异,以及线上线下的消费者关注点有何不同;第三,由于平台的用户隐私保护机制,在线评论难以直接和消费者画像建立关联。未来研究可通过访谈法或问卷法深入探讨消费者所关注的产品质量指标,以及性别、年龄、地域、购买渠道等不同因素对蚕丝被购买的影响。

参考文献:

[1]毕达天, 楚启环, 曹冉. 基于文本挖掘的消费者差评意愿的影响因素研究[J]. 情报理论与实践, 2020, 43(10): 137-143.

BI Datian, CHU Qihuan, CAO Ran. Research on the influencing factors of consumers’ bad comment intention based on text mining[J]. Information Studies: Theory & Application, 2020, 43(10): 137-143.

[2]伍冬平, 周颖, 李鹏, 等. 《蚕丝被》国家标准修订解析及实施建议[J]. 丝绸, 2020, 57(3): 1-6.

WU Dongping, ZHOU Ying, LI Peng, et al. Analysis and implementation suggestions on the revision of the national standard of Silk Quilt[J]. Journal of Silk, 2020, 57(3): 1-6.

[3]劉文全, 柳恩见. 中国丝绸行业2021年运行分析及2022年展望[J]. 丝绸, 2022, 59(7): 1-6.

LIU Wenquan, LIU Enjian. Analysis on operation of Chinese silk industry in 2021 and prospect in 2022[J]. Journal of Silk, 2022, 59(7): 1-6.

[4]李建琴, 顾国达, 何樟勇, 等. 中国茧丝绸产业区域布局与发展重点[J]. 蚕业科学, 2018, 44(6): 936-946.

LI Jianqin, GU Guoda, HE Zhangyong, et al. Regional distribution and developing emphasis of China’s cocoon silk industry[J]. Acta Sericologica Sinica, 2018, 44(6): 936-946.

[5]陈芳艳, 潘世俊, 盛家镛, 等. 双宫丝绵纤维的性能检测[J]. 丝绸, 2018, 55(1): 9-13.

CHEN Fangyan, PAN Shijun, SHENG Jiayong, et al. Performance detection of duppion silk floss fiber[J]. Journal of Silk, 2018, 55(1): 9-13.

[6]张凤林, 周丽霞, 王安皆, 等. 蚕丝被用家蚕品种鲁41×鲁42的育成[J]. 蚕业科学, 2022, 48(2): 118-126.

ZHANG Fenglin, ZHOU Lixia, WANG Anjie, et al. Breeding of silkworm variety Lu 41×Lu 42 for silk quilt[J]. Acta Sericologica Sinica, 2022, 48(2): 118-126.

[7]何秀玲, 杜鑫, 姚陆松, 等. 蚕丝被生产专用家蚕新品种丝棉1号的选育[J]. 蚕业科学, 2021, 47(4): 328-334.

HE Xiuling, DU Xin, YAO Lusong, et al. Breeding of new silkworm variety Simian 1 specialized for silk quilt production[J]. Acta Sericologica Sinica, 2021, 47(4): 328-334.

[8]黄阳阳, 刘伟, 华英, 等. 幼童用智能示警蚕丝被的研发[J]. 纺织学报, 2020, 41(10): 150-157.

HUANG Yangyang, LIU Wei, HUA Ying, et al. Development of novel intelligent silk quilt for young children[J]. Journal of Textile Research, 2020, 41(10): 150-157.

[9]ZHANG X, PAN Z J. Preparation and formation mechanism analysis of regenerated silk fibroin/polyvinyl alcohol blended fibers with waste silk quilt[J]. Fibers and Polymers, 2022, 23(8): 2090-2102.

[10]计海洋, 汪玉瑛, 吕豪豪, 等. 不同炭化温度制备的蚕丝被废弃物生物炭对重金属Cd2+的吸附性能[J]. 应用生态学报, 2018, 29(4): 1328-1338.

JI Haiyang, WANG Yuying, L Haohao, et al. Cadmium adsorption by biochar prepared from pyrolysis of silk waste at different temperatures[J]. Chinese Journal of Applied Ecology, 2018, 29(4): 1328-1338.

[11]李胜臻, 徐建东. 蚕丝被内在质量的分析及探讨[J]. 纺织导报, 2014(6): 153-155.

LI Shengzhen, XU Jiandong. Analysis and discussion of the intrinsic quality of silk quilts[J]. China Textile Leader, 2014(6): 153-155.

[12]汪为华. 蚕丝被检测中的质量问题及对策[J]. 上海纺织科技, 2014, 42(4): 15-17.

WANG Weihua. Problems and countermeasures in quality detection of silk quilt[J]. Shanghai Textile Science & Technology, 2014, 42(4): 15-17.

[13]LU Y H, NIU M M, SONG W F, et al. Investigation on the total and local thermal insulation of the bedding system: Effects of filling materials, weights and body postures[J]. Building and Environment, 2021, 204: 1-10.

[14]ZHENG Q, YAN F Y, WANG H B, et al. Effects of quilts on comfortable indoor temperatures and human thermal responses during sleep[J]. Indoor Air, 2022, 32(9): 1-11.

[15]張惠芳, 姚伟慧, 何波, 等. 标准解读: 蚕丝绵纤维长度试验方法解析[J]. 丝绸, 2022, 59(3): 150-154.

ZHANG Huifang, YAO Weihui, HE Bo, et al. Standard interpretation: Analysis on the test method for fiber length of silk floss[J]. Journal of Silk, 2022, 59(3): 150-154.

[16]苏日娜. 半自动机制桑蚕丝绵片含胶率检验装置的设计探索[J]. 丝绸, 2019, 56(4): 8-11.

SU Rina. Exploration on design of semi-automatic detection device for gum content of silk floss[J]. Journal of Silk, 2019, 56(4): 8-11.

[17]方方. 被服产品填充物纤维含量取样方法分析与改进[J]. 上海纺织科技, 2015, 43(8): 86-90.

FANG Fang. Analysis and improvement of sampling methods of filling fiber content for quilts products[J]. Shanghai Textile Science & Technology, 2015, 43(8): 86-90.

[18]楼陈钰. 蚕丝被填充物含油率检测影响因素的探讨[J]. 上海纺织科技, 2017, 45(7): 13-15.

LOU Chenyu. Influencing factors discussion in oil content measure of silk quilts[J]. Shanghai Textile Science & Technology, 2017, 45(7): 13-15.

[19]何樟勇, 李建琴, 顾国达, 等. 中国蚕丝供求测算与预测研究[J]. 蚕业科学, 2020, 46(3): 356-366.

HE Zhangyong, LI Jianqin, GU Guoda, et al. Calculation and prediction of silk supply and demand in China[J]. Acta Sericologica Sinica, 2020, 46(3): 356-366.

[20]何松涛. 基于百度指数的蚕丝被网络关注度分析[J]. 丝绸, 2018, 55(5): 1-7.

HE Songtao. Analysis on internet attention of silk quilt based on Baidu Index[J]. Journal of Silk, 2018, 55(5): 1-7.

[21]于永霞, 余武昌, 邱长玉, 等. 广西消费者对蚕丝被的认知及市场需求调查报告[J]. 丝绸, 2014, 51(10): 75-79.

YU Yongxia, YU Wuchang, QIU Changyu, et al. A survey of consumers’ congnition of silk quilt and market demands in Guangxi[J]. Journal of Silk, 2014, 51(10): 75-79.

[22]黎文平, 谢安, 张显峰, 等. 安康茧丝绸产业融入“一带一路”建设的发展建议[J]. 北方蚕业, 2016, 37(1): 50-53.

LI Wenping, XIE An, ZHANG Xianfeng, et al. Suggestions on integrating Ankang cocoon and silk industry into “One Belt and One Road” construction[J]. North Sericulture, 2016, 37(1): 50-53.

[23]聂爽爽, 王维红. 基于文本挖掘的速卖通平台女性消费者连衣裙偏好分析[J]. 现代纺织技术, 2021, 29(6): 113-121.

NIE Shuangshuang, WANG Weihong. Research on female consumers’ dress preference on AliExpress based on text mining[J]. Advanced Textile Technology, 2021, 29(6): 113-121.

[24]XIAO Y, LI C D, THURER M, et al. User preference mining based on fine-grained sentiment analysis[J]. Journal of Retailing and Consumer Services, 2022, 68(9): 103013.

[25]DARKO A P, LIANG D C. Modeling customer satisfaction through online reviews: A FlowSort group decision model under probabilistic linguistic settings[J]. Expert Systems with Applications, 2022, 195(6): 116649.

[26]WU Z Z, HE Q F, LI J R, et al. Public attitudes and sentiments towards new energy vehicles in China: A text mining approach[J]. Renewable and Sustainable Energy Reviews, 2023, 178: 113242.

[27]林偉振, 刘洪伟, 陈燕君, 等. 基于在线评论的顾客满意度研究: 以健康监测穿戴产品为例[J/OL]. 数据分析与知识发现: 1-15[2022-09-23]. https://kns.cnki.net/kcms/detail/10.1478.G2.20220714.1910.008.html.

LIN Weizhen, LIU Hongwei, CHEN Yanjun, et al. Costomer satisfaction modeling for healthcare wearable devices through online reviews[J/OL]. Data Analysis and Knowledge Discovery: 1-15[2022-09-23]. https://kns.cnki.net/kcms/detail/10.1478.G2.20220714.1910.008.html.

[28]KIM C, NA Y. Consumer reviews analysis on cycling pants in online shopping malls using text mining[J]. Fashion and Textiles, 2021, 38(8): 1-21.

[29]孙宝生, 敖长林, 王菁霞, 等. 基于网络文本挖掘的生态旅游满意度评价研究[J]. 运筹与管理, 2022, 31(12): 165-172.

SUN Baosheng, AO Changlin, WANG Jingxia, et al. Evaluation of ecotourism satisfaction based on online text mining[J]. Operations Research and Management Science, 2022, 31(12): 165-172.

[30]郭莉, 李杰. 消费者危机感知风险对在线评论效果的影响[J]. 东北大学学报(自然科学版), 2022, 43(11): 1662-1672.

GUO Li, LI Jie. Impact of consumers’ perception of crisis risks on the effect of online reviews[J]. Journal of Northeastern University (Natural Science), 2022, 43(11): 1662-1672.

[31]FAN Z P, CHE Y J, CHEN Z Y. Product sales forecasting using online reviews and historical sales data: A method combining the Bass model and sentiment analysis[J]. Journal of Business Research, 2017, 74: 90-100.

[32]王阳, 王伟军, 刘智宇. 在线负面评论信息对潜在消费者购买意愿影响研究[J]. 情报科学, 2018, 36(10): 156-163.

WANG Yang, WANG Weijun, LIU Zhiyu. An empirical study on the influence of online negative reviews on potential consumers’ purchasing intention[J]. Information Science, 2018, 36(10): 156-163.

[33]张公让, 鲍超, 王晓玉, 等. 基于评论数据的文本语义挖掘與情感分析[J]. 情报科学, 2021, 39(5): 53-61.

ZHANG Gongrang, BAO Chao, WANG Xiaoyu, et al. Text semantic mining and sentiment analysis based on review data[J]. Information Science, 2021, 39(5): 53-61.

[34]TESO E, OLMEDILLA M, MARTINEZ-TORRES M R, et al. Application of text mining techniques to the analysis of discourse in eWOM communications from a gender perspective[J]. Technological Forecasting and Social Change, 2018, 129(4): 131-142.

Analysis of online reviews about silk quilts based on text mining: A case of Jingdong Mall

ZHANG Chi, WANG Xiangrong

LIU Jiakaia, LI Mina,b

(a.College of Fashion and Design; b.Key Laboratory of Clothing Design and Technology, Ministry of Education,Donghua University, Shanghai 200051, China)

Abstract: Silk quilts, made from natural animal protein fibers, are always highly favored by consumers due to their advantages, such as softness, coziness, breathability, hygroscopicity, skin-friendliness, and warmth. They are essential products making contributions to the development of the silk industry. With the rapid development of the internet and the steady growth of residents’ disposable income, online shopping has become one of the daily shopping channels for Chinese consumers in recent years. Many silk quilt brands have also expanded their e-commerce channels, resulting in the emergence of many silk quilt household brands on e-commerce platforms such as Jingdong and Taobao. During the online shopping process, consumers usually refer to the reviews left by other consumers on the product comment page to obtain information related to the product or service. For consumers, online reviews can assist in their purchasing decisions, while for businesses and enterprises, online reviews can be used to understand consumer concerns and satisfaction, thereby better improving product quality and service quality.

To explore consumers’ satisfaction, concerns, and reasons for dissatisfaction when purchasing silk quilts online, we first took Jingdong Mall as an example to collect sales characteristic information and product review data of silk quilts (including positive and negative review set A and negative review set B). Then we analyzed the brand information, price distribution, preferential information, and labels of silk quilt products by graphics, and later conducted emotional analysis and co-occurrence cluster analysis of reviews using text mining methods. Finally, we discussed the reasons based on reality, and proposed relevant suggestions from the perspective of industry and enterprise. According to the analysis of sales characteristics, we can see that the price of silk quilts ranges from several hundred yuan to over ten thousand yuan, with an average price of about 2 000 yuan. The price range within the brand is quite extensive, and the price hierarchy between brands is also obvious. Silk quilt brands can be divided into four categories: affordable, mid-to-high-end, high-end, and luxury ones. The most common promotional methods are money off and coupons, and silk quilts with good sales are often labeled with such words as self-operated, assured purchase, flash purchase, and money off. According to the text mining results, it can be seen that about 95% of the reviews are positive, and consumers pay the most attention to four aspects when purchasing: (i) product quality, which is divided into functional quality (overall warmth retention, breathability, and practicality), external quality (craftsmanship, style, and handle of quilt cover), and internal quality (inner odor and silk floss length); (ii) price and promotion; (iii) packaging and express delivery; (iv) customer service. The main reasons for negative comments include product odors, volatile price fluctuations without insurance services, poor packaging, inadequate warmth retention, poor fabrics and workmanship, discrepancies between images and actual products, and poor service attitude. On the whole, consumers who purchase silk quilts online have strong brand awareness and recognize the higher price positioning of silk quilts, but prefer products with preferential activities. Most consumers are satisfied with their online purchase experience of silk quilts, and a good purchase with good use experience can promote repurchase and recommendation intentions. However, there are still deficiencies in products, promotions, packaging, express delivery, services, and other aspects. Enterprises still need to strengthen branding, and the industry ought to further improve relevant testing standards and regulatory norms.

We discuss the key points that consumers pay attention to when they buy silk quilts online from the perspective of e-commerce big data reverse traction, and put forward relevant suggestions. This helps businesses better understand consumer demand and market conditions, which provides reference for e-commerce enterprises’ strategic decision-making. Thus, this article is of strong innovation and practical significance. In future research, we could use interview or questionnaire to deeply explore the product quality indicators that consumers care about, as well as how different factors such as gender, age, region and channels affect the purchase of silk quilts.

Key words: silk quilt; text mining; Jingdong Mall; online review; sentiment analysis; cluster analysis

收稿日期: 20220929;

修回日期: 20230710

基金项目: 上海高校知识服务平台资助项目(13S107024);上海市设计学Ⅳ类高峰学科资助项目(DD18005)

作者简介: 刘佳锴(1998),女,硕士研究生,研究方向为服装产业经济与品牌营销管理。通信作者:李敏,教授,fidlimin@dhu.edu.cn。

猜你喜欢
在线评论文本挖掘蚕丝被
蚕丝被产业发展及其关键质量性能指标分析
浅谈蚕丝被的检测技术
链接:蚕丝被清洁与保养
数据挖掘技术在电站设备故障分析中的应用
基于LDA模型的95598热点业务工单挖掘分析
在线评论情感属性的动态变化
从《远程教育》35年载文看远程教育研究趋势
慧眼识璞玉,妙手炼浑金
消费者个体行为偏好对在线评论真实性的影响机理研究
蚕丝被行业的开拓者