基于在线评论和集成独立子空间的移动应用采用预测研究

2023-08-14 16:02沈旺时倩如李贺孙晓琦
现代情报 2023年8期
关键词:在线评论移动应用预测

沈旺 时倩如 李贺 孙晓琦

摘 要: [目的/ 意义] 对现有移动应用用户采用预测方法进行优化, 为移动应用开发商和发行商提供决策依据。[方法/ 过程] 从应用商店采集在线评论, 抽取移动应用产品信息特征, 利用独立子空间方法进行特征采样和特征重要性评估, 然后结合MLR、CART、ANN 和SVR 算法对移动应用的用户采用趋势进行预测。[结果/结论] 本文提出的基于独立子空间的集成方法在评估输入特征的重要性上表现更佳, 且能够准确地预测移动应用用户采用趋势。研究结论能够为移动应用开发商、发行商和应用商店运营人员提供决策依据。

关键词: 移动应用; 预测; 在线评论; 独立子空间

DOI:10.3969 / j.issn.1008-0821.2023.08.010

〔中图分类号〕G254 9 〔文献标识码〕A 〔文章编号〕1008-0821 (2023) 08-0102-12

移动互联网时代, 移动应用程序(Mobile Ap⁃plication, 简称APP)成为用户获取互联网服务的重要载体, 渗透到人们生活的方方面面。根据中国互联网络信息中心发布的第49 次《中国互联网络发展状况统计报告》, 截至2021 年12 月, 我国手机网民规模达10 29 亿, 网民使用手机上网的比例为99 7%, 国内市场上监测到的APP 数量为252万款[1] 。

应用宝、华为应用商店和小米应用商店等应用商店是移动应用的主要分发渠道。随着竞争加剧,市场的饱和程度不断提高, 人口红利消耗殆尽, 移动应用用户增长速度已经放缓。如何在激烈的竞争中挖掘和获取用户, 提高自身的竞争力, 并为用户提供最契合其需求的服务, 成为开发者和应用商店共同面临的迫在眉睫的问题。预测用户的采用趋势能够帮助开发商改进产品、掌握其产品生命周期演化过程以及做出运营决策。同时, 还有助于应用商店优化产品推荐、产品管理和挖掘潜在商机。

现有的针对应用程序的研究主要包括发展现状分析[2] 、创新挖掘[3] 和用户使用意愿分析[4] 等, 对应用程序用户采用趋势的分析与预测较少。软件产品属于体验型商品, 消费者很难事先获知其真实质量。应用商店可以讓用户搜索、购买和安装移动应用, 并且以评论和评分的形式提供反馈。在线评论在解决消费者决策过程中的信息不对称问题上发挥了重要的作用[5] , 对于用户、开发商和应用商店运营人员都具有重要的意义。因此, 本文以移动应用用户采用趋势为研究对象, 挖掘用户在线评论观点, 引入独立子空间特征评价算法, 优化现有的移动应用用户采用预测方法, 为服务提供商提供决策依据。

1 文献综述

1 1 在线评论对用户决策的影响相关研究

在线评论是消费者获取产品信息和辅助购买、采纳等决策的重要信息来源。国内外研究者集中探讨了评论数量和效价对用户决策的影响。首先, 评论数量显示了产品受欢迎的程度, 对产品销售有显著影响[6] 。Cui G 等[7] 考察了在线评论对电子产品和视频游戏销售的影响, 发现评论数量对新产品的早期销售影响较大; 其次, 在线评论效价反映用户对产品的态度倾向[8] , 通常以用户评分的平均值形式来表现, 可以分为积极、消极和中立3 种类型[8] 。关于在线评论效价与用户采纳之间的关系, 现有的研究存在不一致的结论。部分学者认为在线评论用户评分正面影响用户采纳[9] , 也有学者认为两者没有显著关系, 因为用户评分不能完全代表用户的情感[10]。

除了对在线评论数量和效价等基本特征的研究外, 还有学者聚焦在线评论中具体的产品属性。如,手机的属性有屏幕分辨率、存储和电池等。Kang Y等[11] 提出了一种基于规则的方法, 从消费者在线评论中识别不同类型的特征, 以帮助优化产品的个性化推荐和营销。Mirtalaie M A 等[12] 提出针对目标特征的情感聚合框架SA-TF, 使用在线数据评估客户对产品的接受程度。沈超等[13] 利用时间序列分析模型预测了客户对13 个汽车产品属性的关注度和情感倾向的趋势变化。

应用商店在线评论中包含了用户对移动应用的功能、玩法、交互等属性的评价和期许, 为软件开发者和应用商店提供了真实、优质的反馈信息。因此, 本文尝试通过应用商店在线评论来预测移动应用用户的未来采用趋势。

1 2 移动应用用户采用预测相关研究

由于APP 的使用人数并非公开数据, 难以获取, 移动应用用户采用趋势预测的研究一般使用下载量、排名等具体的指标作为采用人数的替代指标。Pagano D 等[14] 发现, 应用商店中的评论对移动应用下载量有显著影响。Wang Y 等[15] 考虑随着时间演变的产品之间的多层次竞争关系, 提出了进化层次竞争模型EHCM, 来预测应用下载数据。Zhu HS 等[16] 利用应用商店中移动应用排行榜、用户评分和评论数据, 提出了一种基于流行度的隐马尔可夫模型(PHMM), 对移动应用的流行度信息进行建模。通过统计分析Blackberry 应用商店的数据,Finkelstein A 等[17] 发现, 应用商店评分和应用的下载排名之间存在很强的相关性, 并且应用价格和评分存在相关性。黄竞瑶[18] 使用应用商城的每日下载量, 建立了ARIMA 模型, 预测移动应用的未来下载趋势。张艺璇等[19] 引入注意力机制, 解释时间层级、局部特征和全局特征层级的特征相关性,提出深度神经网络模型DeePOP, 预测移动应用的动态流行度。

现有针对应用采用趋势的研究未能充分利用在线评论中用户对产品不同属性的态度等有用信息。此外, 常用的预测方法分为基于统计学习的方法和基于机器学习的方法。总的来说, 基于机器学习的预测方法预测性能更好, 但其“黑箱” 的性质使其无法评估输入特征的重要性。如何在保证预测性能的前提下, 对输入特征进行评价, 仍然需要进一步的研究。为解决上述问题, 本研究尝试提出一种基于在线评论和集成独立子空间的移动应用采用预测方法。

2 基于在线评论和集成独立子空间的移动应用采用预测方法

本研究提出的预测方法总体流程如图1 所示。首先从应用商店采集移动应用在线评论和产品信息,从产品联运方获取产品评级信息。在数据预处理后,抽取在线评论基本特征、产品属性特征和产品特征,然后使用独立子空间方法和随机子空间方法进行特征重要性评价。最后结合MLR、CART、ANN 和SVR算法进行移动应用采用趋势预测。根据报告[1] , 游戏类APP 占我国全部APP 比重的28 2%, 位列第因此, 在本文选用游戏类APP 作为分析对象。

2 1 移动应用采用预测特征指标抽取

2 1 1 在线评论基本特征

1) 基本特征指标。用户在线评论通常包括评分和评论内容。评分反映了用户对产品的整体满意程度, 评论内容则更为完整地表达用户对产品的情感、态度和感受。本文将应用商店中用户评分和评论内容的情感作为在线评论基本特征, 其中评论情感使用积极、中立和消极的评论数量和评论率来衡量, 如表1 所示(p=0,1,2,3)。

2) 基本特征抽取。文本情感识别方法主要有基于词典的方法、基于机器学习的方法和混合方法。長短期记忆神经网络(LSTM)模型[20] 是循环神经网络RNN 的变体, 能更好地解决梯度消失问题,在文本情感分析领域得到了广泛的应用[21-22] 。本文使用基于LSTM 的情感分类模型, 将在线评论分为积极、中立和消极3 类。过程如下:

①预处理: 对采集到的在线评论进行分句, 然后进行去重、删除不完整数据、去除无意义的符号与表情、去停用词等数据清洗工作。

②分词: 使用结巴分词来对文本进行分词处理。

③词向量训练: 本文选取了维基百科中文语料库来进行词向量的训练, 将语料库进行化繁为简和分词等处理后, 利用Word2vec 进行词向量训练。

④LSTM 情感分类: 使用词向量模型构建句向量, 将句向量输入LSTM 训练获得LSTM 情感分类模型。最后, 利用该模型对应用商店在线评论文本进行情感分类。

2 1 2 在线评论产品属性特征

1) 在线评论产品属性特征识别。识别评论文本中的产品属性, 可以帮助开发者和应用商店了解用户的关注点和相应的情感倾向。潜在狄利克雷分布(LDA)[23] 是经典的主题挖掘模型, 已经应用于各种文本挖掘任务[24-26] 。因此, 本研究使用LDA识别应用商店在线评论中用户关注的产品属性。

在对评论文本进行挖掘之前, 需要确定主题的数量。主题数量过少会使结果缺少解释性, 而主题数量过多则会导致主题分布过于分散。一般而言,当困惑度—主题曲线趋于平缓时, 说明主题数的边际效应减少, 以拐点作为相应的主题数目最为合适。困惑度—主题数量曲线如图2 所示, 当主题数为9时, 曲线趋于平缓。因此, 将应用商店在线评论产品属性主题数设置为9, 相应关键词如表2 所示。

表2 的9 个主题中, 主题1、主题7 和主题9的关键词主要与游戏的玩法有关, 主题2 和主题4的关键词主要与游戏的美术有关, 主题5 主要与游戏的配音有关, 主题3 和主题8 的关键词主要与游戏的付费情况有关, 而主题6 的关键词主要与手机的运行流畅程度有关。将玩法、美术、配音和付费作为游戏的产品属性特征。由于手机的运行流畅程度并非移动应用本身特质, 因此不纳入本研究分析。

2) 在线评论产品属性特征量化。为了量化产品属性特征, 将搜集到的应用商店在线评论数据进行分类处理。产品属性特征测量与描述如表3 所示。具体过程如下:

①将每款游戏应用的在线评论分为4 类: 玩法类、美术类、配音类和付费类。

②识别评论的情感倾向: 积极、中立、消极。

③当游戏的某类产品属性评论中, 积极评论超过50%, 表明用户对该特征满意, 赋值为1, 否则赋值为0。

2 1 3 移动应用产品特征

除了移动应用在线评论基本特征和产品属性特征, 移动应用本身的产品特征也可能影响用户下载量。首先, 有研究表明出品方对产品的销量有显著的影响[27-28] , 因此选择手机游戏的研发商和发行商作为出品方特征。游戏在发行之前, 发行商会根据游戏的研发费用和研发团队等因素来对游戏进行评级, 分为SS、S、A、B、C 5 个等级。游戏的评级能在一定程度上反映该产品的质量, 从而影响用户的决策。此外, 如果游戏是由动漫、漫画或者小说等改编而来(也称该游戏有IP), 很大程度上能够吸引动漫、漫画的观众或小说的读者, 从而提升游戏的销量。最后, 产品代言人或参演人能提高产品知名度、品牌认可度和收益。综上, 将研发商、发行商、产品评级、IP 和代言人作为移动应用的产品特征。表4 为移动应用产品特征的测量与描述。

2 2 基于独立子空间的用户采用预测方法

2 2 1 特征重要性评价方法

为了在保持高预测性能的同时弥补基于机器学习的预测方法无法评估输入特征重要性的缺陷, 本文引入独立子空间方法进行特征重要性评价, 结合常用的预测算法, 构成集成预测模型来进行特征重要性评价和用户采用趋势预测。

独立子空间(Independent Subspace Method, ISM)是在独立分量分析(Independent Component Analy⁃sis)的基础上发展而来的机器学习算法, 是一种无监督特征学习方法。术语“独立” 表示在选择特征时尽可能选线性无关的特征[29] 。从结构上看,ISM 可以被看作是一个两层网络, 模型的第一层学习线性变换的权重, 第二层将同一子空间的元素合并, 执行固定的非线性变化, 得到对相位变化相应不变的特征。独立子空间方法能够识别非线性模型中各个特征的重要性, 并且当特征之间存在相关性时, 该方法也能保持准确性。图3 为独立子空间算法的详细过程。

2 2 2 移动应用用户采用预测模型

根据Kim T 等[30] 的研究, 越早地做出预测, 模型就越有价值, 为了保持预测的有效性, 预测应该在发行后两周内进行。本文收集3 个不同时间段的数据用于移动应用用户采用预测。如图4 所示, 模型W1、W2、W3 所使用的数据分别为截至发行后第一周、第二周和第三周的数据。与之前的研究相比,该模型对多个时段的用户评论数据进行分析, 能够更客观地反映用户对游戏应用的采用趋势, 并且能够对比游戏发行后一段时间内的用户评论的差异。

最后, 使用基于ISM 的集成方法对移动应用用户下载量进行预测, 预测过程如图5 所示。首先通过ISM 进行特征采样, 然后使用多元线性回归、分类回归树、人工神经网络与支持向量回归这4 种常用的预测方法进行预测。

3 实验及结果分析

3 1 数据集

本研究使用Python 语言编写爬虫, 从小米游戏中心采集移动应用在线评论数据和产品基本信息。产品评级信息由产品联运方(小米游戏中心运营部门)提供。采集范围为2020 年6 月—8 月发布的60 款手机游戏应用的在线评论与产品信息, 其中, 共采集到由用户于2020 年6 月—10 月发布的在线评论57 627条。首先对采集到的数据进行去重、去停用词、去除无意义的表情和颜文字等数据清洗工作。接着使用Jieba 分词对数据进行预处理。本研究根据时间序列构建了3 个不同的模型, 因此需要将采集到的在线口碑数据分为3 个不同时期的数据集, 产品发布后第一周的数据记为W1, 以此类推, 得到本研究的实验数据集。将实验数据集划分为90%的训练集和10%的测试集。

3 2 特征抽取结果

在对数据进行预处理后, 使用LSTM 模型对在线评论数据进行情感分类(见3 1), 部分应用的评论情感分类结果如表5 所示。对于大多数产品来说, 积极评论和中立评论占多数, 消极评论不超过20%。此外, 在游戏发行的初期, 用户给出的在线评论较少, 随着时间的增加, 在线评论数量出现急剧的增长。

接着使用LDA 主题模型对在线评论进行主题聚类, 抽取产品属性特征。玩法、美术、配音和付费四大类主题及关键词如表6 所示。

然后根据各主题在线评论的情感分类结果来判断用户对该产品的玩法、美术、配音和付费方面是否满意。部分数据处理结果如表7 所示。大多数游戏的玩法类的评论数量最多, 其次是美术类, 说明用户对游戏的玩法和美术较为关注。此外, 用户对产品的玩法类和美术类积极评论率较高, 大部分超过了50%, 而用户的付费类评论积极评论率较低,超过70%的产品的付费类积极评论率低于50%,表明用户对这些游戏的付费体验存在较多不满。

3 3 特征重要性评估结果

3 3 1 基于ISM 的特征重要性评估有效性验证

以非集成方法和基于随机子空间方法(RandomSubspace Method, RSM)的集成方法作为基线, 在MLR、CART、ANN 和SVR 4 种算法下验证基于ISM 的集成方法的有效性。其中, 随机子空间方法(Random Subspace Method, RSM)[31] 常被用于评价非线性模型中特征的重要性。该方法从所有的M个输入特征中选择m 个特征的子集, 然后利用一個简化的特征空间建立学习模型。随机选择特征和应用学习模型步骤重复B 次, 称为引导。在验证阶段, 向具有相应选择特征的B 模型提供一个新的数据集, 并通过聚合模型中的每个输出来估计随机子空间的输出。为了评估每个特征的重要性,RSM 通过置换预测模型中的各个特征来计算每个引导程序中验证错误的增加情况, 然后根据这些权重的相关性进行组合和排序, 其重要性对应特征在预测模型中的有用性。

以往研究在验证ISM 的有效性时, 通常通过生成一个包含相关特征的人工数据集, 测试模型能否正确地找到重要特征且忽略相关特征[32] 。本研究采用同样的策略, 对模型W1 添加人工特征Y1,对模型W2 添加人工特征Y2 作为分析特征, 预测模型需将该特征识别为重要特征。同时还添加了相关特征, 分别是(-Yi ), Y2i、(-Y2i)以及log(Yi )(i =1,2 分别对应模型W1 和W2)。如果预测模型能将上述人工生成的特征识别为重要的特征, 模型就具有鲁棒性。

表8 总结了W1 模型中使用4 种算法和3 种方法计算的每个特征的重要性测量值和相应的排名(例如36 75, 2/21 表示特征的重要性测量值为36 75, 在输入的21 个特征中, 其重要性排名第2)。特征的排名越小, 表示该特征越重要。

1) 在非集成方法中, MLR 算法下的5 个人工生成的特征的平均排名为6 4。CART、ANN 和SVR算法下人工生成特征的平均排名都高于9 0, 特别是ANN 算法的人工生成特征的平均排名为13 60。

由此可见, 非集成方法在检测这些相关特征的重要性上表现不佳。

2) 类似的结果也出现在基于RSM 的集成方法中。MLR 算法下人工生成特征的平均排名为5 80,表现尚可, CART、ANN 和SVR 算法都不能很好地评估特征的重要性。

3) 在基于ISM 的集成方法中, MLR、CART、ANN 和SVR 4 种算法下的5 个人工生成特征的平均排名都小于5 0。

模型W2 中也出现了类似的结果, 如表9 所示。由此可知, ISM 方法在评估特征重要性任务上表现较好。

3 3 2 特征重要性分析

验证了ISM 能够有效地评估输入特征的重要性后, 分别对W1、W2 和W3 这3 个模型中的各特征进行重要性评估, 结果分别如表10、表11 和表12所示。其中星号(∗∗∗、∗∗、∗)分别表示特征重要性在0 05、0 1 和0 2 显著性水平上大于0, 合计表示特征变量个数。由表中数据可知:

1) 在应用发行后的第一周(模型W1 ), 在线评论评分、研发商、发行商、美术、IP 和代言人这几项因素对用户采用预测有着较为显著的影响。此外, 大部分与在线评论有关的特征在这阶段的预测模型中重要性不高。可见在游戏应用发布的最初期, 用户会根据一些最直观的因素来判断是否使用该应用, 比如代言人和IP。

2) 应用发行一段时间后(模型W2 和W3), 在线评论评分、研发商、发行商和美术等直观因素仍然重要, 但重要性已经逐渐降低。而此时玩法和付费的重要性已经十分显著。由此可见, 此时除了直观的因素, 用户还会根据游戏的玩法和付费这些内在因素来做出采用应用的决策。

3) 对比W1、W2 和W3 这3 个模型可以发现,随着发行时间的增加, 在线评论情感因素的重要性逐渐提升, 特别是积极评论数与消极评论数在游戏发行后第二周变得重要起来。

3 4 移动应用用户采用预测结果

本文采用均方根误差(RMSE)和平均绝对百分比误差(MAPE) 作为模型的评价指标, RMSE 与MAPE 的计算公式如式(1)、式(2):

其中yi 为实际的移动应用采用人数, ^yi 为预测的移动应用采用人数。

MLR 算法常用于预测任务, 具有较强的可解释性, 本文将MLR 算法作为基线模型, 评估基于ISM 的集成方法的预测性能。移动应用用户采用预测结果如表13 所示。由表中数据可知, 与基线MLR预测方法相比, 集成独立子空间的MLR 预测方法性能有轻微的降低, 这可能是由于MLR 算法自身就能够较好地评估特征的重要性, 这与ISM 方法的作用重复, 两者结合导致了预测性能的轻微降低。而集成独立子空间的CART、ANN 和SVR 预测方法的性能都比基线方法有较大的提升, 特别是对于ANN 算法而言, RMSE 和MAPE 都大幅减小, 预测性能最佳。总体来说, 本文提出的基于ISM 的移动应用用户采用预测方法能够显著提升预测方法的可解释性, 并提升模型的预测性能。

4 结 论

本研究分析了60 款游戏移动应用的在线评论数据和产品数据, 引入独立子空间算法评估特征重要性, 显著地提升了用户采用预测方法的性能。研究结果能够给移动应用开发商、发行商和应用商店运营人员提供决策依据。

本研究在移动应用用户采用预测方法上取得了一些具有创新性和重要意义的研究成果, 但仍然存在一些不足。第一, 本研究选取的实验数据主要来源于小米游戏中心, 游戏应用的娱乐性较强, 与其他类型的移动应用可能存在一定的差别。第二, 参照以往研究, 本研究使用应用的下载量来判断用户对移动应用的采用情况, 但用户下载该应用可能无法完全代表用户使用了该应用。对用户的持续使用数据进行分析可能可以解决这个问题。这些不足需要在未来的研究中完善, 也为后续的研究指出了新的思路和方向。

参考文献

[1] 中国互联网络信息中心. 第49 次中国互联网络发展状况统计报告[ EB/ OL]. http: / / www. cnnic. net. cn/ NMediaFile/ old_at⁃tach/ P020220721404263787858.pdf, 2021-02-02.

[2] 田丹. 我国移动图书馆APP 应用现状分析[ J]. 国家图书馆学刊, 2015, 24 (5): 74-80.

[3] 王金凤, 王孟琪, 馮立杰, 等. 需求驱动下移动互联网产品创新机会识别路径研究———以网易云音乐为例[ J]. 情报理论与实践, 2020, 43 (12): 96-102, 95.

[4] Patil P, Tamilmani K, Rana N P, et al. Understanding Consum⁃er Adoption of Mobile Payment in India: Extending Meta-UTAUTModel with Personal Innovativeness, Anxiety, Trust, and Griev⁃ance Redressal [ J]. International Journal of Information Manage⁃ment, 2020, 54: 102144.

[5] Chen Y, Xie J. Online Consumer Review: Word-of-Mouth as aNew Element of Marketing Communication Mix [ J]. ManagementScience, 2008, 54 (3): 477-491.

[6] 冯娇, 姚忠. 基于社会学习理论的在线评论信息对购买决策的影响研究[J]. 中国管理科学, 2016, 24 (9): 106-114.

[7] Cui G, Lui H K, Guo X. The Effect of Online Consumer Reviewson New Product Sales [J]. International Journal of Electronic Com⁃merce, 2012, 17 (1): 39-58.

[8] 吴卿毅, 黄斐. 在线评论对消费者行为意愿的影响———基于数值型在线评论的效价[J]. 技术经济与管理研究, 2019, 11:60-65.

[9] Sun M. How Does the Variance of Product Ratings Matter? [ J].Management Science, 2012<26aa><717, 58 (4): 696-707.

[10] Duan W, Gu B, Whinston A B. Do Online Reviews Matter?—An Empirical Investigation of Panel Data [ J]. Decision SupportSystems, 2008, 45 (4): 1007-1016.

[11] Kang Y, Zhou L. RubE: Rule - based Methods for ExtractingProduct Features from Online Consumer Reviews [ J]. Information& Management, 2017, 54 (2): 166-176.

[12] Mirtalaie M A, Hussain O K. Sentiment Aggregation of TargetedFeatures By Capturing Their Dependencies: Making Sense from Cus⁃tomer Reviews [ J]. International Journal of Information Manage⁃ment, 2020, 53: 102097.

[13] 沈超, 王安宁, 方钊, 等. 基于在线评论数据的产品需求趋势挖掘[J]. 中国管理科学, 2021, 29 (5): 211-220.

[14] Pagano D, Maalej W. User Feedback in the Appstore: An Em⁃pirical Study [ C] / /2013 21st IEEE International RequirementsEngineering Conference (RE). IEEE, 2013: 125-134.

[15] Wang Y, Yuan N J, Sun Y, et, al. App Download Forecas⁃ting: An Evolutionary Hierarchical Competition Approach [C] / /Proceedings of the Twenty-Sixth International Joint Conference onArtificial Intelligence. California: International Joint Conferenceson Artificial Intelligence Organization, 2017: 2978-2984.

[16] Zhu H S, Liu C R, Ge Y, et, al. Popularity Modeling for Mo⁃bile Apps: A Sequential Approach [J]. IEEE Transactions on Cy⁃bernetics, 2015, 45 (7): 1303-1314.

[17] Finkelstein A, Harman M, Jia Y, et, al. Investigating the Rela⁃tionship Between Price, Rating, and Popularity in the BlackberryWorld App Store [J]. Information and Software Technology, 2017,87: 119-139.

[18] 黄竞瑶. APP 下载量趋势预测及其模型评价[ D]. 苏州: 苏州大学. 2018.

[19] 张艺璇, 郭斌, 刘佳琪, 等. 基于多级注意力机制网络的App流行度预测[ J]. 计算机研究与发展, 2020, 57 (5): 984-995.

[20] Hochreiter S, Schmidhuber J. Long-Short Term Memory [ J].Neural Computation, 1997, 9 (8): 1735-1780.

[21] 国佳, 郭勇, 沈旺, 等. 基于在线评论的网络社区信息可信度评价方法研究[J]. 图书情报工作, 2019, 63 (17): 137-144.

[22] 陈凌, 宋衍欣. 基于公众情绪上下文的LSTM 情感分析研究———以台风“利奇马” 为例[J]. 现代情报, 2020, 40 (6): 98-105.

[23] Blei D M, Ng A Y, Jordan M I. Latent Dirichlet Allocation [J].Journal of Machine Learning Research, 2003, 3 (4-5): 993-1022.

[24] 王欣研, 张向先, 张莉曼. 学术APP 用户在线评论主题语义关联研究[J]. 情报科学, 2020, 38 (6): 25-31.

[25] 王曰芬, 许杜娟, 杨振怡, 等. 舆情评论与新闻报道的话题识别及其主题关联分析[J]. 现代情报, 2018, 38 (6): 3-10.

[26] 张涛, 马海群. 一种基于LDA 主题模型的政策文本聚类方法研究[J]. 数据分析与知识发现, 2018, 2 (9): 59-65.

[27] Hur M, Kang P, Cho S. Box-office Forecasting Based on Senti⁃ments of Movie Reviews and Independent Subspace Method [ J].Information Sciences, 2016, 372: 608-624.

[28] Bhave A, Kulkarni H, Biramane V, et, al. Role of DifferentFactors in Predicting Movie Success [ C] / /2015 InternationalConference on Pervasive Computing (ICPC). IEEE, 2015: 1-4.

[29] Rodgers J L, Nicewander W A, Toothaker L. Linearly Independ⁃ent, Orthogonal, and Uncorrelated Variables [ J]. The AmericanStatistician, 1984, 38 (2): 133-134.

[30] Kim T, Hong J, Kang P. Box Office Forecasting Using MachineLearning Algorithms Based on SNS data [ J]. International Journalof Forecasting, 2015, 31 (2): 364-390.

[31] Lai C, Reinders M J T, Wessels L. Random Subspace Methodfor Multivariate Feature Selection [ J]. Pattern Recognition Let?ters, 2006, 27 (10): 1067-1076.

[32] Goia A, May C, Fusai G. Functional Clustering and Linear Re⁃gression for Peak Load Forecasting [ J]. International Journal ofForecasting, 2010, 26 (4): 700-711.

(责任编辑: 郭沫含)

猜你喜欢
在线评论移动应用预测
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
T学校公共设施便捷报修平台的移动应用研究
在线评论情感属性的动态变化
消费者个体行为偏好对在线评论真实性的影响机理研究