基于多层次细粒度评论挖掘的图书影响力评价研究

2020-04-06 03:25周清清章成志
图书与情报 2020年6期
关键词:在线评论

周清清 章成志

摘   要:海量的在线评论表达了用户对于图书整体及其内容、印刷等属性的观点与态度,能够反映图书的影响力。文章对图书在线评论进行多层次细粒度挖掘从而评价图书影响力。首先获取图书的在线评论数据,然后细粒度挖掘图书评论以获取评价指标,并且通过比较多个文本表示方法及构建领域情感词典提高指标挖掘的性能,最后整合评价指标获取图书影响力结果。实验结果表明,虽然存在学科差异,但是图书的在线评论可以作为图书影响力评价的有效资源。此外,在研究语料中,基于One-hot文本表示方法的评论情感判断性能优于基于主题模型与基于深度学习的方法,同时,考虑模糊情感词的情感词典能够有效提升情感判断的性能。

关键词:图书影响力评价;在线评论;评论挖掘;文本表示;情感词典

Abstract Massive online reviews express users' opinions and attitudes towards books and their aspects (e.g. content, printing etc.), thus reflecting the impacts of books. This paper conducted multi-level fine-grained mining of online book reviews to evaluate the impacts of books. This paper first collected books' online reviews. Then, fine-grained book review mining was conducted to get evaluation metrics, and multiple text representation methods were compared and domain sentiment lexicons were constructed to improve the performance of metric mining. Finally, evaluation metrics were integrated to identify book impacts. The experimental results show that although there are disciplines differences, online book reviews can be used as an effective resource for book impact assessment. In addition, in this corpus, the performance of one-hot text representation is superior to that of topic model based methods and the deep learning based method. Meanwhile, sentiment lexicon with fuzzy sentiment words can effectively improve the performance of sentiment classification.

Key words book impact assessment; online reviews; review mining; text representation; sentiment lexicon

圖书影响力评价研究能够推荐优秀作品,为大众读者提供信息参考,为科研人员提供信息指导,帮助了解学科发展趋势与前沿方向。同时能够指导科研成果的评定,帮助识别高影响力作者,并为评价科研机构的学术竞争力提供依据。因此,判断图书的影响力是非常有意义的。现有研究多数利用图书的被引频次评价图书影响力[1-2]。此外,大量的替代计量资源也被广泛用于评价图书的影响力,如馆藏信息[3]、借阅信息[4]等。然而,被引频次与替代计量指标均忽略了内容层面的信息,无法识别用户的真实意图。

与此同时,随着Web 2.0的迅速发展,人们越来越倾向于在线购买图书,并留下了海量的在线图书评论。这些在线评论表达了用户对于图书的观点,能够用于评价图书的影响力。因此,本文将对图书的在线评论进行多层次细粒度的挖掘,识别用户对图书整体及其各个属性的态度,从而用于判断图书的影响力。具体而言,我们首先获取图书的在线评论数据。其次,细粒度挖掘图书评论获取基于在线评论的图书评价指标,并且通过比较不同的文本表示方法及构建基于语料的情感词典确保指标挖掘的性能。最后,整合评价指标获取图书影响力结果。实验结果表明,虽然存在学科差异,图书的在线评论能够作为图书影响力评价有效的补充资源。

1   相关工作

1.1    图书影响力评价

传统的学术出版物评价主要基于被引频次。如苏新宁[1]借助中国社会科学引文索引(CSSCI)对中国人文社会科学图书学术影响进行了分析,给出了人文社会科学各学科最有学术影响力的前5种国内学术著作;Ye[5]基于BKCI 提出了Chinese Book Citation Index数据库;Zuccala和Cornacchia[6]利用Scopus数据中的被引数据评价图书影响力。传统的基于引用频次的评价方法越来越不适用于Web2.0时代,许多研究人员开始尝试用替代指标进行图书的影响力评价。如White等[7]提出利用图书的馆藏资源评价图书影响力;Shema等[8]分析了发布在ResearchBlogging.org的博客信息,并证明了博客被引频次也可作为评价影响力的替代资源;Zuccala[9]通过计算Goodreads中的读者等级从而计量历史领域学术著作的广义影响力。

总结而言,基于频次指标的评价方法具有可行性,且操作简单。然而,许多图书并未被BKCI等数据库收录。因此,难以利用被引频次的方法对这类图书进行影响力评价。同时,替代计量的方法虽然众多,但缺乏内容信息无法识别虚假引证与负面引证。因此,频次信息确实是评价图书的一种有效的方式,但其缺点也是不能忽视的。

为弥补基于频次方法的不足,已有研究尝试利用图书相关的内容信息进行图书的影响力评价,如图书的评论内容、引文内容等。Gorraiz等[10]发现图书评论能够作为引用指标一个替代指标;Kousha和Thelwall[11]验证了来自Choice网站的学术评论能否系统地用于评价图书学术影响力、理解力以及教育价值的指标。Kayvan和Mike[12]利用亚马逊评论进行图书的影响力评价;Zhou等[13]通过多粒度的挖掘在线评论从而评价学术著作的影响力;章成志等[14]基于引文内容分析中文图书的被引行为,从而用于优化基于被引频次的图书影响力评价研究。

从以上分析可以看出,已有研究基于内容层面的信息进行图书的影响力分析,但仍存在明显不足。如基于在线评论挖掘的影响力评价方法多数只进行了粗粒度的情感分析,并未对用户的评论内容进行深度挖掘。

1.2    评论挖掘

评论挖掘即从海量评论信息中挖掘出用户关注的信息,其中最主要的技术为情感分析。本文主要涉及篇章级情感分析与属性级情感分析。

篇章级情感分析的目的是判断整篇文档的情感倾向。研究方法主要可以分为两类:监督学习方法与非监督学习方法。监督学习方面, Dey等[15]整合朴素贝叶斯与决策树判断产品评论的情感极性;Al-Amrani等[16]比较了五种不同的分类器,包括PART、支持向量机、决策树、朴素贝叶斯和logistic回归,用于识别最优分类器。在非监督学习方面,Mandal和Gupta[17]利用基于词典的文本分类算法来分析和预测在线评论中用户的情感极性;Almatarneh[18]基于自动构建的,包含最消极和最积极词汇的情感词典来识别极端情感。

属性层情感分析致力于更细粒度的评论分析,识别属性及其情感,包括属性识别与属性情感判断。在基于监督学习的属性抽取方面,Kobayashi等[19]利用监督学习方法同时抽取属性、属性间关系并识别产品类型;Jin和Ho[20]利用词汇化HMM抽取属性。该方法自然地整合了语言特征,如词性和上下文线索进行自动学习。在基于非监督学习的属性抽取方面,Hu和Liu[21]认为用户多次提及的词汇即为属性词,因此该方法利用词频抽取热门属性。Popescu和Etzioni[22]通过计算候选属性词的PMI,从而过滤非属性词,提高属性抽取的性能。属性情感分类即确定每个属性在句中的情感倾向。Boiy和Moens[23]以及Jiang等[24]利用解析器来生成属性集并对其进行分类。Thet等[25]提出了一种细粒度的情感分析方法,该方法借助情感词典SentiWordNet确定评论中各个属性的情感倾向和情感强度。

总结而言,目前多数属性抽取研究主要挖掘产品的主要属性,忽略了同义属性聚类,难以全面挖掘产品属性。在情感分析方面,監督学习方法的标注成本高,而基于词典的方法针对模糊搭配的属性情感分析研究相对较少,且算法相对复杂。

综上所述,可以看出图书影响力评价研究中基于频次的方法是目前主要研究方法,该方法利用与期刊评价、论文评价类似的方法,主要依靠一些传统的评价指标,如借阅量、被引量等,这在一定程度上确实能反映出图书的影响力。然而,由于图书存在特殊性,传统的学术影响力评价指标尚不能全面和深入地反映其影响力。当前,互联网上比较容易获取图书相关的内容层面的信息,如用户在社交网络上产生的海量评论,为图书的评价提供了新的契机。因此,本文将利用细粒度情感分析进行基于在线评论的图书影响力评价研究,比较多种不同的文本表示方式获取精准的用户态度,同时构建基于语料的情感词典准确判断属性情感倾向,从而得到更加细粒度的图书影响力评价结果。

2   研究框架

2.1    图书影响力评价

基于图书的在线评论进行图书的影响力评价,可以得出图书影响力评价研究框架(见图1)。首先获取图书及其在线评论作为研究数据;其次利用多层次细粒度的情感分析获取基于在线评论的评价指标,具体而言,即比较几种不同的文本表示方法用于判断评论的情感极性。同时,抽取评论中提及的图书属性,并构建领域情感词典识别各个属性在评论中的情感倾向,从而得到基于在线评论的图书评价指标;然后对评价指标进行处理,包括归一化及权重计算,从而得到图书影响力得分;最后对评价结果进行分析,并与现有的评价指标进行相关性分析,从而验证本文方法的可靠性。

2.2    实验数据

本文以图书的在线评论作为实验数据,首先,通过比较亚马逊的中文图书类目与中国学科类目确定了图书的学科,包括计算机科学、文学、法学、医学以及体育学;其次,采集了这五个学科下图书在亚马逊的评论,共采集了6282册图书的50798条评论,包括图书的ISBN、评论者、评论星级以及评论内容数据。

同时,还需采集用于图书评价的其他数据,包括图书的被引频次、销量及馆藏信息。首先,通过百度学术[26],匹配图书的题名、作者、发表年份获取对应图书的被引信息;其次,通过亚马逊匹配图书的ISBN信息获取图书的销量信息;然后,通过OCLC获取图书的馆藏信息,包括图书的馆藏总量以及图书在各个地区的馆藏信息。

2.3    篇章层情感分析

篇章层情感分析旨在识别用户评论中表达的对于图书的整体情感倾向,包括正面情感与负面情感。本文采用监督学习方法识别评论的整体情感极性。

2.3.1   篇章层情感分析关键技术

现有研究表明,监督学习方法的关键是抽取有效的特征[27]。换言之,本文中篇章层情感分析的关键任务是合理地抽取文本特征,从而将文本表示为向量形式。因此,本文比较了几种不同的文本表示方法,包括One-hot表示模型[28]、LSA(Latent Semantic Analysis)矩阵分解模型[29]、LDA(Latent Dirichlet Allocation)文档生成模型[30]以及Doc2Vec模型[31]。

(1)基于One-hot表示模型的文本表示。目前,最常用的文本表示方法是One-hot表示。这种方法把每个文本表示为一个很长的向量。这个向量的维度是词典大小。因此,可以首先通过特征选择构建词典;然后计算词典中每个特征词在各个文本中的特征权重;最后得到每个文本的向量表示。在研究中,我们采用CHI方法抽取特征构成特征词典[32]。根据特征词典计算各个特征词在文本中的特征权重。本文采用TF-IDF(Term Frequency–Inverse Document Frequency)進行特征权重计算[33]。

(2)基于LSA矩阵分解模型的文本表示。LSA也被称为LSI(latent semantic index),基本思想就是把高维的文档降到低维空间。即利用Gensim的LSI模型[34]进行基于LSI的文本表示。首先选定主题数N,然后利用LSI模型判断每个文本隶属于各个主题的概率,从而获得文本-主题矩阵,最终获得各个文本的主题概率表示。

(3)基于LDA文档生成模型的文本表示。LDA,即隐含狄利克雷分布,按照文本生成的过程,使用贝叶斯估计的统计学方法,将文本集中每篇文本的主题按照概率分布的形式给出。本文利用Gensim的LDA模型[35]进行基于LDA的文本表示。首先确定主题数N,然后利用LDA模型判断每个文本隶属于各个主题的概率,从而获得文本-主题矩阵,最终获得各个文本的主题概率表示。

(4)基于Doc2Vec模型的文本表示。Doc2Vec是从Word2Vec的基础上发展而来。Word2vec[36]是将词表示为实数值向量的一种高效的算法模型。然而,Word2Vec模型是基于词的维度进行语义分析的,不考虑上下文和单词顺序信息,因此在进行文本分析时会丢失重要信息,所以在进行文本分析时需要采用基于Doc2Vec的模型[31]。本文使用Gensim的Doc2Vec模型[37]进行基于Doc2Vec的文本表示。首先确定文本向量的维度L,然后利用Doc2Vec模型中的Distributed Memory算法将文本表示为向量,最终获得各个文本的向量表示。

2.3.2   篇章层情感分析数据标注及分类性能评估指标

(1)数据标注。由于本文采用监督学习方法进行篇章层情感分析,所以需要人工标注训练语料。在研究中,我们共标注了10000条评论语料。其中,8000条作为训练集(包括4000条正面评论与4000条负面评论),2000条作为测试集(包括1000条正面评论与1000条负面评论)。

(2)分类性能评估指标。我们利用以下指标进行分类性能的评估,包括:宏平均精度、宏平均召回率以及F1值[33],可以得出评估指标表(见表1)及计算公式:

2.4    属性层情感分析

属性层情感分析包括属性抽取与属性情感判断两个子任务。其中,属性抽取的目的在于识别评论中提及的图书属性,如:内容、价格、印刷等。同时,将同义属性聚类,如“价格”“售价”“价钱”等。依据文献[38]可以获取图书属性,共获得12类属性,包括内容、作者、纸张、包装、封面、物流、价格、插图、印刷、版本、字体、文笔。属性情感判断是指判断用户对属性的情感倾向。本文采用基于情感词典的方法判断属性的情感倾向。因此,本节的关键任务即为情感词典的构建。

2.4.1   情感词典构建

本文采用基于情感词典的方法判断属性的情感倾向,而现有通用情感词典难以识别特定领域情感词和模糊情感词的情感倾向,如大、小、高、低等。不同的模糊情感词搭配不同的属性将会表达不同的情感倾向,如“价格高”与“清晰度高”为相反的情感极性。因此,本文将构建基于语料的领域情感词典,以现有的通用词典为基础,结合连接关系构建基于图书评论的情感词典(见图2)。

(1)虚拟句识别。对所有评论进行分词、词性标注。然后,将评论按照标点符号进行断句,得到多个分句后,判断句子是否为虚拟语气。如果句子为虚拟语气,则跳过该句。以是否存在虚拟词汇判断句子是否为虚拟句,其中虚拟词汇包括:要是、希望、但愿、如果、换成、假如、原来、是否、以为。

(2)连接关系识别。基于连接关系的极性转移规则将形容词划分为两个集合A、B。具体而言,如出现可转折连接词,则将连接词前后的形容词分放于两个集合,否则放于同一集合。同时,如形容词为模糊情感词,则将其与短句中属性词作为词对放置在集合中。此外,我们寻找形容词前后是否存在否定词,从而确定是否要翻转其情感极性。具体而言,我们设置窗口大小为3,识别形容词前后是否存在否定词。如存在否定,则将其情感极性翻转(见表2)。

(3)情感倾向生成。通过将情感词典HowNet[39]与NTUSD[40]合并去重得到基础情感词典,然后过滤其中的模糊情感词,将处理后的情感词典作为种子情感词,利用种子词确定集合A、B的情感倾向。规则是:如果集合中褒义词数量高于贬义词,则该集合为褒义集合,否则为贬义集合。

首先利用种子词对集合中的情感词进行情感倾向校正。然后将校正后的情感词加入种子词集,并更新词汇被判断为该极性的频数。如前所述,用户在给出关于图书的评价时,往往会给出正面评价,因此语料中正面评论比例要高于负面评论。所以,对于既被判断为正面情感词又被判断为负面情感词的情感词,分别计算其被判断为正面与负面情感词的频数,如正面频数大于2倍的负面频数,则将其视为正面情感词,否则为负面情感词。

最后,重复以上步骤,直至遍历全部语料。最终保留词频数大于等于5的情感词构建基于图书语料的情感词典。

2.4.2   属性情感判断实验数据标注

为了评估属性情感分类的性能,本文共标注了5000条包含图书属性的在线评论。由于一条评论可能提及多个属性,最终得到包含12个图书属性的7796个情感倾向标注。在评估指标方面采用与篇章情感分析相同的指标,即宏平均精度、宏平均召回率以及F1值。

2.5    图书影响力计算

2.5.1   基于在线评论的指标得分计算

本文利用在线评论信息进行图书影响力评价,首先需要计算每种图书各个指标的值,从而得到最终的图书影响力得分。经过细粒度的评论挖掘,共得到四个评价指标,包括正面评论数、负面评论数、星级得分以及属性满意度(各指标的计算方法见表3)。

2.5.2   其他图书影响力评价指标得分计算

同理,可得出其他图书影响力评价指标得分计算方法(见表4)。

2.5.3   图书影响力得分计算

由于不同指标得分的量綱、单位等存在差别,因此首先需要对各个指标进行标准化处理,从而使得各个指标存在可比性。本文采用反正切函数转换进行归一化计算[41]。然后,我们利用熵权法计算各个指标的权重[42]。最后,通过对各个指标的加权求和得到各个图书的影响力得分(计算过程见表5)。

3   实验及结果分析

3.1    多层次细粒度情感判断性能分析

本文通过多层次细粒度的评论挖掘识别用户对图书及其属性的态度,通过比较不同的挖掘方法从而获取更加精准图书评价指标结果。

3.1.1   篇章层情感分析结果分析

本文基于几种不同的文本表示方法进行评论文本的表示,然后利用SVM(Suport Vector Machine)分类器进行情感分类模型的训练,最终识别每一条评论中的情感倾向,得出不同文本表示方法的情感分类性能评估结果(见表6)。可以看出,基于One-hot文本表示方法的分类性能较优,各项指标得分均高于0.9。同时,不同的主题数(N=5、10、15)对于LSI与LDA文本表示方法的分类性能有明显的影响。主题数越多其分类性能越好,但是随着主题数的增加,性能上升幅度变缓。对于Doc2Vec的文本表示方法,不同的向量维度(L=100、200、300)对于分类性能有明显的影响。维度L=100时,分类性能最优。

根据上述分析可以发现,基于One-hot文本表示方法的分类性能优于其他三种方法,其次为基于LSI的表示方法,基于LDA的方法性能最差。因此,本文将利用基于One-hot的文本表示方法对全部评论语料进行篇章层情感分析,并得出最终情感分类结果(见图3)。可以看出,多数用户在图书评论中给出正面评价。

3.1.2   属性情感判断实验及结果分析

本文首先利用连接关系构建基于图书评论语料的情感词典,得到相应的统计结果(见表7)。由结果可以看出,本文构建的情感词典包含1050个正面情感词与913个负面情感词,较通用情感词典增加了1935个情感词,其中包括32个模糊情感词。

然后,依据构建的情感词典对全部50798条图书在线评论中提及的属性进行情感分类。为验证情感词典的性能,对基于几种不同的情感词典的分类结果进行比较,得出属性情感分析性能评估结果(见表8)。其中,M1为基于通用情感词典进行情感判断,即将情感词典HowNet与NTUSD合并去重得到的情感词典进行属性的情感判断;M2为合并通用情感词典与本文构建的情感词典进行情感判断;M3为利用本文构建的领域情感词典进行属性情感判断;M4为去除模糊情感词的领域情感词典进行属性情感判断。由评估结果可以看出,M2的分类性能优于M1,说明本文构建的领域情感词典能够提升属性情感分类的性能。同时,M3的分类性能优于M2,说明通用情感词典中的部分情感词对于本文语料的情感倾向判断存在干扰,换言之,通用情感词典并不能完全适用于不同领域语料的情感判断。此外,M3的分类性能优于M4,说明模糊情感词的情感极性判断对于分类性能的影响明显,在进行属性情感判断时,需要考虑模糊情感词与不同属性词搭配所表达的情感倾向。总结而言,M3的性能最优,说明本文构建的情感词典能够有效地提升属性情感分类的性能。其次,考虑模糊情感词是很有必要的。

为了进一步了解用户对于不同属性的观点,对进行各个属性的满意度(见图4)。其中横坐标为图书的各个属性,纵坐标为属性满意度平均值。可以看出,用户对于不同属性的满意度存在差异。内容属性的满意度最高,其次为物流属性。满意度最低的为封面属性,其次为字体属性。同时可以看出,当前图书的属性满意度偏低,其中满意度最高的内容属性得分也低于0.55。因此,图书作者、出版社以及销售单位需要在图书生产的各个环节有针对地提升图书的属性。在优化图书内容的同时,需要关注图书的封面、纸张等外观方面的属性,同时需要选择高质量的出版社,以提高印刷、纸张等属性的满意度;此外,高效的物流、优质的包装等也是选择销售单位时需考量的因素。

3.2   图书影响力评价结果分析

经过上述数据处理与分析,可以得到基于多源数据的图书影响力评价得分(见图5)。由图可以看出,多数图书的影响力得分低于0.1。这一结果基本符合二八定律。针对这一结果,图书涉及的学者以及多个机构需要进行有针对的资源分配。从图书作者的角度出发,需要致力于图书综合水平的提升,使之处于高影响力图书集,才能获得来自多方面的关注。但同时,图书作者应了解大多数的图书属于相对低的影响力集合,换言之,进入高影响力图书集合是非常困难和具有挑战性的,作者需保持乐观的心态,不因图书影响力的高低而放弃图书的创作。从出版行业的角度来看,出版单位需要有差异地投放出版资源,增加高影响力图书的出版数量、版次,版本(精装版、电子版等)。就图书馆而言,需要依据影响力评价结果做出合理的采购决策。高影响力图书需要增加馆藏数量、版本等,以供于借阅、收藏等,而低影响力图书可以适当减少馆藏数量等,从而合理地配置资源。对于图书的销售商而言,可以针对图书的影响力结果进行高效的采购以及制定营销策略。在采购方面,高影响力图书需要保证充足的货源以及多样化的版本供消费者选择,而对于低影响力图书则可以适量减少采购数量。在营销方面,保证高影响力图书良好的包装以及高效的物流服务,而低影响力图书营销则需要销售商增加宣传、适当调整价格等,以减少库存压力。此外,也可以进行图书组合优惠销售等。最后,对于用户(读者)而言,可以根据影响力评价结果进行图书的选择。

将本文计算得到的图书影响力得分与其他图书影响力评价指标进行相关分析,得出分析结果(见表9)。利用图书的被引频次度量图书的学术影响力[43],利用图书的销量及馆藏指标评价图书的使用影响力[7]。可以看出,基于在线评论的图书影响力得分与图书被引存在显著的正相关关系,表明基于在线评论的图书影响力评价能够用于衡量图书的学术影响力,为图书的学术影响力评价提供更多的补充信息。同时,基于在线评论的图书影响力得分与销量显著正相关,且与图书的馆藏数量存在显著的负相关关系,这说明基于在线评论的图书影响力评价能够用于衡量图书的使用影响力,但是面向不同的使用目的存在不同的影响极性与影响强度。

3.3    图书影响力评价学科差异性分析

为了比较不同学科的差异,本文分析了各个学科图书基于在线评论的影响力得分与其他评价指标之间的相关性(见表10)。可以看出,不同学科图书影响力与其他指标之间的相关性存在差异。在学术影响力方面,仅有计算机科学与医学图书的影响力得分与被引存在显著的正相关关系,而法学与体育学图书的影响力得分与被引存在显著的负相关关系。在使用影响力方面,相关系数最高的是文学图书的影响力得分与销量之间的相关性,而该相关性在法学领域则比较低。这说明即使是同一类的图书(人文社科类),也存在明显差异。同时,仅有医学与体育学图书的影响力与馆藏显著相关,其他学科图书与馆藏指标没有显著的相关关系。因此可以认为,不同学科的图书在使用影响力方面差异是非常明显的。基于上述分析,我们认为学科差异是真实存在的,即使是隶属于同一类别的学科也存在明显差异。

4   相关讨论

本文基于图书的在线评论进行图书影响力评价。与基于频次类评价研究相比,能够弥补频次类评价数据在内容方面的不足,识别用户的意图与态度。通过与其他现有的图书影响力评价指标的相关性分析验证基于在线评论数据评价影响力的可靠性。显著但较低的相关系数表明在线评论可用于评价图书的多维度的影响力。更重要的是,在线评论能够提供与被引、销量或馆藏不同的评价角度,从而对学术评价、使用评价等数据进行补充,丰富图书影响力评價资源。因此,如何将在线评论数据与现有的频次数据进行有效的整合,丰富图书影响力评价的维度是值得研究的方向。

为了得到更加丰富的分析结果,本文还对基于在线评论的评价结果与馆藏指标(馆藏数量与馆藏地区)进行了相关性分析(见表11)。结果表明,基于在线评论的影响力得分与馆藏指标存在显著的负相关关系,即基于在线评论的影响力越大,其馆藏数量及地区将会减少。这也表明,如果图书被广泛在线购买或者阅读,那么用户对于图书馆的阅读需求将会降低。

对各学科图书影响力评价指标与馆藏指标进行差异分析(见表12)可以看出,不同学科图书影响力与馆藏指标之间的相关性存在差异。计算机科学图书与馆藏地区存在显著负相关关系,医学图书与馆藏分布显著正相关,文学图书与馆藏数量显著负相关,其他学科图书与馆藏指标没有显著的相关关系。因此,可以认为不同学科的图书在图书馆用户影响力方面差异是非常明显的,针对具体的馆藏指标而言,存在明显的学科差异。

此外,为了确保评论挖掘的性能,本文比较了四种不同的文本表示方法,实验结果表明One-hot的方法明显优于其他三种方法,包括深度学习方法。这表明,在实际的任务中,并没有具有绝对优势的方法,需要根据具体任务情境及数据进行不同方法的比较与选择。

本文也存在一些不足。首先,本文仅选择了五个学科领域的图书,没有考虑其他领域的图书情况,今后的工作中我们将尝试更多的学科数据,均衡人文社会科学与自然科学领域的学科及其图书数量,从而提升研究价值;其次,本文仅选择了来自亚马逊的图书评论,或许会造成评价结果的单一性。同时,由于亚马逊用户评论更加关注图书的外部属性(如物流、包装等),对于图书内部属性(如内容、文笔等)的评价相对较少。今后,我们将整合来自更多平台的图书评论(如豆瓣、当当等)进行综合挖掘,丰富评论数据来源与维度;最后,在进行评论挖掘时,本文未进行虚假评论的识别,或许会降低挖掘结果的准确性。今后,我们将着力于评论质量的识别,从而提高评论挖掘的可信度。

5   结语

本文研究了基于在线评论进行图书影响力评价。为了验证本文方法的可靠性,将基于在线评论的影响力评价结果与现有的评价指标进行相关分析。显著的相关系数表明,虽然存在学科差异,但是图书的在线评论可以作为图书影响力评价的有效参考资源。

此外,针对评论情感倾向识别任务,对四种不同文本表示方法进行比较,实验结果表明基于本文语料,One-hot表示模型的文本表示的分类性能最优。50798条在线评论分类结果表明,多数用户在图书评论中给出了正面评价。针对属性情感极性判断任务,本文构建了基于图书语料的情感词典,精确识别语料中情感词的情感倾向,同时确定高、低、快、慢等模糊情感词的极性。与通用情感词典等词典的比较结果表明,本文构建的情感词典能够更加精确地抽取并识别语料中情感词的情感倾向,取得最优的属性情感分类性能。

作为对图书影响评估的一个新视角,本文方法将成为评价出版物质量的有效参考数据。其理论意义在于,出版物影响力评价应该考虑内容信息,而不仅仅是频次信息。同时,本文对图书在线评论的细粒度挖掘提出了建议。在实践中,本文方法可以为学术交流、出版决策等提供有用的信息。

参考文献:

[1]  苏新宁.我国人文社会科学图书被引概况分析——基于CSSCI数据库[J].东岳论丛,2009(7):5-13.

[2]  Abrizah A,Thelwall M.Can the Impact of Non-Western Academic Books Be Measured?An Investigation of Google Books and Google Scholar for Malaysia[J].Journal of the Association for Information Science & Technology,2014,65(12):2498-2508.

[3]  White H D,Boell S K,Yu H,et al.Libcitations:A Measure for Comparative Assessment of Book Publications in the Humanities and Social Sciences[J].Journal of the American Society for Information Science & Technology,2014,60(6):1083-1096.

[4]  Cabezas-Clavijo,Robinsongarcía N,Torressalinas D,et al.Most Borrowed Is Most Cited?Library Loan Statistics as a Proxy for Monograph Selection in Citation Indexes[C].Proceedings of the 14th international conference on scientometrics and informetrics,2013:1-14.

[5]  Ye J.Development,Significance and Background Information About the“Chinese Book Citation Index”(Cbkci)Demonstration Database[J].Scientometrics,2014,98(1):557-564.

[6]  Zuccala A,Cornacchia R.Data Matching,Integration,and Interoperability for a Metric Assessment of Monographs[J].Scientometrics,2016,108(1):465-484.

[7]  White H D,Boell S K,Yu H,et al.Libcitations:A Measure for Comparative Assessment of Book Publications in the Humanities and Social Sciences[J].Journal of the American Society for Information Science & Technology,2009,60(6):1083-1096.

[8]  Shema H,Bar-Ilan J,Thelwall M.Do Blog Citations Correlate with a Higher Number of Future Citations?Research Blogs as a Potential Source for Alternative Metrics[J].Journal of the Association for Information Science & Technology,2014,65(5):1018-1027.

[9]  Haustein D S.Altmetrics for the Humanities:Comparing Goodreads Reader Ratings with Citations to History Books[J].2015,67(3):320-336.

[10]  Gorraiz J,Gumpenberger C,Purnell P J.The Power of Book Reviews:A Simple and Transparent Enhancement Approach for Book Citation Indexes[J].Scientometrics,2014,98(2):841-852.

[11]  Kousha K,Thelwall M.Alternative Metrics for Book Impact Assessment:Can Choice Reviews Be a Useful Source?[C].Proceedings of the 15th international conference on scientometrics and informetrics,2015:59-70.

[12]  Kayvan K,Mike T,Can Amazon.Com Reviews Help to Assess the Wider Impacts of Books?[J].Journal of the Association for Information Science & Technology,2014,67(3):566-581.

[13]  Zhou Q,Zhang C,Zhao S X,et al.Measuring Book Impact Based on the Multi-Granularity Online Review Mining[J].Scientometrics,2016,107(3):1435-1455.

[14]  章成志,李卓,趙梦圆,等.基于引文内容的中文图书被引行为研究[J].中国图书馆学报,2019,45(241):96-109.

[15]  Dey L,Chakraborty S,Biswas A,et al.Sentiment Analysis of Review Datasets Using Naive Bayes and KNN Classifier[J]. International Journal of Information Engineering and Electronic Business,2016,8(4):54-62.

[16]  Al-Amrani Y,Lazaar M,Elkadiri K E.Sentiment Analysis Using Supervised Classification Algorithms[C].Proceedings of the 2nd international Conference on Big Data,Cloud and Applications,2017:1-8.

[17]  Mandal S,Gupta S.A Lexicon-Based Text Classification Model to Analyse and Predict Sentiments from Online Reviews[C].Porceedings of the International Conference on Computer,Electrical & Communication Engineering,2016:1-17.

[18]  Almatarneh S.A Lexicon Based Method to Search for Extreme Opinions[J].Plos One,2018,13(5):e0197816.

[19]  Kobayashi N,Inui K,Matsumoto Y.Extracting Aspect-Evaluation and Aspect-of Relations in Opinion Mining[C].Proceedings of the Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning,2007:521-574.

[20]  Jin W,Ho H H.A Novel Lexicalized HMM-Based Learning Framework for Web Opinion Mining[C].Proceedings of the International Conference on Machine Learning,2009:465-472.

[21]  Hu M,Liu B.Mining Opinion Features in Customer Reviews[C].Proceedings of the 19th national conference on Artifical intelligence,2004:755-760.

[22]  Popescu A M,Etzioni O.Extracting Product Features and Opinions from Reviews[C].Proceedings of Human Language Technology Conference and Conference on Empirical Methods in Natural Language Processing,2005:339-346.

[23]  Boiy E,Moens M F.A Machine Learning Approach to Sentiment Analysis in Multilingual Web Texts[J].Information Retrieval,2009,12(5):526-558.

[24]  Jiang L,Yu M,Zhou M,et al.Target-Dependent Twitter Sentiment Classification Target-Dependent Twitter Sentiment Classification[C].Proceedings of the Association for Computational Linguistics:Human Language Technologies,2011:151-160.

[25]  Thet T T,Na J-C,Khoo C S.Aspect-Based Sentiment Analysis of Movie Reviews on Discussion Boards[J].Journal of Information Science,2010,36(6):823-848.

[26]  百度學术[EB/OL].[2020-09-15].http://xueshu.baidu.com/.

[27]  Yousefpour A,Ibrahim R,Hamed H N A.Ordinal-Based and Frequency-Based Integration of Feature Selection Methods for Sentiment Analysis[J].Expert Systems with Applications,2017(75):80-93.

[28]  Salton G,Wong A,Yang C S.A Vector Space Model for Automatic Indexing[J].Communications of the ACM,1974,18(11):613-620.

[29]  Deerwester S.Indexing by Latent Semantic Analysis[J].Journal of the Association for Information Science & Technology,1990,41(6):391-407.

[30]  Blei D M,Ng A Y,Jordan M I.Latent Dirichlet Allocation[J].Journal of Machine Learning Research,20083(3):3993-1022.

[31]  Le Q.Mikolov T,Distributed Representations of Sentences and Documents[C].Proceedings of the International Conference on International Conference on Machine Learning,2014:1-9.

[32]  Yang Y,Pedersen J O.A Comparative Study on Feature Selection in Text Categorization[J].Advances in Information Sciences & Service Sciences,1997,4(3):412-420.

[33]  Salton G,Mcgill M J.Introduction to Modern Information Retrieval[M].McGraw-Hill,1983:305-306.

[34]  LSI模型[DB/OL].[2020-09-15].https://radimrehurek.com/gensim/models/lsimodel.html.

[35]  LDA模型[DB/OL].[2020-09-15].https://radimrehurek.com/gensim/models/ldamodel.html.

[36]  Word2vec模型[DB/OL].[2020-09-15].http://word2vec.googlecode.com/svn/trunk/.

[37]  Doc2vec模型[DB/OL].[2020-09-15].https://radimrehurek.com/gensim/models/doc2vec.html.

[38]  周清清,章成志.在線用户评论细粒度属性抽取[J].情报学报,2017,36(5):484-493.

[39]  情感词典HowNet[DB/OL].[2020-08-20].http://www.keenage.com.

[40]  情感词典NTUSD[DB/OL].[2020-08-20].http://www.datatang.com/data/44317.

[41]  Chien-Lih H.An Elementary Derivation of Euler's Series for the Arctangent Function[J].The Mathematical Gazette,2005,89(516):469-470.

[42]  Nie H Z,Pan L,Qiao Y,et al.Comprehensive Fuzzy Evaluation for Transmission Network Planning Scheme Based on Entropy Weight Method[J].Power System Technology,2009,33(11):278-281.

[43]  Kousha K,Thelwall M,Rezaie S.Assessing the Citation Impact of Books:The Role of Google Books,Google Scholar,and Scopus[J].Journal of the American Society for Information Science & Technology,2011,62(11):2147-2164.

作者简介:周清清,女,南京师范大学网络与新媒体系讲师;章成志,男,南京理工大学信息管理系教授。

猜你喜欢
在线评论
消费者个体特征对在线评论有效性的影响研究
在线评论情感属性的动态变化
基于复杂网络构建面向主题的在线评论挖掘模型
巧用“在线评论”提升图书网上销量
消费者个体行为偏好对在线评论真实性的影响机理研究