基于在线评论的游客情感分析模型构建

2016-11-19 16:22涂海丽唐晓波
现代情报 2016年4期
关键词:在线评论情感分析模型构建

涂海丽 唐晓波

〔摘 要〕在线旅游社区中的用户评论客观真实地反映了游客关于旅游景点和服务的感受,本文基于在线评论数据构建了一个游客情感分析模型。该模型首先从多个知名旅游网站的评论社区中获取关于某旅游目的地的评论文本并进行预处理,利用领域本体构建方法构建旅游本体,将处理后的评论文本与旅游本体进行匹配,得出本体各属性的分类评论集,运用情感程度加权规则计算这些评论集的情感极性均值,得出游客关于旅游各要素总体情感倾向,并进行可视化分析与展示。该方法能够直观显示游客关于旅游目的地的总体情感倾向,为旅游经营者改进服务提供参考,以庐山旅游为例,验证了该模型的可行性。

〔关键词〕在线评论;情感分析;旅游本体;可视化;模型构建

DOI:10.3969/j.issn.1008-0821.2016.04.013

〔中图分类号〕F724.6 〔文献标识码〕A 〔文章编号〕1008-0821(2016)04-0070-08

〔Abstract〕User reviews in online travel community truly reflect visitors feeling about the tourist attractions and services,this paper builds a tourist sentiment analysis model based on online reviews.Firstly,the paper acquired comments text about some tourism destination from the comment community of a few well-known tourist sites and made a pretreatment.secondly,the paper used domain ontology construction method to build tourist body,and matched the texts after processing to tourism body,drew classification commentaries on each property of the body.Thirdly,using emotional extent weighting rules,the paper calculated the emotional polarity average value of these commentaries,got tourists whole emotional tendencies about all elements of tourism,and the paper gave a visual analysis and presentation.In this way,the paper could visual display tourists whole emotional tendencies about the tourism destination,and it could provide reference for improving services by tourism operators.Taking Lushan Tourism as an example,the paper verified the feasibility of the model.

〔Key words〕online review;sentiment analysis;tourism ontology;visualization;model building

随着在线旅游的兴起和网络旅游社区的出现,越来越多的旅游者倾向于借助互联网规划自己的旅游出行计划,购买相关的酒店服务、交通运费、景点门票等,并在网上分享各自的旅游体验以及对旅游地服务的看法。Double Click[1]进行了一项针对美国旅游业网络客户的研究,发现有近一半以上的旅游者在做出购买决定前会在互联网上搜索相关产品的介绍及其他旅游者对旅游的评论信息,网络评论对于旅游者的旅游决策有着重要的影响。其中旅游网站中的旅游社区是旅游者表达自己旅游意愿、寻求旅游帮助和发表游后体会的重要平台。旅游社区中的点评内容大都真实反映了旅游者所见、所感、所想。如果充分收集这些信息并对其进行综合分析,直观地揭示游客关于旅游服务要素的褒贬态度或情感倾向,将有助于旅游者了解先行者对某个旅游地的情感倾向,优化旅游决策;旅游经营者可以了解游客对其服务的意见或褒贬态度,从而扬长避短,赢得竞争优势。然而,在线旅游评论的内容都是碎片化的,且篇幅长短不一,需要对其重新进行分类和情感分析,才能挖掘其中反映用户褒贬态度或情感倾向的有用信息。情感分析(Sentiment Analysis)又称评论挖掘或意见挖掘(Opinion Mining),指的是对某些商品评论的文本内容进行分析,发现评论人对这些商品的褒贬态度和意见[2]。主要任务包括主题抽取、意见持有者识别、评论范围确定和情感极性分析[3]。基于在线评论的情感分析是Web信息挖掘的一个新兴领域,近年来受到计算机科学、经济学、管理学等相关学科的广泛关注。以往关于在线商品评论的情感分析的数据主要来自电子商务网站,而选择的主要产品是数码相机、笔记本电脑、手机、汽车,很少有关于旅游的,原因可能是前者都是实体产品,比较容易确定其主题的属性特征,而旅游是一种服务,牵涉的服务主题和服务项目较多,不容易确定其属性特征。

在线旅游评论是用户生成内容(User Generated Content,简称UGC)的一种,是用户关于旅游感受和情感的自然流露,反映了游客对旅游服务的关注点,因此,有必要从用户关注角度来确定旅游属性特征分类,从而进行情感分析。本文基于游客关注的旅游六大要素(吃、住、行、游、购、娱)视角,从不同网站的旅游社区中获取关于同一旅游地的评论数据,分析每一个要素游客的评论点(如吃的方面游客可能从口味、卫生、环境、价格等方面展开评论;住的方面可能从舒适性、房价、方便性等方面进行评论;等等),根据这些评论点和前人研究的基础,构建旅游本体以揭示旅游要素与其属性特征之间的关系,将旅游本体与利用自然语言处理后的评论文本进行匹配,在此基础上,对在线旅游评论进行情感分析与可视化,一方面有助于旅游经营者了解游客对旅游景点和服务的褒贬态度,以便提供更好的服务;另一方面为潜在客户提供旅游决策参考。

1 相关研究

旅游在线评论是网络口碑传播的重要途径,是旅行社或旅游经营者开展网络营销重点关注的内容之一。目前,国外学者的研究主要集中在旅游在线评论对酒店预订、酒店业绩、消费者决策行为的影响等方面。Vermeulen等运用关注集理论研究在线评论对顾客酒店预订的影响,实证结果表明,不管是积极的还是消极的在线评论都增加了顾客对酒店的关注度,特别是不太出名的酒店,评论的专业性对酒店积极的影响不大[4]。Yea等关于网上评论对酒店客房销售的影响进行了实证研究,研究结果表明在线消费者评论和酒店的经营业绩之间有显著关系[5]。Rhee等通过收集旅游网站上某个酒店的405条客户评论,分析不同客户群(跟团游、企业游、家庭游、国内游客和国外游客)对同一酒店各属性重要性的看法,结果表明价值和房间是各客户群都认为是最重要的属性,但不同客户群在酒店其他属性重要性排名上有所不同[6]。国内关于旅游在线评论的研究主要集中在消费者对旅游主题的评价维度、在线评论对旅游决策的影响等方面,相关文献并不多见。赵学锋等以携程网上消费者对酒店的评论中的词语进行聚类,得到其中隐含的消费者最关注的酒店评价维度[7]。张梦等认为,在线评论内容对消费者购买意愿有重要影响[8]。

在线评论一直是商家了解客户反馈以及消费者购物的重要参考而备受关注,如何将碎片化的用户评论内容进行自动化情感/意见分类并可视化展示,并挖掘其中隐藏的规律,以便更好地辅助商家和消费者决策服务,是竞争情报领域关注的热点之一。由于在线评论表达语法随意、新造词多、主客观句掺杂,而基于在线评论的情感分析需要识别主观句,并将评论主题特征与相应的情感词或主观词自动提取,然后计算情感极性值。因此,基于在线评论的情感分析方面的研究主要集中在主题特征提取、主观句识别、特征-情感词抽取和情感极性计算等方面。Wallace等基于f-LDA模型按用户关心的各个方面抽取医生在线评论进行情感分类[9]。Deng等认为虚假餐馆评论误导消费者的选择。文章通过分类设置,分析了虚假评论所有特征,认为虚假评论永远是绝对的正面或负面,并提出了一种基于情感分析算法来检测网上餐馆虚假评论[10]。Liu等考虑当评语集合随着时间的推移的情绪变化,并研究制定适应在线评论的情感分析模型问题。选择电影的评论和他们的票房收入为实验数据,研究使用提取的自适应模式进行销售预测的可能性[11]。Xueke X等提出了一种新生成主题模型,联合纵横/情感(JAS)模型,从网上顾客评论中提取属性和属性相关的情绪词汇[12]。Xianghua F等提出了一个基于LDA主题模型和HowNet词典的无监督的方法来自动发现中国网络社会评论的多方位情感分析,实验结果表明,该方法不仅可以取得很好的话题分区的效果,也有利于提高情感分析的准确性[13]。Shi H等提出了一种无人监督的细粒度情感分析模型识别一个句子中的多方面情感的方法[14]。Somprasertsri等通过应用依赖关系,结合基于概率模型的本体知识,提出了基于句法信息和语义信息的挖掘产品特征和意见的做法[15]。

目前基于旅游在线评论的研究和基于在线评论的情感分析方面的研究已取得了一些成果,但还存在一些问题:①基于旅游在线评论的研究主要集中在评论对于游客出行决策的影响的实证研究,大多采用采访或问卷的方法获取调研数据,较少涉及对评论内容的研究;②现有涉及评论内容的研究主要针对酒店运用聚类等方法进行评论维度的划分,鲜有针对旅游目的地的研究;③旅游领域针对在线评论的情感分析方面的研究还是一个新的领域,现有相关文献较少;④基于在线评论的情感分析也存在主题特征难以准确提取、特征-情感词的准确匹配等问题。本文在借鉴前人研究成果的基础上,构建了一个基于在线评论的游客情感分析模型,针对旅游在线评论内容,尝试利用自然语言处理技术和本体构建技术,获取评论主题特征,并分类提取属性-情感词对,设计情感极性量化计算规则,分析游客关于旅游目的地旅游要素的细粒度情感倾向,并进行可视化展示,为后来者的出行决策和旅游经营者服务优化方向提供参考。

2 基于在线评论的游客情感分析模型

本文基于在线评论构建的游客情感分析模型如图1所示。主要工作包括:数据获取与预处理、自然语言处理、旅游本体构建、属性比对与依存句法分析、属性-情感词对抽取与情感倾向分析和游客情感倾向的可视化。

2.1 旅游评论数据获取与预处理

我们的数据来自于同城旅游网、携程网、穷驴网旅游社区中的用户评论,为了获取网络社区中用户关于某一旅游地的评论数据,我们首先打开这些网站,进入到在线社区模块,运用网站中提供的站内搜索功能,以某一旅游目的地为关键词进行在线评论的搜索,在显示关于此目的地旅游的评论数据后,利用网络信息采集工具抓取评论数据,每一条记录内容包括用户名(或用户号)、评论内容、回复数(指回复该评论的用户数),采集到的所有数据导出到EXCEL文件保存。为了确保采集到的数据对研究问题有价值,需要把一些无用的数据清理掉,以减少噪音数据干扰。需要过滤掉的数据主要包括:(1)干扰信息。主要是一些广告信息和与检索关键词匹配但与主题无关的信息,都需要删除。(2)某一用户多次重复的评论,这种评论数据是用户为了赚取积分等满足自己某个目的而产生,对统计真实正负面评论会造成“虚高”干扰,因而,需将重复记录删除,只保留该用户重复记录中的一条记录作为该用户关于某主题的评论数据。(3)规范表述。网络中有一些比较随意的表述,为了分析方便,将其规范化、统一化。经过预处理后的数据,为与检索关键词匹配的评论集,将其保存以备下一步使用。

2.2 自然语言处理

2.2.1 分词与词性标注

预处理后的评论数据集中的文本长短不一,有些是客观描述游客庐山旅游经历的,而且一条记录中并不是所有的内容都是对旅游的主观评论,而情感分析的对象是关于某主题的主观评论,因此需要在预处理文本中提取主观句。一般来说,带有情感词或评价词的句子表达了人们对某事物的某种感想、意见或看法,被认为是主观句。而要获取带情感词或评价词的句子就要先对评论集中的每一条记录进行分词、词性标注和分句处理。

分词与词性标注是在线评论情感分析的基础,目前有很多分词工具,而分词的正确率是选择分词工具首要考虑的因素,中科院ICTCLAS 2015分词系统分词正确率达到98.45%,是用户公认的分词系统,具有分词、词性标注、命名实体识别和新词识别等功能,本文运用该系统对预处理后的评论集进行分词、词性标注和命名实体识别,我们主要关注的是名词、形容词、动词和副词,因为这些词对中文情感分析起关键作用。

2.2.2 分句与主观句提取

中文一般以句号、感叹号、问号为一句完整的话的断句符号,我们也以这3种符号为分句依据。由于在线评论语言表达的随意性,可能存在一个用户评论内容的末尾没有标点符号或不是断句符号的现象,我们将人工添加上句号,以使该用户的评论内容完整。将词性标注后的单句逐一与HowNet词典进行比对,如果不包含情感词语或评价词语,表示该句可能只是叙述或客观描述句,没有发表意见,不是主观句,不进行情感分类。否则,表示该句为主观句,我们将这些主观句进行保存,每个主观句保存为一条记录,每条记录除了保存一个主观句之外,还需保存这条记录原用户名/号、主题属性词对(初始值为空)、该评论回复数(每个句子的回复数与该句所在的原用户名/号的回复数相同)。

2.3 旅游本体构建

上一步虽然提取了评论中的主观句,但是不是每一句都是对旅游目的地旅游要素的评价,如“真是太舒服了”、“出来旅游,心情舒畅”等只是旅游者心情的释放,并不是对旅游要素的评价或正负向情感的流露,因此,需要将关于旅游要素的主观句子二次提取,并依据旅游各要素的相关属性(即游客关注点,如饮食方面,游客可能关注口味、价格、卫生、环境等)对二次提取的主观句进行分类,以便对目的地旅游各要素游客关注点进行情感分析与可视化。目前,关于主观句二次提取与分类的方法主要有两种:词频统计和构建领域本体。前者是将所有产品属性出现的频次分别进行统计,按出现频次的高低顺序进行排名,提取前若干名属性作为评论对象,对其进行情感分析;后者建立领域本体,确立主题及其属性之间的关系,然后将二次提取的主观句与本体属性匹配,从而将评论对象分类,分别计算其情感极性值。本文选择后者,构建旅游本体,然后分属性统计评论情感倾向。

领域本体的构建是个复杂的工程,需要领域专家个本体构建专家的通力合作才能够完成,本文借鉴领域本体构建的相关研究成果,构建本文需要的本体库,简化本体构建过程。根据旅游体验的六大要素:吃、住、行、游、购、娱,参考已有旅游本体构建框架[16-17]和旅游网站中用户评论关注点,运用本体构建工具Protege4.3构建旅游本体。

2.4 依存句法分析与属性-情感词对抽取

旅游本体构建好后,本体概念属性就可以表达出来,将上一步提取的主观句中的名词逐一与旅游本体中概念属性进行比对,这里存在3种情况:(1)主观句中的名词至少有一个与旅游本体属性匹配,保存该条记录,对该句做依存句法分析。(2)主观句中没有显式名词,只有情感词或评价词,将手动分析该句评价对象,如果与旅游本体属性匹配,添加该属性到该条记录的主题属性词字段值中,使得该隐性主题属性显性化,保存该条记录,并将该属性作为该句的显式主题属性,对该句做依存句法分析;否则,将不做任何操作。(3)主观句中的名词与旅游本体属性全部不匹配,说明该句评论与主题无关,删除该句。针对3种情况中可做依存句法分析的句子,借助哈尔滨工业大学社会计算与信息检索研究中心研制的在线语言技术平台(LTP)上提供的API代码[18],运用Python语言以GET方式调用REST API,得到这些句子的依存句法分析结果。

根据依存句法分析后句中词与词之间在语义层面上的修饰关系,可以识别和抽取出句中的属性-情感词对。抽取的规则如下:匹配领域本体属性集,识别出评价集中的命名实体以及命名实体所依赖的语法元素。若依赖关系为ATT(定中关系)、ADV(状中结构)或SBV(主谓关系),而且其依赖的语法元素词性为形容词、其他名词修饰词、副词、动词或者习惯用语,则认为该命名实体为评价对象,其依赖的语法元素对应的词为情感评价词。如图2为对某一评论句进行依存句法分析的结果示例,图中命名实体与修饰词之间的依赖关系为SBV,修饰词的词性为形容词,因此可以抽取属性情感词对“观光车很贵”。

2.5 情感倾向分析与可视化

对于上一步的规则抽取属性-情感词对,要特别注意处理否定词和程度副词对情感极性的影响。(1)否定词的处理,如果有否定词与情感词存在依存关系,这里可能有3种情况:如果是否定词修饰的是另一个否定词,则为双重否定,抽取的属性-情感词对的极性不变;如果否定词修饰的是情感词,则将抽取的属性-情感词对的极性进行反转;如果否定词修饰的是包含程度副词的情感词,则调整属性-情感词对的极性程度。(2)程度副词的处理,考察程度副词与情感词是否有依存关系,如果有,调整属性-情感词对的极性程度;否则,属性-情感词对的极性不变。按属性将抽取的属性-情感词对分类,为了了解所有用户对同一属性的整体情感倾向,我们将情感词、带程度副词的情感词的极性进行量化,参考HowNet字典中给出的褒贬情感词的强烈程度,将不同程度分为4个等级,如表1所示:

表1中,有程度副词修饰的情感词,其总极性值=程度副词的极性值情感词的极性值。如“庐山很美”表达的情感值为21=2;“门票稍贵”表达的情感值为1.5(-1)=-1.5。带否定词的情感极性计算按否定词处理办法的实际情况来定。另外,评论的回复数表达了其他用户对该评论的关注与认同,将一定程度调整该评论的情感值,我们对有回复的评论添加一个加权值,该值的计算方法为:加权值=该评论的回复数/总回复数,那么该条评论最终的情感极性值=计算的总极性值(1+加权值)。我们从游客评论关注点、游客关于某主题特征的正负向情感诉求点两方面,利用Excel来对游客关于旅游目的地情感倾向进行可视化展示,详见实证分析部分。

3 实证分析

3.1 数据处理

本文选取庐山旅游作为实证研究实例。之所以选择庐山旅游,原因有二:一是在线旅游评论所涉及旅游地域范围太广,相应的属性特征不统一,评论数据体量大价值稀疏,如果选取所有的旅游评论数据,分析起来没有可比性且收集资料难度较大,因此没必要笼统地收集所有的评论;二是庐山旅游具有游客所关注的旅游要素的典型性。游——庐山拥有以雄、奇、险、秀而闻名于世的自然景观和聚宗教、政治、教育于一体的人文景观,是观光旅游的首选,也是避暑、疗养、写生、摄影的胜地;吃、住——山上宾馆、酒店、招待所、农家旅社、小吃店、饭馆应有尽有,能满足不同层次游客的需求;购——庐山茶饼、三石、云雾茶等特产,牯岭镇是庐山吃、住、购的中心地带;行——山上有观光车、缆车;娱——庐山度假村中的温泉浴、庐山影院、高空索道行走表演等娱乐项目。庐山的这些旅游要素给游客留下了深刻的印象,旅游在线评论中关于庐山旅游的评论数据丰富,可以很好地支持本文的研究。

在进入同城旅游网、携程网、穷驴网旅游社区后,以“庐山旅游”为关键词进行在线评论的搜索,利用八爪鱼采集器4.1.5版抓取了9 937条评论数据,并作如下预处理:①将一些干扰信息如“到庐山旅游,请跟我来……”、“庐山旅游精品”、“庐山旅游咨询”、“终于见到厦门的庐山真面目了”关于厦门旅游或其他地方旅游的信息删除。②删除同一个人的重复评论。③将表述不够规范的词替换为规范表达,如:“赞”、“美呆了”分别改成“好”、“太美了”。经过预处理后得到9 746条数据。对预处理后的庐山旅游评论分词、词性标注、分句和主观句提取后,共获得10 324个关于庐山评论的主观句。主观句提取的部分结果如图3所示。庐山旅游本体构建结构如图4所示。3.2 结果分析

本文共获得9 427对属性-情感词对。根据2.5设计的情感极性计算规则,我们将抽取的属性-情感词对逐一计算其情感极性值,并按主题-属性分类求其情感极性平均值,得到庐山旅游评论情感分类均值,如图5所示。

由图5中可知,游客对庐山旅游的绝大部分要素指标表现出正向情感,少数指标表现出负向情感。如果把表2的庐山旅游评论情感分类均值N依据表1分成4个区间:N≥2(表示非常满意)、1≤N<2(表示比较满意)、0≤N<1(表示还算满意)、N<0(表示不满意),则可以看出,评论用户对庐山的景色、选购的商品、住宿的卫生条件以及有关娱乐方面的服务、设施、趣味和性价比都非常满意;而对庐山整体观光价值、购物的服务、购物环境、饮食口味、餐饮服务、用餐环境、住宿服务、住宿的设施等方面比较满意;对庐山的景区服务、交通的方便性和安全性方面还算满意;但对各种价格,如门票价、购买的商品价格、餐饮价格、住宿费以及景区缆车和观光车等交通票价不太满意。

可以从游客关于某主题属性的评论数看出游客评论主要关注点,而游客关于庐山旅游各要素的评论数并不均匀,图6(a)显示了获取的九千多条记录中关于各主题-属性的评论数占比,占比越大,说明游客越关注该主题属性。从图中可以看出,庐山所有的主题属性(依据图3庐山旅游本体)中游客对庐山的景色最为关注,评价数最多,占到39.22%(近四成),结合图5来看,游客对庐山景色的评价的情感均值达到2.27,表示非常满意,说明庐山美景是名不虚传,实至名归。评价数靠前的主题特征还有娱乐服务、娱乐趣味性和景区服务。从提取的属性-情感词对中看出,娱乐趣味性和服务主要涉及温泉浴、庐山恋影院、冲浪、高空表演等娱乐项目,从娱乐的趣味性和服务方面游客都有极好的体验。

游客对景区服务的评论情感均值为0.9,属于还算满意范围。图6(c)和图6(d)显示了游客关于景区服务正面评价项和负面评价项的诉求点,正面评价的方面有取订票方便(这也是关于景区服务评论中评论数量最多的,查看原始评论,发现主要是因为采取网络订票,现场取票的购票方式,减少了游客排队等待的时间)、卫生状况好、服务周到态度好、以及景区管理有序。负面评价的方面有景区管理混乱、取票不方便、服务态度不好、导游很黑。值得注意的是,正负向评论中有服务态度、取票方便性、景区管理3个共同项游客持相反态度,我们认为,除了游客个体对服务要求的高低程度不同外,景区服务质量的提升更是关键,特别是节假日人流高峰期,如果服务质量得不到保障,将会引起网络负面评论的连锁反应,而相反,如果庐山景区管理部门在服务态度、服务周到方面管理有序性等方面更多地从游客角度出发进行改进,更好地满足游客需求,将会使庐山服务的口碑更上一层楼。

值得一提的是,在所有的评论主题中,关于价格的评论情感值都为负,游客对庐山的各种价格表示了不满。图6(b)显示了门票价格的游客评价项,除了少数游客觉得便宜实惠外(从原始评论数据中看出,主要是将促销活动价与平常时期价格相比、网络订票优惠价与实地购票价格相比的评价),大部分游客对票价的意见是门票贵、大小门票、收费景点多,特别是重复收门票问题在庐山旅游官网上的一篇纪实报道中得到印证,报道中提到“票中票”问题一直是庐山面临的历史难题,并从2015年3月份起,在核心景区实行“一票制”[19]。这一举措将提高游客对庐山旅游的满意度,如果能够合理调整其他价格的收费方式或降低收费标准将大大提高用户体验。

4 结束语

旅游在线评论反映了游客关于旅游服务的真实感受,怎样准确把握旅游用户对旅游目的地的满意度和需求,是旅游市场营销领域长期关注的问题,具有重要的研究意义和商业价值。本文根据在旅游线评论语言表达的随意性和关于某一主题评论内容的分散性等特点,综合运用网络数据获取技术、自然语言处理技术、本体构建技术、情感分析与可视化技术,以庐山旅游为例,对用户评论进行情感分析与可视化展示。从研究结果来看,本文提出的方法是可行的,运用这些技术能够将网上碎片化的用户生成数据转化为对其他用户和旅游经营者有用的直观信息,以辅助旅游者选择出行地,帮助经营者了解客户意见,进而优化旅游服务。此外,本文的研究方法可以为旅游研究领域自动、全面地获取在线客户知识提供借鉴,也可以为旅游评论挖掘系统的构建提供参考。但是,本文尚存在一些缺憾和不足,本文中隐式评论对象的识别,是通过人为添加的方式来完成的,应在自动识别和准确率上做进一步改进的研究;对于属性-情感词对的抽取方法也应做进一步改进,尽量获取更多的匹配数[20]。另外,由于用户评论数据是动态变化的,如何自动跟踪用户评论,并进行情感分类和可视化,是下一步需要研究方向。

参考文献

[1]Double Click.Search before the Purchase-Understanding Buyer Search Activity as it Builds to Online Purchase[R].2005(http:∥www.doubleclick com/insight/pdfs/searchpurchase0502.pdf).

[2]张紫琼,叶强,李一军.互联网商品评论情感分析研究综述[J].管理科学学报,2010,13(6):84-96.

[3]Pang B,Lee L,Vaithyanathan S Thumbs up?Sentiment classification using machine learning techniques[C]∥Proceedings of the 2002 Conference on Empirical Methods in Natural Language Processing(EMNLP),Morristown NJ USA,Association for Computational Linguistics,2002:79-86.

[4]Vermeulen I E,Seegers D.Tried and tested:The impact of online hotel reviews on consumer consideration[J].Tourism Management,2009,30(1):123-127.

[5]Ye Q,Law R,Gu B.The impact of online user reviews on hotel room sales[J].International Journal of Hospitality Management,2009,28(1):180-182.

[6]Rhee H T,Yang S B.How does hotel attribute importance vary among different travelers?An exploratory case study based on a conjoint analysis[J].Electronic Markets,2014:1-16.

[7]赵学锋,汤庆,张睿,等.基于客户评论和语料库的在线酒店信誉维度挖掘[J].图书情报工作,2012,56(12):124-129.

[8]张梦,杨颖,叶作亮.酒店网络评论内容特征对消费者购买意愿的影响——基于时间距离和社会距离情景的实验研究[J].旅游学刊,2012,27(11):97-104.

[9]Wallace B C,Paul M J,Sarkar U,et al.A large-scale quantitative analysis of latent factors and sentiment in online doctor reviews[J].Journal of the American Medical Informatics Association,2014,21(6):1098-1103.

[10]Deng X,Chen R.Sentiment Analysis Based Online Restaurants Fake Reviews Hype Detection[M]∥Web Technologies and Applications.Springer International Publishing,2014:1-10.

[11]Liu Y,Yu X,An A,et al.Riding the tide of sentiment change:sentiment analysis with evolving online reviews[J].World Wide Web,2013,16(4):477-496.

[12]Xueke X,Xueqi C,Songbo T,et al.Aspect-level opinion mining of online customer reviews[J].Communications,China,2013,10(3):25-41.

[13]Xianghua F,Guo L,Yanyan G,et al.Multi-aspect sentiment analysis for Chinese online social reviews based on topic modeling and HowNet lexicon[J].Knowledge-Based Systems,2013,37:186-195.

[14]Shi H,Zhou G,Qian P,et al.An Unsupervised Fine-grained Sentiment Analysis Model for Chinese Online Reviews[J].International Information Institute(Tokyo).Information,2012,15(10):127-135.

[15]Somprasertsri G,Lalitrojwong P.Mining Feature-Opinion in Online Customer Reviews for Opinion Summarization[J].J.UCS,2010,16(6):938-955.

[16]冯欣,王成良.本体在旅游信息系统中的应用研究[J].计算机与现代化,2010,26(3):128-132.

[17]Marrese-Taylor E,Velásquez J D,Bravo-Marquez F.A novel deterministic approach for aspect-based opinion mining in tourism products reviews[J].Expert Systems with Applications,2014,41(17):7764-7775.

[18]Wanxiang Che,Zhenghua Li,Ting Liu.LTP:A Chinese Language Technology Platform.In Proceedings of the Coling 2010:Demonstrations,Beijing,China.2010,(8):13-16.

[19]庐山旅游事业赶超发展纪实[EB/OL].http:∥www.china-lushan.com:88/xinwenzhongxin/yaowen/2015-04-16/6011.html,2015-04-16.

[20]唐晓波,王洪艳.微博产品评论挖掘模型研究[J],情报杂志,2013,32(2):107-111.

(本文责任编辑:郭沫含)

猜你喜欢
在线评论情感分析模型构建
基于SVM的产品评论情感分析系统的设计与实现
基于词典与机器学习的中文微博情感分析
在线评论情感属性的动态变化
基于云计算的大学生移动学习模型构建
高中物理解题的模型构建
文本观点挖掘和情感分析的研究
消费者个体行为偏好对在线评论真实性的影响机理研究