知识和数据双轮驱动的网络舆情分析技术研究

2018-05-15 10:17张思龙王兰成
现代情报 2018年4期
关键词:大数据

张思龙 王兰成

〔摘 要〕为应对当前网络舆情的新挑战和舆情分析的精准性要求,需要从大数据的角度研究舆情处理新模式,从知识工程的角度挖掘舆情知识体系。借鉴知识技术和大数据技术在舆情领域的最新研究成果,设计了基于知识和数据双轮驱动的网络舆情分析模型,讨论了模型设计和关键技术。最后以“南海问题”主题舆情为案例,对模型在实际舆论工作中的效用进行了验证,结果显示该模型能够较好地对特定主题舆情进行深度分析和挖掘。

〔关键词〕网络舆情分析;知识技术;大数据;南海问题

DOI:10.3969/j.issn.1008-0821.2018.04.015

〔中图分类号〕G206.2 〔文献标识码〕A 〔文章编号〕1008-0821(2018)04-0106-06

〔Abstract〕In order to meet the new challenge of the network public opinion analysis technology in the big data era.It is necessary to study new models of public opinion deals from the perspective of big data,and to excavate the public opinion knowledge structure from the perspective of knowledge engineering.The paper used the latest research of knowledge technology and big data technology in public opinion field for reference,and designed a network public opinion analysis model based on knowledge technology and big data science.Then discussed the design and key technology of the model,finally verified the actual utility in the work of the public opinion based on the subject“the South China Sea issue”public opinion analysis.The results showed that the model could good for a particular theme public opinion in-depth analysis and mining.

〔Key words〕network public opinion analysis;knowledge technology;big data;the South China Sea issue

网络舆情是广大网民对国家政治、经济、文化和社会发展趋势以及人们普遍关注的社会热点、难点在互联网上的集中体现,是网民表达情绪、述求、行为倾向的信息集合[1]。中国互联网络信息中心第39次《中国互联网络发展状况统计报告》显示,截至2016年12月,我国网民规模达7.31亿,互联网普及率达到53.2%,手机网民规模占比达到95.1%。海量的用户资料和行为数据为情报学者研究网络舆情提供了堅实的数据基础。然而,庞大的数据体量、错综的行为关系和海量的碎片化知识制约了传统网络舆情分析技术的发展。同时,海量的用户网络数据是社会舆情在互联网上的映射,业已成为政府了解社会民生、加强执政能力,有关部门及时掌握舆论动向,发现潜在舆论危机的重要参考,网络舆情分析技术的关键性突破显得尤为迫切。当前大热的大数据、知识工程等相关研究工作为网络舆情分析技术的研究提供了理论和技术参考,海量的用户网络数据也已成为大数据的重要来源,网络舆情研究进入了大数据和大知识时代[1]。

1 相关研究现状

1.1 网络舆情分析基础理论

网络舆情是网民情绪、意见、行为倾向的综合体现,按照其信息构成和内容可以分为多种类型[2]。网络舆情产生和传播也存在不同的表现形态,比如电子政务、新闻网站、搜索引擎、社交网络等,当前最为典型的就是百度、网易、新浪微博和腾讯微信等,涉及商品情报的还包括淘宝、京东、亚马逊等电子商务网站。

网络舆情分析基础理论就是要在传统舆情分析理论的基础上不断扩展和深化,既要从宏观上分析和预测用户群体性行为,也要从微观上洞察用户个体行为的动机和倾向。一般的,网络舆情分析基本流程包括舆情需求分析、舆情数据采集、话题识别、情感和统计分析、热点发现,以及基于用户的评价准则进行预测,并为需求方提供舆情服务[3]。宏观上讲,网络舆情分析包括整个环节和流程,但一般只把数据采集之后、舆情服务之前的环节作为网络舆情分析的主要内容,其中涉及的关键技术主要包括:话题识别与跟踪、倾向性分析、话题传播分析等。

话题识别与跟踪的研究始于1996年,是由美国国防高级研究计划委员会、卡内基·梅隆大学、DARPA等研究机构的众多学者共同定义[4]。话题识别与跟踪的主要任务是对相关话题的报道文本进行聚类,对特定话题进行跟踪报道,并以某种形式呈现给用户。常用的话题识别与跟踪方法主要是基于聚类和分类的方法[4]。其中分类方法主要用于现有话题跟踪的场景,聚类则是用于识别新话题,包括层次聚类和增量聚类。层次聚类适合非实时的离线数据处理,增量聚类则能够进行在线话题识别,应用广泛。常用的增量聚类算法有单遍聚类算法、K-means聚类算法。

倾向性分析是通过用户发表的内容对用户要表达的情绪进行判断,识别出用户对某一问题或观点是持乐观或悲观、赞同或反对等。相关概念最早是由人工智能创始人之一的Minsky教授提出的。其主要应用在电子商务领域,在政治选举等舆情领域也有比较多的研究。情感分析随着机器学习相关技术的发展,取得了一些成绩,朱晓旭[5]提出两层架构的基于知识库和检索引擎的人物分类方法,基于知识库和机器学习中的文本分类方法对人物评价进行情感分析;房磊[6]结合语法知识,引入少量“评价词”——“评价对象”的搭配和大量的评论数据,对情感分析各个任务进行改进,实现功能模型简单有效,鲁棒性好。

话题传播分析是对话题在用户之间传播的途径和规律,一般基于传染病模型进行研究。也有学者借助社会网络分析的方法,即通过构建舆情社会网络对用户关系进行表示,对用户行为模式进行揭示,进而对话题传播趋势进行预判。Zhou[7]等人在原有的社团发现技术基础上,结合用户关联关系和用户参与的话题,挖掘社会网络结构和话题分布的关系,该方法实现了对微博兴趣社团的挖掘。Liu等人[8]将对话题信息和用户关联关系属性进行综合,提出了一种生成模型,用于挖掘用户在话题层面的直接影响力,最终用于预测用户行为和话题传播趋势。

1.2 知识技术及其在网络舆情分析中应用

舆情知识组织当前是舆情分析领域的研究热点之一。知识库是知识组织和管理的基础,结合网络舆情的特点,引入知识组织与管理的理论和方法,构建专门的舆情知识库。从舆情决策基本知识需求出发,从发现知识到更新知识,不断扩充知识库规模,完善舆情知识内容,从根本上把握网络舆情的动因和趋向,对科学有效地进行网络舆情管控和引导工作具有重要的理论价值和现实意义。

王静婷等在网络舆情内容分析系统框架中融入知识技术,将知识组织和管理相关研究成果与舆情分析的关键流程和技术进行充分融合,建立基于知识技术的网络舆情内容分析框架,以提高网络舆情内容分析的准确度[9]。谢明亮等对知识管理相关技术在舆情管理中的应用进行论证,提出舆情机构库的定义,从特点、构建策略和专业人员建设三方面进行舆情机构库研究[10]。郭韧等通过空间向量模型构造网络舆情的知识需求,挖掘舆情知识供需关系,整合舆情源中的知识片段,结合词频变化的方法抽取与主题相关的核心概念[11]。毛秀梅等在构建知识组织——知识供应的两阶段知识服务流程模型的基础上,研究了面向政府的网络舆情知识服务能力需求,提出了基于OGSA的网络舆情知识服务平台架构[12]。

1.3 大数据技术及其在网络舆情分析中应用

大数据通常是指常规软硬件平台无法及时感知、处理的数据集,它具有数据量大、增长快、来源广泛等特征。针对大数据的特征,网络舆情分析首要解决人工无法应付的海量网络数据的采集、存储和处理任务。数据采集应当突出高效性和全面性,对于特定需求数据需要进行定向采集,散布的零星信息和碎片化知识需要进行全面收集、整理,海量历史数据需要整理再利用。同时,网络舆情数据往往存在用途不同、来源多样、格式各异等特点,还需要研究多源融合理论和方法,尤其大数据环境下,在数据融合基础上,逐步构建信息融合、知识融合的研究体系[13]。大数据处理技术体系方面,基于Hadoop的分布式存储和大规模并行处理技术成为当下热门的解决方案[14]。

另外,近几年大数据知识工程的研究也初见端倪,大数据知识工程是从国内兴起、引领大数据分析走向大知识研究和应用的一个国际前沿研究方向,与传统知识工程相比,大数据知识工程除权威知识源以外,其知识主要来源于用户生成内容,知识库具有动态更新和自我完善能力[15]。

1.4 大数据环境下的舆情知识供给问题

当前网络舆情数据已经成为大数据的重要来源,可以说网络舆情分析已经离不开大数据处理技术了,网络舆情也进入了大数据时代,事实上大数据分析已經成为当前舆情领域热点研究之一。相关研究结果表明,通过大数据技术的应用,网络舆情分析可以达到微观层次,使得即时性、细节化的用户情绪和倾向判断成为可能,大数据改变了传统舆情注重内容而忽略关系的情况,依托大数据社会网络分析,可以将舆情与情报源进行关联分析,以生产更高价值的信息[16]。然而从舆情分析的重要目的,舆情决策的角度讲,当前舆情分析的现状还存在不足,在舆情案例研究、政策法规和领域知识等方面出现了供需不匹配的问题,也就是舆情知识供给的问题。当前包括复旦大学、合肥工业大学在内研究机构都在致力于大数据和知识工程的研究就是要拓展大数据到大知识,将大数据中离散的多元信息、碎片化知识统一建模,用以构建新型大数据知识服务体系,所以解决大数据环境下的舆情知识供给问题还要从大数据知识服务相关理论和技术方面着手。

2 知识和数据双轮驱动的网络舆情分析模型

2.1 必要性分析

大数据时代的到来,使得网络舆情呈现了数据体量庞大、知识多元、价值宏大等特征,从数据规模上来看,其规模是海量级的,从数据内容上来看,包含所有与之相关的信息内容,从数据类型上来看,包括结构化数据、半结构化数据、非结构化数据及交互数据等,更加复杂多样[17]。传统的抽样式的舆情分析方法已不能适应这种新的变化。大数据处理技术无疑为网络舆情研究提供了新的研究思路,网络舆情大数据处理超越了传统的舆情数据处理模式,通过海量数据挖掘、智能信息处理和深度语义分析等手段,将舆情分析中各种潜在的关联、微观的异动和动态的演化进行可视化图谱演示和分析,并直接用于辅助决策。

然而,大数据带来的是海量的信息流动和离散多元的舆情信息,严重影响了舆情信息处理的效率和效果,所以还需要对舆情信息进行组织,相关研究显示出知识技术的适用性,尤其针对特定主题或特定需求的舆情信息处理场景[9-12]。知识技术的应用主要对特定领域、特定需求的舆情信息进行组织,从而对舆情数据的采集、分析进行过程性指导和监督,甚至可以直接用于舆情服务,提高大数据舆情分析系统的准确性和实用性。

因此,研究知识和数据双轮驱动的网络舆情分析技术十分必要,它既能够充分发挥大数据处理技术在智能信息处理和深度语义挖掘方面的优势,又能结合知识技术构建一系列的舆情知识库和案例库,从而完善舆情知识服务体系。

2.2 模型设计

本文结合大数据处理和知识技术设计了面向知识服务的知识和数据双轮驱动的网络舆情分析模型,包括舆情知识库、舆情大数据采集、舆情研判、舆情知识服务等功能模块,如图1所示。该模型各模块之间信息互通,形成有机整体。

2.2.1 舆情知识库模块

舆情知识库主要用于提炼知识需求、指导数据采集、舆情知识匹配、舆情知识服务等。基于知识的舆情分析系统中可以有一个或多个知识库用于支撑舆情知识挖掘和利用。本文设计舆情知识库包括领域知识库、业务知识库、舆情事件库、舆情案例库和决策支持库等。领域知识库是对特定领域知识的组织和管理,是该领域通用概念及其关系的集合,比如政治领域、公共卫生领域等;业务知识库则是舆情工作部门业务知识的集合,往往建立在一定领域知识库基础上的,比如政治领域舆情工作知识库等;舆情事件库保存了特定舆情事件基本信息和相关信息,比如事件主体、客体、时间、起因、经过等要素;舆情案例库保存了特定领域系列舆情事件发生、发展、处理和效果等信息;决策支持库保存了舆情决策的相关知识,比如相关案例、引导策略、管控方法等,一般是对舆情案例库综合分析而形成的决策支持信息,可直接用于舆情知识服务。

2.2.2 舆情大数据采集模块

大数据时代网络舆情信息涉及的范围十分广泛,涉及人们生活活动的方方面面,数据来源众多。所以舆情大数据采集的对象除了舆情工作部门日常关注的新闻媒体、门户网站、以及微博、微信等社交网络之外,还需要不断扩展舆情数据的来源,发挥大数据全角度、全方位覆盖的信息优势。比如对电子政务网站、舆情工作部门的业务数据等进行采集汇总,尤其是涉及政策解读、民生问题等数据的收集工作等。从而构建包含媒体报道、网民意见、政府工作等全角度、全方位、立体化的舆情数据来源,为舆情知识库提供源源不断的知识,同时,舆情知识库也可以为舆情大数据采集提供指导,既保證采集信息全面无遗漏,又能一定程度上保证精准采集,避免不必要的数据冗余和资源浪费。

2.2.3 舆情研判模块

舆情大数据为舆情知识库提供了十分丰富的知识来源,但这些知识往往是低价值密度和离散稀疏的,需要通过舆情研判工作,充分挖掘舆情大数据的价值。舆情研判的任务就是对网络舆情进行价值判断和前景预测,而这里的价值更多的是体现在舆情知识上。从数据、信息和知识的关系上来看,知识往往是对数据和信息进行组织、总结、体系化归纳而得到的,知识的获取需要从数据提取信息,从信息归纳知识。所以,舆情研判需要综合运用数据融合、文本分析、深度语义挖掘、智能信息处理等大数据处理技术,同时结合舆情知识库中相关领域知识、业务知识和舆情案例等知识保障,实现网络舆情大数据的数据整合、信息要素提取、知识发现等相关分析任务。从处理流程上来讲,舆情研判首先需要根据舆情研判的知识需求对采集的数据进行初步筛选、过滤和清洗,对多源数据进行融合,对数据中的舆情信息进行抽取,然后通过语义挖掘和关联,发现舆情热点,提取相关事实知识,通过知识匹配对适合的知识内容存入知识库,不断完善知识库。另外,舆情研判还可以专门针对某一特定事件进行跟踪,探索舆情事件的演化规律和传播效应,为舆情监督和管控等提供必要的案例素材。

2.2.4 舆情知识服务模块

舆情知识服务面向的是网络舆情业务工作人员或舆情决策者,主要用于在特定时期和特定任务情况下,根据舆情决策者的舆情需求或者特定舆情事件发展的不同时期,为舆情决策者提供相关舆情知识服务。一般的,舆情研判相关结果可直接用于舆情服务,知识库中包含了大量的事实知识、显性知识和隐性知识,通过对各类知识的梳理,以一定形式进行可视化,也可以为舆情决策者提供舆情服务。舆情知识服务主要功能包括,对未知舆情危机发生前进行常规性的舆情监测和预警工作;对特定舆情事件提供事件跟踪、阶段性舆情评估、风险分析及应对策略的舆情服务;根据不同时期不同任务需要,提供专门性的舆情报告、案例总结、对策意见等咨询服务。另外,通过人机交互,实现舆情分析系统与舆情决策者的信息互动,对舆情决策者的知识需求进行实时传递和反馈,发挥舆情决策者通过自身业务知识对网络舆情的把控优势。

2.3 关键技术

2.3.1 舆情知识库构建技术

舆情知识库一般以领域知识作为知识库蓝本,借鉴领域专家的知识体系构建舆情知识库结构。常用的舆情知识库种类有专家系统、机构数据库、本体库、主题词表、分类词表等。针对不同的知识库类型,知识库内容、构建思路和方法也不相同。现有的知识库构建技术一般包括基于知识管理的、基于知识工程的和基于本体的知识库构建。基于知识管理的知识库构建一般用于图书情报领域,主要侧重强调知识的获取、存储和共享,一般从现有的文献资料中提取显性知识和隐性知识,通过知识分类对知识进行有序化,以便于知识的存储和共享。基于知识工程的知识构建一般用于人工智能领域,主要侧重强调自主学习和知识推理,也就是从当前存储的事实信息和显性知识中提取用户需要的隐性知识。本体是共享的概念模型的形式化规范化描述,基于本体的知识库是当前比较流行的语义知识库解决方案。本体的目标是捕获相关领域的知识,提供对该领域知识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇和词汇间相互关系的明确定义。

2.3.2 舆情大数据语义挖掘

舆情大数据语义挖掘是为了解决网络复杂语义环境中准确提取舆情信息的问题的。当前比较流行的方法是基于主题模型和语义网技术的方法。主题模型是一种语言生成模型,在自然语言处理、机器学习等领域应用广泛。主题模型起源于隐性语义索引,隐性语义索引为主题模型的发展奠定了基础,LDA模型被认为是第一个主题模型。主题模型有利于挖掘潜在的语义关联模式,对舆情大数据语义挖掘研究具有重要借鉴意义。语义网技术,就是能够根据语义进行判断的智能网络,实现人与计算机之间的无障碍沟通,目前,语义网的研究主要集中在RDF和本体,语义网的实现包括关联数据、谷歌知识图谱等技术,都在大数据语义挖掘方面有相关研究。

2.3.3 知识发现技术

知识发现是确定数据中有效的、新颖的、潜在有用的、基本可理解的模式的特定过程。大多数知识发现方法是在人工智能、数据库、信息组织与检索等领域中发展来的。典型的基于知识发现技术包括贝叶斯推理、K-Means聚类、神经网络、决策树和粗糙集理论等。

2.3.4 知识匹配技术

知识匹配是知识管理中知识检索的重要任务。目前,知识匹配主要是基于语义相似度的计算方法。部分学者也从知识的表达方式上探索知识匹配的有效算法,提出基于范畴论的最大公约子范畴用于知识匹配,以解决高维知识结构上的匹配量化问题。

3 “南海问题”主题舆情分析案例研究

“南海问题”相关舆情涉及了国家主权、海洋权益、国际公约和国际政治局势等众多敏感话题,我国政府和学术界对“南海问题”舆论工作十分关注。构建基于知识和数据双轮驱动的“南海问题”舆情分析系統有利于整合现有“南海问题”舆情知识库,及时跟进相关事件发展,为舆论引导工作提供决策支持。

3.1 “南海问题”舆情分析系统构建

依据知识和数据双轮驱动的网络舆情分析模型构建“南海问题”舆情分析系统是模型技术实现的具体化过程,包括了“南海问题”舆情知识库、舆情数据采集、舆情研判、舆情知识服务4个模块的技术实现过程。

3.1.1 构建“南海问题”舆情知识库

知识库使用本体技术实现,通过对相关文献整理筛选初步形成事件类、国家类、关注类、岛礁类4类舆情本体库,以事件类为核心,将事件发起或介入的国家、关注的媒体或机构、涉及的岛礁分别纳入国家类、关注类和岛礁类本体库中,媒体所在国家则纳入国家类本体库中,如图2所示。

3.1.2 “南海问题”舆情数据采集

舆情数据主要通过网络爬虫和相关媒体API接口进行多种渠道、分布式并行采集,一般需要预先设置采集条件,比如关键词和目标网站等。由于多种渠道得到的数据分散、格式相异,还需要对采集的数据进行整理,对不规范的数据进行规范和整理,不完整的和不一致的数据进行清理,完成数据的统一模式转换。另外,借助“南海问题”舆情知识库,系统可以根据用户提供的关键词,查找更准确表达用户需求的检索词集合,并根据该检索词集合实现对相关内容的全面准确爬取。

3.1.3 “南海问题”舆情研判

舆情研判是一个复杂的过程,根据不同的任务需要采取不同分析策略。以热点事件追踪为例,按照时间轴推进的方式,查找该事件在网络中的报道、评论,从而获取该事件的发展脉络。比如通过文本处理技术,对采集的网页正文、微博评论等进行分词、特征词提取、主题发现和分类、时序关联,获取事件发展情况,通过情感分析判断广大网友对后续发展的态度。

3.1.4 “南海问题”舆情知识服务

“南海问题”涉及领域范围广,知识结构复杂,随着国际形势变化,突发事件频发,需要及时的积极应对。通过舆情知识服务,突发事件一旦发生,一方面要第一时间形成相关历史事件发展脉络图,掌握相关法律依据,占据法理高地;另一方面要及时跟进事态发展,形成相关舆情报告,引导相关舆论,形成有利的舆情态势。

3.2 典型事件“南海仲裁案”的舆情分析

以“南海仲裁案”相关信息,包括事件过程、涉及国家、涉及岛屿和各方观点为需求,对舆情数据进行采集、处理和分析。针对“南海仲裁案”事件,相关国家中国、菲律宾、美国纳入国家类库,涉及岛礁黄岩岛、美济礁、仁爱礁和渚碧礁等纳入岛礁类库,对此事件报道的新华网、新浪网、微博、微信等纳入关注类,如图3所示。

舆情数据主要来源于新华网、新浪网、今日头条等新闻网站,新浪微博、微信等社交媒体,围绕关键词“南海问题+南海争端+南海仲裁”,以2016年7月12日“南海仲裁案”结果发布后1周为限,即7月12日零时至7月18日24时,通过网络爬虫、新浪微博API、搜狗微信搜索对相关平台数据进行采集,借助新浪微舆情社会化大数据应用平台对相关数据进行补充。以天为单位对采集的文本数据进行分时处理,分词后利用LDA模型对文本数据进行建模,获取主题词分布,通过时序分析,获取舆情发展走势。另外,对文本数据中涉及实体和关系进行抽取,提取相关的事实知识补充南海本体知识库。

对比不同平台提取的信息可以发现,“南海仲裁案”事件信息比较集中,各平台间转载量和引用量比较大,用户评论意见比较一致,形成比较清晰的发展脉络。各媒体和广大网友等关注方意见比较一致,均认为“中国对南海拥有正当领土权益”、“南海仲裁案是披着法律外衣的政治闹剧”。

同时,通过对知识库中已有案例对比报道提取的主题词或关键词用于发现“南海仲裁案”事件的发展脉络和后续走势(见表1),包括“2013年1月22日,菲律宾单方面将就南海问题提交国际仲裁”开始,到结果发布,再到后续的“多国领导人支持中国南海问题立场”等相关报道。同时南海问题知识库国家类库也扩展了新加坡、越南、老挝等国家,岛礁类基本涵盖了与菲律宾有争议的岛礁。

4 结束语

网络舆情研究是较为复杂的一项系统工程,相比传统媒体舆情,网络舆情的表现途径、用户规模和结构特性等更为复杂,同时大数据时代的到来为网络舆情研究提供机遇的同时也带来了很大挑战。大数据时代网络舆情分析要在传统舆情分析理论的基础上不断扩展和深化,既要从大数据的角度在宏观和微观层面上洞察网民群体性动向,也要从知识工程和知识管理的角度对舆情大数据进行知识挖掘,以更科学有效的方式提供舆情决策支持。本文借鉴知识技术和大数据技术在舆情领域的研究成果,设计了面向用户知识需求的基于知识和数据双轮驱动的网络舆情分析模型,讨论了模型设计和关键技术。最后以“南海问题”主题舆情为案例对模型在实际的舆情工作中的适用场景和实际效用进行了验证,结果显示该模型能够较好的结合知识和大数据技术对特定主题舆情进行深度分析和挖掘。

参考文献

[1]尚明生,陈端兵,高辉.舆情信息分析与处理技术[M].北京:科学出版社,2015:1-10.

[2]汪建基,马永强,陈仕涛.碎片化知识处理与网络化人工智能[J].中国科学:信息科学,2017,47(2):171-192.

[3]郝晓玲.网络舆情研判技术的研究进展[J].情报科学,2012,30(12):1901-1906.

[4]J.allan J.-Carbonell-et-al.Topic Detection and Tracking Pilot Study:Final Report[C].In the Proceeding of the DARPA Broadcast News Transcription and Understanding Workshop,1998.

[5]朱晓旭.人物评价文本情感分析研究[D].苏州:苏州大学,2016.

[6]房磊.融合知识的情感分析研究[D].北京:清华大学,2015.

[7]Zhenjun J.Hongxia-and-L.-Yan.Community Discovery and Profiling with Social Messages[C].In the Proceedings of the 2012 KDD,2012:388-396.

[8]Liu T.Jie-H.Jiawei.Mining Topic-level Influence in Heterogeneous Networks[C].In the Proceedings of the CIKM10,2010.

[9]王靜婷,徐震.一种基于知识技术的网络舆情内容分析系统框架[J].图书情报导刊,2016,(2):139-143.

[10]谢明亮.基于知识管理的舆情机构库研究[J].江苏第二师范学院学报,2016,(3):110-114,124.

[11]郭韧,陈福集.政府面向网络舆情的知识源整合研究[J].情报科学,2016,34(8):133-137,142.

[12]毛秀梅,杨晔.面向政府的网络舆情知识服务体系构建研究[J].情报科学,2016,34(9):124-128.

[13]祝振媛,李广建.“数据—信息—知识”整体视角下的知识融合初探-数据融合、信息融合、知识融合的关联与比较[J].情报理论与实践,2017,40(2):12-18.

[14]杨爱东,刘东苏.基于Hadoop的微博舆情监控系统模型研究[J].现代图书情报技术,2016,(5):56-63.

[15]吴信东.从大数据到大知识:HACE+BigKE(报告)[J].计算机科学,2016,43(7):3-6.

[16]徐敏.大数据环境下情报学在网络舆情研究中的作用[J].图书情报研究,2016,(2):12-18.

[17]瞿志凯,兰月新,夏一雪.大数据背景下突发事件情报分析模型构建研究[J].现代情报,2017,37(1):45-50.

[18]丁晟春,龚思兰,周文杰.基于知识库和主题爬虫的南海舆情实时监测研究[J].情报杂志,2016,35(5):32-37.

(实习编辑:陈 媛)

猜你喜欢
大数据
浅谈大数据在出版业的应用
“互联网+”对传统图书出版的影响和推动作用
大数据环境下基于移动客户端的传统媒体转型思路