基于语义网络分析的门户媒体图书馆新闻报道趋势研究*

2020-03-25 02:35莫扬海
图书馆研究与工作 2020年2期
关键词:新闻报道集群频率

莫扬海

(广东轻工职业技术学院图书馆 广东广州 510300)

1 引言

新闻是一种社会意识的表达方式,它可以启发公众,同时也可以传播信息。公开并能迅速揭露事实的新闻报道,能够正面或负面地批判某些社会现象,因此新闻报道有助于反映社会问题,提前预防非法事件,并在未来发展中纠正这些错误。虽然图书馆还没有被视为新闻中的一个重大社会问题,但是分析门户媒体如何报道图书馆新闻以及门户媒体从何角度关注图书馆如何随着时代的发展而改变,对于图书馆适应时代发展和满足读者需求具有重要意义。

因此,本项研究试图通过从新浪网的文本数据中提取结构化信息,理解相关模式和语义系统,来可视化我国图书馆在门户媒体中是如何向公众展示自己。在本研究中,以公共图书馆、学校图书馆和大学图书馆作为关键词。语义网络分析通过使用ICTCLAS和Wordij计算所选关键词的共现来进行。通过这样的方式,研究门户媒体新闻报道中反映的三个关键词之间的差异,以及最近和过去新闻报道中与图书馆相关问题之间的差异。

2 研究现状

门户媒体图书馆新闻报道的研究现状可分为4种类型。

第一类研究是通过指定特定类型的图书馆,如学校图书馆、公共图书馆和大学图书馆,对图书馆的新闻分析进行研究。Kim专门分析了从2002年1月—2008年12月之间韩国综合性日报对学校图书馆的新闻报道,指出门户媒体对图书馆的新闻报道只集中在学校图书馆新项目的开始和结束时,学校图书馆只在项目的这些阶段受到门户媒体的关注,而在其他时间却没有[1]。张正分析了《南方日报》2008年1月—2010年12月对广州地区公共图书馆的新闻报道情况,指出《南方日报》对广州地区公共图书馆服务均等化的发展给予正面报道,有助提升其形象,应借助媒体宣传,推动广州地区公共图书馆服务均等化发展[2]。2015年,Kim和Giyeong继续对2009—2014年期间报纸上报道的194篇与韩国小型公共图书馆相关的文章进行了内容分析,发现有许多新闻报道涉及了图书馆在振兴地方社区和地方文化方面的作用,另有一些新闻报道涉及到私营公司对图书馆的支持[3]。Estrada-Cuzcano和Huaman-Huriarte则监测和检查了秘鲁的37家媒体对于秘鲁大学图书馆在大众媒体中的形象定位,发现尽管许多大学都有机构传播或媒体办公室,但是大众媒体只提到大学图书馆43次,得出的结论是,目前大学没有做出什么努力来加强或发展大学图书馆的定位[4]。

第二类研究是通过分析与图书馆相关的新闻报道随时间的变化而呈现的趋势来进行。刘兹恒、高丹以《人民日报》1949—2006年期间关于图书馆的报道为依据,归纳了近60年来我国权威新闻媒体对图书馆关注的主题及其变化趋势,着重分析了对图书馆的负面报道,由此提出图书馆如何加强与媒体联系以优化图书馆形象的建议[5]。Galluzzi研究了与图书馆主题相关的西班牙报纸媒体的报道,发现新闻报道最初时期的特点是对图书馆基础设施投资非常感兴趣,因为金融危机的压力越来越大,新闻报道将重点转向图书馆数字模式,以此作为应对危机的工具[6]。他报告称,媒体展示的西班牙图书馆形象明显是传统的,对图书馆和图书馆员有着共同的成见。

第三类研究是分析媒体报道的方向如何随社会情况而变化。宋蓉以近五年来对安徽省图书馆的报纸新闻报道为视角,对报道数量和报道主题进行统计、分析。认为安徽省图书馆在报纸上没有被视为一个重要的社交领域,通过媒体宣传图书馆是不够的,媒体报道只专注于社会活动,如图书馆建设和阅读活动,这些活动比图书馆本身更受欢迎[7]。Shaw以《泰晤士报》和《镜报》的264篇报纸文章为样本,研究了英国图书馆的事业[8]。Cebrian-Solis和Faba-Perez研究了西班牙经济状况是否影响了图书馆新闻的数量及其在媒体中的可见度[9]。

第四类研究是使用文本挖掘技术定量分析报纸报道图书馆的流量。Lee使用网络分析方法基于定量提取的关键词分析报纸报道的流量[10]。Lee的研究通过推导单词共现度量来进行语义网络分析,在方法论上与本项研究非常相似。

正如所分析的,关于门户媒体图书馆新闻报道的研究通常涵盖了媒体对特定类型图书馆开放的问题或者是关注新闻报道随时间变化的趋势。而最近,研究已经开始使用文本挖掘对累积的媒体数据进行定量分析。本项研究的区别在于对上述所有先例研究采用的所有方法进行全面分析。本项研究不仅通过将图书馆分为公共图书馆、学校图书馆和大学图书馆来分析媒体报道的差异,还揭示了其随时间变化的差异,此外,所有这些过程都是通过使用文本挖掘技术的语义网络分析进行的。

3 研究方法

本项研究将新浪网新闻作为调研对象,从新浪网网页中提取关键词。不同于微博、百度、微信这些任何人都可以编写新闻的开放的平台新闻服务,新浪网的新闻内容来自全国328家经过政府相关监管单位严格审查和备案的媒体,占据中国互联网新闻消费的37.8%,具有更高的可信度。同时,考虑到可能出现的虚假新闻,将搜索的信息发布者定义为主流媒体、政府单位和报纸媒体。通过这样的有条件设置,将新浪网的数据作为本项研究的调研对象比其他网络新闻媒体的数据更具有真实性。而本研究加入数据分析方法,可以帮助项目研究形象化从门户媒体提取到的图书馆关键词,因此本研究通过文本挖掘方法选择关键词、计算频率,并进行网络分析和可视化,以识别单词的频率和两词之间的共现频率数值。在实际操作上,分为以下3个步骤进行。

第一步:从去年(2018年1月1日—2018年12月31日)和过去10年(2008年1月1日—2017年12月31日)的新浪网门户新闻中提取数据,将文章搜索结果的最大数量限制为每次搜索1 000个项目,以提高系统效率,并且每周抽取图书馆相关文章,数量不超过1 000篇。使用汉语词法分析系统(Institute of Computing Technology,Chinese Lexical Analysis System,ICTCLAS)对抓取的名词、动词和形容词进行分词,进而生成分词文本。不过因为分词系统词典的有限性,对于在分词文本内里不能被识别的固定词用人工方法进行筛选,纠正不合逻辑的分词处理,最终形成正确的分词文本。

第二步:分词处理之后,开始分析与图书馆有关的概念以及概念之间的关系,从而取得图书馆相关概念的频率和概念共现频次,然后再使用Wordij分析词频和词对频率。Wordij是一款集成了词频、词对频率、可视化语义网络分析等多种运算程序的开源软件,由Danowski J.A.开发,能够分析UTF-8编码的文件,所以可以用来分析中文[11]。这其中,分析网络变化的过程很重要,因为节点和组成网络节点之间的相关性根据外部环境或时间的动态变化是不固定的,因此,本项研究表明中心节点不仅在不同类型的图书馆中不同,而且根据时间变化也不同。

第三步:将最终形成的正确分词文本导入进该软件,并设定词频下限和词对频率下限的参数数值均为3个词,当两词之间的间距小于3时则返回两词之间的共现频率数值。通过Wordij的可视化分析结果,让文本之间的关系以聚类的可视化方式呈现,从而研究社交意识的差异以及门户媒体中图书馆新闻报道的变化。通过以上方法,收集到语义网络数据的基本要素和两词之间共现频率的数值。

4 数据分析

4.1 公共图书馆

使用“公共图书馆”作为检索词检索有关图书馆的新闻报道,在过去10年的新闻中,有5 430个相关关键词,而去年的新闻中提取了30 125个关键词。频率分析、中心度分析和Wordij分析的结果总结如下。

首先,比较从最近新闻中提取的高级关键词和从10年前的新闻中提取的高级关键词,查看关键词之间的排名变化,如表1所示。诸如“书”(第一)、“阅读”(第二)、“活动”(第三)、“商业”(第四)和“文化”(第七)等关键词在最近的新闻中出现频率很高。另一方面,从过去新闻中提取的关键词排名对于最频繁出现的单词“书”来说是一样的,不过,“全民”“面积”和“文化”排在前列,与最近的新闻有所不同。另一方面,“智慧”与“无纸化”是最引人注目的,现在出现的频率比10年前的更多,因为许多与政府推动的智慧城市项目相关的图书馆建设已经形成发展趋势。

表1 公共图书馆媒体新闻报道关键词排名变化

其次,根据最近公共图书馆相关文章中出现超过200次的40个关键词的网络分析结果,“全民”“阅读”“文化”等关键词具有高度的集中性。高度集中意味着由于与其他关键词同时出现的频率较高,因此它在关键词之间的关系中起着中心作用。“活动”一词在出现频率上排在第一位,显示出与“阅读”和“文化”的高度关联。另一方面,当我们查看10年前从与公共图书馆相关的文章中提取的40个高级关键词的网络分析结果时,“图书馆”和“主题”显示出最高程度的集中性,然而,像“社区图书馆”这样的关键词在最近的新闻中才显示出高度的集中性,但在过去并没有显示出高度的集中性。这可以用一个事实来解释,即社区图书馆最近吸引了媒体的注意,而社区图书馆的概念在过去的新闻报道里并没有被重视。

第三,Wordij分析的结果显示了基于结构等价分析的聚类,可以用来直观地识别公共图书馆媒体新闻报道文章的主要主题,如图1所示。随着以地方政府为中心的图书馆的建设和扩大,最近的媒体新闻报道文章都趋向研究“规模与改造”,由文化部门推行的人文项目、终身教育项目和地方图书馆服务也形成主要报道趋势。过去10年公共图书馆的相关媒体新闻报道文章也形成了集群,主要集中在地方图书馆服务方面,与人文项目相关的集群并不引人注目,相反,有一个集群连接公共图书馆、学校图书馆、大学图书馆和推荐书籍清单。根据分析结果,可以得到以下结论:尽管与公共图书馆相关的媒体新闻报道文章主要报道倾向于图书馆的基础设施建设,但近年来与文化项目或人文项目相关的宣传文章正在大量涌入,这表明图书馆作为终身教育和文化空间的功能对公众的影响更大了。自注重绩效的公共图书馆评价体系推行以来,媒体过分强调针对地方政府的图书馆活动的新闻报道,这使得公众误解了公共图书馆的原始功能。

图1 公共图书馆媒体新闻报道可视化分析

4.2 学校图书馆

通过分析新闻数据并使用“学校图书馆”作为关键词,从过去一年的新闻中提取了20 053个关键词,从过去10年的新闻中提取了15 642个关键词。

首先,将最近媒体新闻报道中出现的15个关键词与10年前媒体新闻报道中提取的关键词进行比较。在最近学校图书馆的相关媒体新闻报道中,“图书馆”(第一名)的出现频率最高,其次是“书”(第二名)、“学生”(第三名)、“利用”(第四名)、“支持”(第五名)和“阅读”(第六名),如表2所示。在过去10年的媒体新闻报道中,出现频率最高的关键词是“图书馆”(第一)、“书”(第三)和“阅读”(第五)。另一方面,在最近的媒体新闻报道中,“智慧”上升了176个位置,“实践”上升了145个位置。此外,诸如“训练”(+139)、“推广”(+111)、“培训”(+93)等关键词也上升了排名。据调研,这是因为有一些关于智慧图书馆建设、图书管理员培训、家长培训、阅读教育项目、阅读推广活动、家长志愿者等的媒体新闻报道,这些关键词经常被提及,所以排名迅速上升。

表2 学校图书馆媒体新闻报道关键词排名变化

第二,对最新学校图书馆相关媒体新闻报道中出现的40个关键词的网络分析显示,“利用”“阅读”“学生”“书”“图书馆”都显示出最高的中心度;另一方面,在过去10年的学校图书馆相关媒体新闻报道中,“阅读”“学生”“书”显示出最高程度的集中性。两者相比,中心性排名和发生频率之间没有显著差异,但是“利用”显示出比发生频率更中心的靠近,即比过去呈现更高的增长,而“阅读”也显示出更高的中心性而不是发生的频率。这些关键词的高度集中,原因在于有许多与学校图书馆文献利用相关的报道,如通过阅读推广或政府赞助的艺术和文化节目竞赛来提高图书馆文献利用率。

第三,通过Wordij分析可视化集群,结果如图2所示。与学校图书馆相关的最新报道可视化结果显示,捐赠书籍构成了主要集群,与家长培训相关的报道形成了第二集群,与青少年阅读项目的报道构成了第三集群,而学校图书馆的使用和运营构成了第四集群。另一方面,当查看从过去新闻中提取关键词的聚类结果时,从与学校图书馆基础设施相关的报道中提取的关键词形成了主要集群,学校图书馆政策和管理、图书馆服务形成了第二、三集群,学校图书馆使用经验构成了第四集群。从可视化集群的结果可以看出,尽管过去和现在关于学校图书馆运营和利用的关键词都是主要的分类,但在最近的新闻中,学校图书馆员的培训、图书捐赠、阅读和文化项目等主题的宣传是最突出的,这与过去学校图书馆重视基础设施不同。关于学校图书馆馆员最关心的图书馆岗位设置及馆员缺乏问题,并没有形成积极的公众舆论。

图2 学校图书馆媒体新闻报道可视化分析

4.3 大学图书馆

分析以大学图书馆为关键词检索的新闻数据,发现过去新闻中有6 423个关键词,去年新闻中有8 761个关键词。与公共图书馆和学校图书馆不同,前者从最新新闻中提取了三万多项内容,后者则只提取了一万多项内容,这样可以认为与大学图书馆相关的最近新闻不多,门户媒体对此兴趣不大。

首先,比较最近新闻报道中出现的15个关键词和10年前的新闻报道,如表3所示。在最近和过去的新闻报道中,“图书馆”“书”“学生”排名第一、第二和第三。因此,“图书馆”“书”“学生”等关键词在过去和现在经常出现,没有变化。然而,在过去和现在的排名中,有一些关键词发生了重大变化,如“人文学科”(+345)、“支援”(+171)、“智慧”(+149)显示出很高的排名,这表明越来越多的大学图书馆喜欢开展智慧图书馆服务和支援地方图书馆建设。在过去频繁出现的关键词中,一些关键词如“美国”(第18个)、“数字”(第20个)消失了。

表3 大学图书馆媒体新闻报道关键词排名变化

其次,对最新大学图书馆媒体新闻报道中出现的40个关键词的网络分析显示,“图书馆”“书”“学生”的频率较高,类似于表3所示的数据分析结果。在过去的数据分析中,诸如“空间”和“人文学科”之类的关键词是具有高度中心性的关键词,而在过去表现出高度集中但在最近的新闻报道中消失的关键词有“美国”和“数字”。

第三,通过Wordij分析,可视化集群结果如图3所示。政府或公共机构的出版物和图书馆人文项目是最新大学图书馆媒体新闻报道的主要集群,与图书馆学术与电子信息服务相关的关键词形成了第三集群,图书馆工作的学生相关的报道占了集群四的位置。另一方面,在过去的新闻中,对国际交流的支持和数字图书馆项目形成了主要集群,这反映了大学图书馆过去十年的主要问题;大学生就业准备集群以及图书馆社区开放集群也是从过去的新闻分析中获得的。总之,无论是过去还是最近,媒体都报道了高校图书馆与政府关系、图书馆运营以及大学生就业准备相关的问题。由于大学图书馆本身无法吸引大量的社会问题,不可避免地媒体曝光率很低。通过研究媒体关于大学图书馆的新闻报道文章,媒体在现阶段有必要深入报道目前以某所大学为中心的全国范围内先进学术信息共享的问题,此外,在大学的社会贡献方面,有必要就图书馆向当地社区开放等问题进行深入报道。

图3 大学图书馆媒体新闻报道可视化分析

5 研究结果

研究结果显示,图书馆尚未被视为新闻中的重大社会问题,公众舆论并不活跃。通过对新闻中预测的关键词的分析,本项研究能够理解随着时间的推移而产生的媒体兴趣的流动。

5.1 公共图书馆不是知识信息中心

公共图书馆一般需要参与到政府的形象营销整体规划中,在这个过程中,无论时间长短,都要就公共图书馆的社会利益和必要性达成共识。根据关键词、计算频率和可视化分析,最近关于公共图书馆的媒体新闻报道分析结果中,“全民”“阅读”“文化”是突出的关键词,人文课程和终身教育课程也具有两个明显的集群。因此,可以得出一个结论,公共图书馆在社会大众心中是一个终身教育和文化功能的形象,而不是一个知识信息中心,公共图书馆作为终身教育和文化空间的功能对公众的影响更大。

5.2 学校图书馆馆员不被公众舆论重视

就学校图书馆而言,与学校图书馆运作相关的经验或学生的用户体验经常被报道。在最近新闻报道分析结果中,“训练”“推广”“培训”是显著上升的关键词,在捐赠书籍、家长培训等方面形成了引人注目的集群。因此,分析表明,与学校图书馆政策和基础设施问题等重大话题相比,关于父母与青少年之间的交流培训或捐赠的问题更为突出。在过去和现在的学校图书馆媒体新闻报道中,图书馆员缺乏的相关问题没有得到积极报道,这意味着学校图书馆的结构性问题不能被视为公众意见。关于学校图书馆馆员岗位设置及人数多寡的问题,并没有形成积极的公众舆论。

5.3 大学图书馆无法吸引媒体新闻报道

与公共图书馆和学校图书馆相比,媒体并没有积极报道大学图书馆,而是通过与社区开放、社区服务功能以及大学生就业和考试准备相关的话题向公众展示。过去,许多关于国际交流和数字化项目的新闻媒体报道已经发表,但在最近的报道中,由于“人文学科”的出现频率和中心地位明显更高,可以认为大学图书馆媒体新闻宣传的重点集中在人文学科项目,媒体有必要深入报道目前以某所大学为中心的全国范围内先进人文学科创新或信息共享问题,并就大学图书馆向当地社区开放等问题进行深入报道。

5.4 媒体新闻只报道通过视觉而不是结构性问题来确认其绩效的项目

随着社会的发展和人口增长停滞,中国社会陆续进入老龄化阶段,终身学习是为社会提前进入老龄化做的准备。不管是公共图书馆、学校图书馆还是大学图书馆,都要面临服务模式的改变和服务对象的扩展。因此,有必要制定一项宣传计划,不仅促进终身学习计划,而且强调图书馆作为知识信息中心的作用。目前,关于各类型图书馆的媒体新闻报道主要是由图书馆的大小、设施的规模以及是否涉及到政府工作任务中的内容而简单的选择性宣传,都没有涉及到图书馆法律、预算和人力问题。这意味着中央或地方政府与图书馆相关的政策宣传重点只是那些通过视觉而不是结构性问题来确认其绩效的项目。为了促进政策落实和公众共识,有必要加强政府或负责制定政策的部门与各类型图书馆之间的公共关系活动,与此同时增加图书馆深度专业报道文章的覆盖面,使其成为改善民生和促进知识发展的主要国家设施。因此,门户媒体的新闻报道有必要研究面向第四次工业革命时代的未来图书馆服务,并通过媒体积极宣传。

猜你喜欢
新闻报道集群频率
处理器频率天梯
振动与频率
“她时代”新闻报道中的“时代精神”呈现
浅析如何在新闻报道中彰显以人为本
海上小型无人机集群的反制装备需求与应对之策研究
培育世界级汽车产业集群
新媒体不当新闻报道的影响
一种无人机集群发射回收装置的控制系统设计
无线电频率的特点
勤快又呆萌的集群机器人