国内外图书情报领域信息聚合的发展趋势分析

2021-02-25 03:43赵海涛尤江东
科技经济导刊 2021年3期
关键词:定义领域图书馆

赵海涛,赵 毅,尤江东

(信息工程大学,河南 郑州 450000)

1.引言

本体论源于哲学,它与事物的基本存在有关。自20 世纪计算机的开始和发展以来,计算机就使用本体来表示特定领域(通常是词汇)中的概念和术语。本体试图通过RDF 和OWL建立概念上的类和属性,创建的类是指表示资源属性定义和关联的资源,并使用逻辑推理规则评估和描述不同资源之间的关系。因此,给定领域中的通用概念构成了知识,从而创建了可以更好地共享和重用的知识网络。在波兰等其他国外的图书馆和信息科学领域,大量的科学家和研究机构在本体论领域进行了相关研究,而图书馆和信息领域是重要的研究主题领域本体论的。2010 年后,因为互联网技术的飞速发展,国内外的图形学和信息学领域在本体论研究的热点问题中具有鲜明的时代特征。但是,由于国内外学科发展水平的不一致以及国家研究发展环境的影响,图书馆学和信息学领域的本体研究的方向是不确定的,导致国内外不同。本文的目的是分析和比较国内外图书馆和信息学领域的本体研究热点。本文从2012-2017 年国外SCI 数据库和CNKI 国家数据库中选择相关文献,并根据发表的文章数量、文献的分布情况,采用适当的信息计量方法进行统计分析,如关键字和受欢迎的作者。在收集并汇总了数据之后,使用陈超美博士的VOSviwer 和CitespaceII 社交媒体分析工具绘制了一个知识图,以便直观地分析和比较该国家和地区的图书馆和信息研究热点。并在我国提供相关研究人员还有国家和国外进行数据参考。

2.信息聚合的内涵及其相近概念辨析

对于词源和字典的解答,聚合一词首先用于聚合物化学领域。它的英文表达是“聚合”,主要是指通过单体或单体混合物的化学反应形成新的聚合物。由于合成或重组,已经发生了质的变化。在《牛津现代英汉词典》中,用于信息聚合的英文表达为“信息聚合”,其基本定义是指通过组合许多事物或将其整体对待而生成的复杂信息。从字面意义和词典定义的角度来看,信息聚合是多学科,多领域的研究内容。尽管信息聚合已成为跨学科研究的内容,但其定义和相关概念尚未有清晰统一的描述。在综合了国内外信息聚合研究的当前普遍应用和重要成果之后,可以总结信息聚合的定义以及所有学科的相关概念的描述。表1 列出了经济管理、计算机科学、图书馆学和信息科学领域中信息聚合的定义、范围、技术措施等相关概念。

表1 信息聚合在不同学科领域中的概念表述

表1 显示了跨学科的信息聚合的目标基本上是相同的,即通过特定方法或技术将定义范围内的离散信息对象重新集成到逻辑上相关的信息集中。处理对象,应用程序范围和处理行为是不同的。特别是,各学科之间信息聚合概念表达的差异主要体现在以下几个方面:

处理对象和应用范围存在差异。实际上,不同的学科认为信息聚合处理的主要对象是信息,但是不同的学科对信息的理解也不同。在经济管理中,信息聚合被视为实现特定目标,将许多内部人员已知或支配的信息组织成一个有机整体,然后借助集体智慧做出决策来弥补的过程。个人决策模型不足,该定义将信息定义为社会系统参与者的个人主观信念和去中心化直觉,这是一种抽象的表达形式。在计算机科学领域,信息聚合通常被认为是信息融合的广泛过程,并且信息聚合处理的主题也定义为在每个应用程序领域的物理级别也可以感知的数据。例如信息源,信息类型和相应的信息模式,像媒体一样,它比其他学科更广泛。在图书馆学和信息学领域,研究人员认为,数据、信息和知识分布在信息聚合过程的不同级别,但是它们通常具有转换关系。因此,该领域的大多数研究并不严格涉及聚集对象。区分仅将应用范围限制为网络的信息资源。

操作方式有所不同。计算机科学家认为,在信息聚合处理的行为中,“聚合”“集成”“融合”和“集成”的表达主要不同。例如,Lenzerini 等人相信,数据集成和集成是根据特定关系将来自不同来源和不同结构的数据进行组合。Dong 等人认为,数据融合是指来自现实世界中引用同一实体的不同来源的数据的集成和融合,其主要功能是将一种类型的数据扩展到存在它的另一种类型的数据特定的关系。可以看出,数据集成,数据集成和数据融合解决了不同的处理对象和行为,但是它们的目标基本相同。在图书馆和信息领域,由于聚合对象、聚合方法、聚合粒度等因素的不同,重要子域(例如科学计量、信息组织和信息检索)中的信息聚合,通常根据特定的研究任务或用途分配不同的类型。短语,但实质上将信息聚合定义为网络信息资源的关联,聚合或集合。因此,在该领域中,“聚集”“集成”“融合”和“集成”之间没有严格的区别,它们通常被认为是相同或相似的概念。根据先前的分析,可以看出信息的聚集是一个动态过程,其主要功能是通过多种方法对来自多种来源的异构信息进行转换、组织、整合和组合,并生成可以满足需求的聚集结果。但是,就概念表达、技术手段和应用而言,不同学科具有其自身的特征,这些特征定义了信息的聚合和特定的研究方法。反过来,图书馆和信息领域是表达信息汇总的最灵活方式。

3.发展趋势分析

3.1 论文增长趋势分析

按照RGR 和Dt 的计算方式,计算了国内外图书馆信息领域的出版物规模和书目信息聚合趋势,并得出了表3 所示的结果。如表2 所示,它显示出线性上升趋势,虽然国家出版物的总数略高于外国,但该国的年度出版物在2011-2012 年略有增加。有所下降,随后呈上升趋势,但在2016 年急剧下降。RGR 和Dt 的统计结果表明,国内外结果的RGR 和Dt 呈下降和上升趋势,但国内结果的Dt 在2016 年出现了指数上升梯度。原因是2016 年年度刊物发行量偏低。全国性报刊的年平均刊载量略高于外国报刊,且全国报刊的发行量为Dt。这几乎是外国人的两倍,但外国的平均RGR 高于国内人的RGR,这表明外国价值的年增长率相对较快,并且需要很长的时间才能实现翻倍成果数量[1]。

表2 2007-2016 增长趋势

3.2 研究主题分布及其发展趋势

这项研究为单词频率大于8 的中外关键字创建了一个不相似矩阵,并将它们导入SPSS 以进行多变量分析,以获得相关的知识图谱进行多尺度量表分析。从图1 和图2 中可以看出,国家和国际信息聚合研究中的高频关键词可以粗略地分为三个主题研究组。从图1 所示的结果可以看出,国家地图C1 区域中的大多数关键字与图书馆、博物馆、档案馆等的内容有关。它们属于公共服务领域中信息聚合的研究;C2 区域中的关键词与信息检索有关。与政府事务和供应链相关的电子内容是对大数据环境中来自多个来源的信息融合的调查;从研究数据处理的角度来看,区域C3 中的关键字与技术内容有关,例如模型、链接数据和语义网,这些信息与信息聚合和知识创新有关。为了进行比较,本国演奏会C1 与外国演奏会C3 相同,本国演奏会C3 与外国演奏会C2 相同,而本国演奏会C2 和外国演奏会C1 在该关键字中具有更多相同的关键字因此,这两个主题也与在大数据环境中使用信息聚合的实践研究大致相同。综上所述,国内外信息聚集研究的主题分布和发展趋势具有相似的特征[2]。

图1 国内信息聚合研究多维度分析图谱

图2 国内信息聚合研究多维度分析图谱

3.3 研究热点分布

从表4 给出的20 个最受欢迎的中外关键字列表中可以看出,国内外相同的研究主题包括:知识管理、图书馆、资源共享和知识整合。国外文献中出现了有关“信息检索”“创新”“案例研究”“信息技能”“协作”“互操作性”和“GIS 热点”的研究。国家文献中出现的频率相对较低的有“本体论”“电子政府”“数字图书馆”和“大学图书馆”之类的研究热点在外国文学中的出现频率较低。从语义关键词的泛化和分布的角度来看,外国文学关键词是高度标准化的,几乎不是同义词,但是大多数高频关键词不是特定的,例如“整合”“聚集”“信息”“知识”“管理”“知识管理”等。重点放在知识管理领域的集成、共享、协作、创新、学习以及信息或知识管理;在频率术语中,有12 个是与“信息聚合”同义的表达,它们的短语主要由“数据”“资源”“信息”“知识”和“整合”组成,但明显减少;根据统计结果,国内和国际结果的Dt、RGR 和Dt 分别呈下降趋势和上升趋势,但2016 年国内结果的Dt 呈指数上升趋势。原因是2016 年出版的年鉴数量很少[3]。

表3 国内外信息聚合高频关键词对比

3.4 主题发展

在过去的十年中,国家对信息聚合的研究首先出现在数字图书馆领域,其研究重点是根据特定的模型或规格成功地集成或集成来自多个来源的异构数字资产,然后结合大数据时代的到来,信息聚集研究的主题正在逐渐转移到Internet 上的信息搜索和大数据领域,并且也从最初的信息集成转变为知识提取和挖掘数据驱动的,即知识的融合和聚合。国外文献首先侧重于信息检索领域的数据融合与合作,然后逐渐将研究主题扩展到社交媒体和信息技术领域的图书馆知识整合和知识管理[4]。

4.结语

信息聚合是跨学科和跨领域的研究内容,主要适用于信息学、经济学和管理学,以及图书馆学和信息学。相似的概念和研究类别的定义的概念和表达因一门学科而异。从学科的角度出发,文章首先对不同学科中信息聚合的概念、相关术语、应用范围和实现方法的描述进行了比较和分析,并明确了含义的定义和相似术语的表达在此字段中添加信息。然后,在图书馆领域的信息聚合和图书馆中的信息研究中,对文献的增长趋势、热点的分布、热点主题的识别及其发展方向进行了深入分析。最后总结了研究的特点和未来的发展趋势。当然,本文还存在一些不足和局限性,需要在以后的研究中加以完善:首先,没有类似方法的实验比较。在爆炸物探测方面的研究中,陈朝美教授提出的爆炸物探测方法是应用最广泛的方法。此方法类似于本文中提出的方法,并且都使用突然的关键字更改作为评估新兴主题的基础。因此,下一步将重点通过实证研究对这两种方法进行比较分析。其次,改进识别新出现问题的方法,由于作者在文献中定义的关键词相对抽象,并且往往具有更多的同义词表达,因此本文提出的主题识别方法可以与主题分析模型结合起来,在以后的研究中获得。使用主题分析模型创建多个主题。并结合主题频率和加权计算,以改善识别新兴主题的方法。最后,分析对象需要进一步扩展。由于本文仅以图书馆数据和信息为研究主题,因此不能完全准确地反映信息聚合的总体发展趋势。因此,有必要将分析对象进一步扩展到社会科学和生命科学的许多学科,例如计算机科学、经济管理、心理学、公共管理、定量统计等。充分了解信息聚合的当前发展和未来趋势,全面而系统地比较和解析[5]。

猜你喜欢
定义领域图书馆
电子战领域的争锋
将现代科技应用于Hi-Fi领域 Perlisten S7tse
2020 IT领域大事记
领域·对峙
图书馆
成功的定义
去图书馆
修辞学的重大定义
山的定义
教你正确用(十七)