基于CiteSpace的档案管理现状知识图谱分析

2019-10-20 03:25刘东费鹏程黄丽香
辽宁经济 2019年6期
关键词:可视化分析知识图谱档案管理

刘东 费鹏程 黄丽香

[内容提要] 以CSSCI数据库中档案学的核心期刊在1998-2019年间的932篇论文作为数据来源,运用CiteSpace5.3.R4软件分析数据得到科学知识图谱,进而对档案管理的研究现状进行分析。通过考查国内档案管理研究的热点、研究的核心作者群以及重要载文期刊,对档案管理的研究现状与发展进行了梳理与分析。结果显示,研究热点从基本的档案管理工作、档案管理制度逐渐偏向电子档案和数字档案馆,紧跟信息技术发展,档案类期刊特别是核心期刊是载文主体;但国内档案管理领域研究机构的合作与联系相对较弱,学术交流有待加强。

[关键词]档案管理 CiteSpace 知识图谱 可视化分析

一、研究方法

1.CiteSpace。CiteSpace是由陈超美教授开发,应用于科学文献中,用于分析、发掘可视化科研文献数据的软件。通过CiteSpace分析得到的可视化图形也被称为“科学知识图谱”。

科学知识图谱是通过对大量文献数据的一系列处理而得到的某一科学领域知识的直观展示,如深度挖掘、信息分析、科学计量和图形绘制等。其可以显示知识发展进程与结构关系的一系列各种不同的图形。近年来,应用知识图谱分析方法分析当前研究现状与热点,在越来越多的领域中得到了应用。

2.研究方法。本文利用CiteSpace关键词共现分析、聚类分析等功能,探讨了不同时期档案管理研究的热点和前沿问题。关键词是作者学术思想和学术观点的凝炼,也是文献收录和索引的一个重要指标。在长期的学术研究领域,收集大量的学术研究成果关键词,可以揭示研究成果的总体特征、研究内容、学术研究的发展与发展方向之间的内在联系等。关键词共现分析是揭示和研究网络关注关系的重要方法之一。研究领域中关键词的共现关系和强度是分析该领域研究热点和前沿的重要依据。

3.数据来源。以中文社会科学引文索引(CSSCI)为数据来源,以“档案管理”为主题进行检索,共得到相关文献932篇,最早的记录出现在1998年,并将论文下载,便于下一步分析及研究的展开。

二、结果与分析

1.档案管理研究热点的可视化分析。关键词体现的是论文的核心观点,是论文的高层次总结,因此分析某一学科范畴相关文献的关键词,对探索该领域的研究热点很有帮助。使用CiteSpace分析研究对象的关键词,并将文献数据导入CiteSpace软件中,Time Slicing选择1998—2019年,Years Per Slice选择1年,Node Types选择keyword,每段时间切片选择Top50,连线强度选择Cosine,Thresholding(c,c,ccv)的值分别为(2,2,20),(4,3,20),(3,3,20),Pruning和Visualization保持默认状态。运行CiteSpace,绘制出档案管理的关键词聚类知识图谱,共有92个节点,172条连接,网络密度为0.0411,出现次数越多的关键词,在图中相对应的节点就越大。为了提高结果的可读性,突出重要信息,通过相关的功能对图谱进行调整和优化,将结果以可视化图谱的形式显示出来(见图1)。关键词中心度可以反映关键词在整个关键词共现网络中的重要程度,其可以代表某一时期的核心研究课题。本文根据关键词的中心度,筛选出关键词共现的关键路径图中的主要关键词(见表1),从而确定不同时期档案管理的研究课题。

结合图1和表1可以看出,档案管理研究在1998—2002年间处于刚刚起步阶段。在此阶段研究主题集中在档案管理、档案工作、档案管理体制、人事档案、企业档案、电子文件、科技档案、文档一体化的基础概念。“档案管理”“档案工作”“档案管理体制”等三个关键词呈现出较强的中心度,是整个研究领域的核心节点。

根据不同时间段关键词的突现情况,可以直观清楚地反映出这一领域研究热点的演进过程。图2表明,我国对档案管理的研究经历了一个从浅到深的过程,大致可以分为以下几个阶段:一是早期萌芽阶段(1998—2000年)。热点关键词主要是“档案管理、档案管理体制、企业档案、电子文件”等,重点关注档案管理基本工作的研究。在这一阶段,现有的研究还处于对档案管理的初步探索期。二是高速发展阶段(2002-2008年)。热点关键词主要是“档案管理网络化、电子文件管理系统、科技档案管理、高等学校、高校档案工作”等,关注点逐渐走向信息化,并且开始进入高等院校档案管理领域,符合大数据的时代背景。三是突破发展阶段(2010年至今)。这一时期内的热点关键词主要是“政府信息公开、档案资源整合、情报学、图书情报与档案管理”等,主要探讨了档案管理工作逐渐融入到政府信息以及图情档领域中。

2.文献作者群体分析。通过文献作者群体分析,可以确定某学科或某领域的核心作者以及他们的合作关系和联系程度。运用CiteSpace软件分析文献作者,可以获得共引作者图谱(见图3),图谱共有81个节点,164个连接,网络密度为0.0506,图中节点的大小寓意着作者出现次数的多少。从图3中可以得到,冯惠玲和吴宝康是出现次数最多的两个作者,分别达到44和12次,其次是陈兆禊、邓绍兴、黄霄羽、周耀林等,发文次数在5次以上的有8位作者。

3.期刊共被引分析。对研究对象的932条检索结果的发文机构进行分析,Time Slicing选择1998—2019年,Years Per Slice选择1年,Node Types选择CiteclJoumal,得到如图4所示的图谱,其中图谱中的节点越大的期刊表示其被引次数越多。图4中共有58个节点,288个连接,网络密度为0.1742,说明档案管理研究的机构间的学术交流较为密切。按照期刊被引次数,表2给出了被引次数在10次以上的期刊。其中《档案学通讯》《档案学研究》《中国档案》三类期刊被引次数达到80次以上,这些期刊即为档案学领域的最核心期刊,发表的论文能够凸显档案管理研究领域的研究重点。《北京档案》《山西档案》《浙江档案》的中心度均在0.05以上,表明该地区的档案管理研究较为突出。

三、結论与思考

本文章CiteSpace知识图谱为基础,对白1998年以来和档案管理有关的知识图谱结构进行分析,明确档案管理研究的热点、研究的核心作者群以及重要载文期刊,以清晰地把握档案管理的研究现状。通过对1998-2019年中国核心期刊的档案管理相关论文的分析,发现档案管理研究白2008年以来有愈热的趋势。对关键词进行识别分析发现“档案管理”“档案工作”“档案管理体制”等是出现频率较高的关键词;致力于档案管理研究的主要作者有冯惠玲、吴宝康、陈兆禊、邓绍兴、黄霄羽、周耀林等。

1.研究主体广泛。如今,档案管理的研究主体包括了高校师生、档案单位的工作者和成员,并且几乎遍布全国。我国已经逐步建立起一支以高校档案学专业教师为主体的档案学研究队伍,包括档案从业工作者、专职档案科研人员和其他相关人员。

2.研究行为受到重视。随着时代的发展和社会的进步,研究工作不断深入,学者水平逐步提高,科学研究机构越来越普遍,理论研究和社会实践越来越受欢迎,引起了全国和社会的关注。档案学研究增加了不同技术,对于电子文件、档案管理现代化等技术性的研究,还需要更多来自不同学科领域的专家共同参与。同时,国际档案大会、国内相关档案学术会议、档案学博士论坛等会议和活动,可以联合全国各地区的学者们博采众长、广开言路,推进档案学研究的进行。

3.研究理论紧随时代。21世纪是基于大数据的信息化、数字化时代。学者们顺应时代的发展,引进理论研究和实践工作的技术手段,进行深入的理论研究,开展技术探索,不断推进理论的完善和技术的成熟。电子文档管理和数字档案馆引起了人们的关注、文件信息化与资源开发已成为工作的重点、档案微博与微信逐渐成为近几年的新兴话题。 4.缺乏研究合作,有待加强。从机构合作和作者身份两方面都可以看出这种现状。合作关系网络还不够广泛,现有合作基本上只局限于本单位机构,机构间合作存在但较少。建议通过项目合作申请、子项目申请、区域合作研究小组等形式的加强档案领域研究的凝聚力,不仅可以提高研究效益的效果和受众面,同时也避免了重复工作。

猜你喜欢
可视化分析知识图谱档案管理
关于企业档案管理体制改革的探讨
新形势下档案管理工作创新探析
新农村建设形势下卫生院档案管理工作探讨
档案管理现代化中档案管理原理的运用分析
我国职业教育师资研究热点可视化分析
声波吹灰技术在SCR中的应用研究
可视化分析技术在网络舆情研究中的应用
国内外政府信息公开研究的脉络、流派与趋势
基于知识图谱的产业集群创新绩效可视化分析
基于知识图谱的产业集群创新绩效可视化分析