基于Citespace的信息检索研究可视化分析

2017-04-29 12:23张思佳
好日子(下旬) 2017年12期
关键词:信息检索可视化分析

摘 要:运用Citespace软件以信息检索为关键词,对2007-2017年收录到CNKI上的所有图书情报与数字图书馆学科的文献进行可视化分析,综合考虑中心度、关键词,绘制科学的知识图谱,对该领域的发文作者、发文机构、研究热点及研究前沿进行分析,以期对未来的研究提供借鉴。

关键词:Citespace 信息检索;可视化分析;数据来源与研究方法

1 数据来源

以CNKI收录的数据作为数据来源,设置检索式为:(SU=信息检索)选取2007-2017年十年间的研究文献作为数据源,检索时间为2018年2月16日,共检索出3902篇文献,去除无关的数据,得到有效数据3850篇。

1.1研究方法

运用Citespace进行文献可视化分析,需要将CNKI的数据保存为“Refwork”格式,然后再通过Citespace中的数据转换器得到可供识别的数据形式。

对3850篇文献进行聚类分析及聚类标识结果,综合分析国内图书情报与数字图书馆领域在信息检索方面的研究,绘制合作图谱,分析该领域学者、机构之间的关系,评价科研人员和机构的学术影响力;绘制关键词图谱,分析该领域的研究热点及热点的演变趋势。

2 信息检索领域知识图谱可视化分析

2.1发文作者及发文机构分析

2.1.1发文作者分析

导入转换后的数据,调节时间切片为2007-2017,选定作者和机构的网络节点类型,将阈值设置为Top20,即每一时间片段中出现品系最高的20个作者数据,可以得到作者合作图谱。每个节点表示发文数量,节点越大表示发文数量越多,节点颜色代表发文时间,时间从早到晚,色调由冷变暖,节点之间的连线表示发文作者和机构之间的合作关系,连线的粗细代表合作关系的强弱。

由图可表以得出以下结论:

(1)从作者发文数量上来看,在该领域发表文献数量最多的前五位作者分别是:王知津、吴丹、韩毅、彭奇志、陆伟,在排名前10 的作者当中后两名发文 数量仅为4,这说明在该领域中后续作者有待进一步提高科研创作能力和科研产出。

(2)从作者之间的合作上来看,合作并不是非常紧密频繁,供职于相同学校的几位老师的团队较为高产,在学科内起到了带头作用。

2.1.2发文机构分析

选取网络节点类型为机构(Institution)阈值设置为Top20可以得到机构合作图谱,节点代表机构,年轮的大小代表机构发文数量,年轮的颜色代表发文时间,节点之间的连线代表机构之间的合作关系。统计机构发文数量,可以得到发文数量排名前20位的机构。

根据图表可以得到以下结论:

(1)发文数量排在前三位的机构分别是:武汉大学信息管理学院、武汉大学信息资源研究中心和北京大学信息管理系。

(2)机构合作图谱中部分节点之间存在着较强的合作关系,如:武汉大学信息管理学院和武汉大学信息资源研究中心以及黑龙江大学信息管理学院都存在着极强的合作关系;北京大学信息管理系和中国科学技术信息研究所之间也有较强的联系。

2.2研究热点分析

关键词是作者对于文章核心的概括和精炼,可以代表一篇文章的主题思想,是一篇文章的精髓。根据关键词在文献中出现的频次及其变化,并对其进行聚类分析,研究它们之间的关系,从而可以反映出某领域的研究热点的演进及变化。频次高的关键词常被用来确定一个研究领域的热点问题。将网络节点类型设置为关键词,其余参数同上,可以得到关键词聚类图谱。在聚类图谱中,节点代表关键词,年轮由内到外表示年份的由近及远。将频次出现大于20次的词称为高频关键词,对关键词统计得出高频关键词列表。

表1 前20位关键词列表

可以看出,20次以上的高频关键词有28个。另外出现频率在100次以上的关键词可以视为是该领域已经被研究的较多的内容,即信息检索、高校图书馆、图书馆、信息素养、信息检索课、数字图书馆、信息素质教育、教学改革、大学生、信息素养、文献检索课这11个。

中心度一词取自社会网络分析理论,一定程度上能够反映出某节点与其他节点之间的联系在整个网络中的地位与作用。将中心度大于且等于0.05的关键词成为高中心度关键词。

综合分析高频关键词和高中心度关键词,并参考文献可以将其大致聚类为以下四组信息检索的重点研究领域:

(1)高校图书館、图书馆作为信息检索的主要媒介,承担着承上启下的作用,随着信息服务的引进,图书馆正往数字图书馆的方向转变着,信息检索相应地也要从传统的检索方法向网络信息检索转变。并且信息检索也是图书馆的主要功能之一。

(2)关于提高大学生信息素质,我国高校目前普遍采用的主要方式是“信息检索课”,该门课程的教师大多为中级职称以上,在教学媒体上多采用了计算机辅助教学。学生通过这门课的选修,学习和了解了有关手工检索、计算机检索及多种数据库检索的知识并能一定程度上予以运用,这就为他们今后完成毕业论文、查找所需资料打下操作基础。此外,高校图书馆通过开展新生入馆培训活动,积极组织学生参观图书馆,同时利用馆内宣传栏张贴有关宣传资料进行广泛宣传并举办与信息资源利用相关的各种专题讲座和专题研讨等措施作为信息检索素养培育的辅助手段。

(3)知识服务、学科化服务、图书馆知识服务。开发、分享只是资产,构建基于本体的知识服务框架,开发本体驱动的信息检索、分析与整和应用系统;集成信息管理、知识管理和战略学习到科研过程更宽泛的功能中。

(4)建立个人信息环境,提高信息服务效率,加强用户的信息交互,定制信息检索的个性化服务。

3 总结

从信息检索在图书情报与数字图书馆领域的研究现状入手,通过运用Citespace软件对该领域2007-2017年的文献进行计量可视化分析,绘制科学知识图谱,对发文作者、发文机构和研究热点进行了分析及总结,对图书情报与数字图书馆领域信息检索的研究有了一定的了解,由于数据的选取和数据的处理方式不同,对研究的挖掘还比较有限,我会在后续的研究中逐步改善。

参考文献

[1]Chen,CM.CiteSpace II:Detecting and visualizing emerging trends and transient patterns in scientific literature [J].Journal of the American Society for Information Science and Technology.2006,57(3):359-377.

[2]Chen Chaomei,Hu Zhigang,Liu Sengbo,et al.Emerging trends in regenerative medicine:A scientometric analysis in CiteSpace [J].Expert Opinion on Biological Therapy,2012,12(5):593-608.

[3]Davis,Fred D.Perceived Usefulness,Perceived Ease of Use,and User Acceptance of Information Technology [J].MIS Quarterly,1989,13(3):319-340.

[4]李陽,谢笑,谢阳群.基于CiteSpace域的国际图情领域信息共享研究可视化分析[J].图书馆,2013,(4):45-48,71.

[5]吴彬彬,王京,宋海涛.基于Citespace 的复杂网络可视化研究图谱[J].计算机系统应用,2013,23(2):7-16.

[6]陈超美,陈悦,侯剑华,等.CiteSpaceⅡ:科学文献中新趋势与新动态的识别与可视化[J].情报学报,2009,28(3):401-421.

[7]杨月华,杜军平,平源.基于本体的智能信息检索系统[J].软件学报.2015(07)

[8]曹红兵.搜索引擎的个性化检索研究[J].图书情报工作.2007(03)

[9]张昭.基于Citespace的商务智能研究热点与前沿可视化分析[J].情报探索,2012,(12):6-9.

[10]赵玉鹏.基于知识图谱的机器学习研究前沿探析[J].情报杂志,2012,31(4):28-31.

[11]侯剑华,胡志刚.CiteSpace 软件应用研究的回顾与展望[J].现代情报,2013,(4):99-103.

[12]王智红,潘晓丽,吴晓鸥.近十年来我国网络信息检索研究主题分析[J].情报杂志,2009,(7):1-6.

[13]吕建新,陈兰杰,李哲.网络信息检索[M].北京:煤炭工业出版社,2011.

[14]王继成,萧荣,孙正兴,等.Web 信息检索研究进展[J].计算机研究与发展,2001,(2):187-193.

[15]谈大军,陈晓转.1998-2003 年我国网络信息检索研究论文的定量分析与研究[J].现代情报,2004,(12):66-68.

[16]卫军朝.基于CiteSpaceⅡ的数字图书馆研究热点分析[J].图书馆杂志,2011,(4):70-77.

[17]廖胜姣.基于TDA 的情报学研究前沿知识图谱的绘制及分析[J].情报理论与实践,2009,32(11):98-102.

[18]Anegon F D,Contreras E J,Corrochano M D.Research fron ts in library and information science in Spain(1985-1994)[J].Scientometrics,1998,42(2):229-242.

[19]AstromF.Changesinthe LIS research front:Time-sliced co-citation analyses of LIS journal articles,1990-2004 [J].Journal of the American Society for Information Science and Technology,2007,58(7):947-957.

[20]宋艳辉,武夷山.作者文献耦合分析与关键词耦合分析比较研究:Scientometrics实证分析[J].中国图书馆学报,2014,40(1):25-37.

作者简介:

张思佳,天津师范大学情报学在读研究生,主要研究健康信息及信息行为方向。

猜你喜欢
信息检索可视化分析
浅析开源情报信息检索与信息鉴别
高校学生管理法治化研究:基于CiteSpace的可视化分析
我国职业教育师资研究热点可视化分析
对大学案理研讨课学生信息检索意识若干问题的思考
声波吹灰技术在SCR中的应用研究
可视化分析技术在网络舆情研究中的应用
国内外政府信息公开研究的脉络、流派与趋势
医学信息检索与利用的探讨
空难事故跨媒体信息采集与检索方法的研究
中外档案网站信息检索功能比较研究