发展知识库是提高我国论文被引次数的有效途径

2014-02-15 11:48叶新明
山东图书馆学刊 2014年5期
关键词:知识库次数数量

叶新明

(浙江交通职业技术学院,浙江杭州311112)

发展知识库是提高我国论文被引次数的有效途径

叶新明

(浙江交通职业技术学院,浙江杭州311112)

本文以17个论文高产出国家(地区)论文数及被引用次数的数据与ROAR、OpenDOAR和RWR三个知识库网站用户注册的知识库数量为依据,得出论文数、论文被引次数与知识库数量之间存在显著相关。并在此基础上,对在RWR网站中17个国家(地区)的知识库排名区间分布进行了统计。研究表明,我国知识库建设,不仅在数量上有较大差距,而且在质量上也处于劣势,提出既要重视知识库理论研究,也要重视知识库实际建设,同时应充分认识知识库开放存取对论文被引的积极作用。

论文 被引次数 知识库 相关分析

1 引言

早在2003年,D.Prosser就将开放存取分成两大主要的分支:开放存取期刊(Open Access Journals,简称OAJ)和机构知识库(Institutional Repositories,简称IR)[1]。前者用学术期刊的方式来组织和揭示学术研究成果,后者从作者所在机构的方式来组织和揭示研究成果[2]。国际学术出版与学术资源联盟(SPARC)认为学术研究过程的成果更快更广地共享提升研究的影响,激起知识的提升,提高研究投资的回报[3]。开放存取期刊或论文能够提高论文的被引次数早已得到学者们的广泛验证[4-6]。Google公司于2004年11月18日推出诸如学术性论文、书籍、摘要及科技报告等学术文献的综合性搜索引擎产品Google Scholar Beta版,2006年1月11日又推出了综合性Google中文学术搜索Beta版,对研究者的学术搜索行为产生很大的影响[7]。它得到了学术界的支持,较之SCI的WOS等专业检索系统而言,尽管还存有异议[8]。免费的Google学术搜索深受研究者的欢迎,很大程度上得益于OAJ和IR的发展,还有作者以其它方式提供的全文存档,让研究者们轻松地获取到所需论文的全文信息,而不再完全依赖受电子资源提供商限制的全文获取。与此同时,专业性的OAJ检索系统也迅速发展,如瑞典的DOAJ、印度的Open J-Gate和日本的J-STAGE等;还有专业的知识库搜索引擎,如欧盟的DRIVER search portal、日本的JAIRO、英国的Intute Repository Search、荷兰的NARCIS、我国台湾的TAIR及香港的HKIR等[9]。它们都为研究者提供了开放存取论文全文等的新通道。

本文以中国科学技术信息研究所最新发布的科技论文数及被引用次数与三个知识库网站用户注册的知识库数量为依据,探讨论文被引次数与知识库数量之间数量上的相关关系以及我国知识库质量上对论文被引次数的影响。

2 数据来源

中国科学技术信息研究所发布的2013年度研究报告《中国科技论文统计结果发布稿(国际部分)》列出了“2003-2013年间发表科技论文数20万篇以上的国家(地区)论文数及被引用情况”[10]。

三个知识库用户注册网站:

(1)ROAR(Registry of Open Access Repositories)[11]是由英国Joint Information Systems Committee(JISC)资助,南安普顿大学电子与计算机科学学院开发的,属于EPrints.org网络的一部分。目前用户注册的知识库数量已达到3542个(注:截至2014-01-15,下同。),是三个网站中知识库数量最多的一个。

(2)OpenDOAR(The Directory of Open Access Repositories)[12]最初是在2005年2月15日由英国诺丁汉大学和瑞典的兰德大学联合开发,2006年1月27日首次发布,现由诺丁汉大学负责管理和维护。先后由Open Society Institute(OSI)、英国JISC、英国和爱尔兰的Consortium of Research Libraries及欧洲研究图书馆联盟的SPARCEurope等机构资助,2010年开始由英国JISC独立资助。用户注册的知识库数量也已达到2553个。

(3)Ranking Web of Repositories[12](简称RWR)网站是由西班牙CINDOC-CSIC的Cybermetrics Lab在2008年开发,当年的2、5和7月出了三个知识库排行版本,以后固定在每年的1月和7月发布全球的知识库排名结果[14],至今已出了13个排行版本。用户注册的知识库数量为1565个,是三个网站中注册的知识库数量相对较少的一个。

ROAR和OpenDOAR提供丰富的统计和方便的检索;而RWR提供知识库排名。

3 论文高产出国家(地区)的论文数、被引次数和知识库数量的统计与分析

3.1 论文数、被引次数和知识库数量的统计

中国科学技术信息研究所研究报告涉及的17个论文高产出国家(地区)中,我国的论文数位居世界第2位,被引次数位居第5位,篇均被引次数却居第14位,低于韩国高于巴西和印度,只有美国的43.28%。我国SCI收录论文存在明显的高产出低引用的现象。

为考察各国论文被引次数与知识库数量的相关性,笔者对ROAR、OpenDOAR和RWR三大知识库网站中注册的各国知识库数量,分别进行统计(见下表1)。统计表明,我国在ROAR中注册的知识库数量位居这17个国家的第8位,处于居中位置,其中中国科学院系统知识库65个,占我国在该网站知识库注册数量的78.13%;在OpenDOAR中注册的知识库数量位居第13位,其中中国科学院系统知识库27个,占我国在该网站知识库注册数量的81.82%;在RWR中注册的知识库数量位居第14位,其中中国科学院系统知识库16个,占我国在该网站知识库注册数量的88.89%。两者均处于尾部位置。

与论文数位居前列的其它国家(地区)相比,我国知识库数量与论文数是很不匹配的。尽管中国科学院近年已开始大规模的发展知识库,但我国知识库在绝对数量上的差距还是极其明显的。

表1 2003-2013年间论文高产出国家(地区)的论文数、被引次数与知识库数量统计

注:(1)我国知识库数量统计时不含港澳台地区,下同。(2)排列顺序按论文数从大到小排列。

3.2 论文数、被引次数与知识库数量的相关分析

笔者采用统计分析软件IBM SPSS Statistics(V20)将数据通过计算Spearman相关系数进行分析,分别对论文数、被引次数与ROAR、OpenDOAR和RWR分别注册的知识库数量等变量进行相关性计算(见下表2)。相关系数r是用以反映变量之间相关关系密切程度的统计指标[15]。

表2 论文数、被引用次数与知识库数量的相关性

注:**.在置信度(单测)为0.01时,相关性是显著的。*.在置信度(单测)为0.05时,相关性是显著的。

从表2中可以看到各变量之间的双侧检验,它们之间的相关性是显著的,而且相关系数r>0,均为正相关。

(1)论文数与三个知识库数量之间的相关程度。论文数与ROAR、论文数与OpenDOAR和论文数与RWR之间的相关系数分别为0.693、0.657和0.630,并且均在0.01水平上达到显著相关,而且均存在显著正相关。论文数与ROAR、论文数与Open-DOAR和论文数与RWR的双侧检验的显著性概率(Sig)分别为0.002、0.004和0.007,均小于0.01,说明各国家(地区)论文数与三个网站注册的知识库数量不相关的概率小于0.01,表明各国家(地区)论文量越高,则该国家(地区)拥有的知识库数量越多。

(2)论文被引次数与三个知识库之间的相关程度。论文被引次数与ROAR之间的相关系数为0.592,在0.05水平上达到显著相关,而且存在显著正相关。论文被引次数与ROAR的双侧检验的显著性概率(Sig)为0.012,小于0.05,说明各国家(地区)论文被引次数与ROAR注册的知识库数量不相关的概率小于0.05,表明各国家(地区)论文被引次数越高,则该国家(地区)的拥有的知识库数量越多。

论文被引次数与OpenDOAR和论文被引次数与RWR之间的相关系数分别为0.645和0.652,并且均在0.01水平上达到显著相关,而且均存在显著正相关。论文被引次数与OpenDOAR和论文被引次数与RWR的双侧检验的显著性概率(Sig)分别为0.005和0.005,均小于0.01,说明各国家(地区)论文被引次数与OpenDOAR、RWR的知识库数量不相关的概率小于0.01,表明各国家(地区)论文被引次数越高,则该国家(地区)的拥有的知识库数量越多。

4 知识库质量的统计与分析

RWR的设计者是致力于学术和科学交流相关的Internet和Web内容定量分析的研究团队。1997年就开始出版免费的OA期刊《Cybermetrics》,在网络计量、科学计量和文献计量方面具有较强的研究实力。该网站2013年7月的最新排名是采用基于Google检索结果的Size(10%)、Visibility(50%)、Rich files(10%)、Scholar(30%)四个加权指标。我国知识库排名最靠前的是厦门大学机构知识库(Xiamen University Institutional Repository),排名162位,其余均在600名之外,表明我国知识库质量也存在明显的差距,排名与韩国、印度和俄罗斯等接近。

表3 2002-2013年间论文高产出国家(地区)知识库排名区间分布

5 结论

本文通过Spearman相关分析,表明论文数、被引次数均与知识库数量有显著相关。尽管我国的SCI收录的论文数靠前,但论文被引次数受到我国知识库在数量上的差距和质量上的劣势影响,造成篇均被引频次明显靠后。为此,笔者认为:

(1)应在重视知识库理论研究的同时,也要重视知识库实际建设。早在2004年吴建中先生就关注知识库的问题[16],但我国一直存在热研究冷实践的现象,需要引起高度重视。

(2)应充分认识知识库开放存取对论文被引的积极作用。为提高论文的被引次数,我国越来越多的期刊编辑部,尤其是科技期刊编辑部,已经开始实施开放存取战略[2],而知识库的开放存取除了中国科学院系统已受重视之外,其它机构的认识还远远不够,应该到了引起高度重视的时候了。为改变论文高产出低引用的现象,不仅需要增加知识库的数量,而且还要提高知识库的质量。

发展我国的知识库,需要数量与质量并举,高起点地进行知识库规划和建设,让更多的国内外研究者能够方便、免费地获取我国作者发表的研究论文,从而提高我国论文的被引次数。

〔1〕 Prosser D.Institutional repositories and Open Access:The future of scholarly communication[J].Information services and Use,2003,23(2):167-170

〔2〕 叶新明,陈益君.我国开放存取中文科技期刊与全文数据库期刊的时效性比较[J].大学图书馆学报,2011(001):31-35

〔3〕 SPARC.About Us[EB/OL].http://www.sparc.arl.org/about.[2014-01-12]

〔4〕 Pringle J.Do open access journals have impact[J].Nature Web Focus,2004,18.http://www.nature.com/nature/focus/accessdebate/19.html

〔5〕 Antelman K.Do open-access articles have a greater research impact[J].College&research libraries,2004,65(5):372-382

〔6〕 Eysenbach G.Citation advantage of open access articles[J].PLoS biology,2006,4(5):e157

〔7〕 夏旭.基于Google学术搜索的引文检索研究[J].情报理论与实践,2006,29(6):697-701

〔8〕 Bohannon J.Google Scholar Wins Raves—But Can It Be Trusted[J].Science,2014,343(6166):14-14

〔9〕 叶新明.全球跨知识库服务项目及其搜索引擎的分析与研究[J].图书馆杂志,2010(2):49-56

〔10〕 中国科学技术信息研究所.2013中国科技论文统计结果发布稿(国际部分)[R].http://wenku.baidu.com/link?url=BQ56HJrZzs0AJKHnLrmsoo7TnPJmysbd67cwU-X15yK40YCRk 44bEV4yfDk8wC4aZIyWdhVrqULQAJ2WizwoTwas8Wyu0A7rcdjt t_hgLya.[2013-09-27]

〔11〕 Registry of Open Access Repositories[EB/OL].http://roar.eprints.org/.[2014-01-07]

〔12〕 The Directory of Open Access Repositories-OpenDOAR[EB/OL].http://www.opendoar.org/.[2014-01-07]

〔13〕 Ranking Web of Repositories[EB/OL].http://repositories.webometrics.info/en.[2014-01-07]

〔14〕 Aguillo I F,Ortega J L,Fernández M,etal.Indicators for a webometric ranking of open access repositories[J].Scientometrics,2010,82(3):477-486

〔15〕 张洪波等.SPSS统计分析使用宝典[M].北京:清华大学出版社,2012:161-181

〔16〕 吴建中.图书馆VS机构库——图书馆战略发展的再思考[J].中国图书馆学报,2004,5(7):5-8

An Effective W ay to Im prove the Times Cited of Articles through Developing Repositories

Ye Xinm ing

In this paper,on the basis of the number of articles and times cited of 17 high-yield article countries(regions),and the number of three repository sites registered by users,such as ROAR,OpenDOAR and RWR,draw significant correlations between the number of articles or times cited and the number of the repositories.And on this basis,the interval distributions of the repository rankings of 17 countries(regions)based RWR website are statistical.Studies have shown that the construction of our repositories is not only a large gap in quantity but also a disadvantage in terms of quality.It is proposed to pay attention to the repositories not only in theoretical studies but also in actual construction,meanwhile we should be fully aware of the open access active role on the articles cited.

Article;Times cited;Repository;Correlative analysis

G353.1

A

叶新明,浙江交通职业技术学院图书信息中心,研究馆员。研究领域:引文分析、电子资源利用与管理。曾在《中国图书馆学报》、《情报学报》、《大学图书馆学报》、《图书情报工作》、《图书馆杂志》、《现代图书情报技术》等刊物上发表论文近60篇,获得各类学术奖20余项,主持或参与科研项目多项。

猜你喜欢
知识库次数数量
机场航站楼年雷击次数计算
2020年,我国汽车召回次数同比减少10.8%,召回数量同比增长3.9%
一类无界算子的二次数值域和谱
基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用
统一数量再比较
依据“次数”求概率
高速公路信息系统维护知识库的建立和应用
头发的数量
基于Drupal发布学者知识库关联数据的研究
我国博物馆数量达4510家