国家社科基金图情档领域的零被引论文分析

2018-02-08 19:24程竹仪
卷宗 2018年2期
关键词:社科基金项目资助

程竹仪

本文系江苏省社会科学基金项目“大数据环境下汉英短语级平行语料标注及知识挖掘研究”(项目编号:13XWC017) 研究成果之一

1 引言

当人们都在关注高被引论文,都在追求自己的论文能够成为高被引论文时,是否想到低被引论文甚至零被引论文中也会“隐藏”着巨大的“金矿”。零被引论文是指在发表了一段时间(可能是一年也可能3-5年)没有被其它论文引用或极少被人引用的论文。那么这些论文是否完全没有价值,或这些论文都没有影响力?当然,回答是否定的。

1965年Price曾对Science杂志上的零被引论文做过评估[1]。其后Garfield总结导致论文零被引的原因,除了太平凡、质量太低等因素使得论文未被引用以外,还可能存在因为论文广为人知或太过优秀超前而未被引用[2]。这样的零被引论文若是在发表当时不受重视,而多年后被科学家重新发现并受到广泛关注,便被称之为科学中的睡美人,或者迟滞承认现象[2]。

鉴于国家社科基金是我国人文社科类研究课题的最高档次,代表了我国社会科学研究的最高水平[4]。因此,笔者认为通过研究国家社科基金中的零被引项目,不仅能提高项目的管理效率,从不同角度了解项目研究成果的利用情况及其主题分布,还能进一步发现潜在的“睡美人”论文及研究方向,把握我国科研未来发展趋势。

2 数据来源与处理

本文的数据来源主要以国家社科规划办公布的历年资助项目目录,并以此为基础,从CNKI、维普和万方数据库中获取这些项目的论文数据。

第一步数据收集。在全国哲学社会科学规划办的项目数据库中获取了1991-2014年1的所有图书馆、情报与文献学的项目共1190项。根据基金项目的名称或者项目批准号,从CNKI上获取了基金资助的学术论文信息,考虑到数据的完整性,本研究又从维普和万方数据库中获取了学术论文的被引信息。

其次,对所有数据进行清洗。这一部分的主要工作是对论文信息里的基金资助项目名称和项目批准号对齐规范。对于在抓取的数据中凡是没有标注具体时间的项目,通过人工标注上具体的年份。

对CNKI、万方和维普三个平台抓取到的数据进行去重、筛选和归并,最终本研究得到论文一共6697篇。因为存在论文将基金项目放在致谢中,以及早期发表论文著录信息不全等问,所以有部分项目实际发表过论文可能没有被统计到,最终得到发表过学术论文的项目一共806项。

最后一步是对基金项目和论文主题进行深入研究。

3 图情档国家社科基金项目的零被引项目统计分析

根据数据统计,国家社科基金项目发表论文的高峰期是在立项后的一年以后开始,所以2013年和2014年度立项的项目发表论文相对之前立项项目相对较少,为了区别这类情况,本文分别统计了截止到2014年立项项目的论文成果零被引情况和截止到2012年立项项目的零被引情况,以示有所区别。

从图1中可以看出国家社科基金立项经过了两个阶段,从1994年至2006年立项数量一直平稳增长,而2007年以后每年立项的上涨幅度越来越大。截止到2006年立项的项目里仅有三项项目的论文成果发表后全部无人引用,在立项数目阶梯性增加的2007到2012年,未被引项目也有所增长。

除了零被引项目随着立项数量的快速增加而稳步增长时,更值得关注的是零被引项目的主题和研究内容。零被引项目一共46项,其中有两项重大项目。其他44项零被引项目主要可以分为四类:一是少数民族的历史档案建设和整理,以及西部地区的信息建设,一共10项。在这些项目中,研究对象为少数民族文献,研究内容多是图书馆和数字资源建设、档案建设整理和信息服务。二是中国古代典籍及其相关问题,总共有8项。这些研究对象都是古文献、典籍,以历史档案文献的整理为主。第三类研究是围绕我国的社会情况展开,探究和解决我国目前信息管理领域所需要处理的问题,涵盖项目13项。第四类项目以学科的技术发展和应用为主,共有项目13项,这些项目的研究主要围绕着引文网络、计量分析、数字图书馆技术、语义网及语义标注和理解等主题。

在这些项目之中,前两类零被引项目的研究对象是少数民族信息建设和古代文献,在当前是相对冷门的研究主题,但这类研究论文在学术上仍有重要价值,它们可能是“睡美人”,日后随着古籍和民族档案信息化建设较为完善,这个主题受到更多人关注时,论文未来可能将得到引用。

4 项目成果的零被引论文分析

仅仅对零被引项目的研究太过粗略,除了一个项目的所有论文成果均未被引用以外还存在许多项目有部分论文成果被引量为零,只有进一步深入到论文的零被引程度才能更加清楚地了解到国家社科基金的零被引情况。

在收集到的數据里,806个国家社科基金项目一个发表论文6697篇,零被引论文一共1551篇,为全部论文的23.16%,超过两成。

根据国家社科基金项目的不同类型,表3整理了不同种类基金项目发表零被引论文的基本情况。

从表2的数据可以看出发表论文最多的是一般项目和青年项目,其中一般项目的零被引论文也是除成果文库以外,在所有项目学术成果零被引论文占比最低的,仅有19.10%。与之相比,青年项目中的零被引论文比例则要略高一些。

在各个类型项目之中,零被引论文比例最高的是后期资助项目,其次是重大项目和西部项目。后期资助项目的学术成果主要是以中文学术专著、学术资料汇编和工具书为重。而重大项目平均每个项目发表论文数量最多,课题研究注重新颖性,范围深入、广泛,容易得到较为超前的论文。西部项目旨在资助西部地区社科研究工作者,重点围绕西部地区问题开展相关研究,这一部分研究目前还只是一些基础性工作,未来民族学和西部地区研究大力发展时,它们可能会得到更多的关注。

从图中可以看到和立项数量增长比较相似的,从1994-2006年之间,每年项目的论文发表也处于稳步增长。2007年的项目申请数量有一定回落。2007年到2011年每年立项项目增加速度越来越快。endprint

依据各年份项目的学术论文成果,图3统计了不同年份立项项目发表论文及论文零被引的相关情况,并且计算出当年立项项目发表论文中的零被引论文百分比。

在从国家社科基金创建初期直到1999年,每年立项项目所发表的论文数量大致相同,零被引论文也仅有一两篇,相对稳定。从2000年立项项目开始发表论文和零被引论文都逐渐增加,但到2007年以后的项目零被引论文比例就增加越来越快,当然这部分项目的论文成果发表时间大也均还未满10年。

上面所展现的是从项目立项时间角度的零被引论文情况,从论文的发表时间来看,在1994-2014年间,社科基金项目所资助发表的论文成果及论文中的零被引情况一直在变化。图4是各年度发表的论文总成果和其中零被引论文数量对比。

从图中可以看出自2003年以后,社科基金项目每年发表的论文稳步上升,到2014年,当年基金发表的学术论文成果达到1017篇。而其中的零被引论文到2007年为止都上升缓慢,保持在20篇以下。而到2007年,当年发表的论文已有372篇,零被引论文占比明显低于10%,这一结果也低于Price首次测度零被引论文的结论,他指出在论文出版后的10年窗口内,大致会有10%的论文从来没有被引用过[1]。

自2010年开始论文成果的未被引用率才超过10%,零被引论文数量也成指数趋势上升。其原因很可能是在2010-2014年期间发表的论文引文时间窗太短,若是以10年作为时间窗口,论文的零被引率应会有所回落。

5 结语

本文根据国家社会科学基金资助下图书馆、情报与文献学项目的项目批准号和项目名称,从CNKI、维普中文科技期刊数据库和万方学术期刊全文数据库获取了项目的研究论文成果,并整理出了其中的零被引论文进行分析。

从图情档社科项目成立至今来看,每年立项项目都在逐渐增加,而零被引项目数量很少,增长幅度也不是很大,体现了国家社科基金作为我国社会科学研究高层次水平一向受到学界及同行的认可。零被引论文虽然随着立项数目的增加也增长了一些,但其占总体论文的比例基本能维持不变。

零被引项目的主题集中在几个方面:一是少数民族档案整理和少数民族地区信息资源建设;二是古籍古文献研究;三是我国当下的信息产业、信息资源、信息技术发展等。这些研究主题本身对社会的实用性很高,而且很多研究还在基础研究起步阶段,未来还有更大的发展空间,因此才造成零被引现象,但它们可更能是潜在的睡美人现象论文。

参考文献

[1]de Solla Price D J. Networks of Scientific Papers[J]. Science, 1965, 149(3683): 510-515.

[2]Garfield E. UNCITEDNESS-III--IMPORTANCE OF NOT BEING CITED[J]. 1973.

[3]梁立明,林晓锦,钟镇,薛晓舟.迟滞承认:科学中的睡美人现象——以一篇被迟滞承认的超弦理論论文为例[J].自然辩证法通讯,2009,01:39-45+111.

[4]张晓阳,窦美玉.“图书馆、情报和文献学”国家社会科学基金结项项目计量分析[J].图书馆论坛,2012,02:167-169+116

1.因为2015年及以后的项目论文发表时间基本在一年以内,被引情况本身本身就很少,故本文选择的项目为1991年-2014年资助的。endprint

猜你喜欢
社科基金项目资助
社科成果展示
社科成果展示
高校资助育人成效的提升路径分析
社科成果展示
“隐形资助”低调又暖心
常见基金项目的英文名称(二)
常见基金项目的英文名称(一)
人文社科
美国防部资助研发能垂直起降的无人机
2600多名贫困学生得到资助