基于语言学中文学术图书的半衰期分析研究*

2019-12-13 08:17
关键词:年数半衰期百分比

程 路

(西华大学 四川学术成果分析与应用研究中心, 四川 成都 610039)

1958年贝尔纳(J.D.Bernal)第一次提出用“半衰期”来表征文献情报老化速度。1960年,巴尔顿(R.E.Burton)和开普勒(R.W.Kebler)提出了文献“半衰期”的概念,指现时尚在利用的文献中较新的一半是在多长一段时间内发表的,也被称为“中值引文年限”。原美国科学信息情报所根据这种定义,从引证与被引证的角度出发,又提出了引用半衰期和被引半衰期。文献半衰期能够从文献利用的角度上,定量地揭示科学文献的老化规律,衡量科学文献的老化速度和程度。[1]

经过文献调查发现,目前关于文献半衰期的研究大多基于期刊文献、学位论文或者标准。方红玲[2]、杨彭[3]、卓可秋[3]、黄利平[4]等分别基于期刊文献计算了科学、数学和环境科学、艺术学、管理学、图书情报学等学科的半衰期。N.Zafrunnisha和V.P.Reddy[5]计算了印度的安得拉大学等3所大学哲学学科博士论文的引用半衰期。A.M.S.Angammana和L.A.Jayatissa[6]计算了科伦坡大学、凯拉尼亚大学图书情报学科的硕士论文引用论文半衰期。陈云鹏[7]等人计算了标准文献的半衰期。随着BKCI的发布,也有学者利用BKCI的数据研究某个学科的半衰期。刘晓娟、马梁[9]、宋雯斐、刘晓娟[10]基于BKCI分析了图书的半衰期。但少有基于中文图书研究图书引用半衰期或者被引半衰期,更少有研究者基于中文图书同时对图书的引用半衰期和期刊半衰期进行研究。

因此,本文将利用中文语言学图书参考文献数据和引文文献数据研究中文语言学图书的被图书引用半衰期、被期刊引用半衰期以及引用图书半衰期和引用期刊半衰期,这对补全文献半衰期研究的版图,探索中文图书的老化特征及其演变规律,促进图书馆藏、剔旧等由经验管理向科学管理的转变,评价图书的研究价值,研究图书著者的学术影响力具有重要价值。

一、数据来源

本文首先从国家图书馆获取所有中图分类号以“H”开头的图书,然后根据中图分类号(CLC),过滤非语言学图书;其次按照图书记录中的文献类型字段,过滤所有非“专著”图书;再次按照学术著作标准,过滤教材、手册、科普读物等所有非学术类语言学图书:共获得有效中文语言学图书20 411本。最后从超星发现数据库获取以上语言学学术著作的参考文献和引证文献。

本文从20 411本图书中选择出版年在1997-2014年之间语言学学术图书共16 217本进行半衰期分析。其图书类型参考文献数量、期刊类型参考文献数量分别为3 384 447条、743 793条,在统计年被图书引用总次数、被期刊引用总次数分别为439 766次、370 869次,具体如表1。

表1 1997-2014年中文语言学图书引用及其被引分布

二、半衰期计算

(一)引用半衰期

文献引用半衰期是指该文献集合在统计年(T年度)中所引用(参考)的文献中,较新文献的引用(参考)次数达到总引用(参考)的50% 的年数。文献引用半衰期表示文献参考利用文献的新旧程度。根据其定义得出对应的计算公式如公式(1)所示:

HCitingT=N+(50%-R1)/(R2-R1)

(1)

公式(1)中,文献引用半衰期指数为HCiting,R1为累计引用频次最接近、并小于50%的那年的累计引用百分比,R2为累计引用频次最接近、并不小于50%的那年的累计引用百分比,N为累计引用百分比为R1的那年到T年的间隔年数。根据引用的文献类型的不同,文献引用半衰期可以分为引用期刊半衰期和引用图书半衰期。

引用图书半衰期是指该文献集合在统计年(T年度)中所引用(参考)的图书中,较新出版图书的引用(参考)次数达到图书总引用(参考)的50%的年数。图书引用半衰期表示图书利用图书的新旧程度,其值越小,表示引用的图书越新。其计算方法同公式(1)。

对引用年在T年的图书集合进行统计(即统计年为T),首先把T年引用的图书按照出版年度统计,然后分别计算其所占T年总引用百分比和累计百分比,最后将相应T年的间隔年数标记为1,并依次标记间隔年数,分别统计出1997-2014年图书引用图书出版年分布情况。

根据定义,如表2可知,当统计年为2014年时,累计引用频次最接近、并小于50%的那年的累计引用百分比R1=49.32%,累计引用频次最接近、并不小于50%的那年的累计引用百分R2=52.88%,累计引用百分比为R1的那年到T年的间隔年数N=12,根据公式(1),图书在2014年的引用图书半衰期HCiting2014=12+50%-49.32%)/(52.88%-49.32)%=12.19。

表2 引用年为2014年语言学图书引用图书半衰期

同理可计算出来源图书在1997-2013年的引用图书半衰期,计算结果如表3所示。

表3 语言学图书引用图书半衰期

由表3可知,在1990年-2014年之间,语言学图书最大引用图书半衰期出现在1999年,是19.14年,最小的出现在2010年,是10.49年,平均引用图书半衰期是13.67年。

引用期刊半衰期是指该文献集合在统计年(T年)中所引用(参考)的期刊论文中,较新发表期刊论文的引用(参考)次数达到期刊总引用(参考)的50%的年数。引用期刊半衰期表示图书利用期刊的新旧程度,其值越小,表示利用的期刊越新,其计算方法同公式(1)。

根据定义,由表4可知,当统计年为2014年时,累计引用频次最接近、并小于50%的那年的累计引用百分比R1=49.76%,累计引用频次最接近、并不小于50% 的那年的累计引用百分比R2=54.08%,累计引用百分比为A的那年到T年的间隔年数N=10。根据公式(1),图书在2014年的引用期刊半衰期HCiting2014=10+50%-49.76%)/(54.08%-49.76%)=10.06。

同理,可计算出中文语言学图书在1997-2013年的引用期刊半衰期,计算结果如表5所示。

由表5可知,在1997年-2014年之间,语言学图书最大引用期刊半衰期出现在2002年,是17.49年;最小的出现在2009年,是7.46年;平均引用期刊半衰期是11.94年。

表4 引用年为2014年语言学图书引用期刊半衰期

表5 语言学图书在1997-2014年引用期刊半衰期

(二)被引半衰期

文献被引半衰期,指文献集合在统计年(T年度)被引用的总次数中,较新的一半文献是在多长时间内发表的,这个时间段就是文献的被引半衰期。文献被引半衰期越长,说明文献的学术生命也越长,该文献越有长期的参考价值。根据其定义得出对应的计算公式如公式(2)所示:

HCitedT=M+(50%-C1)/(C2-C1)

(2)

公式(2) 中,文献被引半衰期指数为Hcited,C1为累计被引频次最接近、并小于50% 的那年的累计被引百分比,C2为累计被引频次最接近、且不小于50%的那年的累计被引百分比,M为累计被引百分比为C1的那年到T年的间隔年数。根据被引对象的不同类型文献,可以分为被图书引用半衰期、被期刊引用半衰期。

被图书引用半衰期是指该文献集合在统计年(T年度)被图书引用的总次数中,较新的占50%的被引图书的出版间隔年数。被图书引用半衰期表示文献生命力,其值越长,表示其对图书的价值越大,其计算方法同公式(2)。

对被引年在T年的图书集合进行统计(即统计年为T),首先把在T年被图书引用的图书按照出版年度统计,然后分别计算其所占T年总被图书引用百分比,和累计百分比,最后将相应T年的间隔年数标记为1,并依次标记间隔年数,分别统计出1997-2014年图书被图书引用出版年分布情况。

表6 被引年为2014年语言学图书被图书引用半衰期

根据定义,由表6可知,当统计年为2014年时,累计被引频次最接近、并小于50%的那年的累计引用百分比C1=49.31%,累计被引频次最接近、并不小于50% 的那年的被引累计百分比C2=52.26%,被引累计百分比为C1的那年到T年的间隔年数X=10,根据公式(1),图书在2014年的被图书引用半衰期HCited2014=10+50%-49.31%)/(52.26%-49.31%)=10.23。

同理可计算出来源图书在1997-2013年被图书引用半衰期,计算结果如表7所示。

由表7可知,在1997-2014年之间,语言学图书的最大被图书引用半衰期出现在2010年,是10.96年,最小出现在1997年,是4.36年,平均被图书引用半衰期是8.53年。

被期刊引用半衰期是指该文献集合在统计年(T年度)被期刊论文引用的总次数中,较新的占50%的被引图书的出版间隔年数。被期刊引半衰期表示文献生命力,其值越长,表示其对期刊论文的价值越大,其计算方法同公式(2)。

表7 语言学图书在1997-2014年被图书引用半衰期

表8 被引年为2014年语言学图书被期刊引用半衰期

根据定义,由表8可知,当统计年为2013年时,累计被引频次最接近、并小于50%的那年的累计引用百分比C1=45.99%,累计被引频次最接近、并不小于50% 的那年的被引累计百分比C2=51.11%,被引累计百分比为C1的那年到T年的间隔年数M=11,根据公式(1),图书在2014年的被期刊引用半衰期HCited2014=11+50%-45.99%)/(51.11%-45.99%)=11.78。

同理可计算出来源图书在1997 -2013年被期刊引用半衰期,计算结果如表9所示。

由表9可知,在1997年-2014年之间,语言学图书最大被期刊引用半衰期出现在2013年,是11.84年;最小的出现在1997年,是4.31年;平均被期刊引用半衰期是7.28年。

表9 语言学图书在1997-2014年被期刊引用半衰期

三、半衰期分析

(一)引用半衰期分析

1997—2014年,中文语言学图书的引用图书半衰期在10.49~19.14年之间,引用期刊半衰期在7.46~17.49之间,平均引用图书半衰期13.67年大于平均引用期刊半衰期11.94年,其年度分布曲线如图1所示。

图1语言学图书引用图书和期刊半衰期

由图1可知,引用图书半衰期和引用期刊半衰期走势相似,进一步分析易知,两者的相关Pearson相关系数为0.90,表明图书的引用图书半衰期和引用期刊半衰期正相关。这给我们测量图书半衰期提供新思路,在现有图书引文数据库不够完善的条件下,当引用期刊文献的引用图书半衰期和引用期刊半衰期正相关时,可以利用期刊引用图书的数据来表征图书的半衰期变化。

Sangam[11]认为文献数量增长越快,文献老化速度越快、半衰期越短。由前表1可知,语言学学术图书的数量越来越多。在1997-2014年之间,引用期刊半衰期和引用图书半衰期的线性趋势如图1直线所示,图书的引用半衰期在变短,图书老化速度在加快,与Sangam的结论基本一致,文献老化与文献的数量有关。

进一步分析可知,引用图书半衰期和引用期刊半衰期在2002年之后,其值大小稳步减小,直至2009年之后小幅上升。表明在2002—2009年,学者利用的文献越来越新,可能的原因是技术影响着学术传播和交流,即随着信息技术的发展,学者获取新文献的方式越来越便捷,学者可以更快地获取新文献,并利用新文献。值得注意的是,在2002—2009年之间,引用期刊半衰期比引用图书半衰期下降得更快,反映学者更倾向于或者更快捷地利用相对较新的期刊论文。但在2009年以后,文献的半衰期变高,这是否表明现在发表的文献的价值逐渐减低,抑或信息技术的发展使得学者获取老文献越来越方便,值得进一步研究。

(二)被引半衰期分析

1997—2014年,中文语言学图书的被图书引用半衰期在10.96~4.36年之间,被期刊引用半衰期在4.31~11.84年之间,平均被图书引用半衰期8.53年大于被期刊引用半衰期7.28年,其年度分布曲线如图2所示。

图2语言学图书被图书和期刊引用半衰期

由图2可知,中文语言学图书的被图书引用半衰期和被期刊引用半衰期走势相似,进一步分析易知,两者的相关Pearson相关系数为0.79,表明图书的被图书引用半衰期和被期刊引用半衰期正相关。

党亚茹等[12]认为期刊的被引半衰期可以反映研究成果的生命力。由图2可知,中文语言学图书的被图书引用半衰期和被期刊引用半衰期曲线都呈上升趋势,表明语言学学科图书对图书和期刊的利用价值越来越大,生命力越来越强。但是,被图书引用半衰期到2010年开始呈下降趋势,被期刊引用半衰期直至2013年才开始呈微弱下降。

如图2,在1999-2011年之间,被图书引用半衰期大于被期刊引用半衰期,在2012年以后语言学图书的被图书引用半衰期开始小于被期刊引用半衰期。

通过对比分析引用图书半衰期、引用期刊半衰期和被图书引用半衰期、被期刊引用半衰期,本文发现,引用半衰期和被引半衰期表征的半衰期的特征不一样,存在明显区别。

四、结论

本文通过对中文语言学图书的半衰期的实证分析,弥补了中文图书半衰期研究领域的不足。通过测量1997—2014年中文语言学图书的引用图书半衰期、引用期刊半衰期、被图书引用半衰期、被期刊引用半衰期,发现引用图书半衰期和引用期刊半衰期、被图书引用半衰期和被期刊引用半衰期分别呈正相关;平均引用图书半衰期13.67年大于平均引用期刊半衰期11.94年,平均被图书引用半衰期8.53年大于被期刊引用半衰期7.28年。同时对它们的趋势进行分析,了解到引用半衰期在整体呈下降趋势,但近几年呈上升趋势;被引半衰期整体呈上升趋势,近两年趋于稳定。通过对比图书引文半衰期和被引半衰期,表征的半衰期的特征不一样,存在明显区别。以上结论,对于研究文献的老化规律具有重要价值,为提升图书利用价值、优化馆藏具有重要价值。

由于引用图书的粒度不统一或者规范、图书参考文献著录的不规范以及超星公司提供的参考和引证数据的不全面,致使本文测量的半衰期存在误差,值得进一步采集更全面、准确的数据来对半衰期进行测量。

猜你喜欢
年数半衰期百分比
我国人口在校模式高质量发展研究
稻秸还田年数和氮肥运筹对小麦出苗和幼苗形态及生理特性的影响
普通照明用自镇流LED灯闪烁百分比测量不确定度分析
基于引用半衰期的我国五官学期刊文献老化研究
基于JCR®的国外临床医学学科半衰期
趋势攻略之趋势线:百分比线
双倍余额递减法与年数总和法的比较
基于文献计量学的我国化学学科半衰期分析
环保车型最多的美国城市
学会当翻译