基于CNKI数据的历史学学科半衰期探究*

2015-11-21 01:55张磊
图书与情报 2015年2期
关键词:半衰期中国史历史学

张磊

(南京大学信息管理学院 江苏 南京 210023)

基于CNKI数据的历史学学科半衰期探究*

张磊

(南京大学信息管理学院 江苏 南京 210023)

文章以历史学为研究对象,通过分类号获取CNKI中相关文献数据,计算了历史学各子学科在2008~2012年间的学科引用半衰期与学科被引半衰期。结论是:从学科引用半衰期来看,历史学引用半衰期较长,引用多为历史经典文献;从被引半衰期来看,其半衰期较长,表明历史学研究的老化速度慢,且对其他学科有较高的借鉴价值。

学科半衰期;历史学;引用半衰期;被引半衰期

1 引言

半衰期是文献老化的计量指标之一,1944年,戈斯内尔针对科技文献老化现象,提出了“半衰期”的概念。之后,贝尔纳进一步提出通过负指数模型来表征文献的老化,巴顿等提出了引文曲线的半衰期公式,并将半衰期定义为“在一段时间内已发表的某一学科领域内正在被利用的全部文献中较新的一半是在多长时间内发表的”。

在我国学术界,罗式胜根据文献主体范围的不同,对文献半衰期进行了继续划分,包括文献、期刊、科学家、国家等半衰期。从数据处理来看,半衰期分为历时半衰期和共时半衰期,历时法观察的是文献资料变得不再有用或不再有效的过程这样一个动态的概念,而共时法则将文献老化视为一种状态。汪继南以文学、历史、哲学、经济学和法学的各一种期刊为研究对象,调查统计了2003年度引文中所有出自期刊报纸网络并标注了出版年份的文献数据,计算得历史学半衰期为8.05年。白云汇总了CSSCI中20个学科735种期刊2000~2004年的被引半衰期,大于10年的均按10年算,得出历史学半衰期为8.59年。姜春林等对人文社科领域较权威的17种专业期刊在CSSCI中2003年度的引文数据进行分析,得出历史学期刊半衰期为10.0年。游毅等获取了SCI和SSCI中1980~2009年30年间数学、计算机科学、经济学与历史学中各40种样本期刊的引文数据,分别采用插值法和B-K方程法计算得历史学半衰期分别为8.69年和8.28年,并揭示了30年间科学期刊文献老化速度总体减缓的趋势。邱均平等以CSSCI收录的2006~2008年的所有人文社会科学7大学科引文数据为样本,用共时法计算得历史学在2006和2007年的半衰期分别为17.47年和18.45年,并显示了历史学的老化并不严格遵循负指数函数。

本文从学科角度,以CNKI中收录的历史学文献引文数据为基础,对历史学各子学科的半衰期进行计算,并从年度变化角度对历史学半衰期加以考察,以此反映我国历史学学科的文献老化情况。

2 研究设计

2.1 数据采集与处理

2.1.1 数据采集

文章以中国图书馆图书分类法(第四版)历史学相关分类号为检索条件,获取了CNKI中历史学各子学科近五年(2008~2012)和近十年(2003~2012)的相关数据(见表1)。

表1 历史学各子学科的总引用数据

从统计结果可以发现,历史学各子学科的十年总被引数反而小于五年总引用数。究其原因:前者来自于引文库,该引文库只收录了引文中的论文部分,而历史学论文的引用文献中论文所占比重只有25%左右;后者是来自于所有历史学论文中的参考文献,这其中包括论文、图书等各种类型的文献。这就是为什么5年的引文数量远远高于10年总被引数量的原因。

2.1.2 数据处理

半衰期的计算方法主要是引文分析法,其他还包括文献管理统计数据分析法和基于假设的纯数学方法等方法。基于引文分析的文献半衰期计算方法又包括作图法、公式法和中值法三类。作图法较为直观但略粗糙,更精确一些的是俞培果提出的灰色预测模型。公式法主要是指上述提及的负指数模型、B-K方程等。中值法则较为简单,假设半衰期的整数部分为x年,a=x+1,b=x。则a引文≥50%,b引文≤50%(a引文、b引文为第a、b年的引文累积百分比),半衰期H=x+(0.5-b引文)/(a引文-b引文),本文采用中值法计算半衰期。

2.2 数据总体分布

2008~2012年间,CNKI收录的历史学文献的总引文数据为712738条,其中期刊104029条,博硕士论文608709条。博硕士论文篇均引文量远高于期刊,约是期刊的六倍。

各子学科中,中国史无疑是主流,引文数占到总数的65%;剩下部分中史学理论(8%)、欧洲史(8%)、美洲史以及世界史引文相对较多,占比均在百分之七八间;亚洲史占4%;非洲史(1%)和大洋洲史(0%)文数最少。

从年代分布上来看,近五年的总引文数呈上升趋势(除2012年相比2011年引文数略有下降),与发文数的逐年增长有关。从各年总发文数与总引文数发布图(见图1)中可明显看出引文比发文的增长快很多,发文的增长大抵呈与坐标平行的方向缓慢增长,而引文则是斜向上方的快速增长。

图1 历史学各年总发文数与总引文数分布

由于2000年以前数据较少,因此只列出自2003年起的数据。可以发现:2003~2012十年间获得总被引数据410923条;总被引数据中,中国史的占比为86%,这个数据表明历史学下被引文献主要是与中国史有关;剩下部分中,史学理论占比为7%;欧洲史为3%;亚洲史和美洲史均为2%;世界史、大洋洲史和非洲史占比最少(0%)。

从各年份的总数来看,总被引数平稳上升,并且在2005~2007以及2009~2011年间有着尤为迅速的增长(见图2),说明这两个年份段中历史学受到相对较高的关注,其他学科对历史学的参照较多,历史学内部间的引用也较频繁。

图2 历史学各年总被引数分布

2.3 引用半衰期计算及分析

引用数据分两类,一部分是期刊引文,另外一部分是博硕士引文,分别按年份进行统计,利用其总引文次数计算各年份的历史学文献共时引用半衰期及每个子学科(即大类号)的半衰期。表2显示了各年份历史学期刊引文总数情况。

表2 各年度历史学研究的期刊引文总数

与总引文数一样,期刊引文总数也是逐年增加的(除2012年相比于2011年略有下降),分布特征也大致与总体吻合:中国史占绝大数,次之为史学理论(这与总体分布略有差异),欧洲史、亚洲史和非洲史为下一梯队,世界史、大洋洲史和美洲史最少。引文量与学科的热度有关,热度越高发文与引文也越多。因此,从期刊数据来看历史学子学科按学科关注热度由高到低依次是中国史、史学理论、欧洲史、亚洲史、非洲史、世界史、美洲史和大洋洲史。

本文根据引文时间分布,先以2012年史学理论为例,计算得其各年度的累积引文百分比(见表3)。

表3 2012年史学理论期刊总引文中各年度的累积百分比

使用中值法计算引用半衰期,此处的a=12,a引文=52.26%,b=11,b引文=48.72%。因此半衰期H= 11+(0.5-0.4872)/(0.5226-0.4872)=11.36。类似地可计算出其他子学科各年份的半衰期(见表4)。

表4 各年度历史学期刊引用半衰期

观察引用半衰期数据,可以发现:从五年半衰期的变化幅度来看,史学理论、中国史以及作为总计的历史学变化最小,在10.5~13.5之间浮动;世界史、大洋洲史以及美洲史变化幅度最大,在0~25之间;亚洲史、非洲史和欧洲史变化幅度约在5~25之间(见图3)。

由此可见:中国史的半衰期变化与整个历史学的变化趋势基本同步,进一步证实了中国史在历史学中的主导地位,2010年半衰期的暂时性缩短则说明当年中国史学界出现新的研究点;史学理论的半衰期逐年增长,2012年有下降趋势,说明其对老旧文献的关注度有所下降,对新兴文献关注度上升,由于产生了新的理论热点话题,旧文献的累积不足;亚洲史和非洲史的变化趋势大致同步,非洲史的半衰期一直高于亚洲史,说明其累积文献较多,前人的研究较丰富,但两者均在2011年出现半衰期大幅下降的情况,说明在当年出现了新的研究点;欧洲史半衰期总体呈上升趋势,说明其研究较为饱和,学科正在变得越来越成熟;世界史、大洋洲史、美洲史的三个学科普遍存在的现象是发文及引文均较少,甚至有“零发文”、“零引文”的情况,因此半衰期的变化幅度大,并且不大能通过半衰期的变化反映学科的发展情况,表明相关研究仍处于发展中,有待于国内学者在今后研究中进一步加强。

本文也对博硕士论文的引文数据进行了统计计算,可得各年度及各子学科的半衰期数值(见表5)。

可以发现:与期刊引文一样,博硕士论文的引文整体也是呈逐年增长趋势,2012年总引文较之2011年有所下降;子学科中,中国史依然是主流,均值在七万左右,但其引文数量优势较之期刊中的一家独大情况有所削弱;引文量次之的为欧洲史、世界史和美洲史,均值在一万左右,大致符合总体分布的排序;史学理论引文数五年均值也将近一万,亚洲史均值为史学理论的一半;引文数较少的为非洲史和大洋洲史,与总体分布保持一致。

从半衰期的变化来看,依旧是以半衰期的变化幅度大小为标杆,将所有学科分为两大类:史学理论、中国史、亚洲史以及历史学整体为一类,其半衰期变化幅度相对较小,在8.5~14.5之间浮动;世界史、非洲史、欧洲史、大洋洲史以及美洲史视为另外一类,其半衰期变化幅度在8.5~33.5之间。

图3 历史学各子学科近五年期刊引用半衰期变化图

表5 各年度历史学博硕士论文总引文及半衰期

根据各子学科的引用半衰期变化图(见图4),可以发现:历史学整体引用半衰期均在10.5以上,体现了其学科的成熟性;中国史半衰期一直在增长中,且半衰期小于历史学整体,说明其还处在不断成熟过程中;史学理论相对变化幅度较大,2008~2010年半衰期的上升源自其学科自身的不断成熟完善,2011~2012年半衰期略有下降并保持稳定,显示出现有历史理论的成熟;亚洲史相较于其期刊的半衰期曲线在引文数增长的情况下半衰期变化有所减缓,2008~2011年的快速增长显示学科的局部不断成熟,研究不断被完善,2012年的大幅减少应是新的研究热点出现造成;大洋洲史与美洲史半衰期仍是在剧烈波动变化中,与其期刊特征一致,说明这两个学科处在萌发中,没有特别成熟的理论,研究点也在不断变动中;非洲史的变化幅度也很大,主要是在2008~2009之间的急剧下降,应是由于研究热点的转向引起,2010~2012三年间关于新研究点的文献趋于饱和,半衰期也随之稳定;世界史由于引文数的增加,不同于期刊半衰期的大幅波动,博硕士半衰期变化相对稳定;欧洲史只有在2012年半衰期呈下降趋势,其他年份半衰期基本稳定,应属合理范围内的波动,与研究点转向关系不大。

总的来说,无论是期刊还是博硕士论文,历史学引用半衰期均在10以上,这意味着历史学文献的引文中的一半距今时长超过10年,也即历史学对经典文献的关注度较高,对新兴的文献兴趣度相对不高。这是学科成熟的表现,不再有特别多的新研究领域出现,着力在现有较为成熟的领域,并且已有较多的文献积累,所以在引用过程中追根溯源,文献源更多以原典性著述为主。历史学又是有长时间积淀的比较强调考据的学科,王国维先生的“地下之学问”与“纸上之材料”相互参证的“二重证据法”即是历史学重考据的反映。因之,历史学的传统即是在原始材料间发现学问的蛛丝马迹,在引用文献上会更偏重于历史经典,半衰期会远长于一般的理工学科,在半衰期普遍较长的人文科学中也少有半衰期能出其右的学科。具体到各个子学科,中国史是历史学研究的主流,引文量远超其他所有子学科。历史学引用半衰期很大程度上由中国史引用半衰期决定,中国史的古籍经典众多,广泛地出现在参考文献中,拉长了整体的半衰期数值,但同时由于中国史相关文章较多,参考新近出现文章的几率更大,这又会将引用半衰期缩短了一些。另外,文章还注意到期刊引文数据中,非洲史的半衰期最长,笔者认为原因有二:其一,有关非洲史的研究文献较少,现下的研究更多地借鉴前人的经验,时新的文献无可参照;其二,非洲史相关的源文章及引文数也较少,因此在统计中半衰期失之准确,半衰期数值未能稳定。相比之下,博硕士论文中关于非洲史的研究就多很多,引文数量也具有一定的统计意义,所以引用半衰期数值会低一些。

2.4 被引半衰期计算及分析

被引数据包括2003~2012年CNKI收录的所有历史学文献的被引情况。本文利用此历时数据计算了历史学各子学科的被引半衰期(见表6)。

表6 各年度历史学文献被引半衰期

图4 历史学各子学科近五年博硕士论文引用半衰期变化图

可以看出,历史学半衰期随时间不断增长,说明学科文献老化速度变慢,学科的影响力在增强。从半衰期数值上看,被引半衰期最长的是史学理论类的,这类纯学术的文章,不免引经据典,而要成为经典性的理论性文献须得经过时间的检验,需要历史背景下的文化积淀,所以被引周期较长;其次是中国史研究,它是历史学研究的主流所在,也是被引用最多的子学科门类,因为文献已有足够的积累,所以在引用时会多加甄别。对同一问题加以新阐释时需要借鉴新近的资料,更多地还是要返其本源,从一手材料出发,所以此类被引文献中年代较远者相对优先,文献的持续利用时间长,半衰期长;再就是大洋洲史的研究,因为相关文献较少,所以时效性不成为引证时的参考因素,现存的文献都能成为资料,相应地文献老化速度会慢一些;其他子学科被引半衰期分布大多在8.5左右,分布相对集中,引文行为大致相似,非主流的学科位置造成发文量少,文献的持续利用时间相对短一些。

对历史学子学科半衰期变化进行细分,大致分为三类:持续增长型、波动增长型和波动型(见图5)。持续增长型包括了史学理论、中国史、美洲史以及整个历史学,特点是每年的半衰期持续增长,引文行为相对稳定,被引年份相对集中,学科研究点持续性强,累计文献丰富。波动增长型包括了世界史、亚洲史和欧洲史,特点是被引半衰期总体呈增长趋势,但部分年份有所波动,由于学科自身发展还在完善中,学科热点累计文献有待增加,被引年份有所分散。而波动型包括非洲史和大洋洲史,这两个都属于相对冷门学科,引文行为不稳定,半衰期波动大,增长趋势不显著,学科累积文献也较少,被引分布规律不明显。

图5 各子学科近十年被引半衰期变化折线图

3 引用半衰期和被引半衰期的对比分析

引用半衰期主要反映的是学科对被引参考文献的时效要求,引用半衰期较短则意味着该学科对最近发表的文献较感兴趣。一般来说,学科发展越快,该学科的半衰期就越短;半衰期越长,说明学科的发展已进入发展较缓的成熟阶段。相比于引用半衰期,被引半衰期更为研究者所注意。学科半衰期一般即是指学科被引半衰期,它反映了学科论文的生命周期及参考价值,是衡量学科文献老化速度的指标。学科半衰期越长说明该学科文献被持续利用的时间越长,学科知识更新和老化速度越慢,影响力越深。

将所有子学科以及历史学科整体的期刊引用半衰期、博硕士引用半衰期以及被引半衰期进行对比,总体上被引半衰期普遍小于引用半衰期,以三个半衰期间具体的数量关系为度量,分所有学科为以下几类:期刊引用半衰期稳定大于博硕士引用半衰期的学科、期刊引用半衰期与博硕士引用半衰期大小关系相对稳定的学科、期刊引用半衰期或博硕士引用半衰期不够稳定的学科以及引用半衰期剧烈波动的学科。第一类包括史学理论(K0)、中国史(K2)以及整个历史学科(History),被引半衰期远小于两个引用半衰期,两个引用半衰期中又以期刊相对较大较稳定(见图6)。这三个学科都是成熟型学科,因此成熟学科一般具有稳定的半衰期,可以半衰期进行相对准确的学科评价分析。

图6 历史学中较为成熟的学科的三个半衰期值分布

而对于第二类,笔者称之为过渡型学科,具体特点是被引半衰期低且稳定,引用半衰期间的大小关系不稳定。如欧洲史(K5),其半衰期特征与成熟型无甚差异,鉴于其引用半衰期特征与成熟型略有差异,故将其列为中间过渡型(见图7)。而世界史(K1)的被引半衰期低且稳定,但引用半衰期中的期刊引用行为波动较大,未有明显趋缓,因此也将其视为过渡型(见图7)。

剩下的学科即对应上述第三四类。如亚洲史(K3)和非洲史(K4)与世界史半衰期分布差别不大,可视为过渡型的剧烈波动版,同样有较低的稳定的被引半衰期,而两个引用半衰期变化波动大,无明显大小关系(见图8)。大洋洲史(K6)和美洲史(K7)则是存在零被引零引用的不规则波动的学科(见图8),由于数据自身问题以及学科自身的冷门性,半衰期无规律分布,不适宜简单用半衰期进行准确的学科评价。

被引与引用是一个问题的两种不同视角,理论上来说被引半衰期和引用半衰期应该在数值上相差不会很多,笔者的实际数据反映出的引用半衰期普遍大于被引半衰期。究其原因,首先是数据源的问题。如上述数据采集部分所言,被引数据中缺少被图书引用的数据,减少了总被引数的同时也改变了被引半衰期。而期刊反映的是学科进展动态,在时效性的要求下引用的大多是靠近发文时间的前沿文献,这部分的被引半衰期较短;图书自身的汇集特性决定了其引用的文献时间跨度较长,并且引用的大多是需要经过一段时间检验沉淀的可靠经典文献,这部分的被引半衰期较长。本文中计算出的被引半衰期是被期刊和学位论文引用的半衰期,不含被图书引用的半衰期,因此实际所得被引半衰期小于真实值,拉大了与引用半衰期的差距。其次,历史学被引和引用可分别看作是历史学被所有学科的引用和所有学科对历史学的引用,被引半衰期短于引用半衰期的一个解释是历史学对其他学科的引用重视经典文献的参照,其他学科对历史学的引用重视其新近的发展情况,这也可以体现历史学作为一门人文科学其基础性的特质,对其他偏重应用的社会科学和自然科学的影响力较大,其他学科关注历史学的发展动态;而其他学科的研究进展对历史学发展影响较小,对其他学科引文老化速度较慢。

4 结论

图7 历史学过渡型学科半衰期分布

图8 历史学波动型学科半衰期分布

通过对文献老化指标——半衰期的定量测度,笔者发现历史学整体的发展趋势是已处在学科稳步发展的成熟期,并随着半衰期的继续增长还在不断成熟中。其引用半衰期均值在10年以上,说明其对引用文献的时效性无甚要求,对热点关注度不高;期刊引用半衰期长于博硕士论文引用半衰期,在于博硕士论文引文数多,并且对文献时效性有一定的要求,需要关注研究的最新动向,缩短了引用半衰期。其被引半衰期相较引用半衰期稍短,但也将近10年,也能反映历史学论文的持续利用时间较长,对经典文献关注度高,学科发展脱离了初创阶段的高增长新引用,文献有了历史的积淀,参照价值更高,对其他学科的影响力更大,能反映人文科学基础性的学科特质。被引半衰期短于引用半衰期的原因一是由于其客观的基础学科性质,二是数据源本身不规范及资源缺失引起。而历史学各个子学科中综合引用和被引半衰期的变化模式可大致分为成熟型、过渡型以及波动型。成熟型适宜用半衰期进行评价,过渡型则需结合其他定性分析,而对于波动型,半衰期数值的意义则有待商榷。

[1]Burton,R.E,Kebler,R.W.Half-life of Some Scientific &Technical Literatures[J].American Documentation,1960(11):18-22.

[2]罗式胜.文献半衰期的类型及其应用[J].情报学报,1997,16(1):62-67.

[3]郭红梅,邵艳娥,何钦成.文献半衰期研究现状[J].医学信息学杂志,2011,32(1):56-59.

[4]汪继南.社会科学各学科引文的高峰值调查及引文评价的时段性要求[J].情报资料工作,2005(3):81-82.

[5]白云.中国人文社会科学期刊被引半衰期分析研究[J].云南师范大学学报(哲学社会科学版),2006,38(4):127-130.

[6]姜春林,刘则渊.历时态角度看人文社会科学引文峰值及其引文评价的时间选择[J].情报科学,2006,24(9):1343-1347.

[7]游毅,索传军,钟晶晶.科技期刊长期老化趋势与影响因素实证研究——基于4门学科期刊30年引文数据的统计分析[J].图书情报工作,2011,55(12):140-144.

[8]邱均平,宋艳辉,杨思洛.国内人文社会科学文献老化规律对比研究——基于Web新形势下的研究[J].中国图书馆学报,2011,37(5):26-35.

[9]苏新宁.中国人文社会科学图书学术影响力报告[M].北京:中国社会科学出版社,2011.

[10]陈云鹏,张宝林.标准文献半衰期算法及实证研究[J].情报杂志,2012,31(8):94-97.

[11]俞培果.科技文献老化的历时研究[J].情报业务研究,1993,10(2):122-126.

Research on the Discipline Half-life of History Studies based on CNKI Data

This paper calculates the discipline half-life(citing half-life and cited half-life)of history studies based on CNKI data.On the basis of discipline citing half-life,it is clear that history studies do not care much about the time of documents and old classic documents are treasured.On the basis of discipline cited half-life,it is clear that the obsolescence of history is long because the history studies have great impact on studies of other social science.

discipline Half-life;history;citing half-life;cited half-life

G250.252

A

10.11968/tsygb.1003-6938.2015045

张磊(1992-),男,南京大学信息管理学院硕士研究生。

*本文系国家社会科学基金项目“以创新和质量为导向的哲学社会科学评价体系实证研究”(项目编号:12BTQ037)研究成果之一。

2015-01-10;责任编辑:刘全根

猜你喜欢
半衰期中国史历史学
楚汉之争(六)
楚 汉 之 争(八)
《半小时漫画中国史4》
如何成为管理时间的高手
以近代化史观整合中国史复习浅见
历史微故事的选取原则以及在初中历史课堂的应用
近十年竹枝词研究述评
高中化学试题中的半衰期
走出半衰期的认识误区