基于共词聚类的藏汉双语教育研究热点分析

2015-12-13 02:46邱婧玲孙淑文
西藏民族大学学报 2015年2期
关键词:藏汉共词主题词

邱婧玲,孙淑文,李 静

(西藏民族学院教育学院 陕西咸阳 712082)

基于共词聚类的藏汉双语教育研究热点分析

邱婧玲,孙淑文,李 静

(西藏民族学院教育学院 陕西咸阳 712082)

文章以中国期刊网全文数据库(CNKI)2009-2014年收录的有关藏汉双语教育的研究文献为研究对象,以共词聚类和多元统计分析为主要研究方法,采用BICOMB软件和SPSS 19.0进行内容挖掘和统计分析,以可视化的知识图谱描述各个关键词之间的内在关系,揭示近6年来我国藏汉双语教育领域的研究热点和发展趋势,为藏汉双语教育及少数民族双语教育研究提供参考和借鉴。

藏汉双语教育;共词聚类分析;因子分析;多维尺度分析

双语教育指的是“以两种语言作为教学媒介的教育系统”[1],它不仅是一种跨文化教育的重要手段,更是民族地区传承民族文化的重要形式。藏汉双语教育指的是“藏语和汉语作为教学媒介的教育系统”,近年来,对民族地区双语教育的研究文献越来越多,也折射出,对双语教育的研究越来越关注。那么藏汉双语教育研究的热点和关注点是什么?本文将运用共词聚类分析法(Co-word Cluster Analysis),对藏汉双语教育进行研究和分析。

在研读了1999-2014年有关藏汉双语教育的文献之后,我们发现有关藏汉双语教育的研究呈现逐年上升的趋势(图1),也取得了一些成就,但对于藏汉双语的研究主要是从2009年急剧上升,从1999年的5篇,到2008年达到13篇,2009年11篇,2011年达到34篇,说明对藏汉双语教育研究的关注逐步上升。但关注的焦点在什么地方,研究的趋势是什么?等问题亟待我们进一步分析和深掘。

图1:1999-2014藏汉双语教育发文量

一、数据来源与方法

(一)数据来源

在CNKI数据库中(1999-2014),以主题词=“藏汉”+“双语教学”或“双语教育”为主题的文献共有176篇,研究发现,对藏汉双语教育的研究主要集中于2008年后,故最终文献确定为2008-2014年12月关于藏汉双语教育的文献为研究对象,经过去除重复、删除相关度不大,新闻报道等非学术文献,共确定有效文献78篇。

(二)研究方法

共词聚类分析(Co-word Cluster Analysis)是一种较新的文献计量学方法。其主要原理是对一组词两两统计它们在同一篇文献中出现的次数,以此为基础对这些词进行聚类分析,从而反映出这些词之间的亲疏关系,进而分析这些词所代表的学科或主题的结构与变化[2]。通常来讲,一个学科的研究热点常常由该学科中主题词出现的频率反应,主题词出现的频率越高,说明该主题词反应的领域就越受关注[3],也就可能成为该领域研究的热点。主题词的分布与学科的发展有密切的联系[4],主题词的出现、合并、分化和消亡从文献内容深度动态地反映了知识情报的发展变化。对具体的文献内容而言,文献的主题词代表该文献的研究主题、研究内容和方向等方面的信息[5]。因此,对于文献学的分析研究,由于主题词的规范性及主题词间的组配性,使得主题词成为理想的分析单元[6]。本研究基于共词聚类分析,研究藏汉双语教育的研究热点和趋势。

二、研究过程与结果

(一)高频关键词表获取

首先,运用共词矩阵挖掘工具——书目共现分析系统(Bibliographic Item Co-Occurrence Matrix Builder,BICOMB)软件①对78篇文献进行主题统计和抽取全部关键词的频次,为避免命名不规范的关键词或涵义过于宽泛的关键词,影响统计结果,剔除了与研究内容和研究领域表征关系不大的关键词,合并了基本同义的关键词,得到172个关键词,结合Donohue J.C.提出的齐普夫定律推导出的高频低频词界分公式,参考孙清兰[7]提出的高频词与低频词的界分及词频估算法②,确定高频词阈值为13,考虑到结果描述的代表性,结合钟伟金[8]提出的对于“同一文献标本,关键词的平均词频值只有主题词的三分之一”,最终将出现次数为3次以上的词确定为本研究的高频低频词,共得到16个高频主题词,其总的出现频次为173次,占主题词总频次(325次)的53.2%,这16个高频主题词基本代表了国内该领域的研究热点(见表1)。

表1:藏汉双语教育高频主题词表

表3:高频关键词共现矩阵(局部)

表4:高频关键词相关矩阵(局部)

(二)高频关键词的共现矩阵

利用BICOMB得到高频关键词的词篇矩阵(表2)和共现矩阵(表3)。

进行共词分析,只有高频关键词的共现矩阵是不够的,对共词分析我们更需要分析高频关键词的相关性,因此,需要将共词矩阵标准化,利用SPSS 19.0将共词矩阵转换为相关矩阵(如表4)。

三、多元统计分析

(一)因子分析

因子分析是最常用的数据分析方法,通过因子分析可以把多个观测变量浓缩为少数几个因素进行分析,把相关矩阵导入SPSS19.0,通过特征值准则和碎石图准则[9],放弃特征值小于1的主成份,取特征值大于1的主成份,得到主成份表(见表5),建立碎石图(见图2),前6个主成份解释了总变异的78.757%,因此,可以认为可提取的最大因子数是6个。

表5:观测变量列表(局部)

图2:碎石图

(二)聚类分析

共词聚类分析法是把距离较近的主题词进行聚集,形成概念相对独立的类团,使类团间属性相似性最小,类团内属性相似性最大[10]。利用SPSS 19.0输入高频词的相关矩阵,利用组间连接聚类法对这些高频关键词进行系统聚类分析[11],得到共现聚类分析树图,如图3所示。

图3:高频关键词聚类树状图

关于树状图的结果判读,主要通过对每一个类别关键词组合的语义关系加以分析,确定中心关键词并对每个类别加以命名,并辅以专家指导和在CNKI中检索含有共现词对的文章,分析共现词对的关系等方法,得到藏汉双语教育研究主题的研究主要表现在以下几个方面:(1)西藏双语教学研究;(2)双语教育;(3)双语教师与双语教材研究;(4)学前双语教育;(5)双语教学模式;(6)基础教育双语教学策略研究等。

(三)多维尺度分析

图4:多维尺度图

多维尺度分析是一种探索性的数据分析方法[12],它通过将含有多个变量的大型数据压缩到一个低维空间,以低维空间图形展现关键词之间的联系,并用平面距离反映关键词之间的相似程度[13]。通过上面得到的相关矩阵,用SPSS 19.0进行多维尺度分析,得到如图4所示的高频关键词多维尺度图。图4中,有高度相似性的点聚集到一起,形成科学共同体[14],并且,越居中的关键词与其他关键词的联系越多,在该领域中的地域越核心,反之则越独立。

四、结果讨论

通过因子分析、聚类分析和多维尺度分析三种方法,结合相关文献,可以将藏汉双语教育相关领域研究热点做进一步分析和探讨,该研究主要从以下四个方面切入和探讨。

(一)藏汉双语教育与教学理论与实践研究

诠释该研究领域的关键词主要有,“西藏”、“双语教育”、“双语教学”三个关键词。从2009年开始,藏汉双语教育得到了越来越多的研究者的关注,如张婷的《浅析藏汉双语教学研究》[15];才让措、程芙蓉共同撰写的文章《藏汉双语教学研究的创新思路》[16];李录琴的《藏汉双语教学的现状及政策研究》等。藏汉双语教育与教学理论与实践成为了双语教育的研究热点之一。

(二)多元文化背景下基础教育双语教育的运用研究

该研究类别主要由“基础教育”、“策略”、“三语教学”、“多元文化”“藏族学生”、“少数民族学生”等关键词构成。双语教育的实施主要在基础教育阶段进行,在这个阶段不仅仅是藏汉双语教育的研究,更有“三语教育”的相关研究,如吕晓娟[17]的“藏族小学汉语文教学之行动研究”;土登贡布[18]的“多元文化背景下内地西藏班(校)双语教学研究”;张善鑫[19]的“民族双语教学问题、成因与对策——以藏汉双语教学为例”,史民英、肖铖撰写的“西藏‘三语教学’的价值取向及模式探析”等。

(三)学前双语教育相关研究

该类别主要由“学前教育”[20][21]、“藏语文”、“双语教学模式”等关键词构成。近年来,对于学前教育中是否有必要开展双语教育?对于幼儿,几岁开始进行双语教育?以上问题成为大家关注的焦点,有学者探讨了深层共享能力假说等理论基础及对学前双语教育的启示与借鉴价值。

(四)双语教师培养、双语教材开发及双语教学

模式研究

双语教材开发与双语教师培养,成为少数民族教育中制约双语教育发展的关键因素,如何培养既懂民族语又懂汉语的双语师资,是实施双语教育的关键,对双语教师的培养涉及双语教师培养的很多方面,如汉语教师的PCK生成个案研究[22],藏汉双语教师教学胜任力评价标准建构研究[23]等方面。通常情况是,汉族教师只懂汉语,不会藏语,教学中,对一些复杂的问题的讲解只能停留在汉语的解释和说明上,但对于低年级的学生来说,因为其汉语水平缺乏,给学生的理解与掌握,造成了很大的困难,因此,实施双语教育的任务就责无旁贷地落在了藏族教师的肩上,而相对来讲,藏族教师的双语水平也有限,致使双语教学绩效问题异常突出。可见,双语教材开发、双语教师培养,运用教育技术进行的双语教学模式等相关问题也是研究热点之一。

对藏汉双语专题文献的高频关键词进行共词聚类分析,不仅探索了藏汉双语教育领域出现的高频词,更注重这些关键词之间的联系,从而更好地反映了藏汉双语教育研究领域的热点和趋势。但是,共词聚类法分析的是已发表文献中关注的热点,而不能较好地反映出位于关注焦点边缘的具有潜在热点的主题。如果降低截取高频主题词的阈值,包容更多的主题词,就会出现一些有苗头的东西和有倾向性的主题,但这样又往往影响聚类的效果。如何在预测功能与聚类效果之间掌握好平衡,应是今后研究中需要注意的问题。

[注 释]

①感谢中国医科大学崔雷博士提供BICOMB软件支持。

②Donohue J.C.提出的确定高低频词阈值公式为T=(-1+,I1是词频为1的词的个数。孙清兰根据上述原理提出高低频词阈值公式为,其中D为关键词的个数,经比较后者更为合理和简洁。T为高频词中的最低频次值,即高频、低频词词频临界值。

[1]W.F.麦凯,M.西格恩著,严正,柳秀峰译.双语教育概论[M].北京:光明日报出版社,1989.

[2]崔雷.专题文献高频主题词的共词聚类分析[J].情报理论与实践,1996(4).

[3]叶然,徐桂华,陈璇,杜世正.近三年国外护理教育研究热点的共词聚类分析[J].解放军护理杂志,2012(9).

[4]西武.木桶定律:国家、企业、个人均衡发展的行动指南[M].北京:机械工业出版社,2004.

[5]周颖,李红梅.图书馆人力资源管理刍议[J].职业时空,2006(16).

[6]鄢高翔.新时期高校教师的师德与师能研究[J].高等农业教育,2005(3).

[7]孙清兰.高频、低频词的界分及词频估计方法[J].情报科学,1992(2).

[8]钟伟金.共词分析法应用的规范化研究——主题词和关键词的聚类效果对比分析[J].图书情报工作,2011(6).

[9]张文彤等.世界优秀统计工具SPSS11.0统计分析教程(高级篇)[M].北京:北京希望电子出版社,2002.

[10]Janssens F,Leta J,GlanzelW,etal,Towards Mapping Library and Information Science[J].Information Processing&Manage⁃ment,2006(6).

[11]张文彤等.世界优秀统计工具SPSS11.0统计分析教程(高级篇)[M].北京:北京希望电子出版社,2002.

[12]孙晓宁,储节旺.近十年知识管理领域硕博士学位论文研究热点分析——以共词分析为方法[J].情报杂志,2012(6).

[13]刘林青.范式可视化与共被引分析:以战略管理研究领域为例[J].情报学报,2005(2).

[14]邓中华,孙建军.网络环境下共词分析方法的应用研究[J].图书馆杂志,2008(12).

[15]张婷.浅析藏汉双语教学研究[J].西北成人教育学报,2013(4).

[16]才让措,程芙蓉.共同撰写的藏汉双语教学研究的创新思路[J].青海师范大学学报(哲学社会科学版),2011(3).

[17]吕晓娟.藏族小学汉语文教学之行动研究[D].西北师范大学硕士学位论文,2003.

[18]土登贡布.多元文化背景下内地西藏班(校)双语教学研究[J].西藏科技,2013(9).

[19]张善鑫.民族双语教学问题、成因与对策——以藏汉双语教学为例[J].当代教育与文化,2012(4).

[20]姚建军.西藏学前藏汉双语教育发展现状研究[J].湖北科技学院学报,2014(7).

[21]姚建军.西藏学前藏汉双语教育师资培养现状[J].佳木斯教育学院学报,2014(6).

[22]靳小龙.中学藏族教师汉语文PCK生成的个案研究[D].青海师范大学硕士学位论文,2011.

[23]李俐,李智元.藏汉双语教师教学胜任力评价标准建构研究[J].西藏大学学报(哲学社会科学版),2013(2).

[责任编辑 杨小峻]

[校 对 夏 阳]

词篇矩阵(局部)关键词文章编号西藏双语教学双语教育双语教师汉语文民族教育双语教学模式学前教育多元文化藏语文双语教材少数民族学生基础教育藏族学生策略三语教学1 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 2 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 3 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 4 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 5 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 6 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 7 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 8 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 9 1 1 0 1 0 0 0 0 0 0 1 0 0 0 0 0 10 11 12 13 14 15 1 1 0 1 0 0 0 0 0 0 1 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 1 1 1 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0

H214;H193

A

1003-8388(2015)02-0109-05

2015-01-04

邱婧玲(1968-),女,甘肃民勤人,现为西藏民族学院教育学院副教授,教育学博士,主要研究方向为民族地区教育信息化。

本文系教育部人文社会科学研究西藏项目“西藏学前双语教育资源共建、共享研究”(项目号:13XZJA880001);西藏自治区国家语委语言文字应用研究重点课题“西藏学前双语教学现状调查与研究”(项目号:YK-2014-005);西藏自治区教学改革项目“西藏高校多媒体课堂教学优化研究”(项目号:2011ZGGJ16)的阶段性成果。

猜你喜欢
藏汉共词主题词
日常交际用语之藏汉对比分析
藏汉双语版话剧《哈姆雷特》亮相首都剧场
藏汉孩子是一家
关键词的提取与确定
《中国医学计算机成像杂志》2020 年第26 卷主题词索引
基于突变检测与共词分析的深阅读新兴趋势分析
基于Matlab的共词矩阵构造
《中国骨与关节杂志》2016 年第五卷英文主题词索引
基于共词知识图谱技术的国内VLC可视化研究
舞阳县博物馆藏汉画像石 汉代民众身后的理想家园