汉字词频与客观口语词汇获得年龄关系的研究

2015-12-17 21:46孙娜娜
安阳师范学院学报 2015年3期
关键词:词频

孙娜娜

(吕梁学院,山西 吕梁 033000)



汉字词频与客观口语词汇获得年龄关系的研究

孙娜娜

(吕梁学院,山西 吕梁 033000)

[摘要]词汇获得年龄和词频对词汇加工有重要的影响。通过选取551个音节的同音最高频词、同音中频词和同音最低频词作为调查词汇,让0-4岁幼儿的家长从中选取其孩子在该年龄阶段获得的词汇,收集AoA数据。根据调查结果探讨汉字词频和客观AoA的相互关系,研究发现客观AoA和词频有一定程度的相关,但并不完全一致。此研究结论可以为心理语言学研究实验材料的选择提供依据。

[关键词]词汇获得年龄;词频;客观AoA

一、引言

词汇习得年龄(Age of acquisition, AoA)指第一次以口语或者书面语形式接触到某个词并理解其意义的年龄。词汇习得年龄效应指个体对早获得词的加工比晚获得词的加工更快且更准确。词频效应指个体对高频词汇的加工易于对低频词汇的加工。

(一)词汇习得年龄效应

语言认知任务中,AoA是影响词汇加工速度的一个重要因素。研究者在图片命名任务(picture-naming task)(e.g., Lotto, Surian & Job, 2010)、词汇命名任务(word-naming task)(Morrison & Ellis,1995; Brysbaert, Lange & Van Wijnendaele,2000)、词汇判断任务(lexical decision making)(e.g., Brysbaert et al., 2000)等任务中,均发现了AoA效应。

(二)词频效应

词频影响词汇的理解(comprehension)和产生(production),包括其加工速度和正确率等(Jay, 2003)。在词汇判断任务(即让被试判断所呈现的一串字母是否是一个真词)(Rubenstein, Garfield & Millikan, 1970)和命名任务(即让被试根据呈现的信号,如客体的图像,说出单词)(Forster & Chambers, 1973)中,均发现了明显的词频效应,词频越高的词,判断或命名的时间越短。

(三)词频与AoA的关系

AoA效应被发现以来,词汇获得年龄和词频在词汇识别中的关系问题一直是研究者争论的焦点。有的研究者认为,过去发现的词汇识别任务中的频率效应可以归因于未加控制的AoA因素,如Morrison(1995) 等人发现词汇命名任务中AoA决定词汇命名的时间,频率没有作用。而有的研究者得出了不同的结论,认为AoA和频率都是词汇识别的重要影响因素,它们对词汇识别的过程独立产生影响,它们的效应是一种相加的关系(陈宝国,王立新,王璐璐,彭耽龄,2004)。

(四)主观AoA与客观AoA

以往研究中有两种类型的AoA数据:主观AoA数据和客观AoA数据。主观AoA数据是通过让被试报告自己在哪个年龄阶段学会的所呈现的词获得的。客观AoA数据通过图片命名任务收集,此项任务中,给不同年龄阶段的儿童呈现图片,让儿童给这些图片命名,如果某一年龄阶段的儿童能正确地给某一图片命名,说明儿童在该年龄阶段已习得与该图片对应的词汇。

以往多数研究采用主观评定的AoA数据(Gilhooly & Logie, 1980),Morrison et al. (1997)试图收集客观AoA数据,并通过计算主观AoA和客观AoA数据的相关系数评估主观AoA的有效性,获得主观AoA和客观AoA的相关系数为0.7。

客观AoA数据和主观AoA数据高度相关,然而客观AoA和其他心理语言学变量有中度相关(相关系数很少超过0.5)(Andrei Grigoriev & Ivan Oshhepkov, 2013)。这使得一些研究者相信主观AoA可能是一个组合变量;它可能依赖于其他变量,如词频、熟悉度等(Morrison et al.,1997)。

然而汉语中还未有研究获取客观AoA数据,因此汉语客观AoA与词频的关系仍是未知数。本研究将一个词的词汇获得年龄定义为该词首次在幼儿时期习得的年龄。通过这种方法获得的AoA数据比较客观,不依赖于被试的回忆而存在,实验结果可进行重复检验,也可为以后心理语言学材料的选取提供依据。

二、研究方法

(一)被试

选取0-1,1-1.5, 1.5-2, 2-2.5, 2.5-3, 3-4六个年龄组幼儿的家长作为调查对象,各年龄段对应的被试人数分别为66人、101人、58人、155人、101人、59人。其中男幼儿242个,女幼儿282个。采用与被试面对面的调查方式,要求被试从调查问卷中选出他们的孩子在该年龄阶段能够理解的词。共发放问卷555份,有效问卷524份,有效率为94%。

(二)调查问卷

首先,从词频词典(2011-9-22校正版)选出不含多音字的、同音字数大于等于三的音节;然后从每个音节各取一个最高频词、一个中间词频的词(即中频词)、一个最低频词作为熟悉度评估的刺激。高频词组或低频词组中,如果有两个以上词的频度等同,则从中随机选出一个作为刺激,如果一个音节的同音字数是奇数,则选择最中间的词作为这个音节的中频词;如果一个音节的同音字数是偶数,则随机选择正中间的两个词中的一个作为这个音节的中频词。最后选出551个音节的高频词、中频词和低频词,共1653个词构成调查问卷。

(三)数据收集与处理

发放问卷过程中,采用主试与被试一对一、面对面的方式,问卷当场回收。检查剔除无效问卷,采用Excel, SPSS13.0等统计软件进行数据处理。

对于某一特定的词,只有超过10个以上的被试选择,才将此词纳入统计处理中,并且将该词中数值最小的三个年龄数据的平均值作为该词的口语词汇获得年龄,即客观AoA数据。

三、结果与分析

本研究探讨汉语客观AoA数据的分布,以及客观AoA数据与词频的关系。

为了便于结果分析,将AoA数据与词频进行分组。

AoA数值范围及分组原则如下:数值在0至1之间(包括1)为组1,数值在1至1.5之间(包括1.5)为组2,数值在1.5至2之间(包括2)为组3,数值在2至2.5之间(包括2.5)为组4,数值大于2.5为组5。

词频数值范围及分组结果见表1:

(一)汉语AoA数据的频数分布

由结果分析可知,汉语AoA为2.5以上的词,即两岁半以上学会的词最多,占到了所有词的77.4%。其次是在AoA分组为2(即一岁到一岁半)这一年龄阶段学会的词居多。在AoA分组为4(即两岁到两岁半)这一年龄阶段学会的词最少。

(二)汉语AoA和词频的关系(见表2和图1)

AoA分组数据与词频分组数据均为等级变量,因此用Spearman相关计算AoA与词频的相关系数,求得r=-0.57,说明词频与AoA数值存在一定程度的关联。

通过表2和图1进一步分析可知,AOA比较大的词(分组为5,年龄为2.5以上),有多种词频,且低频词(词频分组<=8,词频<569)占到了近87%。AOA比较小的词(分组为1至4,年龄小于2.5)共375个,多数为词频相对较高的词,74%以上词频大于572(词频分组为9、10.11)。低频词(词频<37,词频分组为1、2、3、4)98%以上属于AOA比较大的词(AOA分组为5,年龄为大于2.5)。高频词(词频>572,词频分组为9、10、11)的AOA分布比较广泛。

四、讨论

通过客观调查的方式,获取了《现代汉语常用词频词典》中1653个词的客观口语AoA数据,区别于以往汉语研究所采用的主观评定的AoA数据(陈宝国,王立新,王璐璐,彭耽龄,2004)。此为汉语中首批客观口语AoA数据。以往研究中主观AoA数据混淆了词频、熟悉度等无关因素的影响,因此其对词汇加工的影响很难解释清楚。本研究收集的客观口语AoA数据可为今后心理语言学的研究提供参考。

汉语口语AoA数据分布的结果表明,虽然本研究所采用的词均源自《现代汉语常用词频词典》,但大部分词仍是幼儿两岁半以后习得的。这可能跟《现代汉语常用词频词典》中收集的是书面语的词频有一定关系,因此很多两岁半之前习得的词未在《汉语常用词频词典》中,或者未在本研究所选取的词汇中。

从AoA与词频的相关关系分析可知,AoA与词频的相关系数为-0.57,高于0.5,这不同于以往Andrei Grigoriev & Ivan Oshhepkov(2013)等的研究结果,前人研究均认为词频与客观AoA只存在中等程度的相关,相关系数小于0.5。本研究之所以得出不一样的结论,可能由于实验材料的不同,前人研究使用的实验材料均为拼音语言材料,而本研究使用的是汉字词。汉字词与拼音语言有很大差异,汉字词中同音字比较多,且很多为象形字,因此导致不同的实验结果。另外本研究获得客观AoA数据的方式与以往研究不同,以往研究客观AoA数据通常通过图片命名任务收集(Morrison et al. ,1997),而本研究采用调查幼儿家长的方式。数据收集方式的不同也可能导致实验结果有差异。以往收集AoA数据的图片命名任务虽然也是一种客观的方法,但本研究中的很多词汇用图片描述非常困难,所以采取了调查幼儿家长的数据收集方法,比起主观评估,此方法更为客观。主观评估的方法由于要求被试凭借记忆进行回忆,得出的数据可能存在一定的误差,且受到词频、熟悉度等因素的干扰。本研究采用的方法虽不能完全排除熟悉度等因素的影响,但由于让幼儿家长选择自己的孩子在当前年龄阶段已经掌握的词,熟悉度等因素的影响程度会大大减小。

由计算的相关系数及图表分析可知,AoA与词频存在一定程度的相关,呈现一种词汇习得年龄越早词汇出现频率越高的趋势,然而相关系数并不是很高,而且由图表可知,这种趋势也不是很明显,所以客观AoA和词频仍然有明显差异,这一点与以往的研究结论是一致的(Alvarez & Cuetos, 2007)。因此心理语言学的研究应同时考虑客观AoA和词频对词汇加工的影响。

五、结论

(一) 本研究收集了《现代汉语常用词频词典》中1653个词的客观口语AoA数据。

(二) 多数汉字词是幼儿两岁半以后习得的。

(三) 客观词频和客观口语AoA既有一定程度的相关,也存在差异。

[参考文献]

[1]lvarez, B., & Cuetos, F. (2007). Objective age of acquisition norms for a set of 328 words in Spanish. Behavior Research Methods,2007, 39(3): 377-383.

[2]Andrei Grigoriev & Ivan Oshhepkov. Objective age of acquisition norms for a set of 286 words in Russian: Relationships with other psycholinguistic variables. Behavior Research. 2013, 45(4): 1208-1217.

[3]Brysbaert, M., Lange, M., & Van Wijnendaele, I. (2000). The effects of age-of-acquisition and frequency-of-occurrence in visual word recognition: Further evidence from the Dutch language.European Journal of Cognitive Psychology, 2000, 12(1): 65-85.

[4]Forster, K. I., & Chambers, S. M. Lexical access and naming time. Journal of Verbal Learning and Verbal Behavior, 1973, 12(6): 627-635.

[5]Gilhooly, K., & Logie, R. Age-of-acquisition, imagery, concreteness, familiarity, and ambiguity measures for 1,944 words. Behavior Research Methods, 1980, 12(4): 395-427.

[6]Jay, T. B. Words and word recognition [M]. New York: Prentice Hall. 2003.

[7]Lotto, L., Surian, L., & Job, R. Objective age of acquisition for 223 Italian words: Norms and effects on picture naming speed. Behavior Research Methods, 2010, 42(1): 126-133.

[8]Morrison, C. M., Chappell, T. D., & Ellis, A. W. Age of Acquisition Norms for a Large Set of Object Names and Their Relation to Adult Estimates and Other Variables. The Quarterly Journal of Experimental Psychology Section A: Human Experimental Psychology, 1997, 50(3): 528-559.

[9]Morrison, C. M., & Ellis, A. W. Roles of Word Frequency and Age of Acquisition in Word Naming and Lexical Decision.Journal of Experimental Psychology: Learning, Memory, and Cognition, 1995, 21(1): 116-133.

[10]Rubenstein, H., Garfield, L., & Millikan, J. A. Homographic entries in the internal lexicon. Journal of Verbal Learning and Verbal Behavior, 1970, 9(5): 487-494.

[11]陈宝国, 王立新, 王璐璐, 彭聃龄. 词汇习得年龄和频率对词汇识别的影响[J].心理科学, 2004, 27(5): 1060-1064.

[12]刘源, 梁南元, 王德进, 张社英, 杨铁鹰, 揭春雨, 孙伟(主编). 现代汉语常用词词频词典[M]. 北京: 宇航出版社. 1990.

[责任编辑:K]

[收稿日期]2015-04-23

[基金项目]吕梁学院2013年校内青年基金项目(RWQN201306)结题成果。

[作者简介]孙娜娜(1985- ),女,山东德州人,主要从事汉语认知研究。

[中图分类号]H193.3

[文献标识码]A

[文章编号]1671-5330(2015)03-0120-04

猜你喜欢
词频
词汇习得中的词频效应研究
基于词频分布的齐夫定律朝鲜语适用性研究
汉语阅读中词频与注视时间、跳读的关系
希拉里2016总统败选演讲修辞与词频简析
希拉里2016总统败选演讲修辞与词频简析
基于关键词共现网络的图书馆与档案馆互联网+研究比较分析
关于影响词汇通达因素的实验分析报告
英语学习者笔语中情态附加语使用情况调查及相应对策
词频,一部隐秘的历史
谈常用字词的选取及其等级划分