辽宁高校语料库与二语习得研究评述

2014-12-25 03:46刘先宽
关键词:书面语高频词二语

刘先宽

自从以文秋芳老师为代表的一批中国学者创建了中国学习者语料库以来,语料库就成为英语学习者的重要工具。虽然语料库语言学研究方法兴起的时间较短,但是由于定量研究方法的准确性和新颖性,以及结合SPSS图表,使语言学研究具有非常强的直观性,将二语习得研究,特别是英语习得研究带入一个全新的领域[1]。作为教育部人文社科研究项目的重要研究内容之一,本课题组试图利用我们所创建的辽宁省高校学生口语、书面语语料库(LCC),通过实验和干预辽宁省高校学生的英语习得,探讨语料库和二语习得特别是英语习得之间的关系,以及研究成果和存在的问题。

一、主要特征

课题组认为,所建立的辽宁省高校学生口语、书面语语料库(LCC)具有以下特征:

(一)创建和处理手段科学

辽宁省高校学生口语、书面语语料库(LCC)全部利用WORDSMITH等专业数据库研究软件,进行语料库的创建和处理,运用BRILLE软件进行附码,将原始语料变成可以研究的语料库。LCC语料库运用WORDSMITH等软件列出语料库中的高频词和低频词进行研究,结合SPSS软件探讨二语习得者出现高频词和低频词的原因,提出相对应的教学和学习方法。同时利用英国国家语料库(BNC)研究它的高频词和低频词,对比研究我们语料库的高频词和低频词,分析原因,指导英语教学,让学生学到更地道的英语。这些研究的应用必将会提高高校教师、学生和研究者的视野,让英语语言教学和研究进入一个全新的阶段。另外,辽宁省高校学生口语、书面语语料库一经发布,就可供所有的教师和研究者共同享有和使用,有助于我省高校英语教学的改革和发展。

(二)提取和研究的语料真实

LCC语料库课题组利用两年多的时间,首先随机抽出辽宁省高校四级和八级口语、书面语的作文题目,然后走遍全省多个地级市的11所高等学校,进行现场语料采集,得到LCC的原始语料,然后利用先进的软件生成语料库。所以,LCC语料库为辽宁省高校英语教师、二语习得者和研究者提供了真实、可靠的,可以经过不断验证的语言数据。为他们研究和克服教学和学习中经常出现的问题和困难,提供了有益的帮助。

(三)设计和实验模式严谨

二语习得者是一个个鲜活的个体,容易受社会环境和心理因素的影响。我们在创建语料库的初期,对于话题范围、话题类型严格设计,从几千个四级和八级的口语和书面语题目中选取人文、社会、自然、生态等几个方面近100个题目。对于参加测试的学生也有明确要求,必须是在校的大二和大三的学生。选取的面尽可能包含我省多个地级市有代表性的大学,比如沈阳、大连、丹东、锦州、朝阳、鞍山、抚顺等地区的11所高校的学生。我们要求他们按照限时和不限时两种方式随机抽取作文题目,并按要求完成。口语的语料库,更是安排有经验的老师现场录音、测试、转录,形成语料库。所有的这些工作都是为了保证LCC语料库具有代表性和典型性。

(四)分析和统计方法独特

现代语言学研究多从事定性的研究。我们创建LCC语料库的初衷是以定量研究为主,辅以定性研究。它以现成的语料为基础,以实验为核心,用SPSS统计软件生成图表。同时,通过对比英国国家语料库(BNC)分析和研究辽宁省高校学生的英语习得情况和产生的原因,以及指导英语教学和研究的实践,多维度地揭示辽宁省高校学生二语习得的特点、成果和现状。

二、主要研究内容和成果

依据语言学研究的目的,LCC语料库的二语习得研究主要包括语段搭配错误分析和特征描写,高频词和低频词研究,学术成果检验和分析三个方面。

(一)语段搭配错误分析和特征描写

课题组的研究者主要运用WORDSMITH检索软件中的CONCORDANCE检索功能,以某个单词或者词组作为检索的关键词,提取出LCC语料库中所有的关于这个关键词的搭配。在提取关键词的过程中我们还可以根据需要来选取不同的跨距 (SPAN),也就是以关键词为核心左右所取的词的个数。也可以利用BRILLE软件的附码功能,研究以关键词为核心,所有词汇间的词性搭配特征。

语段搭配错误分析总体上可以分为两种:一是针对二语习得者普遍存在的搭配错误进行分析,查找原因,发现规律,指导教育和教学活动。我们创建和分析LCC语料库,发现目前辽宁省高校的学生,在词汇和语法两个方面出现较多错误,原因主要是受母语负迁移和学习者语言能力的影响。同时课题组的研究人员运用桂诗春的语段搭配错误分析认知模型,分析和解释了辽宁省高校学生的二语习得错误的成因及交互影响,提供了我省高校学生深层认知模型和整体理论框架,并把他们用于英语的教学和实践当中[2]。二是针对某个词汇或者短语的特种类型的研究。这是一种微观的研究,主要研究辽宁省高校学生英语口语和书面语表达中的单词或短语的错误使用,比如拼写错误、冠词错误搭配、介词错误搭配[3]。结合教学和课题研究的需要,课题组的全体研究人员对这些错误进行了逐项的研究,发现了一定的规律性,比如使用规则错误、语法项掌握不够、母语负迁移影响等等。

(二)高频词和低频词研究

描写母语或者二语习得者的语言特征是语料库语言学研究的重点,涉及到语言的各个层面。高频词和低频词的研究是语言特征研究的中心,文秋芳老师、杨惠忠老师、王立非老师等都不同程度地进行过这方面的研究。LCC语料库课题组把高频词和低频词的研究也作为研究的重点,探讨LCC语料库中高频词出现的次数和所占的比重。对于低频词的研究,主要是一种对比研究,对比BNC语料库和LCC语料库之间低频词使用的异同,并分析出现这种情况的原因。

我们对LCC语料库四级(定时)写作分库进行了高频词研究,采用WORDLIST软件列出使用频度前十位的词。它们出现的次数和所占的百分比如表1所示:

表1 英语四级考试高频词出现次数及百分占比

从这个词表我们可以看出冠词占据LCC语料库四级写作 (定时)分库的前两位,所占的百分比为8.24%。可见英语的初学者在语言的使用方面有很大的局限性,能够灵活运用的词汇量较少。另外,介词、人称代词、连词、系动词也占有很大的比重。通过和BNC语料库的高频词比较,我们发现辽宁省高校学生尤其是低年级的学生常用的词汇量较少,并且书面作文有口语化的倾向,需要在高校基础阶段的教学过程中加强这方面的训练[4]。连词的使用方面,也较多地使用and,but等口语化明显的连词,而像furthermore,however等较地道的和较正式的词汇用得比较少且蹩脚。但是,课题组成员研究八级写作分库时发现,高年级的学生英语写作的口语化现象不明显,且受汉语负迁移的影响也相对少一些[5]。对比研究BNC语料库,我们发现辽宁省高校学生的英语写作相对于本族语者比较僵化,尤其在语言的搭配和使用方面表现明显,常用的词汇少且重复率很高。

(三)学术成果检验和分析

LCC语料库不仅是我省二语习得者的口语和书面语的储备库,而且是许多语言现象的有力解释工具。课题组在创建LCC语料库之初就力求把检验和验证二语习得的理论和现象作为首要目标。比如,以介词in和on为关键词,通过CONCORDANCE软件和与BNC语料库的对比进行了搭配研究和母语迁移假说的研究,我们发现英语的初学者介词搭配错误较多,而且受母语负迁移的影响较重。例如,经常使用on the bed(表示睡在床上)这样的搭配。

LCC课题组把学术成果检验和分析作为我们研究和探索的突破口。我们运用WORDLIST软件列出LCC四级写作分库的词汇表,发现冠词的使用频度居于所有使用词汇的前两位。而BNC语料库中冠词的使用明显减少,而以日语为母语的英语学习者的语料库中,冠词的使用量更少。分析原因,得出如下结论:一是受母语迁移的影响,中国学生大量使用冠词;而以日语中没有冠词体系,所以他们英语初学者的冠词使用很少。二是受语言使用的灵活度影响,母语习得者可以用很多其它的词汇来代替冠词,所以使用的频率不是很多。这些研究体会,都为我们辽宁省英语的教学和研究提供了可靠的理论和实践依据[6]。

三、存在的问题和发展趋势

辽宁省高校学生口语、书面语语料库(LCC)作为辽宁省二语习得研究和学习的一个重要的资源,是语料库语言学这一新兴领域在我省的一项探索,尚有一些不完善的地方。

首先,语料采集的样本和文体的类型相对单一。LCC语料库主要是研究辽宁省高校学生的口语和书面语的语料库,所采集的样本都是辽宁省高校学生四级和八级的口语、书面语的作文。所选择的题目也都是四级、八级考试和练习的作文题目,其中以议论文和说明文为主。今后我们在创建语料库的时候,会在采集样本和文体类型上有一个突破,增加几个分库作为对比研究的重要资源。

其次,口语和书面语语料规模和研究不均衡。LCC语料库是一个兼有口语和书面语的语料库。但是,口语语料库的规模要明显小于书面语语料库。原因是口语语料库的创建非常复杂,需要消耗大量的人力、财力和时间。课题组的研究人员需要赴各个高校现场采样、录音,回来后还需要把录音资料转录成书面语的形式,再附码形成语料库。受课题组成员能力的限制,二者非常不均衡。另外,受能力和技术的限制,口语和书面语的研究也具有不均衡性。我们对于口语语音的变异和英语发音受方言迁移影响等研究也没有深入开展。这是我们课题组以后研究的重点。

最后,语料库的纵横向研究不对等。LCC语料库研究课题组的成立,从通过国家教育部的审查到现在不到三年时间。我们所选取的语料均是来自于现有高校学生的口语和书面语作文。对于同一学习者在不同阶段的语言能力研究还没有深入开展。对于同一语言现象在不同时期的应用也没有开展。如果时间和精力允许,课题组会在这方面有所突破。

总之,LCC语料库还是语料库语言学研究领域的一个新军,无论是语料库的设计、样本、创建和研究都有很多需要完善的地方。解决之,一是期盼各位专家和学者给予帮助和指导;二是课题组的全体成员在发展和完善语料库的时候,也会观察和关注不同的语言现象和语言规律。

[1]Granger S.Applied Corpus Linguistics:A Multidimensional Perspective[C].Amsterdam&Atlanta,2004.

[2]桂诗春.以语料库为基础的中国学习者英语失误分析的认知模型[J].现代外语,2004(2).

[3]Dagneaux E,Denness S,Granger S.Computer:aided error analysis[J].System,1998(2).

[4]邓耀臣.中国大学生英语议论文中连接副词使用特征研究[J].中国英语教学,2006(6).

[5]Ringbom H.Vocabulary frequencies in advanced learner English:A cross-linguistic approach[M].London:Longman,1998.

[6]何安平.学生英语拼写错误分析[J].外语教学与研究,2001(3).

猜你喜欢
书面语高频词二语
30份政府工作报告中的高频词
省级两会上的高频词
28份政府工作报告中的高频词
省级两会上的高频词
“口语和书面语转换”备考指导
关于初中学生书面语感的思考与提升策略
汉语书面语与口语的特征
“透视”第二语言习得心理过程*——关于二语加工的一次学术访谈
当代二语习得研究中介语对比分析方法理论与实践
《教学二语习得简介》述评