基于语料库的不同水平书面语的言语失误分析

2013-09-21 11:04
关键词:词形书面语语料库

杨 扬

(大连海事大学 外国语学院,辽宁 大连 116026)

一、引 言

对学习者的言语失误进行标注是中国学习者英语语料库(Chinese Learner English Corpus,简称CLEC)[1]最主要的特点,其标注的言语失误有词形(fm)、动词短语(vp)、名词短语(np)、代词(pr)、形容词短语(aj)、副词(ad)、介词短语(pp)、连词(cj)、词汇(wd)、搭配(cc)和句法(sn)11种一级言语失误,以及如拼写失误(fm1)、构词失误(fm2)、时态(vp6)、语态(vp7)等61种二级言语失误。本研究基于CLEC中的大学英语四级语料库(ST3),对不同水平书面语的言语失误情况进行比较分析。

失误是失检和错误的合称。Corder(1967)[2]根据Chomsky的能力和运用的两分法,认为错误和能力有关,而失检和运用有关,即错误是因学习者的能力不足而无法自行检查出来并作更正的,而失检则是学习者的失误造成的,经学习者自行检查是可以作出更正的。但也有不少语言学家对Chomsky的能力和运用的两分法持有不同意见,他们认为能力和运用二者密切相关,只注重一个因素而忽略另外一个因素是不太科学的。学习者语料库中所定义的失误是失检和错误的统称,因为语料库无法识别学生书面语的言语失误是由于不小心而导致的,还是由于缺乏必要的知识而导致的。因此,本研究里的言语失误采用了学习者语料库中对失误的定义,即主张用“失误”来笼统地表示失检和错误。

二、研究设计

1.研究的问题

本研究旨在分析不同水平书面语中的言语失误行为,试回答如下问题:(1)不同水平书面语在CLEC语料库所标注的各项言语失误中是否存在显著性差异?(2)不同水平书面语在哪些言语失误方面存在显著性差异?(3)较低水平书面语较中等及较高水平书面语在哪些言语失误方面的失误率更高?本研究基于CLEC,采用定量分析和定性解释相结合的方法,研究和回答以上几个问题。

2.语料来源

为了检测不同水平书面语的言语失误行为,本研究从CLEC语料库的大学非英语专业1~4年级四级考试作文(ST3)中随机抽取6分作文(本研究中被定义为较低水平书面语,即C级水平书面语,以下简称C级)、9分作文(中等水平书面语,即B级水平书面语,以下简称B级)、12分作文(较高水平书面语,即A级水平书面语,以下简称A级)各50篇,共计23 826词,其具体分布如表1所示。

表1 语料来源

3.语料分析

本研究的语料分析采用的是AntConc 3.2.4软件和SPSS(19.0)中的卡方检验(Chi-square)。首先,运用AntConc软件分别对ST3中随机抽取的150篇A、B、C级作文进行检索,统计3类不同水平书面语在11类一级言语失误方面的出现情况,并统计频数。为了检验语料库之间言语失误频数差异的显著性,本研究采用了SPSS(19.0)中的卡方检验,显著水平设为5%(P <0.05)。

三、结果与讨论

(一)不同水平书面语的言语失误情况

通过对ST3语料库中随机抽取的150篇A、B、C级书面语分别进行检索,统计出11类一级言语失误在不同水平书面语中的出现频数及其在各自语料库中的失误比例,如表2所示。

表2 ST3中不同水平书面语的言语失误频数及比例

从表2中可以看出,无论是C级、B级还是A级书面语,不同水平书面语均在词形(fm)、动词短语(vp)、词汇(wd)和句法(sn)4个言语失误方面的发生频率较高,频率多数大于1%;而在形容词短语(aj)和连词(cj)上的失误率较低,频率均小于0.1%。从失误的整体来看,C级水平书面语的失误比例为12.96%,高于B级水平书面语的10.14%和A级水平书面语的6.14%。

由于四级考试要求的作文长度要不少于120词,而本研究选取的作文长度均在150词左右,因此为了更直观地对比不同水平书面语在各类言语失误上的频数,以每150词为单位分别计算3个语料中的11大类一级言语失误的标准频数并进行比较,其结果如图1所示。

图1 不同水平书面语的言语失误频数比较

图1 清楚地比较了不同水平书面语在各类言语失误上的标准频数,其中,C级水平书面语在词形(fm)、动词短语(vp)、名词短语(np)、代词(pr)、介词短语(pp)、词汇(wd)、搭配(cc)、句法(sn)以及整体失误(total)上均高于B级和A级水平书面语,表明C级水平书面语较B级和A级水平书面语具有更高的言语失误率。

(二)不同水平书面语的言语失误差异性分析

1.不同水平书面语的一级言语失误差异性分析

不同水平书面语的一级言语失误频率及差异见表3。

表3 不同水平书面语的一级言语失误频数及差异

由表3可见,C级水平书面语在绝大多数一级言语失误上的标准频数均高于B级、A级水平书面语,这再次表明C级水平书面语具有更高的言语失误率。但是,从卡方检验的结果来看,不同水平书面语只在词形(fm)、动词短语(vp)、代词(pr)、词汇(wd)、搭配(cc)、句法(sn)的6个一级言语失误以及整体失误(total)方面呈现显著性差距,而在其他如名词短语(np)、形容词短语(aj)、副词短语(ad)、介词短语(pp)和连词(cj)5个一级言语失误方面均不呈现显著性差距。这说明不同水平书面语并不是在所有言语失误方面都存在显著性差异,较低水平书面语较中、高水平书面语只在某些言语失误方面的失误率更高。

2.不同水平书面语的二级言语失误差异性分析

由于CLEC语料库对11类一级言语失误中的每一类失误都做了具体细分,例如词形失误(fm)又被分为拼写失误(fm1)、构词失误(fm2)和大小写失误(fm3)三类,而动词短语又被分为固定用法(vp1)、固定短语(vp2)、一致关系(vp3)等九类,因此,为了比较不同水平书面语在二级言语失误上的差异,以得出C级水平书面语究竟在哪些言语失误方面的失误率更高,笔者对言语失误发生频率大于1%的四个一级言语失误即词形(fm)、动词短语(vp)、词汇(wd)和句法(sn)的二级言语失误(共计28个)进行了统计和分析,结果如表4所示。

表4 不同水平书面语的二级言语失误差异分析

表4清楚地显示,在28个二级言语失误中,C级水平书面语较B级、A级水平书面语只在12处言语失误中呈现出显著性差异,分别为拼写(fm1)、大小写(fm3)、一致关系(vp3)、非限定性动词(vp5)、情态动词/助动词(vp9)、词性(wd2)、换词(wd3)、缺词(wd4)、冗余(wd5)、句子不间断(sn1)、结构缺陷(sn8)和标点符号(sn9);而在其他16个二级言语失误上并没有呈现显著性差异。这样的结果再一次证明,C级水平书面语只是在某些言语失误方面,而并非在所有言语失误方面都表现出较高的言语失误率。

因此,为了进一步分析C级水平书面语与B级、A级水平书面语在言语失误上的差异情况,对从语料库中选取的150篇A、B、C级水平书面语再一次进行了定性和定量分析,其结果如下:

(1)C级水平书面语较B级、A级水平书面语在词形(fm)这一言语失误中呈现显著性差异,C级水平书面语较 B级、A级水平书面语仅在拼写(fm1)和大小写(fm3)这两项言语失误上表现出更高的失误率,而在构词失误方面则没有明显的区别。

从词形失误(fm)的定性分析中可以看出,C级水平书面语较B级、A级水平书面语表现出更多的拼写失误。例如,society这一词的拼写错误在C级水平书面语的179处拼写错误中出现了35次,占总拼写错误的19.55%,其误拼形式分别有socity(13次)、sociaty(21次)和scosity(1次),而在B级、A级水平书面语中则没有发现以上3种误拼形式。

(2)从动词短语(vp)这个言语失误来看,C级水平书面语较B级、A级水平书面语在vp3(一致关系)、vp5(非限定性动词)以及vp9(情态动词/助动词)3个方面的言语失误率更高(其结果呈现显著性差异),而在其他6个方面的差异并非明显。例如:

a....if we have mastered the technologe[fm1,-]that the socity[fm1,-]require[vp3,1-](一致关系错误,require应改为requires)

b.For example,you will like tospeaking[vp5,2-]and write in English if you always read and listen[vp1,-1]English.(非限定性动词使用失误,speaking应该为动词原形speak)

c.I’ll reading[vp9,1-]newspapers everyday...(助动词使用错误,应去掉 will并将 reading改为read)

d.So we university studentsmust to[vp9,1 -3]be[vp7,3 -2]understand it.(情态动词使用错误,must to应改为must)

(3)从句法(sn)的定性分析来看,C级水平书面语较 B级、A级水平书面语只在句子不间断(sn1)、结构残缺(sn8)和标点符号(sn9)上呈现显著差异,而在其他6个方面则没有显著差别。例如:

a.If you can do so,you will learn English very well,even master it.[sn1,s-](句子不间断,两句之间应用连词and连接)

b.We should know what is the most people like to do,[sn8,s-]...(句子结构残缺,名词性从句用法错误,应该为what the most people like to do)

c.But,[sn9,-s-]now people in the world[wd4,-s-]much care of their healths[np5,-],and they believe science,that is also a reason.(标点失误,逗号应位于but now之后)

四、结论与启示

本研究从对不同水平书面语的言语失误的观察和分析中得出以下结论:(1)不同水平的书面语并非在所有言语失误方面都呈现出显著性差异;(2)C级水平书面语较B级、A级水平书面语在词形、动词短语、代词、词汇、搭配、句法6个一级言语失误上呈现显著性差距,而在名词短语、形容词短语、副词短语、介词短语和连词5个一级言语失误上均不呈现显著性差距;(3)C级水平书面语较B级、A级水平书面语在例如单词拼写、一致关系、情态动词/助动词、句法结构残缺等12个二级言语失误上显著高于B级、A级水平书面语,而在其他16个二级失误上无显著性差异。

以上结论对大学英语的写作教学具有一定的启示意义。第一,较中、高水平书面语而言,低水平书面语在某些言语失误上的失误率更高,这一点也直观地说明了某些作文得分偏低的原因。因此,在实际的英语写作教学中,如果能够向学生指出这些低水平书面语的高失误类型,进而帮助学生纠正这些失误,并且引导学生在自己的写作中有意避免这些失误,就可以在一定程度上提高学生的书面语质量和写作分数。第二,无论是低、中、高水平书面语,学生在词形、动词短语、词汇、搭配和句法上的言语失误均大于其他方面。因此,教师在实际的写作教学中应该有目的地强化该方面的训练,以帮助学生尽量降低其在这些方面的言语失误率,进而达到提高学生的写作质量的目的。

当然,本研究受到条件的限制,也存在以下几点不足。第一,本研究只从ST3中选取了C级、B级以及A级水平书面语各50篇,共计150篇作文,其数量较小。要想更准确地了解不同水平书面语在言语失误上的差异,可以选取更多的文本以提高结果的可信度。第二,CLEC语料库对学习者言语失误的标记仅限于词汇和句法两个基本层面,然而,影响作文分数的因素还有语篇和结构等,而本文并没有对该方面进行观察和分析。第三,受篇幅的限制,本文未能对所有的61种二级言语失误进行分析,而只是选取了其中的几个方面,而在其他的几个言语失误方面,本文没有做更深入的分析。这些问题都有待将来的进一步探究和探讨。

[1]桂诗春,杨慧中.中国学习者语料库[M].上海:上海外国语教育出版社,2003.

[2]CORDER SP.The significance of the learner’s errors[J].International Review of Applied Linguistics,1967,4(5):161-169.

[3]MYHILL D.Towards a linguistic model of sentence development in writing[J].Language and Education,2008,22(5):271-288.

[4]MO Haiwen.A study of the teaching of ESL writing in colleges in China[J].International Journal of English Linguistics,2012,2(1):118 -127.

[5]MIRLOHI M.The effect of instruction on writing performance of intermediate EFL Persian students[J].International Journal of Linguistics,2012,4(4):325 -343.

[6]SCOTT M S,TUCKER G R.Error analysis and Englishlanguage strategies of Arab students[J].Language Learning,1974,24(1):69-97.

[7]DOOLAN S M,MILLER D.Generation 1.5 written error patterns:a comparative study[J].Journal of Second Language Writing,2012,21(1):1-22.

[8]LU Xiaofei.Automatic analysis of syntactic complexity in second language writing[J].International Journal of English Linguistics,2010,15(4):474 -496.

[9]桂诗春.以语料库为基础的中国学习者英语失误分析的认知模型[J].现代外语,2004(2):129-139.

[10]郭晓华,欧阳菁.基于错误分析理论的大学英语写作教学新探[J].外国语文,2010(2):137-140.

[11]赵新城.中国学习者英语作文中的词类失误现象分析——一项基于中国学习者英语语料库的实证调查[J].北京第二外国语学院学报,2008(8):72-76.

[12]胡姝夏.基于语料库的大学生英语作文错误分析[J].洛阳师范学院学报,2008(3):152-155.

猜你喜欢
词形书面语语料库
词形变换解题指导
韩国学校语法中副词形语尾的变迁
《语料库翻译文体学》评介
“口语和书面语转换”备考指导
关于初中学生书面语感的思考与提升策略
带前置功能的词形《 в сопоставлениис 》的结构与搭配
汉语书面语与口语的特征
基于COCA语料库的近义词辨析 ——以choose和select为例
基于JAVAEE的维吾尔中介语语料库开发与实现
从语法范畴视角解释日本学生英语书面语错误