错误分析视角下对大学英语写作的SPSS实证分析

2014-02-09 12:16
文教资料 2014年7期
关键词:语料均值显著性

瞿 菁

(杭州电子科技大学,浙江 杭州 310018)

错误分析视角下对大学英语写作的SPSS实证分析

瞿 菁

(杭州电子科技大学,浙江 杭州 310018)

错误分析是对学生在学习和使用第二语言过程中的错误进行研究与分析,探索学习者所运用的策略、产生错误的原因、如何克服等。错误分析方法成为二语习得中的一个组成部分,帮助教师意识到学生的特点、错误偏好、认知空缺,提高教学导向性。通过对学生的英语写作中的错误进行归类、统计,用SPSS工具分析其与写作水平之间的相关和回归关系,可以帮助师生调整学习内容,了解语言学习的步骤,明确学习者努力的方向。

错误分析 英语写作 SPSS分析

1.国内外同类研究工作现状

错误分析(Error Analysis)于20世纪60年代发展起来,指学习第二语言过程中对错误进行探索、归类,通过错误的形式探讨其背后的认知、母语迁移、理论意识等方面的原因,进而采取相应的教学策略。

错误分析的提出者是科德Corder(1967),他认为错误分析是一种有效的指导教学的方法,把错误分为前系统错误、系统错误、系统形成后的错误。另外,科德还提出了错误评价,就是这些错误是否妨碍理解和交际,是否应该纠正,以及对写作者和读者产生的影响。Richards(1974)把错误分为语际错误、语内错误和发展性错误。Dulay和Krashen(1982)从评价的角度,将错误分为全局性错误(影响交际)和局部性错误(不影响交际)。

错误分析在中国的发展主要在这十年。蔡龙权和戴炜栋(2001)对错误分类进行了补充和整合,得出了三大类错误:认知错误、语言性错误、行为性错误。

目前的研究主要是文献研究和实证研究,文献研究多半是围绕错误分类、错误的评价、理论的回顾;实证研究占较大比重,即以语料为基础的定量定性相结合的研究。有些语料是基于几个教学班的小规模的语料收集然后进行分析的。同时,语料语言学的发展,特别是CLEC(chinese learner English Corpus)的建成[1],使得大规模对语料进行错误分析变成可能。研究涉及音素、词汇、句法、语法、语用及文化等方面,从口语、听力、写作到翻译等层面。

2.错误的分类

进行错误分析,首先是把写作中的错误按照一定的类别归类。错误分析的难点,也是导致分析结果相异的原因,不同学者对错误分类的方法不尽相同。有些是从学习的不同阶段,有些是从错误评价的角度,有些是从对交际的影响,等等,这里把错误分为语际错误和语内错误。

提到语际错误,就要提到迁移。Oldin提出二外习得中迁移现象很普遍。根据Odlin(1989)的理解,迁移是指学习者将母语的知识运用到第二语言的学习中。迁移有正迁移、负迁移。正迁移发生在母语和目标语在形式与结构上有相似之处时,母语成为外语学习的帮助。负迁移就是当学习者习惯把母语中的结构和形式错误地运用到第二语言中,比如中国学生学习英语,就习惯把汉语的结构、语法规则运用到英语中,这种负迁移导致的错误,就是语际错误。

学习过程中除了有语间错误外,还有语内错误,当学习者已经学习了目标语的一些规则、结构、形式后,对其用法的掌握还有限,有时候会有错误的推断,这种对目标语错误判断形成的错误称为语际错误。

3.错误分析的过程

根据Corder(1981),错误分析就是对语言学习者的语言样本进行收集、确认、描述,根据它们产生的原因进行归类,这是一种双语对比,就是学习者所掌握的第二语言的实际语言水平和目标语之间的对比。本文就对英语作文中的错误进行分析,按照语内错误和语际错误的大分类,找出错误,进行归类,然后用SPSS软件分析,以得出学生写作中主要的错误点分布,以及写作成绩与四级成绩的相关性有多大,辅助写作教学的导向。为了更加精确地分析,这里把语际错误归为一类,语内错误分为过度类推(overgeneralization)、简化(simplification)、交际策略等[6]。过度类推指学习者把语法规则的运用推广到不应有的范围。简化在于简化冗余成分,对表达意义用处不大,但有语体语用功能。交际策略发生在学习者语法知识或词汇上存在局限时,就是为了达到交际目的,学习者有意识地使用一些语言或非语言手段进行交际。当然,如果语料规模较大,则应该有多种分类,本文仅以以上几类作为示例。

4.实证分析过程

将一个班级学生的作文当做语料,进行错误分析。对每个学生的错误进行收集、描述,按照以上错误分类分为四类。围绕性别、错误点、写作水平、四级成绩几个要素展开分析,探讨几个要素之间的相关性,分析工具是SPSS软件(杨晓明,2012)。

(1)对比写作成绩和四级成绩,看二者有无显著性差异。检验结果如下:

成对样本统计量均值 N 标准差 均值的标准误写作成绩对1 6 5 . 4 5 9 5 3 7 1 2 . 0 0 3 6 9 1 . 9 7 3 3 9四级成绩4 5 1 . 0 8 1 1 3 7 4 3 . 0 3 7 7 0 7 . 0 7 5 3 5

成对样本检验成对差分差分的9 5 %均值 标准差 均值的标准误置信区间t d f S i g .(双侧)下限 上限对1写作成绩—四级成绩-3 8 5 . 6 2 1 6 2 3 5 . 5 5 1 4 9 5 . 8 4 4 6 3 -3 9 7 . 4 7 5 0 8 -3 7 3 . 7 6 8 1 6 -6 5 . 9 7 9 3 6 . 0 0 0

S i g .对1 写作成绩—四级成绩成对样本相关系数N 相关系数3 7 . 7 0 9 . 0 0 0

写作成绩的标准差12.0,相对于四级成绩43.0来说较小,均值的标准误写作1.9,相对于四级的7.0更小,说明写作成绩的误差比四级的要小。写作成绩和四级成绩的相关系数为0.7,伴随概率sig.为0.000,小于0.05,说明二者相关性比较显著。双侧概率是用来判断差异是否显著的关键指标,上面Sig值为0.000(<0.05),说明写作和四级成绩有显著性差异。(大于或者等于0.05则没有显著差异,小于0.05则有显著差异)。四级成绩是广为接受的测试,该写作和四级成绩有较高的相关,表示此次写作还是基本反映了学生的真实水平。

(2)把每个学生写作的错误点统计出来,然后把学生分为两组,通过四级的一组和未通过的一组,分别代表较好和较差的英语水平,看两组错误点的多少是否的确有显著性差异,这个属于独立样本的T检验。结果如下:

组统计量四级成绩 N 均值 标准差 均值的标准误>= 4 2 5 . 0 0 3 2 1 4 . 0 9 8 . 4 9 4 1 . 5 0 2错误数<4 2 5 . 0 0 5 2 1 . 8 0 6 . 6 4 8 2 . 9 7 3

独立样本检验方差方程的L e v e n e检验 均值方程的t检验F S i g . t d f S i g .(双侧)均值差值标准误差值差分的9 5 %置信区间下限 上限错误数假设方差相等 . 3 7 7 . 5 4 3 -1 . 9 3 0 3 5 . 0 6 2 -7 . 7 0 6 3 . 9 9 3 -1 5 . 8 1 3 . 4 0 1假设方差不相等-2 . 3 1 4 6 . 2 4 8 . 0 5 8 -7 . 7 0 6 3 . 3 3 1 -1 5 . 7 7 9 . 3 6 6

从均值上看,通过四级的(大于425)学生的错误点均值为14,未通过的学生为21,说明未通过组的错误明显更多。Sig检验显著性的概率,为0.543,大于0.05,说明方差差异不显著。应该在方差相等的栏目看Sig.(双侧)T检验的概率为0.062,大于0.05,说明通过四级和未通过四级组犯的错误点没有显著性差异。这说明不管通过还是未通过的同学,在犯以上几类错误的概率是均等的。

(3)验证了该次写作测试,比较能反映学生的英语水平,同时发现英语水平不论高低,错误点都是不可避免的。那么,进一步分析错误点和学生的写作究竟相关程度如何?

相关性写作成绩 错误数P e a r s o n相关性 1 -. 5 4 9 * *写作成绩显著性(双侧). 0 0 0 N 3 7 3 7 1 P e a r s o n相关性 -. 5 4 9**错误数显著性(双侧). 0 0 0相关性3 7 3 7**.在. 0 1水平(双侧)上显著相关。N写作成绩 错误数P e a r s o n相关性 1 -. 5 4 9 * *

写作成绩和错误的相关系数为-0.549,说明错误数和写作成绩有一定的负相关性。

(4)以上分析的错误点一定程度上反映了写作水平,进一步设定一个变量,即学生学习时间(每周投入的学习)。假设在学习时间都一定的情况下,探讨错误数和写作水平的相关度如何,这属于偏相关分析。

?

上半部分是没有控制变量的时候,三者的两两相关系数。写作成绩与错误数呈负相关(-0.549),这与前面第三点的分析很吻合。下半部分控制了学习时间,二者的偏相关系数为-0.197,自由度为34,Sig.为0.25,大于0.05,说明二者之间无显著性线性相关的可能性大于0.05,二者的相关性不强。上面第三点在认可学习时间数不同时,错误数和成绩相关系数为-0.549,但是这里学习时间因素剔除了,则二者相关度迅速降低到-0.197,说明学习投入的时间,即刻苦程度也是决定写作成绩的一个重要因素。

(5)印证了学习投入时间的重要性后,为了探讨学生可以侧重哪些方面提高学习的导向性,可以把错误根据原因归类为4类,分别为:语间错误,语内错误中的过度类推、简化、交际策略。这四类错误作为自变量,因变量就是写作成绩,建立不同错误类别和写作成绩的线性回归模型。结果如下:

模型汇总b模型 R R方 调整R 方 标准估计的误差1 . 8 6 8a. 7 5 3 . 7 2 2 6 . 3 2 6 3 7 a .预测变量:(常量),错误4,错误3,错误2,错误1。b .因变量\:写作成绩

A n o v a a模型 平方和 d f 均方F S i g .回归 3 9 0 6 . 4 5 5 4 9 7 6 . 6 1 4 2 4 . 4 0 1 . 0 0 0 b 1残差5 1 8 7 . 1 8 9 3 6 a .因变量\:1 2 8 0 . 7 3 4 3 2 4 0 . 0 2 3总计写作成绩b .预测变量:(常量),错误4,错误3,错误2,错误1。

系数a模型非标准化系数 标准系数B t S i g .标准误差 试用版(常量)8 4 . 2 6 7 2 . 1 9 6 3 8 . 3 8 1 . 0 0 0错误1 1 -. 8 9 4 . 2 9 7 -. 3 1 9 -3 . 0 1 0 . 0 0 5错误2 -1 . 5 2 4 . 3 6 4 -. 3 9 6 -4 . 1 8 7 . 0 0 0错误4 -1 . 5 7 0 . 4 3 8 -. 3 4 4 -3 . 5 8 1 . 0 0 1 a .因变量\:3 -1 . 0 5 5 . 4 5 1 -. 2 2 7 -2 . 3 3 9 . 0 2 6错误写作成绩

从调整R方看拟合优度检验。R方为0.772,说明拟合度较好,即因变量中有77%左右的信息可以由自变量解释。然后,Anova看方程显著性检验结果。从中Sig.为0,小于0.05,说明写作成绩和错误数之间有线性关系。再看系数表中。回归系数常数项Sig.值为0.0,说明常数项应该加入公式。四类错误的Sig.值分别为-0.894,-1.524,-1.055,-1.570,且显著性概率Sig.均小于等于0.05,说明它们和成绩有显著性回归的关系。得出的回归方程为:y=84.267-0.894×错误1-1.524×错误2-1.055×错误3-1.570×错误4。从中看出,还是错误2,错误4对写作成绩的影响较大,即过度类推和交际策略。

5.结论分析

综合以上分析结果,可以看出几点:此次写作的测试的结果与学生的四级表现基本吻合,说明测试成绩基本反映了学生的水平;不管是通过还是未通过四级的同学,犯以上几类错误的概率是均等的,说明提到的几类错误是学生中很普遍的,值得同学们注意的是:统计出来的错误数和写作成绩有一定的相关性;进一步得出学生学习投入的时间是影响相关性的一个重要因素;通过几类错误和写作成绩的线性回归方程,找出每类错误对写作成绩影响都是很显著的,过度类推和交际策略是其中较为凸显的两类错误。反过来,可以从残差部分可以看出还有多少错误的原因没有归类进来,比如认知的、交际的、情感上的。这样的分析还是十分有益于教学的。

6.未来可以改进的空间

以上是小样本下用SPSS软件进行错误分析的一个初步尝试,为进行更深入的研究做铺垫。具体来说,就是帮助研究者反思写作测试该如何设计才更加科学;分析的语料怎么才能更大更有代表性;哪些自变量是有意义而这次没加进去的,哪些自变量这次看来是意义不大的;SPSS还有些有用的分析方法,比如聚类分析、因子分析该如何利用起来为分析服务。

既然这里证实了SPSS工具进行错误分析的可行性,更深入的研究有以下方面:一是在于大型语料库作为分析的对象。比如基于CLEC(Chinese Learner English Corpus)的语料库,无疑分析的结论比目前的小规模语料的分析科学很多。二是将来可以加入更多因子作为自变量展开分析。自变量设定得越全面,结论将更立体。三是现在对样本大部分是共时分析,可以深化为将来对大规模的样本进行历时分析,看看在不同学习阶段,错误原因有何不同,帮助教师了解学习的过程和规律,这个应该是最有意义的角度。

[1]Corder,S.P.The significance of learner’s errors.In International Review of Applied Linguistics,1967,5(4),1961-70.(1981).Error Analysis and Interlanguage.Oxford:Oxford U-niversity Press.

[2]Corder,S.P.Error Analysis and Interlanguage.Oxford:Oxford University Press,1981.

[3]Richards,J.A non-contrastive approach to error analysis.[J].English Language Teaching Journal,1975.

[4]Brown,H.D.PrinciplesofLanguage Learningand Teaching.Englewood Cliffs,New Jersey:Prentice-Hall Regents,1987.

[5]蔡龙权,戴炜栋.错误分类的整合[J].外语界,2001.4.

[6]Odlin,T.Language Transfer.Cambridge:Cambridge U-niversity Press,1989.

[7]高文成.语言学精要与学习指南[M].北京:清华大学出版社,2007.

[8]杨晓明.SPSS在教育统计中的应用[M].北京:高等教育出版社,2012.

猜你喜欢
语料均值显著性
基于显著性权重融合的图像拼接算法
基于视觉显著性的视频差错掩盖算法
一种基于显著性边缘的运动模糊图像复原方法
基于语料调查的“连……都(也)……”出现的语义背景分析
论商标固有显著性的认定
均值不等式失效时的解决方法
均值与方差在生活中的应用
华语电影作为真实语料在翻译教学中的应用
关于均值有界变差函数的重要不等式
对偶均值积分的Marcus-Lopes不等式