基于语料库的中学英语学习者写作句法复杂性变化研究

2016-04-11 02:50李梦骁刘永兵

李梦骁,刘永兵

(东北师范大学 外国语学院,吉林 长春 130024)



基于语料库的中学英语学习者写作句法复杂性变化研究

李梦骁,刘永兵

(东北师范大学 外国语学院,吉林 长春 130024)

[摘要]本研究基于英语学习者写作语料库(WCEL),探讨中学英语学习者书面语句法复杂性及其变化趋势。调查的指标包括单位长度(W/T、W/C)、单位密度(C/T、DC/C)、独立子句、从句、非限定动词和被动句。研究发现,中学英语学习者的各项长度指标和密度指标大多随着年级和写作水平的上升而呈现出线性增长的趋势,简单句的使用频率高于从句。各类从句中,学习者对状语、宾语和定语从句掌握得相对更好,使用频率也更高。各类从句、非限定动词中的动名词、过去分词、现在分词以及限定性被动形式的使用频率与年级和写作水平的变化方向相同。根据研究结论,为中学英语教材研发和课堂教学提出几点启示。

[关键词]句法复杂性;单位长度;单位密度

一、研究背景

对二语习得者中介语水平的研究一直是二语习得领域的核心课题之一,复杂性、准确性以及流利性是衡量中介语水平的三个最重要的方面[1]461-473,也是学习者中介语发展过程中的里程碑[2]576-598。因此,中介语语言复杂性的研究引起了国内外学者的广泛关注。语言复杂性主要被划分为词汇复杂性和句法复杂性两个层面,其中,前期针对于书面语句法复杂性的研究可以主要归纳为以下几个角度:

第一,研究各项句法复杂性指标能否有效地区分二语习得者不同的写作水平[3]474-496,[4]579-589,[5]492-518,讨论句法复杂性与写作质量之间的关系。第二,测量不同年级、年龄的二语习得者写作句法复杂性的特点,通过对比分析复杂性的变化,来追踪句法复杂性随着时间变化的轨迹或趋势[5]492-518,[6]36-62。第三,研究其他因素(如不同的教育背景、任务类型、体裁等)对句法复杂性和中介语水平之间的关系有怎样的影响[5]492-518,[7]185-200。第四,研究句法复杂性对教学的作用,句法复杂性研究的结果对二语教学有积极的反馈作用,从而反哺二语教学[8]555-578。

国内对句法复杂性的研究通常采用上述角度中的前两种。赵俊海、陈慧媛[9]27-33检验了从属小句、T单位、衔接成分以及非限定动词四个指标对于二语书面语句法复杂度测量的效度。鲍贵[10]291-297、徐晓燕[11]264-275等其他学者的研究则都集中于探讨不同英语水平的中国大学生在英语写作中句法复杂性具有哪些特点、差异并与本族语者的书面语句法复杂性开展对比分析。

文秋芳、秦晓晴[12]568-580开辟了对中国大学生二语句法复杂性研究的先河,但他们对句法复杂性的研究仅停留到从句层面,为后续研究留下进一步深化的空间。鲍贵[10]291-297从单位长度、密度两个角度对中国英语专业学生的句法复杂性进行研究,仅仅使用长度和密度指标对句法复杂性进行量化,完全忽略了对各类句型的使用情况进行考察。先前国内句法复杂性的相关研究都仅仅关注于对大学生英语写作的探讨,忽略了对中学英语学习者书面语句法复杂性的探索。综上所述,本研究基于英语学习者写作语料库(Writing Corpus of English Learners),对中学英语学习者书面语的句法复杂性进行探索,具体回答以下问题:

(1)随着年级的升高,中学英语学习者笔语句法复杂性呈现出怎样的变化趋势?

(2)中学生笔语句法复杂性在不同水平的作文中表现出怎样的变化?

二、测量指标

句法复杂性指语言产出形式的范围及其复杂程度[5]492-518,具体地表现在遣词造句的过程中对各类基本的或复杂的句式的准确、灵活、恰当地选择和使用。

研究写作中的句法复杂性,通常需要对单位长度、单位密度以及各类句式的使用频率这三方面指标进行考察。其中,单位长度测量输出单位的平均字数,最常用的测量指标是T单位长度(W/T)和子句长度(W/C),分别用每篇作文的总字数除以这篇作文所包含的T单位总数以及子句(C单位)总数。子句指各种主谓结构,T单位是独立的子句或一个主句以及嵌入在该主句中的所有从句或非从句。对单位密度的测量,最有效的指标为T单位复杂性比率(C/T)和从属句比率(DC/C)。C/T的比值越低,每个T单位平均包含的子句的数量就越少,句子的复杂性就越低。DC/C比值越高,该篇作文所包含的从句越多,各种基本句式使用的就越少,句子相应就越复杂。

本研究选取的长度指标是W/T和W/C,密度指标是C/T和DC/C。考察的句型包括:(1)独立子句,包括简单句、并列句、复合句以及并列复合句;(2)从句,包括状语、定语、宾语、表语、主语和同位语从句;(3)非限定动词,包括动名词、现在分词、动词不定式以及过去分词;(4)被动句,分为限定动词和非限定动词的被动形式。

三、研究设计

(一)语料的选取

英语学习者写作语料库(Writing Corpus of English Learners,简称WCEL语料库)是国内第一个中学英语学习者语料库[13]568-580。WCEL语料库容量:形符166 301,类符5 907,共包含1 494篇限时作文,本研究采用随机抽样的方法,从7年级(初一年级)和10年级(高一年级)分别抽出60篇作文,共120篇,每篇平均100—200词。

(二)评分与分组

两位具有五年以上教学经验的高中英语教师同时对本研究选取的语料进行评分,相关系数为0.876(P<0.01)。每篇文章的最终得分为两个评分的平均值。当评分的差值大于3分时,第三位教师对这篇作文重新进行评分,最终分数取最接近的两个分数的平均值。

接下来再将评分按照从高到低排序,取分数分布在前30%—35%的样本组成写作高分组,高分组由37篇作文组成,得分为25—22分;再取分数排序在后30%—35%的样本组成写作低分组,低分组包含40篇作文,得分为13—6分。

(三)标注与分析

首先,对每篇作文进行标注之前,先统计出每篇作文的字数,为计算单位长度做准备。然后,标注出每篇作文包含的T单位、C单位以及各类句型。最后,将各类标注的数量输入到SPSS 17.0中,统计各项指标的数值并进一步进行独立样本T检验以及单因素方差分析,讨论各项指标的差异程度。

四、结果与讨论

本研究按照单位长度、单位密度、各类句式的顺序报告和讨论不同年级以及不同水平的中学英语学习者书面语句法复杂性的情况和变化的趋势。

(一)单位长度的变化

从表1可以观察到,初一和高一年级的W/T值为8.645和12.605,高分组与低分组的差值为1.648,这些数据说明W/T随年级和写作水平的上升呈现出从低到高的发展趋势。W/C随年级与随写作水平变化的方向不同,W/C随年级的上升而增长。低分组的W/C值为7.522,中分组的W/C值为8.568,W/C在低分组与中分组之间增长,而高分组的W/C值为7.998,W/C在中分组与高分组之间下降,W/C随写作水平的上升表现出迂回式发展。

单因素方差分析表明组间具有显著性差异(P<0.05)。采用LSD检验方法进行独立性检验(下同)表明,初一年级与高一年级的W/T和W/C值的差异都已达到显著性要求,分别为3.960和1.332(P<0.05),支持了W/T和W/C区分不相邻年级组的结论[11]264-275。

通过分析表2与表3,采用组间多重比较法(根据方差齐性与否,采用了LSD法检验,下同)发现,W/T值在高分组与低分组、中分组与低分组之间均存在显著性差异(P<0.05),与鲍贵[10]291-297的研究一致。W/C在中分组与低分组之间有区分力,中分组的W/C值显著地高于低分组(P<0.05)。

在其他研究中,W/T和W/C的值与写作水平的变化方向一致,随着作文水平的升高,W/T和W/C的值都增加[10]291-297,[11]264-275,[12]3-55。而在本研究中,仅W/T值随着写作水平的提高表现出从低到高的线性发展趋势,W/C则随写作水平迂回式发展,先升高后下降,其中,增幅较大而减幅相对较小,说明随着写作水平的提高,中学英语学习者逐渐尝试使用各种从句、被动句等具有书面语特征的结构来代替简单句和并列句,从而有效地增加了T单位和子句的平均长度。

表1 单位长度的统计

表2 W/T高、中、低分组组间显著性检验

表3 W/C高、中、低分组组间显著性检验

对比和分析高分组和中分组学生作文的原文发现。中分组和高分组的学生具使用从句等含有书面语特征的语言结构的能力。但高分组学生更擅长用更加浓缩的语言阐述自己的观点,可能由于高分组学生语言的精炼性大幅度提高,作文篇幅随之减短,W/C值反而不显著地下降。

(二)单位密度的变化

表4显示,高一年级的C/T和DC/C值均比初一年级的更高,差值分别为0.3和0.142,以上数据表明T单位复杂性比率C/T和从属句比率DC/C与年级的变化方向一致,而且高一组与初一组使用C/T和DC/C的差异都具有统计意义(P<0.05)。C/T随着年级的上升而显著地增加(P<0.05),与徐晓燕[11]264-275的结果相似。而在本研究中,DC/C和年级一起显著地上升(P<0.05),这与Lu[6]36-61和鲍贵[10]291-297的研究报告不同。

根据表5与表6中的数据进行组间多重比较发现,C/T和DC/C不仅随着写作水平的提升呈现出线性增长,而且这两个指标在高分组、中分组和低分组中任意两组之间都具有显著性差异(P<0.05),与鲍贵[10]291-297的结论完全相悖。

中学英语学习者在掌握了从属句的使用方法之后,明显地表现出倾向于使用从属句代替简单句等基本句式的偏好。从属句数量的增加,必然会提升从句在子句总数占有的比例;因此,C/T和DC/C随着年级和写作水平的上升都表现出明显的发展迹象。

Lu[6]36-61在研究中发现,高年级的大学生因为使用短语结构代替从属句,所以降低了T单位复杂性比率,大四年级的C/T值最低。由于中学英语学习者英语水平的局限,中学生们普遍不具备使用短语结构代替简单句、从属句等句式的能力。因此,本研究中中学生英语写作的T单位复杂性比率表现出线性上升的趋势,与其他学者对大学生的调查结果不同[6]36-61,[10]291-297,[12]3-55。

表4 单位密度的统计

表5 C/T高、中、低分组组间显著性检验

表6 DC/C高、中、低分组组间显著性检验

(三)句式使用的变化

1.独立子句的使用

虽然独立子句包括简单句、并列句、复合句以及并列复合句四种句式,但是由于中学英语学习者在英语写作中很少使用复合句以及并列复合句,本研究随机抽取的样本中,复合句和并列复合句数据不足,无法进行独立性T检验。所以,本研究仅针对简单句和并列句展开分析和讨论。

根据表7提供的数据可以发现,高一年级使用简单句的平均数量比初一年级少,差值为5.7,高分组与低分组的差值为5.53。中学生使用简单句的数量随着年级和写作水平的升高,都变现出减少的趋势,印证了徐晓燕[11]264-275和秦晓晴[12]3-55的发现。高一组使用简单句的平均数量显著低于初一组(P<0.05)。

表7 独立子句的统计

表8 简单句的高、中、低分组组间显著性检验

表9 并列句的高、中、低分组组间显著性检验

通过组间多重比较得出,高分组与低分组、中分组与低分组对简单句的使用均具有显著差别(P<0.05),高分组使用简单句的数量最少,支持高水平学习者更少使用简单句的结论[11]264-275。

在过去的研究中,大学生使用并列句的数量随着年级和作文分数的上升而不显著地下降[11]264-275,[12]3-55。而在本研究中,高一年级和初一年级使用并列句的平均数量分别为1.53和0.88,高分组和低分组使用并列句的数量分别为1.89和0.73。随着年级和写作水平的升高,并列句使用的平均数量呈现增长的趋势。其中,高一年级与初一年级、高分组与低分组对并列句使用的差异均已达到显著水平(P<0.05)。通过对比低分组和高分组的作文发现,在低分作文中很少出现and,but 等衔接手段,低水平的学习者通常仅仅按照想表达的顺序机械地堆积简单句,很少使用衔接手段将两个句意关联的简单句连接在一起构成一个逻辑关系更顺畅的复合句。而在高分作文中,学习者时常娴熟地使用衔接手段写出逻辑更严谨的复合句。因此,高分组学习者使用复合句的数量明显高于低分组(P<0.05)。

2.从属子句的使用

根据表10中的数据可以看出,中学英语学习者使用各种从句的频率与年级和写作水平都呈现出正相关的趋势,这一结果与先前研究[11]264-275,[12]3-55中大学生使用从句的情况完全不同,中学英语学习者从句使用的频率随着年级和写作水平的上升而升高。

组间多重比较发现,高分组学习者与低分组学习者使用状语、定语以及宾语从句的频率均有显著差异(P<0.05),呈现出发展的迹象,这不支持各组从句的使用差异都不显著的结论[11]264-275。三组不同水平的学习者对主语、表语、同位语从句的使用均没有显著性差别(P>0.05)。

表10 初一、高一各类从句使用的差异性分析

表11 各类从句高、中、低分组组间比较的显著性检验

3.非限定动词和被动句的使用

表12显示,高一年级学生使用动名词、过去分词和现在分词的数量都高于初一年级,差值分别0.66、0.73和0.66,说明随着年级的上升,非限定动词中的动名词、过去分词和现在分词的使用频率都随着年级的升高显著地增加(P<0.05)。赵俊海[9]27-33发现如果学习者具备一定的语言水平,就可以比较好地使用非限定动词来提升句法复杂性,而低分组的学习者较少使用非限定动词,与本研究的发现基本一致。

中学英语学习者对限定性被动形式使用的频率高于非限定性被动形式,而且高一组显著高于初一组,年级对于限定性被动形式的使用有显著差别(P<0.05)。

动名词、不定式、现在分词、非限定性被动形式经F检验后,对应显著性分别为0.07、0.546、0.07、0.504,均大于0.05的显著水平,接受方差齐性的原假设,说明动名词、不定式、现在分词以及非限定性被动语态的使用不能区分高、中、低得分组。过去分词和限定性被动形式因为不满足方差齐性的假设,所以无法进行组间多重比较。

表12 非限定动词和被动句的统计

五、.结语

本研究基于英语学习者写作语料库(WCEL),以句子的单位长度、单位密度以及各类句式的使用变异为测量指标,对中学英语学习者书面语的句法复杂性展开研究。研究表明,除了高分组的W/C值出现了略微的下降之外,中学英语学习者的各项长度指标和密度指标都随着年级和写作水平的上升呈现出线性增长的趋势。中学生对简单句的使用频率高于从句。各类从句相比,学习者对状语、宾语和定语从句掌握的相对更好,使用频率也更高。各类从句、非限定动词中的动名词、过去分词、现在分词以及限定性被动形式的使用频率与年级和写作水平的变化方向相同。

[参 考 文 献]

[1] Housen,A,Kuiken,F.Complexity,Accuracy,and Fluency in Second Language Acquisition [J].AppliedLinguistics,2009(30).

[2] Vyatkina,N.The Development of Second Language Writing Complexity in Groups and Individuals:A Longitudinal Learner Corpus Study [J].TheModernLanguageJournal,2012(96).

[3] Lu,X.Automatic analysis of syntactic complexity in second language writing [J].InternationalJournalofCorpusLinguistics,2010(15).

[4] Larsen-Freeman,D.Adjusting expectations:the study of complexity,accuracy,and fluency in second language acquisition [J].AppliedLinguistics,2009(30).

[5] Ortega,L.Syntactic complexity measures and their relationship to L2 proficiency:A research synthesis of college-level L2 writing [J].AppliedLinguistics,2003(24).

[6] Lu,X.A Corpus-based Evaluation of Syntactic Complexity Measures as Indices of College-level ESL Writers’ Language Development [J].TESOLQuarterly,2011(45).

[7] Beers,S.& W.Naggy.Syntactic complexity as a predictor of adolescent writing quality:Which measures? Which genre? [J].ReadingWriting,2009(22).

[8] Norris,J,L.Ortega.Towards an organic approach to investigating CAF in instructed SLA:The case of complexity [J].AppliedLinguistics,2009(30).

[9] 赵俊海,陈慧媛.英语学习者书面语语法复杂度的测量研究 [J].外语教学理论与实践,2012(1).

[10] 鲍贵.英语学习者作文句法复杂性变化研究 [J].外语教学与研究,2009(4).

[11] 徐晓燕,王维民.中国英语专业学生英语议论文句法复杂性研究 [J].外语教学与研究,2013(2).

[12] 秦晓晴,文秋芳.中国大学生英语写作能力发展规律与特点研究 [M].北京:中国社会科学出版社,2007.

[13] 张会平,刘永兵.英语介词学习与概念迁移—以常用介词搭配与类联接为例 [J].外语教学与研究,2013(4).

[责任编辑:何宏俭]

A corpus-based Study on the Syntactic Complexity of English Writing by Chinese Middle School English Learners

LI Meng-xiao,LIU Yong-bing

(School of Foreign Languages,Northeast Normal University,Changchun 130024,China)

Abstract:Based on the Writing Corpus of English Learners,this study explores the syntactic complexity of English writings by Chinese middle school English learners.The syntactic complexity is measured by the length of T units(W/T) and clauses(W/C),T-unit ratio(C/T) and dependent clause ratio(DC/C),independent and dependent clauses,non-finite verbs and passive structures.The results reveal that the length and embeddedness measures increase in line with their grades and English writing proficiency.Simple sentences are used more frequently than clauses.The frequency of adverbial,attributive and object clauses is used higher than other kinds of clauses in the writings.The use of all kinds of clauses,gerunds,past participles,present participles and passive voice in finite clauses change in the same direction with grades and writing proficiency.Based upon the findings,implications are provided for English textbook development and English pedagogical practices.

Key words:Syntactic Complexity;the Length of Production;the Subordination of Production

[中图分类号]G42

[文献标志码]A

[文章编号]1001-6201(2016)01-0140-06

[作者简介]李梦骁(1988-),女,吉林长春人,东北师范大学外国语学院博士研究生;通讯作者:刘永兵(1954-),男,吉林长春人,东北师范大学大学外国语学院教授,博士生导师。

[基金项目]教育部人文社会科学规划基金一般项目(I2YJA740050)。

[收稿日期]2015-09-10

[DOI]10.16164/j.cnki.22-1062/c.2016.01.028