高职非英语专业学生英语写作大数据多维度的实证研究

2017-06-28 12:59宋仁福
温州职业技术学院学报 2017年1期
关键词:标点符号语料英语专业

宋仁福

(无锡科技职业学院 外语与基础教育学院,江苏 无锡 214028)

高职非英语专业学生英语写作大数据多维度的实证研究

宋仁福

(无锡科技职业学院 外语与基础教育学院,江苏 无锡 214028)

英语写作是大学英语教学的难点之一。对无锡科技职业学院非英语专业学生作文进行多维分析,结果表明,学生写作高峰期为每月下旬、每周周日和每天20:00—22:00,约20%作文存在抄袭,标点符号后缺少空格,行文呈口语化、劝说型特点。为此,教师应按周分解、考核写作任务,对学生进行差异化评价;强化英语基础教学,对比英汉体裁及思维,提升学生英语综合水平;开展严谨治学、诚信做人的思想教育,树立学生的学习信心。

高职院校;英语写作;语言学;MAT

近15年来,相关学者借助网络写作平台、语料库、多维分析等手段对大学英语写作进行了许多有益的研究。从CSSCI外国语来源期刊分析,这些研究基本以本科院校学生为研究对象,基本不涉及高职学生;其他以高职学生为对象的研究普遍缺乏源自高职的、较大型的语料和样本。在大力发展职业教育的今天,为从宏观视角多维度探讨高职学生英语写作的规律性特征,笔者自建了高职非英语专业学生英语写作语料库,涵盖16个题目的同题作文23 132篇共计460多万字(字数以“[a-zA-Z0-9]+”正则表达式[1]统计),具有较好的高职性、时效性、规模性、原创性和普遍性等特点。剔除比赛作文并经查重处理后,最终选用的语料涵盖14个题目的同题作文16 365篇共计270多万字。本研究拟用高职非英语专业学生作文提供的真实数据,采取语言学视角与非语言学视角相结合的路径,借鉴语料库语言学理论与方法,对其英语写作进行全景式探讨,以期全面了解其英语写作情况,对高职英语教师的写作教学有启发作用。

一、研究方法

1.研究问题

采用语言学视角与非语言学视角、定量分析与定性分析相结合的路径,围绕作文在提交时间、修改次数和分数分布等非语言学方面的特点,作文在标点符号、体裁类型和主题词使用等语言学方面的特点,试图揭示高职非英语专业学生英语写作的普遍特点与规律,以及这些特点给写作教学带来的启示。

2.研究对象2014级、2015级和2016级全体大一(大二、大三不开设“大学英语”课程)非英语专业学生作文,历时3年。语料主要为学生月度作文,每篇写作周期为一个月,学生有充足的时间进行构思、写作、修改,提交批改网平台后,在截至期内依然可无限制修改。语料库包含所有月度作文(含低分作文及未完成的作文片段),以及英语写作初赛作文和期末考试作文。作文正文前附有学期、文章标题、提交时间、修改次数、文章得分、作者性别、英语高考成绩等文本元信息(metadata),所有语料都进行了词性标注,信息标注维度之多在同类语料中较为少见。为此,可从不同视角对作文进行多维度、多视角考察与研究。

以无锡科技职业学院2014级、2015级和2016级全体大一学生为研究对象,学生人数约7 000人,涉及38个专业。其中,文科专业20个,理工科专业18个;男女生性别比为1.33∶1。

3.数据收集

大数据时代,不用再依赖随机样本,有时甚至可研究全体数据。大数据可记录、跟踪以前无法观察到的数据,使人们可能看到以往看不到的规律、特征或关系。从大数据的细节中,可分析出学习者的性格、学习风格、认知倾向、学习策略、动机类型等[2]。基于大数据思想,收集的语料来自无锡科技职业学院

二、结果与分析

1.作文的非语言学特征

(1)提交时间。作文提交时间维度包含日期、星期和钟点三个层面,其中钟点以整点为单位进行统计,如08:45按整点8点统计。

月度作文一般在每月初布置,提交截至时间为当月月末。作文提交日期分项统计情况见表1。由表1可知,每天都有学生提交作文,但提交的高峰期出现在每月下旬,即22日开始,30日到达顶峰(占总提交量的6.4%);其中,每月头21天内作文提交量累计百分比为47.9%,而22日到月末约10天时间作文提交量累计百分比为52.1%。

表1 作文提交日期分项统计情况

31日日期比较特殊,因为去除寒暑假3个月(2月、7月和8月)不布置作文,一年中其它9个月都有30日,而有31日的月份只有5个月,约为总数的一半。这样,虽然31日作文提交量只有30日的60.71%,但如果把两类月份作文提交量考虑在内,31日作文提交量比重实际超过了30日(见表1)。

总体上,每月上旬、中旬日均作文提交量约为2.2%,进入下旬后,作文提交速度成倍增长,到最后一天更是增至近3倍。这说明,越接近截至日期,作文提交量越密集。

每周七天的作文提交情况如图1所示。由图1可知,周一到周三基本稳定在14%左右,接下来三天有所下降,周日突然上升并达到高峰。这表明经过几乎一周紧张、忙碌的学习,到周四、周五,学生已觉得疲乏,正期盼即将到来的周末,因而作文提交量有所下降;到周六、周日,随着学生余暇时间增多,作文提交量迅速回升并达到高峰。

图1 作文提交星期信息

作文提交钟点信息如图2所示。由图2可知,每天24小时都有学生提交作文,07:00—22:00期间,作文提交量几乎稳定、持续上升,作文提交量累计百分比高达87.8%,其间虽然17:00—18:00点(晚餐时间)作文提交量有所回落。此外,23:00—06:00当属学生正常睡眠休息时间,作文提交量理所当然逐步下降。不过,有些“夜猫子”喜欢在夜深人静时学习,睡在床上或许还在手机上写作。

上述分析揭示了学生作文提交的共同特点:约一半学生能提前5~7天完成作文;约一半学生偏好在末端时间(如月末、周末、深夜)提交作文;每时每刻几乎都有学生提交作文;大部分学生非常重视写作任务。

(2)修改次数。文章不厌百回改,反复推敲佳句来,英文写作也是如此。作文修改次数一定程度上说明了作者对写作的态度。作文修改次数为提交次数减1,修改次数为0意味着作者提交后未作修改。本语料库中作文修改次数从0次到238次不等,人均修改次数为10.99次。作文修改次数前10统计情况见表2。由表2可知,只有17.04%的作文一次成型,未经修改。尽管在每次提交作文的同时,批改网平台一般会生成包括拼写、词性、搭配等常见错误的“检测报告”并给出修改建议,但部分学生对此视而不见,不予理睬。

图2 作文提交钟点信息

表2 作文修改次数前10统计情况

本语料库中,约83%的学生经过了1次及以上的修改,修改次数超过100次的作文仅占3‰,个别学生甚至“打磨”了238次,但修改次数与作文总数呈反比趋势。研究表明,首次提交越临近截至日期,修改次数越少。

(3)分数分布。批改网平台还提供了评阅、评分功能,平台从“内容相关、篇章结构、句子、词组搭配、词汇和流畅度等六个维度对学生作文进行全面智能评价,……每篇作文的成绩由192个子维度构成”,网络批改与研究者批改的成绩基本一致[3];“就同一分数档来看,人/机评阅一致性和相关性较高”[4]。

月度作文字数通常要求不低于120个单词,但实际作文字数由12个单词到900多个单词不等,跨度非常大。少数作文或雷同/抄袭,或通篇只有十几个单词。好在大部分作文都在120~175个单词之间,平均为166.32个单词,且90%以上的作文均达到字数要求。

同样,作文分数呈两极分化十分明显。作文最低分不到10分,最高分为98分,平均74.3分;出现频数最高的是80分,约1/3的作文高于80分。查阅语料发现,分数极低的作文多为没有写完的作文片段,字数为10个单词,结构不完整,意思表达不清楚。

2.作文的语言学特征

(1)标点符号。规范使用标点符号有助于作者表达意思和思想,同时也便于读者理解。以2014年上半年的作文为例,统计逗号、句号和感叹号(问号因出现次数太少未纳入统计)三个常用的标点符号在书写格式方面的错误,结果见表3。由表3可知,学生使用最多的标点符号是逗号,其次为句号,感叹号最少。这三种标点符号在使用过程中都出现了格式方面的错误,错误率均在60%左右,其结果均超出老师、学生预料。

表3 2014年上半年作文中标点符号格式错误

此类错误主要表现在标点符号前添加了不该加的空格(前冗空格),而后面缺少了该有的空格(后乏空格),其中后面缺失该有的空格是这类错误的集中体现。英汉语分属印欧语系和汉藏语系,有着不同的书写规范与要求,这些错误反映出广大学生对英语标点符号的规范要求缺乏敏感性,可能与汉语标点符号格式的负迁移有关。

(2)体裁类型。为探究学生作文总体语体特征,利用SPSS 23.0版的随机抽样功能,从文献[1]语料库中14个题目16 365篇作文中随机抽取1 000篇,然后通过多维分析工具(MAT)对每篇作文进行时态、词法、句法等16大类共67种语言特征标注、分析,进而确定与本研究文本最接近的体裁类型。

MAT是Nini[5]运用Biber[6]英语语域变异分析方法和流程,并经过了一定的优化而成。Biber将所有体裁分为交互性与信息性表达(Involved Versus InformationalProduction)、叙述性与非叙述性关切(Narrative Versus Non-Narrative Concerns)、指称明晰性与情境依赖型指称(Explicit Versus Situation-Dependent Reference)、显性劝说型表述(Overt Expression of Persuasion)、信息抽象与具体程度(Abstract Versus Non-Abstract Information)、即席信息组织精细度(On-Line Information Elaboration)六个维度[6]。各维度均由不同语言特征的结合体组成,维度呈互补分布,其显著性以分值大小表示,正(负)对应相关维度的上下端。有关多维分析法见文献[7]。

经过分析,MAT统计出1 000篇作文在六个维度的均分及最接近文本类型(见表4)。由表4可知,维度一得分最高,维度四次之,其他分值都比较低,故作文体裁特点较维度一和维度四更明显,即交互劝说型。

表4 MAT作文体裁分析

“交互性”是现场互动的一种表现,体现了口语的特点,“劝说型”可能和汉语习惯用“……可以……”或“……应该……”之类表达有关。所有六个维度的分值都不高,说明作文文本类型并不明显,即体裁界线模糊、不鲜明。这些研究发现与潘璠关于“中国学习者书面语体的交互性和说服性较强,信息性、叙事性、指代明确性和抽象性都偏低”[8]的阐述相一致,也印证了文秋芳等关于学生的书面语具有口语化倾向的结论[9]。

通过对文本进一步分析发现,本语料中多用如下语言现象(依频数高低):私有动词(private verbs)(如think,hope,believe),that省略,现在时动词,人称代词,劝说性动词(如ask, suggest, decide)和必要性情态动词(如ought, should, must)等。这些都促成了作文具有交互劝说型特点。

(3)主题词使用。为进一步理解作文交互劝说型特点,利用WordSmith Tools 7.0[10],以英美本族语学生作文语料库(LOCNESS,库容约32万个词)为参照语料库制作作文主题词表。主题性为对数似然值(log likelihood),P值为P<0.000001。

本语料库中存在超用(多用)主题词情况,这里仅列出主题词前20统计情况,词表按主题性数值的大小降序排列(见表5)。由表5可知,与英语本族语作文相比,高职学生过多使用私有动词think,第一人称代词I, we, my, us,第二人称代词you,预测情态动词will等,这与MAT分析结果相吻合。上述词语超用直接导致“我(们)认为你(们)应(该) ……”口语化、劝说类句型的高频出现。

3.作文雷同现象

在整理语料过程中发现,作文雷同或涉嫌抄袭现象比较严重。本语料库共收集作文23 132篇,排除预赛和期末作文3 028篇,其中3 739篇作文雷同或涉嫌抄袭,占作文总数的18.6%。作文雷同或涉嫌抄袭存在两种情况:一是两篇或多篇具有较高的相似度,相似度达30%或以上;二是两篇或多篇几乎一样,相似度甚至超过90%或以上。在雷同或涉嫌抄袭的作文中,男生占57.8%,女生占42.2%,男生人数相对更多。

三、结论与建议

通过大数据多维度分析发现,高职非英语专业学生英语写作具备四个特点:一是写作高峰期为每月下旬、每周周日和每天20:00—22:00,四成以上学生提前10天完成;二是篇均修改次数为11次,分数集中在74~80分之间;三是近两成作文涉嫌抄袭;四是标点符号后缺少必要空格,行文口语化、劝说型。这说明大部分高职非英语专业学生具备一定英语基础,刻苦上进,作文完成方面有较好的时间意识,能充分利用课余时间认真、独立完成作文,反复修改、不断完善,但也存在诸多不足。为此,提出以下建议:

(1)按周分解、考核写作任务,学生进行差异化评价,提高写作时效性。将月度作文任务逐项分解到每周,分周分项考核。敦促学生第一周需提交作文初稿,以后每周至少修改两遍,以免月底“开夜车”,影响身体健康;督促学生月底前需将网络平台所有修改建议全部改正,提醒时机可选择傍晚前、周期前和下旬前。由于学生英语基础不同,以最终分数作为评价作文的唯一标准缺乏个性化,因为基础欠佳的学生修改作文无数遍仍可能达不到要求,容易挫败学生英语写作的积极性。作文评价应视学生现有基础、加分语句、修改次数、作文得分等因素综合评定。此外,教师可利用班级QQ群、微信等工具,定期公布作文进展情况,起到表扬和敦促作用。

(2)强化英语基础教学,对比英汉体裁及思维,提高学生英语综合水平。由于学生英语基础不够扎实现象普遍存在,教师需要从英语基础开始教学,强化英语语言基础知识,并通过真实写作样例、案例进行“标准化、范本式”讲练,剖析英语口语与书面语、不同体裁之间在词汇、句式、篇章结构等方面的特点与差异,对比英汉常见文化及思维方式等,引导学生克服畏难心理,循序渐进,以培养英语思维能力和体裁意识,提高英语综合能力。

(3)开展严谨治学、诚信做人的思想教育,树立学生的学习信心。抄袭是英语能力欠缺、自信心缺乏和学术不规范的表现[11]。为此,在提高学生英语能力的同时,还需要进一步强化严谨治学、诚信做人的思想教育,端正学生英语学习态度和求学态度,引导学生树立信心,制订科学可行的学习计划与目标,督促学生独立完成英语写作;同时通过QQ、微信、短信等方式提醒、告诫涉嫌抄袭学生,并有针对性地进行个别教育和学习辅导等。

[1] 许家金.2015年新出炉中国英语学习者语料库The TECCL Corpus[EB/OL]. (2015-12-28)[2016-09-10]. http://www.corpus4u.org/threads/9628.

[2] 刘润清.大数据时代的外语教育科研[J].当代外语研究,2014(7):1-6.

[3] 蒋艳,马武林.中国英语写作教学智能导师系统:成就与挑战—以句酷批改网为例[J].电化教育研究,2013(7):76-81.

[4] 张荔,盛越.自动作文评阅系统反馈效果个案研究[J].外语电化教学,2015(3):38.

[5] NINI A.Multidimensional Analysis Tagger (Version 1.3)[EB/OL].(2015-10-05) [2016-09-10].

http ://sites.google. com/site/ multidimensionaltagger.

[6] BIBER D.Variation Across Speech and Writing[M].Cambridge:Cambridge University Press,1988:102-103.

[7] 江进林,许家金.基于语料库的商务英语语域特征多维分析[J].外语教学与研究,2015(2):225-236.

[8] 潘璠.中国非英语专业本科生和研究生书面语体的多特征多维度调查[J].外语教学与研究,2012(2):230.

[9] 文秋芳,丁言仁,王文宇.中国大学生英语书面语中的口语化倾向—高水平英语学习者语料对比分析[J].外语教学与研究,2003(4):268-274.

[10] SCOTT M.WordSmith Tools Manual Version 7.0[M].Stroud:Lexical Analysis Software Ltd.,2016:245-270.

[11] 赵宇,姚冬莲.大学生英语写作能力的调查与分析[J].温州职业技术学院学报,2010(3):93-96.

[责任编辑:黄雪英]

A Multi-dimensional Empirical Study on English Writings of Non-English Majors in Vocational Colleges

SONG Renfu
(School of Foreign Languages and Basic Education, Wuxi Professional College of Science and Technology, Wuxi, 214028, China)

English writing is one of the dif f culties in college English teaching. A multi-dimensional study on compositions was made among non-English majors of Wuxi Professional College of Science and Technology. Results show that students usually write at the latter part of a month, on every Sunday, and from 8pm to 10pm. Some problems stand out, for example, 20% of the compositions are plagiarized; punctuation marks are not followed by a blank space; writings are too colloquial and persuasive. Thus teachers should divide and evaluate the writing tasks on a weekly basis and offer assessments strengthen basic English teaching and compare the differences between English and Chinese genre to improve students’ English prof ciency; and offer ideological education of how to pursue studies seriously and how to be an honest person and cultivate students’ conf dence in learning English.

Vocational colleges; English writings; Linguistics; MAT

H319

A

1671-4326 (2017) 01-0024-06

10.13669/j.cnki.33-1276/z.2017.006

2016-09-27

江苏省高校哲学社会科学基金(2015SJD376);教育部职业院校外语类专业教学指导委员会研究课题(GZGZ5414-13)

宋仁福(1971—),男,江西丰城人,无锡科技职业学院外语与基础教育学院副教授,硕士.

猜你喜欢
标点符号语料英语专业
交互式教学在英语专业阅读课改中的应用研究
基于归一化点向互信息的低资源平行语料过滤方法*
我们班的“标点符号”
论英语专业语法教学中三种思辨能力的培养
标点符号争吵记
标点符号的争论
西方修辞教育传统及其对我国英语专业教育的启示
新人教版《逍遥游》中几处标点符号误用例说
《苗防备览》中的湘西语料
国内外语用学实证研究比较:语料类型与收集方法