写作智能评阅系统在大学英语写作教学中的应用研究述评

2018-02-24 00:41
新课程研究 2018年29期
关键词:信度大学智能

写作技能是英语学习四大基本技能之一,是英语教学重点之一。然而,面对大学英语课堂大班教学、教师评阅量大难以及时反馈、学生学习动力不足的现实,英语写作一直以来存在费时低效的教学困扰。随着计算机技术和语料库语言学的发展,智能评阅系统进入写作教学领域。相比人工评分,自动写作评价在终结性写作考试中可节约大量人力、物力和财力。国外写作智能评阅系统从20世纪60年代起步,国内起步较晚但近年来发展迅猛。国内写作智能评阅系统在英语写作的形成性评估和提高学生自主学习能力方面起到了相当重要的作用。研究写作智能评阅系统在大学英语写作课堂的应用有利于构建机器评阅和人工评阅相结合的写作教学模式,有利于探索高效率新型大学英语写作课堂。通览相关文献,对国内外写作智能评阅系统的综述性评述以梁茂成、文秋芳[1]和唐锦兰、吴一安[2]为代表,此后此类研究尤其对国内写作智能评阅系统的综述性评述直缺乏。信息技术日新月异,21世纪初的研究已不能代表当前发展。国内写作智能评阅系统近年来发展迅速,其在大学英语写作教学中的应用呈现广泛而深入的趋势。

一、写作智能评阅系统的发展历程

写作智能评阅系统的发展经历了单一分数评定、合作分数评定和人机交互评改三个阶段[3]。单一分数评定阶段以1966年杜克大学教授Page等人推出的人类历史上第一个作文自动评分系统PEG为代表和开端,在作文自动评分史上有着里程碑的意义。这一阶段的评分系统旨在尝试解决大规模写作考试自动评分问题,快速获得终结性分数。然而,由于当时计算机和语言学发展的局限性,PEG的评价体系只重视语言形式而忽视内容,忽视了作文主题、组织和体裁等语义层面,其评价的是写作的间接因素。因此,该系统1968年即宣告搁置,进入了长达20年的休眠期。此阶段另一代表性系统为IEA[4],此系统注重作文内容的评定,以范文为训练集,比较作文和范文的相似性,在一定程度上解决了作文内容评定问题。合作分数评价阶段出现在20世纪90年代后,代表系统IntelliMetric,E-rater,BETSY等,尤以E-rater在TOEFL等大型考试中的应用而闻名。此阶段系统评分从形式和内容两方面对作文进行评价,注重评分过程中的质量控制,将机器评分和人工评分结合起来,机器注重语言特征,人工更注重高层次的写作技巧,在评分信度上较之第一阶段有了大幅度提升。第三阶段人际交互评改是近十多年才出现的写作智能评阅系统,以注重评分转向注重学习者自主学习和错误诊断反馈,更好地实现“促学评价”,并最终达到“评估即为学”。国内以“句酷批改网”和“iwrite”为代表,学生提交作文可立即获得评分和错误反馈,学生可多次修改并重新获得评分。

纵观2010年以后的国内相关文献,有关写作智能评阅系统的研究大致可分为三大类:一是对相关系统评分信度的研究,研究系统评分结果与人工评分的一致性;二是研究国内写作智能评阅系统对大学生写作水平的影响,研究写作智能评阅系统对大学生写作词汇、语法、句法等方面能力的影响;三是基于国内写作智能评阅系统对大学英语写作课堂的作用,研究构建写作智能评阅系统与大学英语写作课堂教学相混合的新型教学模式。

二、写作智能评阅系统信度研究

国内有关写作智能评阅系统的信度研究文献为数不多,现有相关文献表明,国内写作智能评阅系统的评分信度较高。在“批改网”评分信度研究方面,何旭良[5]对30篇作文进行人机评分对比研究后认为,“句酷批改网”与人工评分一致性高,但评分显著偏高。张荔等[6]对两套CET作文评分标准样卷共10篇作文进行人机评阅,二者结果呈现很高的相关性。有国内研究者[7]对“句酷网”和“冰果”这两个平台的评分效度差异进行了实证研究。对大学非英语专业3种题型作文文本的分析结果表明:“句酷网”和“冰果”的自动评定成绩和人工评定成绩之间存在显著的正相关关系,相关程度存在差异,两个平台对不同类型作文的评定成绩效度之间也有差异。对“iwrite”系统评分信度研究方面,李艳玲、田夏春[8]通过对645篇同题作文人工评分和“iwrite”系统评分对比,认为“iwrite”系统评分信度高,达到可推广水平。

以上研究在一定范围内对相关系统进行了信度分析,但样本量不够大,作文题型不够丰富,实验结果的普遍性受到影响。大数据下国内写作智能评阅系统的信度分析将是未来研究的重点之一。

三、写作智能评阅系统反馈语及反馈效果研究

在“句酷批改网”评阅反馈语方面国内研究较为丰富,研究方法上多采用量化或者质性的调查方法。石晓玲[9]通过对大一共161人的问卷和访谈,对“句酷批改网”的评阅反馈语和评分进行了实证研究,认为其在词汇、语法方面的反馈较多,而在思想内容、逻辑性和连贯性以及篇章结构上的反馈较少。有将近一半(48%)的学生对“句酷批改网”持欢迎态度,认为其具有批改和反馈及时的优势,对语法和词汇方面的提高帮助最大。该研究问卷调查和访谈设计全面合理,研究结果有一定说服力。但介于信息技术的快速更新,该研究时效性稍欠缺,必然与当前不断更新的相关系统研究之间有一定差距。蒋艳,马武林[10]指出句酷批改网作为智能导师系统所面临的挑战。如:只能从语言上判断水平,不能从语义上判断内容,无法对作文内容错误进行识别、部分语言错误无法识别。该研究泛泛而谈,介绍全面但缺乏较科学的研究方法,因此是研究结果的可信度不高。

何旭良[11]以篇章个案分析的形式研究发现,“句酷批改网”的智能反馈主要集中于词汇和语法层面,在内容、篇章结构、修辞、内容逻辑性和连贯性方面反馈不够。此论文仅选取一篇作文分析,研究结果参考价值不高。侯芬[12]以3个英语班级共105名学生为受试对象,将“批改网”融入大学英语写作教学,进行了为期14周的教学实验,用问卷调查和个案研究的方法探讨了“句酷批改网”对提高大学生英语写作能力的有效性。结果表明,大多数学生对批改网的使用持肯定态度。与过去的相关研究结果类似,批改网系统更多关注语法、拼写、句型、搭配等方面的反馈,在篇章结构、逻辑性和连贯性方面反馈不够。该研究采用实证研究方法,使用了问卷调查和分析作文样本,研究结果有参考价值。胡学文[13]以45名大学非英语专业二年级学生为研究对象,考察了“句酷批改网”在线反馈对大学生英语写作结果的影响。该研究的基本数据来自于“句酷批改网”保存的各种记录,研究者使用SPSS7.0软件对相关数据进行处理。研究结果表明,“句酷批改网”上学生对作文的多次自我修改能显著提高作文质量,但修改的次数与作文成绩的提高不存在相关关系,修改质量更具意义。该研究旨在考察大学生写作自我修改对作文质量的影响,研究问题清晰有意义,但两周的实验时间对于研究修改次数与写作水平提高之间的关系没有意义。

周丽[14]从英语写作应用研究角度出发,通过对某南方理工科高校的对照班和实验班的实证研究,通过句法能力的分析来探讨“批改网”对大学生英语写作能力的影响。通过一学年的实验发现,在线写作平台在时间与空间上为学生提供了较之传统写作更多的便利,但在提升学生的并列复句、状语、表语、同位语从句、形容词、名词短语等写作能力方面需要与传统课堂教学相结合。该研究在细化“批改网”对写作能力提高方面的影响有创新意义。李霞、钟兰凤[15]采用了定量和定性研究相结合的研究方法对“句酷批改网”对大学英语写作教学的有效性进行了实证研究。实验对象为118名大学生,分实验组和对照组,在长达两学期的写作课批改中中,分别给予在线反馈和人工反馈。实验结果表明,实验组的写作成绩显著高于对照组。此外,教师观察和问卷调查表明,多数学生对“句酷批改网”持欢迎态度,认为对写作水平的提高很有帮助,能提高写作兴趣和自主写作意识。

综上研究,国内写作智能评阅系统在词汇、语法方面的反馈较多、修改建议较具体,但其在内容和连贯性方面反馈不足。多数学生对写作智能评阅系统持接受态度,认为对写作水平提高有帮助。

四、写作智能评阅系统在新型大学英语写作教学模式构建中的应用研究

国内写作智能评阅系统基于上述相关研究,目前国内写作智能评价系统的评分信度较高,但评阅反馈较多集中在词汇和语法层面,在内容、篇章结构、修辞以及篇章的衔接和连贯方面反馈不够。因此,大学英语自主写作教学模式应该强调写作智能评阅系统与教师反馈、同伴互评相结合。研究主要集中于“句酷批改网”。张文霞、黄静[16]认为,信息技术应该和英语教学高度融合,采取自动讥评、助教评议、教师总评、同学互评、反思自评相结合的方式。杨晓琼、戴运财[17]以135名学生为实验对象,采用问卷调查、访谈和实验法,对基于批改网的大学英语自主写作教学模式进行了实践研究。研究结果表明,“句酷批改网”在提高学生写作兴趣和能力方面有积极意义,有助于培养学生自主学习能力;同时,批改网在内容、篇章结构和逻辑等方面的反馈不足要求教师充分利用点评功能对学生作文进行及时点评。批改网在线及时反馈、同伴反馈和教师反馈在大学英语写作教学中应充分结合,学生的自主写作能力及写作教学质量才会得以切实提高。

黄红兵[18]以“句酷批改网”为在线作文自动评分工具,结合计算机辅助大学英语教学原理和形成性评价理论,在相关文献梳理与分析基础上提出在线大学英语写作形成性评价“三阶模型”。即作文经过“初稿、修订稿、定稿”三个阶段,在初稿和修改稿阶段,教师在自动作文评分反馈和同学评价基础上,有针对性地做出综合评价,学生以即时评价和同学评价为参考、以教师评价为准绳修改作文。实验证明该模型可为大学生在线英语写作提供有效的反馈、减轻教师作文批阅负担,也能有效促进大学生英语写作水平提升。甘容辉、何彩顺[19]在梳理学习分析的概念、要素和模型、主要分析工具和方法的基础上,阐述了学习分析技术于外语教学中的应用,即“句酷批改网”运用学习分析促进个性化教学的案例分析,提出了学习分析在外语教学中的建模构想,展望了学习分析在外语教学应用中的可行性。唐锦兰[20]为期一学年的教学实验以及调查问卷和访谈数据表明,实验教学有助于学生写作能力的发展和自主学习能力的提高;写作教学重点从关注语言错误到关注内容的挖掘和表达,从关注结果到关注写作教学过程和写作教法;在此过程中,师生的角色发生变化。本文在此项研究基础上建构了将自动评价系统融入写作课程的教学模型。

五、问题和展望

首先,目前对写作智能评阅系统在大学英语写作教学中的应用研究主要集中在对“句酷批改网”的研究上,对目前国内应用逐渐广泛,技术不断在开发中的“iwrite”系统的研究寥寥无几。作为该系统的主要开发人梁茂成,十多年来一直致力于此系统的开发和运用,从最初对中国学生英语作文自动评分模型的构建[21]到该系统用于近几年的“外研社杯”全国大学英语写作竞赛等大规模作文评阅和在部分高校的推广使用,“iwrite”系统的使用前景广阔、对“iwrite”系统的研究可能会成为今后几年的研究热点。

其次,目前相关研究主要集中于写作智能评阅系统反馈语的总体效果研究,对涉及其具体对大学生写作某方面能力的影响研究很有限,只有周丽[22]研究了英语在线写作平台对大学生写作句法能力的影响和Zhihong Lu&Zhenxiao Li[23]研究了“句酷批改网”对学习者词汇运用能力的影响等。

最后,目前相关研究只提出构建基于写作智能评阅系统的大学英语自主写作教学模式,是一种粗线条的展望和推测,并没有提出如何将写作智能评阅系统和教师点评、同伴互评结合起来,哪种结合方式才是适合中国大学生写作学习的具体模式。

猜你喜欢
信度大学智能
“留白”是个大学问
《广东地区儿童中医体质辨识量表》的信度和效度研究
《大学》
48岁的她,跨越千里再读大学
大学求学的遗憾
智能前沿
智能前沿
智能前沿
智能前沿
平衡损失函数下具有时间效应和通胀因子的信度估计