2018年北京市中考听说考试述评

2019-04-25 09:01徐惠琦
名师在线 2019年9期
关键词:效度答题北京市

徐惠琦

(山西省太原市山西师范大学英语周报社教育教学研究院,山西太原 030006)

引 言

多年来,全国各地的中考试题大多以考查学生听、读、写的语言技能为主,而很少或几乎不涉及对学生口语表达能力的考查。因此,从测试的构念以及效度角度来讲,这样的测试并不能完全考查学生的英语语言能力。造成这一现象的原因大多为考试成本较高、施测困难、评分随机性误差较大等。但随着我国经济的快速发展和计算机信息技术的普及,人机对话形式的听说考试以其容易操作、评分科学可信等优点被各地中考命题者所尝试使用。目前,全国有16 个省市在中考中开始考查听说技能。其中,北京市勇当先锋,在中考英语听说考试改革中跨出一大步,2018年在全市中考中增加听说考试;一年两考;分值占总分的40%。2017年12月23日,改革后的北京首场中考听说考试顺利举行,受到广大英语基础教育工作者的关注和一线教师的肯定。鉴于此,本文将从构念、任务特征和效度研究三个维度对北京教育考试院官方网站提供的“英语听说计算机考试在线体验系统”中的试题进行分析,旨在为从事中考听说考试的开发人员及一线教师提供测评和教学依据。

一、考试的构念效度

(一)考试内容

根据《北京市高级中等学校招生考试英语听说考试说明(征求意见稿)》(以下简称《听说考试说明》),北京市听说考试以教育部制定的《义务教育英语课程标准(2011年版)》(以下简称《义务教育课标》)所规定的五级目标要求为考试内容范围,其目的是通过各种语言使用任务考查考生在听和说两个方面的运用能力(含听说技能、语言知识、情感态度、学习策略和文化意识)。《听说考试说明》和《义务教育课标》考查的听说内容和能力有所不同,具体对比如表1所示。

(二)考试形式

从考试形式来看,北京市中考听说考试时长为30 分钟,满分40 分,共四道大题,20 个小题;具体任务包括听后选择、听后回答、听后记录、听后转述和短文朗读。

表1 考试要求对比

(三)考试构念

上述考试内容和考试形式表明,北京市听说考试主要考查学生理解或表达相对简单的英语口语能力,充分说明了交际语言观、任务型教学和语言技能观是支撑该考试的理论基础和构念框架。交际语言教学观认为,学语言不仅是学语音、词汇和语法知识等孤立的语言知识,而且还是获取人与人用语言进行交际的能力。北京市听说考试中的具体试题任务,如听后回答、听后转述和短文朗读就是考查这种交际能力的有效题目或相对真实的语言任务。《听说考试说明》中明确规定了对听和说两种语言技能(language skills)的详细要求,这说明该测试开发者非常重视从语言技能的角度来对听说考试进行构念,这也符合《义务教育课标》对义务教育阶段英语课程总目标的描述:“通过英语学习使学生形成初步的综合语言运用能力……综合语言运用能力的形成建立在语言技能、语言知识、情感态度、学习策略和文化意识等方面整体发展的基础之上。语言技能和语言知识是综合语言运用能力的基础……”这些内容充分说明,《义务教育课标》将语言技能放在综合语言运用能力的首位。2018年1月,教育部颁布了新的《普通高中英语课程标准(2017年版)》(以下简称《高中新课标》),明确指出:“普通高中英语课程强调对学生语言能力、文化意识、思维品质和学习能力的培养……语言能力指在社会情境中,以听、说、读、写、看等方式理解和表达意义的能力,以及在学习和使用语言的过程中形成的语言意识和语感。”《高中新课标》的这种描述与Bachman 和Palmer 所提出的“语言能力就是使用者表达与理解话语的能力……语言技能是在完成具体的语言使用任务时对语言使用能力的实现……”(Bachman & Palmer, 2010)的理念相一致[1]。因此,北京听说考试从构念上应更多地借鉴《高中新课标》和测试学领域关于语言能力描述的理念,而不是一味地强调语言技能。

(四)难度设计

从表1中可以看出,《北京听说考试说明》对听说能力的要求比《义务教育课标》的要求稍低,尤其是在说的方面表现得更为突出,如《义务教育课标》的要求“能借助语境克服生词障碍、理解大意”“能就简单的话题提供信息,表达简单的观点和意见,参与讨论”“能与他人沟通信息,合作完成任务”“能根据话题进行情景对话”等难度稍大的项目,在《北京听说考试说明》中均未得到体现,这就说明北京听说考试从构念上来说,试题难度较低,这可能是为了照顾北京市不同地区的英语教学水平差异,同时力求中考听说考试的改革平稳过渡。

二、考试的任务特征

语言使用离不开具体的任务,学生的语言能力通常通过完成语言测试任务的表现来衡量。测试任务不同,学生的表现也会存在差异。所以,为了准确测量北京市初三学生的听说能力,有必要厘清北京市听说考试各个任务的特征。

本文主要参考了Bachman 和Palmer 在2010年提出的任务特征框架,包括任务情境特征、任务说明特征、任务输入特征、任务预期作答反应特征和任务输入与作答反应之间的关系5 个基本要素[2]。

(一)任务情境特征

北京市听说考试均在统一建设的听说考试实验室进行,每人使用一台计算机。学生考前可以在北京教育考试院提供的“英语听说计算机考试在线体验系统”进行模拟体验,确保熟悉考试流程和答题要求等。考试对象为北京市初三在册学生,备考时间为40 分钟,考试时间为30 分钟。

(二)任务说明特征

通俗地讲,任务说明就是指答题时的题目要求。北京市听说考试的题目要求为中文,同时用书面形式和录音形式呈现。题目要求明确说明了考试的具体任务、学生应如何反应、答题位置、答题时间以及每题的分数等内容。

题目要求较为详尽,字数较多。各大题的题目要求最短有33 个字,最长有119 个字;而各小题的题目要求最短有14个字,最长有37 个字。无论是大题还是小题的题目要求中,均未呈现示例,但说明了做题准备时间和答题时间。

题目说明的结构比较清晰。在考试开始时,计算机就通过语音和屏幕呈现了“同学们,欢迎参加北京市高级中等学校招生考试英语听说考试。试题共包括四道大题。下面请看第一大题。”准确说明了听说考试的大题数量,而且在每个大题的题目说明中,又包括了每个大题中的小题数量。听说考试的答题顺序也是固定的,必须按顺序在固定时间内完成每道题目,且完成后不可更改答案。

学生所答的听说答案数据都是通过计算机进入保密性较强的服务器,便于计算机评分并供任何时间的人工审核和查阅。2017年12月23日举行的首场听说考试已于2018年1月19日公布成绩,考生可以通过北京市教育考试院官方网站进行查询。

(三)任务输入特征

北京市听说考试的输入材料基本都是相对真实的英语口语素材,材料是由试题命制者精心加工后重新录制的,不是源自生活中的真实英语口语。

表2 考试选材的语境和话题

续 表

如表2中的分析数据显示,北京市听说考试选材的语境和话题贴近学生的生活实际,有利于学生发挥自己真实的英语水平。听说材料总长度858 个词,题目长度225 个词,总计1083 个词。相较于北京市2017年中考英语听力部分的材料词数835 个,题目词数205 个,总计1040 个词略有增长。听说材料的选材难度较低,弗莱士易读值(Flesch Reading Ease)显示材料的难度在84.7~100,属于特别容易的水平;而Grade Level 则表明材料难度在英语为母语的国家为学前至小学三年级英语水平。听说材料的语速也比较慢,每分钟92~122 个词,比全国普通中考每分钟140 个词左右慢了许多。这些都充分印证了试题难度较低的构念和设计初衷。

听说材料的呈现形式主要分为两种:一种是长对话,另一种是独白。相比以往北京市中考英语试题听力部分的输入材料,删去了短对话的形式,也就是说,北京市听说考试的材料更强调其语篇特征,将语言放入仿真实的交际情境中,用语篇的形式呈现,避免了用碎片化的语言考查学生的语言能力,这与《高中新课标》刚提出的核心素养六要素中的主题语境和语篇类型的理念高度相一致。

(四)任务预期作答反应特征

北京市听说考试共4 道大题,20 个小题,其中有8 道选择题,其余全是主观题。在主观题中,有5 道题目要求学生口头简答问题,有5 道题是填写关键信息,1 道题目是口头转述短文大意,还有1 道题目为朗读短文,期待应答的文本形式覆盖了短语、句子、语篇等各种形式。考试为考生预留的答题时间也非常充足,选择题或简答题为10 秒,填写关键信息为1分钟,口头转述准备时间为90秒钟,答题时间为90秒钟,而朗读短文则给出90 秒钟的准备时间和2 分钟的答题时间,这些都确保了学生能够在作答时从容不迫,保证了考试的信度和效度。

(五)任务输入与作答反应之间的关系

北京市听说考试的答题顺序是固定的,虽然是计算机考试,但不可前后调整答题顺序且不能对学生的答案即时给出反馈。任务输入与作答反应关系有宽域(broad scope)和窄域(narrow scope)两种,北京市听说考试的任务主要是窄域,即绝大部分是细节理解类的直接性题目,而宽域的、间接性的题目也略有涉及,如第一大题的第8 小题,考查学生是否能够理解长对话的主旨大意。

三、考试的效度分析

效度验证其实并不抽象,简单来说就是指研究试题是否考查了目标能力。听说考试效度验证主要回答两个方面的问题,即各试题是否能够考查到考生的相应能力以及在多大程度上考查到了这种能力。本文将主要从内容效度、相关效度、共时效度、表面效度和后果效度5 个方面来分析北京市听说考试的效度。

(一)内容效度

将北京市教育考试院体验版的听说考试内容与《听说考试说明》相对比,可以发现,考试基本覆盖了《考试说明》中规定的内容,考试内容效度较高。对照分析如表3所示。

表3 北京市教育考试院体验版听说考试内容与听说考试说明对比

(二)相关效度

北京市听说考试能够有效考查考生的听力理解和口语产出能力,但是,人机对话听说考试的智能程度尚在发展之中,实施测试的功能仍具有一定局限性,如计算机不能对考生的表达做出模仿真实交际者的回应[3]。也就是说,目前人机对话的听说考试考查了学生的理解性和产出性能力,但对交际性能力的考查略显不足。

(三)共时效度

上文在对考试构念和任务特征分析时指出,北京市听说考试的难度较低,与2017年北京市中考英语的笔试部分相比,无论在语言输入材料的易读值方面,还是在所考查题目的能力方面,难度明显降低。这有可能造成试题的区分度不明显。这些在一定程度上表明,北京市听说考试的共时效度还有待提高。

(四)表面效度

北京市听说考试的计算机页面显示其题目要求明确清晰、题目简洁明了、答题位置突出易找,从卷面上来看比较符合初中毕业生的英语学习特点,表面效度较高。

(五)后果效度

北京市计划实施听说考试以来,取得了十分令人满意的反拨效果。听说考试的实施,对英语教师自身的语音语调、英语口语表达能力等提出了更高要求,教师应力求调整和修正自己的语音语调,以求为学生起到示范和引领作用。听说考试中包括模仿朗读和听后复述两部分,学生在日常英语学习过程中应更加重视自己的语音语调和口头转述关键信息的能力[4]。听说考试已真正成为治疗“聋哑英语”的一剂猛药。

需要特别指出的是,人机对话的听说考试一开始受到了一些质疑,尤其是对计算机评分代替人工评分持怀疑态度。随着计算机信息技术的不断发展,广东省在2011年率先在高考中实行人机对话的听说考试,积累了许多有价值的经验,也用事实验证了计算机评分比人工评分信度更高的优点。Barry O'Sullivan 也指出,对于低段的英语听说测试,计算机评分有较高的信度。另外,计算机评分不容易出现随机误差,也不会因人工评分中主考官语言水平的差异、情绪波动、体能变化等出现评分误差。因此,人机对话的听说考试更有利于实现考试的计划性和公平性。

结 语

正如曾用强教授所说:“现代生活的任何一方面都离不开信息化,包括教育。”人机对话的听说考试在推动考试改革的同时,也推动了教育信息化的发展。在考试大环境下,计算机具有纸笔考试所无可比拟的优势,在评分方面也表现出更高的信度。“人机对话”的听说考试将是未来发展的趋势。教育部考试中心于涵副主任在“第二届语言测试与评价国际研讨会”上说,北京可以成为“大舞台”,广东可以强调“导向性”。试题命制者和一线教师要及时更新观念与意识,学习先行考改地区有价值的经验,确保英语听说考试改革在为教学和选拔人才服务的道路上走得稳健、长远。

猜你喜欢
效度答题北京市
北京市公共机构节能宣传周活动“云”彩纷呈北京市机关事务管理局
北京市:发布《北京市2022年能源工作要点》
北京市医疗器械检验研究院
北京市丰台区少年宫
答题、拍照、必微博、求关注…… 减了老负担,又练“新技能”
挑战答题
一场全民答题狂欢
谈高效课堂下效度的提升策略
巧用模型法提高科学课堂教学的效度
大学生积极自我量表初步编制