评价量表的内涵、特点及开发

2019-07-08 03:53张所帅
教学与管理(理论版) 2019年3期
关键词:表现性评价

摘   要 评价量表的出现源自于表现性评价的兴起,是一种基于学生能力表现的评价工具。国外对评价量表的研究已有二三十年的历史,形成了数量可观的研究成果,并在教学实践中被大量运用;在国内,评价量表是随着信息化教育改革的浪潮和新一轮基础教育课程改革的号角在世纪之交进入到教育研究视野的,时至今日虽已过去十多年的时间,但对其研究和使用依然没有太大起色,其在教学评价中的独特功能并未得到充分彰显,为此有必要重新审视和关注它。

关键词 评价量表  表现性评价  能力表现  评价工具

评价量表的英文译为“Rubric”,原意为“红土”“红壤(土壤)”,在中世纪是指用红墨水写在各种手稿中的标志,在礼拜仪式的文档中,红色标记可以指明赞美诗该如何唱或者宗教仪式该如何进行。后在法律公文中,红色的文字通常表示一部法典的标题,由此“Rubric”开始意指任何简要、权威的规则[1]。引入到教育领域后,其被赋予了特殊的评价内涵——权威性的规则,在实际应用中主要是以二维矩形表格的形式出现。

一、评价量表产生的背景与内涵

1.评价量表产生的背景

20世纪70年代以来,随着对课程改革运动的深入反思,传统的评价方式在美国受到了猛烈的攻击,标准化的测试也被广为诟病,具体表现在:只重视事实性等低级知识的测量,而在学生高级知识比如批判性思维和解决问题能力等方面显得无能为力;无法测量出学生在主题性、综合性、探究性、复杂性等活动中的学习经验;只重视学生学习结果的测量而忽视学习过程和学习进步的测量,只重视教师对学生的评价而缺乏学生的自评和互评;只呈现评价结果,而不能呈现学习的优点和不足,学生难以得到有效的反馈,不利于今后的学习改进[2]。这种“为测试而教学”的评价观最终被建构的教育评价观所取代,这就是美国评价专家古巴(E.G.Guba)和林肯(Y.S.Lincoln)所说的“第四代评价”。

20世纪80年代以来,在建构替代标准化测试评价方式的过程中出现了诸如替代性评价(alternative assessment)、表现性评价(performance assessment)、真实性评价(authentic assessment)等一些新的评价方法。尽管其称谓各不相同,强调的侧重点也各有差异,但它们都“试图从固定反应、机器评分的测验,转向使用要求学生构建某种反应、通过人的主观判断进行评分的任务”[3]。新的评价方式需要新的评价工具来承载落实,评价量表应运而生。

在国内,评价量表真正进入到研究者的视野是在世纪之交。20世纪90年代以来,信息化浪潮席卷全球,以教育信息化带动教育现代化成为我国面向21世纪教育改革发展的重要抉择。以现代教育技术为基础的信息化教育带来了教育领域全方位的深刻变革,教学中强调“以生为本”“以学为中心”,注重培养学生的综合实践能力和创新精神。面对新的教学情境,传统的评价方式已经无法胜任,迫切需要与信息化教学设计相适应的新的评价方式。新一轮基础教育课程改革也在《基础教育课程改革纲要(试行)》中明确提出“改变课程评价过分强调甄别与选拔的功能,发挥评价促进学生发展、教师提高和改进教学实践的功能”,评价理念和评价方式的转变促成了评价量表在教育领域中的兴起。

2.评价量表的内涵

关于评价量表的内涵,国内外的研究者给出了诸多不同的解释。例如“评价量表是一个评估工具,使用明确规定的评价标准和熟练水平来衡量学生在这些标准上的学业成就。根据学生能够做什么,描述了学生在每一个水平上的表现。评价量表帮助教师测量学生学习的成果、进步和过程。同时,清楚地和学生交流各领域学术成就的标准”[4]。再例如,“评价量表是一种评分工具,描述的是对某项任务的具体期望。评价量表将任务分成多个组成部分,并对每个部分合格或不合格的表现进行了详细的描述。评价量表可用于多种任务,包括研究论文、书评、讨论、实验报告、档案、小组活动、口头陈述等”[5]。从中可以得出评价量表是一种评价工具或评分指南,用于评判学生学习作品、学习过程和学习成就等方面的学习表现,特别适用于表现性评价。评价量表是一种结构化的等级评价,具体描述了学生在不同水平上的实际表现,一般由评价指标、等级水平和表现描述以及具体样例等部分构成。

二、评价量表的特点和类型

1.评价量表的特点

评价量表是继黑板发明之后最方便的教具之一,与其他的评价工具相比具有鲜明的特点,具体表现在:

从教师的角度来看,通过制定评价量表,可以帮助自己更加明确教学的目标和任务,进一步优化教学设计,提高教学质量;在与其他教师协作开发评价量表的过程中,通过协商交流,观点碰撞,可以分享各自经验心得,促进专业发展;通过运用评价量表,能够保证评价结果的前后一致性,评价标准的公开化也能确保评价过程的客观、公正,避免“暗箱操作”;运用评价量表可以減轻教师的负担和压力,避免了简单打分的模糊性和编写评语的繁琐性,能够提供及时反馈,提高工作效率。

从学生的角度来说,评价量表的出现能够帮助其明确学习任务,聚焦学习目标;学生可以对自己的学习有更为详细的了解,清楚自己的优缺点和努力方向;在结合评价量表反观自己的学习状况时,能够激发自我反思和自我完善的动力,并能提高自我评价能力;学生参与或部分参与评价量表的制定和完善工作,有助于发挥其在评价活动中的主体性,提高其在评价过程中的主人翁意识,增强学习的干劲。

从评价本身来说,评价量表以评价标准为核心,以教学目标为导向,有利于促进基于标准的教学实施;评价的主体由以前教师单一主导变成现在教师评价、学生自评、同伴互评等多元评价相互参照;评价的方式由单一的纸笔测试变成纸笔测试和“观察资料(observations)”“表现样本(performance sample)等多种评价方式相结合;同时,评价量表淡化了评价的甄别与选拔功能,强化对学习的促进和反馈功能。

总之,“评价量表的核心是一次重大的权力再分配,也是学术界对教育方式的一次重要界定和指导。这种权力再分配始于课堂,其中教师使用评价量表赋予学生访问的权力,让他们更好地了解教师的期望,并让他们进一步参与自身学习以实现这些期望。从个人层面上看,这种再分配也能帮助教师记录自身的进步”[5]。

2.评价量表的类型

评价量表大致可以分为整体型评价量表和分析型评价量表两种。整体型评价量表(holistic rubric)是把学生的学习表现或成果的重要因素综合起来,给出一个整体的评价。其优势是评价简单的成果或表现,快速获得对总体水平或整体成绩的评定,对成果或表现给出“印象分”;缺点是缺乏对成果或表现的详细分析,起不到诊断与反馈作用,不能很好地区分学生的能力差别。其基本样式见表1[6]。

分析型评价量表(analytic rubric)是把学生的学习成果或表现分解成基本的要素或维度,对它们分别做出评价。分析型评价量表特别适用于评价复杂的任务表现,能提供更有针对性的反馈信息,便于更好地改进;缺点是所需的时间比较长,评价的效率和可信度难以保证。其基本样式见表2[7]。

整体型评价量表与分析型评价量表各有优缺点,在具体的使用过程可以根据实际需要,灵活选用,充分发挥各自在评价中的优势。

三、评价量表的适用条件和具体开发

1.评价量表的适用条件

评价量表源于表现性评价的兴起,所谓表现性评价“就是让学生参与一些活动,要求他们实际表现出某种特定的表现性技能,或者创建出符合某种标准的成果或作品。简言之,就是我们在学生执行具体的操作时直接观察和评价他们的表现”[8]。表现性评价的优势非常明显:可以对涉及校内外自然情境中复杂表现的教学目标的实现情况进行评价;可以测量用其他方法无法测量的复杂的学习结果;不仅能评价完成任务的结果,还能评价任务完成的过程;体现了现代学习理论,把学生看作是意义建构的积极参与者,而非分散知识的接受者[3]。当然表现性评价也存在明显的局限性,集中体现在评价结果的不一致上,因此需要制定明确的评价标准来确保评价结果的客观、公正,于是评价量表便成为表现性评价的重要组成部分,也是表现性评价设计中的关键一环。

由此可见,评价量表主要适用于学生的能力表现评价,这里的能力更多的是一种高水平的、复杂的、综合性的思维能力以及思考问题、解决问题的实践能力。在纸笔测试中,主要体现在建构反应题型上,题目的答案往往是开放性的,用以考查学生的思维过程和结果,反映其认知水平的差异和特点;另外还体现在“观察资料(observations)”和“表现样本(performance sample)”等其他评价方式中。

2.评价量表的具体开发

评价量表的开发大致有两条路径:一条是对现有的评价量表进行借鉴和改造,使其为我所用;另一条是根据评价目标和任务,结合评价量表的特点开发新的量表。目前网络上有许多专业的评价量表网站,其中有各种形式的评价量表,可以根据需要有选择地借鉴使用。如果没有合适的评价量表,就需要自己或者与同事包括学生共同开发了。

评价量表的开发主要有两种基本模式:自上而下式和自下而上式。所谓自上而下式就是从评价的目标和任务出发,采用演绎的思维方式,从抽象到具体。具体的内容和环节包括:确定评价的任务;明确任务中的要素;确定出各要素的特征;描述出代表各要素的不同水平;选择评价量表的类型;制订、修改评价量表。所谓自下而上式是指从分析学生的具体表现或作品入手,采用归纳的思维方式,由具体到抽象。具体的内容和环节包括:收集并分析学生的作品;分类不同作品;明确分类的依据和要素;确定不同的水平;选择评价量表的类型;制订和修改评价量表[9]。当然在实际的开发过程中,并没有严格的规定限制,也不必拘泥于某种固定的程序,一切以目标要求和实际需要为依据,必要时可以将两种模式结合起来使用。

在开发评价量表时,需要注意以下事项:

(1)对标准的描述要具体、明确、易懂,避免使用模糊、笼统的语句,既不利于学习指导,也不利于评价判别。

(2)水平等级的划分不宜过多,一般3~5个层次即可,否则过多的层级划分,难以保证有效的区分度;在进行水平等级的划分时,首先确定最高等级和最低等级的表现特征,然后再确定中间等级水平的描述,可以试着采用“是”“是,但是”“不,但是”“不”的逻辑思路来进行定级描述。

(3)评价指标不宜过多,过多的评价指标容易造成等级划分的复杂性,操作起来比较麻烦,同时也难以保證评价量表的针对性和有效性。

(4)避免使用消极、否定的语言,总体上要用积极、肯定的语句对各等级的水平表现进行描述,这既有利于鼓励学生以积极的心态投入到学习中去,也能体现表现性评价的真正内涵。

参考文献

[1] Edward P.Asmus.(1999).Rubrics:Definition,Benefits,History and Types https://www.music.miami.edu/assessment/rubricsDef.html,2016-05-03.

[2] 邵朝友.评分规则开发与应用研究[D].上海:华东师范大学,2007.

[3] Robert L.Linn & Norman E.Gronlund.教学中的测验与评价[M].国家基础教育课程改革“促进教师发展与学生成长的评价研究”项目组,译.北京:中国轻工业出版社,2003.

[4] Montgomery K.Classroom rubrics: Systematizing what teachers do naturally[J].The Clearing House, 2000,73(06).

[5] Dannelle D.Stevens,Antonia J.Levi.评价量表:快捷有效的教学评价工具:第2版[M].陈定刚,译.广州:华南师范大学出版社,2014.

[6] 李桂琴.信息化教学评价量规的设计及应用研究[D].南京:南京师范大学,2005.

[7] 闫寒冰.信息化教学评价——实用量规工具[M].北京:高等教育出版社,2003.

[8] RichardJ.Stiggins.促进学习的学生参与式课堂评价:第四版[M].国家基础教育课程改革“促进教师发展与学生成长的评价研究”项目组,译.北京:中国轻工业出版社,2005.

[9] 崔允漷,王少非,夏雪梅.基于标准的学生学业成就评价[M].上海:华东师范大学出版社,2008.

[作者:张所帅(1978-),男,山东青岛人,海南师范大学文学院副教授。]

【责任编辑   杨  子】

猜你喜欢
表现性评价
高中历史课堂教学表现性评价初探
浅析中职学生考试、考核评价策略
表现性评价的理论探究与实践探索