“双减”背景下分数评价和等级评价的辩证关系

2022-06-30 22:27程姣姣
基础教育参考 2022年6期
关键词:价值判断双减人工智能

程姣姣

[摘   要]分数评价和等级评价都是价值判断的结果,测验分数不是分数评价,而是事实判断的结果。二者在区分度、表现形式和功能偏向方面存在较大差别,但是二者是形式不同的考试评价,目的都是将教学结果反馈给教师和学生。在实际运用中,二者应相互渗透、相互转化。二者的相互配合需要聚焦教育本质,重塑考试评价认知,结合评语,引入人工智能。

[关键词]分数评价;等级评价;价值判断;人工智能

近代以来,我国考试评价一直在分数评价和等级评价之间摇摆。在清代废除科举制度以前,此前多数朝代在考试评价中均采取等级评价。新中国成立之初,我国仿照前苏联采取五分制等级评价。此后,分数制开始占据主导地位,并成为人们熟悉的一种评价制度。21世纪初,由于分数评价的高区分度给学生带来了巨大的学业压力,学者们开始探究等级评价,也有部分地区开始实行等级评价。然而,尽管改革初期轰轰烈烈,最终还是被分数评价所取代。近年来,“唯分数”评价的愈演愈烈,已经给家长、教师和学生带来了难以承受的压力,导致了“大家都知道唯分数不好,但还是越走越远”的局面,即进入了一种恶性循环。在这样的背景下,2021年7月,中共中央、国务院印发《关于进一步减轻义务教育阶段学生作业负担和校外培训负担的意见》(以下简称“双减”)鲜明地提出“考试成绩呈现实行等级制,坚决克服唯分数的倾向”。[1]这一文件的发布使得等级评价再次被广泛关注。为了使评分制度改革更加完善,以促进考试评价更好地为学生健康发展服务,有必要对等级评价和分数评价的关系进行探讨。

一、分数评价和等级评价的概念

分数评价和等级评价都属于评价范畴。评价是一种价值判断活动,是对事物价值的判断,既包括对已存在价值的判断,也包括对超前性价值的判断。[2]评价判断需要在事实判断的基础上进行,否则多是不切实际的“空想”。斯塔弗尔比姆(Stuffleboem)提出,评价是描述、收集和提供有效咨询,从而进行判断和调整方案的过程。格伦兰德(Gronlund)用简单公式表示了评价的含义,即“评价=测量(量的记述)+非测量(质的记述)+价值判断”。[3]可见,评价的前提是事实判断,重点是价值判断。事实判断是对事物真实性的判断,价值判断是对是否有价值、有什么样的价值以及多大价值的判断。[4]分数评价和等级评价作为评价活动,也应是一种价值判断活动。本文将在这一基础上,进一步分析两类评价的含义。

一般来说,分数评价是指用分值表示学生学业成就的结果,既可以用满分一百分制表示,也可以用一百二十分制、一百五十分制表示。也正因为其结果的量化表示,很多人直接把测验结果作为评价结果,并认为用分数评价得到结果是顺序数据,其科学性高于等级评价的结果。当然也有一部分人认为,分数评价和等级评价的结果都是等距数据,其差别只在于区别度的高低,分数评价的结果更加精确,而等级评价的结果略显模糊。但是,人们没有注意到的是,他们视为分数评价的结果实际上不是最终结果,而是事实判断的结果,只是格兰伦德所提出公式的前一部分,即量的记述。他们所认为的“分数评价”还没有涉及价值判断,因此不算是完整的分数评价。因此,大多数人所认为的“分数评价”并不能称为分数评价,只是测量的结果。再如,一名男生通过尺子测量的结果是160厘米,我们不能说这个160是价值判断的结果,而要根据某一标准,在测量数据的基础上,进行价值判断,是高还是矮,并推测能否参军入伍等。因此,分数评价作为一种评价,并不是事实判断的结果,而是价值判断的结果。例如,教师对学生写作水平的评价,需要写作评价标准,最后用与他水平相匹配的数字表示。也就是说,对测评结果的打分只是完成了评价的前半部分,即“收集资料”,对这一数据资料进行价值判断之后,整个评价过程才算完成[5]。等级评价是指评价者有目的地将在评价学生学业成就活动中所获得的结果——价值判断,用等级的形式表示。等级形式多样,可直接采取A、B、C、D等字母表示,也可用优秀、良好、合格、努力等词语表示,也可用小红花的数量表示,等等。评价者在收集了学生学业发展的相关资料之后,若想以等级形式表示,就需要按照一定的标准,对这些资料进行相应的价值判断,表示其价值判断的结果。因此,等级评价在日常操作过程中,较少存在误将事实判断作为价值判断的情况。

二、分数评价和等级评价的辩证关系

合理的考试评价制度能够发挥考试的积极作用,客观、科学地反映教师教和学生学的效果。分数评价和等级评价是最基本的考试评价,二者既有区别,也有联系。

1.二者的区别

一是表现形式不同。分数评价只能用数字形式表现,等级评价则是用序数词表示,或者用与序数词等价的其他符号表示。其表现形式不同的重要原因之一是区分度的不同。分数评价将学生的学业成就按照不同满分制的大小划分成99、119或149等区间,每个区间的间隔很小,区分度很高。而按照教育部发布的《加强义务教育学校考试管理的通知》,等级评价分为4-5个等级,[6]学生的学业成就分布在3到 4个区间,每个区间的间隔很大,区分度显然更低。区分度会影响学生心理状态和评价功能的发挥。区分度越大意味着个体间可被比较的空间越大,也意味着个体之间的竞争加大,必然会形成“分分必究”的形势,从而造成学生较大的心理压力。因此,从义务教育阶段的根本任务和学生身心健康发展的规律出发,学生的考试成绩应实行等级评价,从而在一定程度上减轻学生的心理压力,形成健康完整的人格,为学生终身学习和发展奠定良好的基础。而高中及以后的教育开始具有竞争性,此时学生的身心发展更为成熟,对压力有一定的承受能力,采取分数评价或者等级数更多的等级评价更为适合。

二是在作用发挥的偏向上存在差异。分数评价和等级评价可以对已存在价值和超前性价值做出相应的判断。对已存在价值的判断称之为鉴别,对超前性价值做出判断叫做引导。换而言之,鉴别和引导是评价最基本的功能。鉴别是指对学生一学期或者一学年学业成就表现好坏的价值判断。引导是发现学生的潜能或错误,引导学生不断发展。虽然分数评价和等级评价都具有评价最基本的两大功能,但二者在基本功能上有不同的偏向性。分数评价更偏向鉴别。由于其区分度更大,对于鉴别不同学生学业成就方面的作用更为明显,即能够区分学生之间的很小差异。当学生看到与他人的差距,可能会激发其学习的积极性和主动性;但如果学生过于重视这种分数差距,则会阻碍其全面发展。由于等级評价更偏向引导,在很大程度上将减少学生因“唯分数”评价带来的较大心理压力,弱化分数评价的鉴别的功能,从而更好地促进学生的全面发展。等级评价的低区分度可为学生横向多样发展提供更多机会。当教师和家长不会因为提高几分而让学生将大量时间和精力花在重复练习上,学生就有更多机会发展多方面的爱好。同时要认识到,尽管分数评价和等级评价各有偏向,但不意味着就完全忽视了另外一种功能。808F3603-761A-4274-87F9-9FFD0A26D1E6

三是适用学段和内容存在差异。在不同的阶段实施不同评价,与各阶段教育的性质有关。基础教育面向全体学生,关注每一位学生的全面发展,要为学生健康成长和终身幸福服务。其考试评价应体现以学生健康发展为本的理念,体现非选拔性、非竞争性的价值。因此,等级评价更适用这一阶段的教育。等级评价是合格性评价,而不是具有竞争性的顶线评价。等级评价的模糊性也可以进一步弱化学生之间的非良性竞争。高中及之后的教育,不仅要强调学生自身的发展,还强调学生对社会的适应,为未来职业打好基础。特别是高中阶段,学生要考虑升入更高级别的学校获得发展机会,开始具有了真正意义上的竞争性。通常这一阶段的学生的心理承受能力也比基础教育阶段更强,因此,这一阶段的教育更适合采取分数评价,利用其较精确的区分度,鉴别顶部人才。此外,不同教育内容适用的评价类型也不一样。在认知领域,主要考察学生对知识的记忆、理解和应用,可以采取标准化测验的方式,实施分数评价更为便利。在情感、态度和价值观领域,很难用客观量表加以测量,更适合采取观察、访谈等方式获得数据并进行等级评价。

2.相互联系

一是同为活动结果的表达符号。任何教育活动的结果都需要使用一定的符号加以表示才能够进行交流。分数和等级是评价者用以表示学生在学业成就活动中表现结果的符号。用分数这种符号类型表示结果的评价称为分数评价,用等级这一符号形式表示结果的评价是等级评价。二者是都是考试结果的价值判断,对同一考试既可以采取分数评价,也可以采取等级评价。二者具有一致性,只是表达形式存在差别。

二是都具有提供反馈的作用。提供反馈是为了便于促进教师改进教学,引导学生反思和努力方向。作为考试结果的价值判断,其最基本的目的是通过评价将学生学习情况反馈给师生。对教师来说,这些反馈便于他们采取相应措施,调整教学计划、改变教学策略,从而确保教学的有效性和针对性。对学生来说,如果评价结果较好并与预期一致,将会增强学生学习的积极性和自我效能感;如果评价结果较差或与预期不一致,则会促使学生反思,调整学习进度、巩固所学内容等。

三是相互渗透与转化。在同一考试评价中,可能会同时出现分数评价和等级评价。例如,“3+3”新高考中即存在语数英三门按照原始分数的表示,也存在其他任选三门课等级赋分法中的等级与分数评价相结合的评价方式。可见分数评价和等级评价可以相互渗透,发挥出组合优势,从而使教育评价体系得到优化。二者还可以按照一定的标准相互转化。有些评价结果用等级评价呈现效果更好,但在收集原始数据时更适合采取分数评价,这就需要将分数评价结果进行转换。例如,一些学校会结合学生平时表现与其自评、教师评价和同学互评,对学生品德发展的总体表现打分,再按照不同分数段,以“甲乙丙丁”四个等级呈现。而当对学生某方面的评价分为若干项目,每个项目又采取等级评价时,则需要采取将等级折算为分数,再将各项分数相加的方式,从而获得总体分数。

三、分数评价和等级评价相互配合的策略

1.聚焦教育本质

任何教育活动都应遵循教育的本质,即有目的地培养人,使人朝着真善美的方向发展。无论实施分数评价还是等级评价,评价者都要关注到人。如果评价是为了衡量学生发展的程度,发现学生发展过程中遇到的问题,挖掘学生发展的潜能,就不容易出现以往“见分不见人”的现象,转而更关注学生的全面发展。学生的全面发展是长期的、持久的,聚焦教育本质的评价活动应更具有全局性,能够破除当前教育评价存在的短视化、功利化的问题。因此,当考试评价聚焦于教育本质时,无论分数评价和等级评价以何种方式配合,都能够因为始终关注人的健康发展而不至于偏离航道。

2.重塑考试评价的认知

在应试教育的背景下,很多人会割裂、忽略或否认分数评价和等级评价的关系。在提倡素质教育的背景下,多数人都能认可用等级评价取代分数评价。在提倡效率的时候,多数人会赞同实行分数评价。考试评价改革不是要打倒一个另立一个,而是需要发现两种评价的辩证关系。因此,在评判以往考试评价时,要保留其蕴含的合理成分,并加以发扬和改造,使其能够融入新的评价体系。考试评价应不断在修正中发展和完善。评价主体要以自组织的而非机械的眼光看待考试评价。

3.结合评语的评价

分数评价和等级评价的表现为“孤零零”的数字或等级,在没有相应说明的情况下,学生和家长仅能从中获得很少的信息,甚至会感到疑惑。因此需要教师提供相应的评语,尤其是在较低年级。其中,分数评价最容易让家长认识不清晰,因为人们对分数普遍存在一种固定的刻板印象,如九十分以上代表优秀,八十分以上是良好,六十分以上是表现一般,其他则是表现不好。但分数评价的结果会受到测验难度的影响,导致实际分数与常见的优劣判断不一致,即有时九十分不一定表现很好,不及格的分数不能代表很差。在这种情况下,只看分数就难以发现问题。“双减”背景下,提倡在中小学实行等级评价,那么,当结果只是在成绩单上呈现等级,必定有很多家长和学生不能理解其含义。因此,应以分数和等级评价结合,再辅以相应评语,对分数进行解释,指出学生的问题,并鼓励学生不断进步,才能使评价对学生发展发挥更大帮助。

4.引进人工智能,赋能考试评价

传统考试采取抽样方式选择测验内容,并不能涵盖全部教学内容。以标准化测验检验学生的收获,并由教师进行评价,不可避免地具有延时性,因此评价活动的效率较低。利用人工智能与教育评价融合,将会极大地改善传统考试评价的弊端,考试内容将实现全样本覆盖,其所体现的也不再仅包括智育方面的信息,还可以更加多维,评价过程也更具情境性、真实性、智能化,对学生的反馈更即时。人工智能的加入将会最大化地发挥分数评价和等级评价的优势功能。

参考文献

[1]中共中央办公厅 国务院办公厅印发《关于进一步减轻义务教育阶段学生作业负担和校外培训负担的意见》[EB/OL].(2021-07-24)[2022-2-25]http://www.gov.cn/zhengce/2021-07/24/content_5627132.htm.

[2]冯平.评价论[M].北京:东方出版社,1995:3.

[3]刘国本.教育评价学概论[M].北京:人民教育出版社,1995:22.

[4]江传月.评价的认识本质和真理性[M].广州:中山大学出版社,2005:140.

[5]刘五驹.“百分制”向“等级制”变革中的评价理念误区[J].江苏教育学院学报(社会科学版),2005(06):22-23.

[6]教育部辦公厅关于加强义务教育学校考试管理的通知[EB/OL].(2021-08-30)[2022-3-20]http://www.moe.gov.cn/srcsite/A06/s3321/202108/t20210830_555640.html.

(责任编辑 郭向和   校对 姚力宁)808F3603-761A-4274-87F9-9FFD0A26D1E6

猜你喜欢
价值判断双减人工智能
“双减”出台,校外培训面临巨震
省教育厅基础教育处一行到莒县开展“双减”工作专项调研活动
持续推动“双减”,强化学校育人主阵地作用
苹果园实现化肥农药“双减”的路径选择
2019:人工智能
人工智能与就业
数读人工智能
量刑的价值判断及公正量刑的实现途径探析
浅谈刑法学中五个关系的研究
下一幕,人工智能!