TIMSS-A2008物理学业成就评价分析及其启示

2014-06-28 02:27熊建文
物理通报 2014年5期
关键词:基准成就课程标准

傅 娇 熊建文

(华南师范大学 广东 广州 510006)

1 引言

TIMSS(Trends in International Mathematics and Science Study)是国际数学与科学成就发展趋势研究,是由IEA(The International Association for the Evaluation of Educational Achievement)国际教育成就评估协会实施的一项国际比较研究项目[1].它包含两大系列的学生学业成就评价,一系列是以四年级和八年级学生为研究对象进行数学和科学学业成就评价,每隔4年进行一次;另一系列是以各国中学阶段最高年级学生(一般为十二年级)为对象进行数学和物理学业成就评价,分别在1995年和2008年进行了评价.TIMMS系列研究不仅受到各国教育界的高度重视,还在一些国家掀起教育改革的浪潮.

TIMSS Advanced 2008,简称TIMSS-A 2008是对中学阶段最高年级学生进行的数学和物理学业成就评价,这些学生的数学和物理学业成就关系到学生升学和未来发展,同时也关系到一个国家的科学能力以及经济生产力[2].通过TIMSS-A 2008测评,参与国可以知道本国学生在国际背景下的学业成就,并由此改善教育政策和教学实践.本文在TIMSS-A 2008物理学业成就评价框架的基础上,分析了测试试题特点及其评分标准,以期对我国基础教育的学业成就评价提供借鉴和参考.

2 TIMSS-A 2008物理学业测评框架

TIMSS-A 2008评价框架是在各参与国物理课程标准的基础上,由TIMSS&PIRLS研究中心经过广泛讨论,反复修订与审议后才确定下来,框架对评价的内容范围和认知能力进行了统一及详细的说明.

2.1 内容维度

内容维度是对测评内容范围的明确界定,包括力学、电与磁、热和温度以及原子物理与核物理4个主题内容,每一个主题又有对主题评价的具体目标,这些目标表明了测评期望学生在这些内容领域中所要达到的行为要求和能力表现.

例如在电与磁这个主题中,TIMSS-A 2008物理学业成就测评期望学生达到的目标有:

(1)用库仑定理计算孤立带电粒子之间的静电力;预测带电粒子在匀强电场中的受力情况及运动路径;

(2)证明对电路的彻底掌握,包括在简单或复杂电路中对欧姆定律和焦耳定律的应用;

(3)分析带电粒子在磁场中受力情况,证明对电导体、电磁铁和电磁感应周围磁场的理解,应用法拉第电磁感应和楞次定律解决问题;

(4)证明对电磁波的理解,通过波长和频率来识别波的类型.

TIMSS-A 2008物理学业成就测评框架还确定了内容维度各个主题所占的比例.其中对力学和电与磁这两部分内容的测评较多,各占了30%,而热与温度和原子物理与核物理占的比例各为20%[3].

2.2 认知维度

TIMSS-A 2008物理测评不仅仅要对物理内容进行检测,同时还要测评学生所具备的认知技能,在测试物理内容时,要体现出对学生认知能力的评价[4].框架中的认知维度描述了学生应该达到的认知水平.

认知维度分为三个部分:一是理解,指学生对所学物理事实、方法、概念和过程等的掌握;二是应用,指在简单的情景中,学生能应用所学物理知识进行问题表征和问题解决;三是推理,指在不熟悉或是更加复杂的问题中,利用所学知识来解决问题.

每一个认知维度都划分为若干个认知层次,“理解”包括回忆、描述;“应用”有联系、利用模式、找出解决方法以及解释说明;“推理”则包括分析、推广、综合、证明、假设和得出结论.而每个认知层次都有相应的行为描述,例如理解维度中的“回忆”的行为表现为:准确表述科学事实、联系、过程和概念;在相关背景下识别并应用科学术语、符号,缩略符,单位以及数值.

测评中对三个认知能力的考查比例也有描述,具体比例如表1所示.

表1 内容维度和认知维度的百分比

3 对应不同基准等级的物理测评试题

TIMSS-A 2008物理试题的设计是在框架确定的基础上,为了能描述各个分数点的学生成就水平,IEA采用了定锚法制定了三个基准点(国际平均标准分为500分):先进国际基准(625分),高等国际基准(550分)和中等国际基准(475)[5].每个基准都有相应的知识和能力要求,不同的试题由于考查的知识和能力要求不同,就对应不同的基准.

(1)先进国际基准(625分):这个基准要求学生能够把不同物理概念和定律联系起来,并加以应用来解决复杂的物理问题.具体说有以下方面:学生能通过对概念的理解,继而推导、计算来解决问题;能够从图表中提取出有用的数据进而加以利用;对力学概念和定律的应用;复杂电路中的欧姆定律等等.

(2)高等国际基准(550分):这个基准要求学生对基本的物理定律的掌握.包括对竖直方向上的圆周运动、弹簧的压缩、物体碰撞和绳子拉力问题的解决,对原子及其原子核相对尺度的理解,放射性同位素半衰期问题,比热容知识的应用,对声波现象的理解.

(3)中等国际基准(475分):此基准主要针对的是日常生活中存在的一些物理知识,有对自由落体、圆周运动和波动中的基本规律的应用,对热传递、温室效应和压强的应用,读懂简单的电路图,知道不同电磁辐射和波长关系等.

例如题目:一个质量为2.0 kg的物块以2.5 m/s的水平速度向一个轻质弹簧运动,弹簧的劲度系数为800 N/m.当物块撞到弹簧后,物块的速度减小,并且弹簧被压缩.弹簧压缩的最大形变量是多少?(忽略摩擦和空气阻力.)

这个题目在内容主题上是力学的内容,认知层面属于应用,考查的是对物理碰撞和弹簧压缩问题的理解和应用,对应成就水平,它应该归属于高等国际基准范围.

4 测试试题的评分标准

测评中使用了两种试题类型:多项选择题(multiple-choice items)和建构反应试题(constructed-response items).多项选择题的分值为1分,它不需要学生提供解释和支持性陈述,而且不太适合评估较为复杂的解释和评价能力.建构反应试题是没有提供待选项的,需要学生自己建构答案.根据完成试题的性质及所需的技能,建构反应试题的分值为1到2分[1].

多项选择题型和建构反应题型的评分处理方法是不一样的.对于多项选择题型,评价方法比较简单.评分时会用数字1~5来分别表示选项A~E.而数字1~5所代表的分值就由该题目的正确答案决定,例如试题的正确答案为A,则数字1就代表了分值1,其他的数字的分值则为零.这样不仅可以获得学生在该题的得分情况,还可以知道学生选择不同选项的概率,掌握学生整体情况.

学生在解答建构反应题目时,需要自己建构答案.由于每个学生的思维方式不太一样,导致学生的答案会有很多种类型.为了保证评价的标准与公正,每个建构反应题都有一个相应的二维细目表评分指南,用来提供诊断信息和参考答案.在对测试学生进行评分前,TIMSS对评分者还进行了相应的评分培训,保证了评分标准一致.

二维细目表中的一个维度是诊断性代码,另一维是与代码对应的学生对题目的理解和解题情况.评分指南包括了学生正确解题,不完全正确解题以及完全错误的情况,把学生解题时所用的方法、策略或通常发生的错误等以答案样本的形式呈现出来,给评分者提供重要的参考.

以上面出现的例题为例,这是一个分值为1的题目,对应的评分指南如表2.

表2 评分指南

评分指南把学生在解题过程中常出现的情况罗列出来,并用代码表示.评分时,把学生做题情况对应到相应的代码中,这样不仅可以知道学生在这道题中的得分情况,还能了解到学生在解答问题时的思维过程.

5 TIMSS-A 2008物理测评的启示

TIMSS-A 2008物理测评是对中学阶段最高年级学生进行的学业成就评价,这些被试学生很有可能在将来会继续学习物理,在我国与TIMSS-A 2008类似的评价有高考.通过上面的分析介绍,认为有些值得我们借鉴和学习的地方.

(1)加强与课程标准的紧密度,完善考试大纲的内容

TIMSS-A测评框架的制定是以各个参与国的课程标准为基础制定出来的,并且框架内容详尽而清楚,各个考核部分的比例均衡、明确,可以很好地指导测试命题的编制.我国高考考试大纲也是用来指导考试实施和试题编制的,但考试大纲并没能很好的与课程标准保持一致[6].比如有些省的考试大纲就不包括选修3-5的内容,这就导致那个省份的很多高中物理课程不讲授这些内容,这样会阻碍素质教育的实施和课程标准的落实.所以在制定考试大纲之前,我们一定要详细分析课程标准,使考试大纲与课程标准的价值取向相一致.

另外考试大纲对认知能力要求的描述过于简单粗糙,只用两个级别来区分认知水平的要求.考试大纲对内容和能力考核比例没做要求,这就导致历年高考试卷考查的知识广度不够宽,主要集中在力学和电磁学上,对其他内容考查得太少;考查的认知水平也大多还是低水平层次[7].故我们要完善考试大纲的内容,将要考核的内容和认知水平描述尽量详细、明确,使命题者在命题过程中有依可循.

(2)促进评价功能的多样化

我国是考试大国,对物理学业成就评价有很多,但大多测验后只知道学习结果,比如成绩、排名,不会对其进行深入的分析研究,评价后也没有分析学生存在的学习障碍,进而改进教学.这样的评价就失去了其本质,评价不仅要检测学习情况,还应起到诊断、导向等作用.

在我国要发挥评价的多样化功能,首先对于每次评价,我们都要建构相应的评分标准指南.评分指南中可以用代码来区分学生解题情况,常见的正确解题方法和不正确解题方法分别用不同的代码表示,这样每个代码反映了学生的思维方式和水平.按照评分指南进行评分后,统计分析这些代码,就能了解学生解题情况,诊断学生学习障碍,并能根据这些信息从而改善物理课堂教学,实现评价的诊断、反馈功能.其次要培养专业的评价分析人员.对评价结果进行统计分析,诊断学生的学习障碍是个复杂的过程,只有专业的评价者才能正确地分析出学生的情况,诊断学习效果,发现问题所在.另外建立一个完善的反馈机制.反馈机制是能根据评价结果,提出改善教学、促进课程发展的措施.同时可以将历年评价结果进行比较,分析教学实施效果及课程改革的发展趋势,这样能使评价结果得到更广泛深入的研究和利用.

参考文献

1 Alka Arora ect.TIMSS Advanced 2008 Technical Report [EB/OL].http://timssandpirls.bc.edu/timss_advanced/tr.html/,2009

2 Pierre Foy,Alka Arora.TIMSS Advanced 2008 User Guide for the International Database[EB/OL].http://timssandpirls.bc.edu/timss_advanced/idb.html,2009

3 田慧生,王连照.国际学生学业成就评价项目比较研究.教育发展研究,2008(20):37~40

4 Robert A.Garden ect.TIMSS Advance 2008 Assessment frameworks [EB/OL].http://timssandpirls.bc.edu/timss_advanced/frameworks.html, 2006

5 Ina V.S.Mullis,Michael O.Martin ect. TIMSS Advanced 2008 International Report[EB/OL].http://timssandpirls.bc.edu/timss_advanced/ir.html,2009

6 雷新勇.基于标准的教育考试.上海:科学教育出版社,20011.8

7 罗莹,郭晨跃,李勇.高考物理命题的一致性研究及其对物理教育的启示.课程·教材·教法,2012,32(11):105~111

猜你喜欢
基准成就课程标准
落实《义务教育艺术课程标准(2022年版)》的实践反思
了不起的成就
立足《课程标准》优化一轮复习
稳中求进,不断替身
——依托《课程标准》的二轮复习策略
下期要目
应如何确定行政处罚裁量基准
失恋“成就”的CEO
明基准讲方法保看齐
滑落还是攀爬
新课程标准下的语文课堂