以评价改革推动科学精神培养

2017-10-12 21:15赵德成
中国德育 2017年18期
关键词:效度菊花开花

如果评价与考试没有相应的改进,所编制的测验题目不能有效考察学生的科学精神,自然也就无法发挥其导向、诊断与发展性功能。只有教育者高度重视科学精神的评价研究,以评促教,才能切实推动教师教学方式的变革,强化科学精神的培养。

科学精神是人类通过自身科学技术获得而产生的对客观世界的观点和看法,是一种理性思维的世界观和方法论。有研究者将科学精神概括为客观的依据、理性的怀疑、多元的思考、平权的争论、实践的检验与宽容的激励等。[1]近些年来,随着第9次中国公民科学素养调查与PISA2015科学素养测试结果的公布[2],以及中国学生发展核心素养框架的颁布,科学精神培养逐渐成为基础教育领域的热点问题。国家要提升青少年学生的科学精神,必须统筹课标、教材、教学、评价、考试等多个環节。如果评价与考试没有相应的改进,所编制的测验题目不能有效考察学生的科学精神,自然也就无法发挥其导向、诊断与发展性功能。只有教育者高度重视科学精神的评价研究,以评促教,才能切实推动教师教学方式的变革,强化科学精神的培养。

通过中考生物题探讨科学评价的重要性

义务教育生物课程标准(2011年版)指出,“生物科学不仅是众多事实和理论的汇总,也是一个不断探究的过程。科学探究既是科学家工作的基本方式,也是科学课程中重要的学习内容和有效的教学方式。”[3]3所以,生物课程高度重视科学精神培养,在教学中倡导探究式学习,提高学生探究能力。具体来说,探究活动包括提出问题、作出假设、制订计划、实施计划、得出结论、表达与交流等多个环节。(见表1)[3] 9

表1较为清晰地界定了探究能力的成分与基本要求,也在一定程度上表明了探究能力培养的预期成果,为教师教学指出了明确的方向。为评价学生生物探究能力,某市在中考生物试卷中设计了这样一道题:

菊花一般在秋天开花。影响菊花开花的生态因素是什么?科学兴趣小组对“菊花是否开花与日照长短的关系”进行了探究。

(1)作出假设:———;———。

(2)进行实验:取十盆大小、长势都差不多且未开花的菊花,放在其他环境条件都适宜且相同的地方,其中五盆放在日照时间短的地方,另五盆放在日照时间长的地方,经过一段时间后,观察开花情况。该实验的主要变量是———;———。

(3)如果他们的假设成立,观察到的现象应该是————————。

不难看出,这道题目意在考察学生提出假设与制订实验计划的能力,但实际上它的效度不甚理想。效度是高质量评价的首要条件。一道测试题,或者一套测评方案,只有其效度良好,才能创造好的评价。如果测试题目效度不良,即使其信度、难度、区分度等其他指标都合乎测量学要求,也没有什么实质意义,也不是好的评价。[4]效度分析的一种常用方法是“出声思考”,具体做法是让学生在解题过程中将自己的思考和解题过程“出声”说出来,分析者可以从中发现学生解题时应用了哪些知识、技能、经验或能力,在这些成分中,哪些是解题的关键、哪些属于意欲测量的内容、哪些已经超出了评价范围,从而判定结构效度的好坏。对本题采用“出声思考”方法进行分析发现,这里没有理性的怀疑,也没有多元的思考,学生根本不需要对影响菊花开花生态因素进行猜想和假设,只需要将题干中“菊花是否开花与日照长短的关系”转述成“菊花开花与日照长短有/没有关系”即可,所以评价者不能考察到学生做出假设的能力。同时,在第(2)小题中学生要从题干给定的实验设计中辨别出主要变量,尽管它涉及实验的理解,但也并不能有效考察学生制订实验计划的能力,学生不需要考虑“客观的依据”和“实践的检验”。

效度不良的评价题目不仅不能有效判断学生的能力发展,而且无法发挥积极的导向作用。评价是指挥棒。评价评什么,教师就教什么,学生就学什么;评价怎么评,教师就怎么教,学生就怎么学。如果生物、物理及化学等学科的中考命题都不能有效考察学生的科学精神,只是考察科学知识(包括事实性知识与程序性知识)的理解和记忆,那么要指望教师在日常教学中落实科学培养就会十分困难。

从这一意义上来说,教育者必须高度重视评价研究,使评价成为助推学校科学教育变革的一个突破口。

借鉴PISA项目经验改进科学评价

PISA项目是由世界经济合作组织统筹实施的一项跨国学生学业成就评价研究,旨在评价参与国家/经济体15岁青少年是否掌握参与社会所需的知识与技能。PISA测试每三年实施一次,测试内容涉及科学、数学和阅读,但每次测评都有不同的侧重点。PISA2015测试重点是科学素养。PISA2015将科学素养界定为一个具有反思能力的公民运用科学知识参与科学相关事务的能力。具体地说,科学能力被区分为“科学地解释现象”“评价和设计科学探究”“科学解读数据和证据”等三种能力[5],这些都是科学精神的核心要素。

为确保每一道评价题目的效度,命题者在题目开发过程中通常采用以下程序 [6]:(1)最初准备:根据细目表编制题目;(2)试题审查:从学生及编码者的视角对题目进行审查;(3)认知性访谈:让学生回答问题,在回答过程中“出声思考”,在答题结束后辅以个人访谈和小组访谈;(4)试点测试:在考试情境中试测,进一步分析题目结构效度。这种通过多个环节、多个视角、多种方法收集效度证据的方式,虽然成本较高,但能确保题目的结构效度,在大规模、高利害评价项目中十分必要。

正是因为有了这些严格的分析与审查程序,PISA科学测试题目的效度都比较好。以下是一道PISA科学测试样题。[7]本题目最初由我国台湾地区台南大学研究人员翻译,这里根据大陆语言习惯有所修改。

阅读下列短文,并回答下列问题。

灭蝇

有个农民在农场担任奶牛的管理工作。牛圈里苍蝇很多,影响了动物健康。所以,农民用含有“杀虫剂A”的溶液喷洒牛圈和奶牛。这种杀虫剂几乎杀死所有的苍蝇。然而,过了一段时间,又出现很多苍蝇。于是,农夫再度喷洒一次这种杀虫剂。这次的喷洒效果,与第一次喷洒的效果相似,虽没有杀死全部苍蝇,但让大多数苍蝇死亡。再过一段时间,苍蝇又来了。于是,农民又再一次喷洒杀虫剂。这样的事情一再发生,总共喷洒了五次杀虫剂。结果很明显,杀虫剂A杀死苍蝇的效果越来越差。农民注意到了他的喷药过程,他先配好一大瓶杀虫剂溶液,这五次喷药都用这一瓶溶液。因此,杀死苍蝇效果越来越差的可能原因,农民提出的解释是:杀虫剂因存放时间过久而分解。endprint

问题1:农民提出的解释是:杀虫剂A因存放时间过久而分解。如何验证这个解释?请简要说明之。

问题2:为什么“杀虫剂A杀死苍蝇的效果越来越差”,农民的解释是:杀虫剂因存放时间过久而分解。除了农民的解释之外,请你提出两个不同的解释。

这道PISA样题与前文提及的中考题同样是生物题,同样是在考察学生提出假设与制订实验计划的能力,但效度明显优于中考题者。在问题1中,学生需要采用控制变量法设计实验以验证农民提出的假设。如果学生在控制苍蝇品种及其暴露经验的条件下,考察新配置杀虫剂与配制后存放一段时间后的杀虫剂的灭蝇效果,就可以得到满分。如果学生仅控制一个无关变量,或者没有设置对照组,就只能部分得分。这里考察了学生提出实验计划的能力,是科学精神、探究能力的核心。在问题2中,学生需要提出新的假设,比如“苍蝇对杀虫剂A产生耐药性”,或者“杀虫剂溶液存放过程中化学物质上升到溶液的上层,而下层主要是稀释用的水”。这里考察了学生依据生物和化学所学知识进行大胆假设的能力。

只有题目的效度有保证,能有效考察到欲考察的特质,才能对学生的素养或表现做出准确的判断,才能强有力地引导教师的教与学生的学。如果中高考在相关学科命题中仅仅考察学生实验操作、实验理解、仪器整理、数据记录等低水平技能,那么教师在日常教学中就可能只是实验演示和实验操作;而如果中高考命题聚焦科学精神,考察学生“科学地解释现象”“评价和设计科学探究”,以及“科学解读数据和证据”等复杂能力,那么教师会更加重视探究式教学,培养学生的质疑意识、探究精神以及批判性分析能力,学生的科学精神将有明显提升。

近些年来,我国部分省市已在中高考命题中有意识地借鉴PISA项目经验,加强表现性评价的应用,考察学生在真实生产生活情境中探究、分析和解决问题的能力,取得了一些积极的进展。[8]但必须承认的是,由于我国测验与评价研究相对滞后,教师、教研员及命题者都缺乏相关培训,不少命题考察的仍然是孤立的知识与技能,没能有效考察到学生的探究能力与科学精神。评价与考试研究亟待进一步加强。

如何通过评价改革推动科学精神培养

评价已成为制约我国科学教育的“瓶颈”。加强命题与考试研究,加大评价改革力度,势在必行。只有评价任务能引发学生的科学精神表现,使科学精神中的重要成分成为解题的关键,确保评价效度,才能充分发挥其导向、诊断及发展性功能,推动实践中科学精神的培养。

以前文提及的中考生物題为例,将这道生物题稍加改进,就可以提高其效度和对实践的影响力。题目可以这样改进。

菊花一般在秋天开花。观察发现,校园里摆放的盆栽菊花开花有早有晚,影响盆栽菊花开花早晚的生态因素是什么?请提出两个假设。如果你想到的不只两个,可以多写。

(1)假设1:—————;(2)假设2:—————;(3)假设3:—————。

这道改进后的题目聚焦于“提出假设”,重点考察了学生提出假设的能力。学生基于“菊花一般在秋天开花”这一季节性特点,除了提出“菊花开花早晚受日照时间长短影响”的假设,还可以提出菊花开花早晚受空气湿度、气温等因素影响的假设。而如果学生提出菊花开花早晚受土壤肥力等非季节性因素的影响,则不能得分,因为即使夏天控制土壤肥力,菊花通常还是不会开花。学生在答题中不能脱离季节提假设,反映了生物课程学习的效果,具有积极的诊断意义。

继续对这道中考生物题进行分析与改进,如果意欲考察学生制订研究计划的能力,我们还可以将原来的中考生物题改成如下这样。

就哪些生态因素会影响菊花开花时间早晚,有人提出假设“日照时间是影响菊花开花早晚的一个因素”,于是他设计如下实验:取十盆大小、长势都差不多且未开花的菊花,放在其他环境条件都适宜且相同的地方,其中五盆放在日照时间短的地方,另五盆放在日照时间长的地方,经过一段时间后,观察开花情况。

(1)在这个实验中,实验变量是——;(2)两组菊花“放在其他环境条件都适宜且相同的地方”,这里所说的其他环境条件主要指什么?请列举两个以上。(3)这个实验设计好不好?请说明理由。

这道改进后的题目聚焦于实验设计能力,重点考察学生理解与评价实验计划的能力。特别需要指出的是,在本题中,我们没有要求学生制订实验计划,而是要求学生评价一个实验计划,这种命题不仅减少了阅卷的工作量,克服了评分的主观性,而且较好地评价了学生实验设计的能力。深度分析发现,本题中的实验设计还存在多个亟待改善的问题,主要有:(1)无关变量控制得不好。本实验控制了菊花的大小与长势,以及除日照长短之外的“其他环境条件”,但没有控制菊花的品种,如果实验组菊花是A品种,而对照组菊花是B品种,这一实验无法验证前面所提的假设,实验的内在效度不好;(2)样本量不够。在本实验中,实验组和对照组的菊花只有5盆,样本量太小,结果出现偏差的可能性增大。正如要比较某两个地市教师的普通话水平,如果仅从两个地区分别随机抽取5名教师进行测评,其结果的可信程度不会很高。(3)对照组数量偏少。要有效考察日照时间对菊花开花早晚的影响,仅有实验组和对照组各1个可能难以验证假设。比如,实验组日照时间为每日180分钟,对照组日照时间为每日170分钟,可能两组菊花的开花时间没有显著差异。如果在实验中设计多个组别,日照时间有多种不同的安排,这要比原有实验能更好地验证假设是否成立。

可以想象,如果第一次采用上述改进后的题目考初三学生,其表现可能不会很理想,但如果第二年再采用类似考题,学生们的科学精神一定会有明显提升,因为在两次考试之间教师的教以及学生的学会因新兴考试方式而改变。

评价改革应成为未来我国青少年科学精神培养的突破口。为此,我们建议加强中高考命题改革。中高考是一种高利害评价,对基础教育具有强有力的导向作用。有关部门和机构亟需借鉴国际经验,特别是PISA项目、国际数学与科学教育成就趋势调查等大规模教育测评项目的经验,加强命题研究,加大考试改革力度,通过改进评价“倒推”教学实践的变革,引领科学精神的培育。同时,地方教研机构与中小学也要在日常教研活动中深化评价研究。评价是教学的有机组成部分。在以往教研活动中,教师通常将研讨重点放在“如何教”上,对“如何评”的研究明显不足。在未来,教研员要指导教师将教研重点转向“如何评”。具体到物理、化学或生物等学科的教研活动中,教师要针对如何操作化定义科学精神、如何确保任务情境的真实性、如何提高评价效度等相关问题,结合具体教学内容开展深入研究,提高教师的评价技能,以评促教,推动教师教学方式的变革,切实提高青少年的科学精神。

参考文献:

[1]胡业生.科学精神到底是什么[EB/OL].(2009-09-14)[2017-08-03].http://blog.sciencenet.cn/blog-40486-255593.html.

[2]赵德成,郭亚歌,焦丽亚.中国四省(市)15岁在校生科学素养表现及其影响因素:基于PISA2015数据的分析[J].教育研究,2017,(6):80-86.

[3]中华人民共和国教育部.义务教育生物课程标准(2011年版)[S].北京:北京师范大学出版社,2011.

[4]赵德成.促进教学的测验与评价[M].上海:华东师范大学出版社,2016.73.

[5]OECD.PISA 2015 Results:Excellence and Equity in Education(volume I)[EB/OL].(2016-12-30)[2017-08-03].http://www.oecd-ilibrary.org/docserver/download/9816061e.pdf?expires=1483280245&id=id&accname=guest&checksum=D39C0E18E2F8868D25A19515684F3A68.

[6]张雨强,张志红.PISA2006 科学试题的设计和开发及其启示[J].外国教育研究,2011,(2):59-65.

[7]台湾PISA研究中心.科学样本试题(中文版)[EB/OL].(2015-07)[2017-08-03].http://pisa.nutn.edu.tw/sample_tw.htm.

[8]杨帆,吴成军.四十年来生物高考的历程、特点与展望[J].课程教材教法,2017,37(1):82-88.

【赵德成,北京师范大学教育学部,副教授,博士生导师】

责任编辑︱黄蜀红endprint

猜你喜欢
效度菊花开花
校企融合背景下,思政教师在职业生涯规划教学中的效度探索
我真的很擅长睡觉
谈高效课堂下效度的提升策略
巧用模型法提高科学课堂教学的效度
词语开花
屁股开花
计算机辅助英语测试研究
秋天的菊花