实施我国中小学生阅读素养测评之研究

2017-06-15 06:23刘雪燕

现代语文(学术综合) 2017年5期

刘雪燕

摘要：本文以PISA、PIRLS、蓝思测验等一系列国际阅读素养测评项目为参考，从确定中小学生阅读目的与阅读能力标准、进行阅读分级的必要性、测评框架的设计、测试文本的选择以及测试题型安排等方面对开展适用于我国小中学生实际情况的阅读素养测评研究提出一些看法。期望为读者提供对阅读素养测评的一定了解，有助于未来以有效的方式关心学生的阅读能力发展。

关键词：阅读素养测评阅读能力标准测评框架

近年来，诸如国际学生评估项目（PISA）、国际阅读素养进展研究（PIRLS）等国际阅读素养测评项目引起了广泛专注，无不显示国际社会对学生阅读素养的重视。经济合作与发展组织（OECD）也于今年12月6日发布了PISA （2015）测试结果。在最新的PISA成绩报告中，中国大陆由北京、上海、江苏、广东等四个省市共同组织参加的PISA测试成绩，相比前两次仅由上海市参加的PISA测试成绩（均列榜首），排名大幅下降，阅读测试排名更是下降至第27名，相较于亚州其他国家的阅读成绩排名低了很多。我国语文教育一向十分重视阅读教学，以培养学生阅读能力为重，但经由此次的PISA测试结果来看，这种“特殊优待”并未发挥应有的成效。预期的阅读教学目标尚未达成，学生尚未具备相应的阅读能力。

PISA等国际阅读素养测评项目，毕竟与我国学生在表达方式、思维模式以及文化背景方面存在一定的差异。故当务之急是应以PISA等国际阅读素养测评项目为参照，自主研发开展适用于我国小中学生实际情况的阅读素养测评研究，透过阅读素养测评所获得的反馈信息，更为真实地了解我国中小学生阅读过程中的困难所在，调整阅读教学的步调、方法或采取某些补救措施，以作为语文教学上的参考。学生自己也可以借此进行自我评价，提高阅读动机，并能自行补救阅读时的缺失以找到最佳的阅读策略。

一、确定阅读目的与阅读能力标准

（一）阅读目的与阅读能力标准的重要性

研究相关文献不难看出，国际社会对于学生阅读素养的评价，已不仅仅聚焦在语文阅读之上，而是把阅读作为一种基础性工具，用来学习其他学科、为未来生活做准备以及参与公共活动。体现了一种“大阅读观”。例如PISA，就已根据阅读目的的不同，将阅读情境分为个人的、公共的、职业的、教育的四种不同类型。而PIRLS阅读素养进展研究也根据阅读目的的不同，将阅读情境分为“为文学体验而阅读”和“为获得和使用信息而阅读”两种不同类型。关于学生阅读目的的确定，应该予以自觉而明确的显示，在讨论清楚这种目的得失的基础之上，才能进一步研究应培养学生的哪些阅读能力、如何培养以及如何测评等一系列的问题。

此外，关于阅读能力标准的表述也将直接关系到阅读课程实施的有效性及评价的合理性，我国语文课程标准中有关阅读部分的标准反映出了结构化与逻辑性不强、表述模糊等特点。按照“字、词、句、段、篇章”这样传统教学逻辑编排的学段目标，并不能作为学生阅读能力培养的逻辑框架。同时语文课程标准大多以主观化、随意化和理想化的描述性语言，如“了解”“理解”、把握“、体会”等，这类语言很难体现出学生阅读水平层次上的差异性。而这一旦落实到语文阅读教学中，就会导致语文教师对阅读能力标准的诠释和建构各不相同，造成教学上的困扰。因此，只有在明确阅读目的，建立简单、清楚、容易应用的閱读能力标准的基础之上，才能使阅读能力测评真正落实到语文阅读教学。

（二）如何确定阅读目的与阅读能力标准

首先应进行大量的文献分析，归纳出阅读能力测评的框架，依据此框架针对义务教育语文课程标准、我国港澳台地区阅读能力评价指标、美国国家教育发展评价标准之阅读能力评价指标（NAEP）、发展性阅读评估之阅读能力指标（DPA）、PIRLS阅读能力评价指标、PISA阅读能力评价指标等，分析其共性与个性，归纳出适用我国中小学生实际情况的阅读目的以及阅读能力标准初稿。

其次应针对拟定的阅读目的以及阅读能力标准初稿，进行小组焦点座谈以及专家访谈。在小组访谈过程中，可以邀请10名左右阅读教学经验丰富的中小学语文教师进行小组座谈；在专家访谈过程中可以邀请5名左右目前正在进行阅读相关研究的大学教授或研究人员进行访谈。访谈内容以拟定的阅读目的以及阅读能力标准初稿内容各项标准逐一检视，针对教师不同意的部分进行讨论，根据教师们的意见将标准初稿修改为修订稿，并请专家针对修订稿提出修改建议，最后再跟据专家的建议修订标准成定稿。

我国台湾地区已就阅读素养测评做了很多的研究和实践，以下是其经反复研究后制定的阅读知能指标：

不难看出，台湾地区有关阅读素养的测评，参考了不同阶段学生的学力特点，主要以考核其文字理解与词语辨析、文艺理解与大意摘取、统整要点与灵活运用、内容深究与作品感受等向度，进行评量。这一系列的测评原则，体现了其国语课程对能力标准的重视，更体现了对采用客观与科学的测评工具的要求。我们在制定阅读能力标准初稿的时候可以此为重要参考之一。

二、阅读分级以及测评框架的设计

（一）阅读分级的必要性

阅读分级“就是指根据少年儿童的年龄大小、思维特点、社会化程度等方面，甄选出适合不同年龄段少年儿童阅读需求的读物并提出如何阅读的一种阅读指导方式”。[1]即根据学生阅读能力水平的不同，将读物分为不同难度等级。目的是让学生的阅读能力与文本难度等级进行很好的匹配，让学生都能达到尽可能大的发展。

阅读分级的重中之重就在于如何分级，对学生和读物进行分级，需要经过专业机构和研究人员的反复研究，才能保证分级具有标准性与科学性。如何进行分级，国外阅读专家们经过多年的探索与实践研究，已形成了较为完备的分级方式。“大致可以分为字母表体系、年级体系、数字体系。字母表体系中应用比较广的是：A—Z分级法：（Guided Reading Level，GRL），即按照26个字母顺序将图书分成26级，图书的难度随着字母表顺序逐渐增加；年级体系如年级等量法：（Grade Equivalent Level，GEL），即根据年级、年龄判断应有的阅读水平；数字体系方式最多，如蓝思（Lexile）、阅读发展评价体（Developmental Reading Assessment，DRA）、阅读数量分级体系（Reading Counts Level，RCL）、阅读校正体系（Reading Recovery，RR）等，都采用具体数值对阅读能力量化计分，学生通过自己的测验分数来确定目前的阅读水平。”[2]

以在美国应用最广，公信力为最大，且对我国阅读分级研究影响最大的阅读分级方式——蓝思分级为例，蓝思分级包括两种蓝思测量：读者蓝思测量和文本蓝思测验。前者用于检测学生的阅读能力，后者用于确定文本的难度等级。旨在两者的共同作用之下，帮助读者选择难度等级与自己阅读能力相匹配的读物。值得注意的是，尽管蓝思官方公布了具体年级对应的蓝思值即该年级学生应达到的阅读能力水平，但在实际测验中，蓝思测验与年级水平并没有直接的对应关系。蓝思测验没有将所有的同一年级学生都设定在同一阅读水平之上。在同一班级内会有不同的阅读能力的学生和不同难度等级的阅读材料。不管学生的阅读能力处于什么水平，蓝思测试都尽可能做到了学生与读物的匹配。

我国的阅读分级起步较晚，且大多还是围绕年龄段进行，但事实证明同一年龄学生的阅读能力水平还是具有较大的差异的。而国外的阅读分级则更多参照阅读能力进行，这种对阅读的重视和阅读分级的理念是我们进行阅读分级研究时应该借鉴的。

（二）阅读素养测评框架的设计

阅读素养测评可包括阅读理解测验和问卷调查两部分。例如：PISA根据其阅读能力评价指标设计的阅读素养测评框架就如下表所示。

考虑到我国的阅读素养测评以阅读分级为基础面向全体中小学生，故应根据阅读分级不同对阅读理解测评基本框架作相应的改动。尽管纸笔测验实施起来较为方便，且容易操作，但通过这种方法只能知道学生阅读的结果，并不能有效地了解学生的阅读思维模式，所以也可根据具体情况选择问答方式进行测评。以一问一答的形式，了解学生的阅读思维方式以及阅读能力，进行综合评分。

除学生需要作答的阅读理解题目外，还可参照PISA、PIRLS等测评项目，通过设计面向学生、家长、学校、教师及课程等的多种问卷，来了解学生基本个人资料以及阅读态度、家庭阅读环境、教师阅读教学、学校阅读教学政策、整体阅读课程安排等阅读条件、环境与学生阅读成就之间的关系。以其详细调查结果，作为改善阅读教学及促进学生阅读能力的重要参考，提出需要改善的方面和做法。例如：PIRLS（2016）的调查问卷框架就如下图所示。

当然在保持调查问卷基本框架不变的基础之上，每次测试，问卷内容维度可根据最新的研究成果和关注点的不同，进行适当的调整。

三、测试文本选择以及题型设计

（一）测试文本选择

在阅读素养测评工作中，对测试文本的选择是重要的一环。所选文本的优劣将直接影响到学生的实际作答反应，关系到最后测评结果的信度和效度。

PIRLS（2016）阅读素养测评框架对测试文本的选择就作了明确的规定，要求所选测试文章必须保证其文本的可读性，即文本内容需超越国家和地区及文化，具有趣味性、吸引力、清晰性、连贯性，且能评估学生的阅读理解过程，力求达到反映近似学生在校内外的真实阅读经历。故在测试文本选择之前需要搜集整理大量学生在校内外阅读过的文学类和信息类文本材料，以此作为选择文本的参考，而不是选择专门为了测评而撰写的测试文章。同时也需要考虑所选文章本身的阅读难度分级，“形式、字体、内容、文体和风格、字词难度、句子复杂度、概念的密度、一致性，有无插画、印刷风格、字间距、行间距等等，都会影响到读者的阅读速度和对文本的理解”[3]。例如前文提到的蓝思文本测验就以描述文本或文章的语义（单词）和句法（句子长短）特征对文本或文章进行难度分级，但其测量的因素還不够全面，很难反映所选文本的真实内容或质量，尤其是对于像诗歌类的文体蓝思文本测试不能对其进行测量。故我们在进行测试文本难度分级时，因保持对各类文本的敏感性，对不同类型的文本使用不同的分级方式，且要对分级方式进行不断分级，以适应在测评中遇到的实际问题。

（二）测试题型设计

一般来说，阅读素养测评的测试题型主要有两大类，即客观性试题和主观性试题。客观性试题能覆盖的测试点较多，但却无法反映学生的阅读思维过程，故更适合测量学生低层次的阅读能力。主观性试题适合于测量学生高层次的阅读思维过程，但是存在评分者信度问题，容易造成评价客观性的缺失。

例如PISA阅读素养测评题型的客观性试题包括单项选择题、复合式选择题、封闭式问答题三种，主观性试题包括简答题和开放式问答题两种。具体如下表所示。

不管是客观性试题还是主观性试题的设计应该以关注学生在回答问题时会表现出来的阅读思维结构为主。在对学生的阅读能力进行评价的过程中，也应关注于学生使用的口头或者书面语言背后所包含的阅读思维结构的不同水平。这样，才能更加充分地发挥不同测试题型的功能。

四、结语

关于实施我们中小学生阅读素养测评的工作任重而道远。在实施过程中必须坚持其评价的理念、框架和宗旨，以便对中小学生阅读素养的发展趋势进行长期跟踪研究，同时也要不断更新改进其具体的维度、内容和方式，力图对最新研究成果和现实需求作出及时回应，使我国的阅读素养测评体系更加完善，更好地达到实施阅读素养测评的意义。

注释：

[1]王泉根：《新世纪十年“儿童阅读运动”综论》，学术界，2011年，第06期，第223-237页。

[2]李欣：《美国中小学生阅读分级研究，上海：华东师范大学硕士学位论文，2016年。

[3]李欣：《美国中小学生阅读分级研究》，上海：华东师范大学硕士学位论文，2016年。

参考文献：

[1]张所帅.PIRLS2016阅读素养评价新动向[J].教育科学研究，2016，（09）：48-51，58.

[2]罗丹.“PIRLS”视野下小学生阅读测评研究[J].语文建设，2015，（16）：55-58.

[3]王泉根.新世纪十年“儿童阅读运动”综论[J].学术界，2011，（06）：223-237.

[4]李欣.美国中小学生阅读分级研究[D].上海：华东师范大学硕士学位论文，2016.

[5]倪文锦，欧阳汝颖主编.语文教育展望[M].上海：华东师范大学出版社，2002.

[6]滕梅芳等编著.面向未来国际学生评价项目PISA启示[M].上海：上海教育出版社，2010.

[7]蒋德仁编著.国际学生评价（PISA）概说[M].杭州：浙江教育出版社，2012.

[8]何瑞珠，卢乃桂编著.从国际视域论析教育素质与平等PISA的启示[M].北京：教育科学出版社，2011.

[9]国际学生评估项目中国上海项目组著.质量与公平上海2009年国际学生评估项目（PISA）结果概要[M].上海：上海教育出版社，2013.

现代语文(学术综合)2017年5期

现代语文(学术综合)的其它文章: 陈景韩对翻译作品的归化; 关于现代汉语语音章实践性教学的一些思考; “纸杯”的思维误导; 广西汉语方言词汇研究综述; 浅论传统词典常用词义项的补充; 辽宁省犯罪隐语刍议