动态评估

2018-09-10 07:22高思畅王建勤

华文教学与研究 2018年2期

高思畅王建勤

[关键词] 社会文化理论；动态评估；语言能力评估；汉语作为第二语言

[摘要] 动态评估理论认为，对学习者语言能力的评估不是静态的、单一的结果，而是评估与发展的结合。动态评估的结果可以体现学习者的发展潜力、学习的迁移能力等多方面的状态，而不只是一个静态的测量分数。因此，不同于传统心理测量学方法，动态评估更强调学习者的发展潜力，即学习者现有水平和学习者通过专家、计算机等帮助调节下可以达到的水平之间的发展程度。自1997年社会学转向开端，动态评估已经被广泛地运用于特殊教育、学科教育、心理诊断以及心理康复领域，动态评估在语言评估与测试领域也越来越受到学者、测试开发人员以及教师的关注，然而，在汉语作为第二语言评估领域却鲜有研究。和动态评估相关的已有研究和理论评述中，大多将动态评估认为是另一种形式的形成性评估或档案袋评估，这是对动态评估理论基础与实施方式的误解。动态评估植根于Vygotsky的社会文化理论，本文首先从社会文化理论的视角来解读第二语言能力发展的本质，阐释动态评估的理论构建过程，并通过对动态评估和与之相关的其他重要理论的梳理，解读动态评估的真正内涵。通过对比动态评估和基于心理测量学的传统评估方式，总结动态评估的具体实施方式，以期为汉语作为第二语言研究者和教学实践者提供评估语言能力的新思路。

[中图分类号]H195.3 [文献标识码]A [文章编号]1674-8174（2018）02-0001-012

1. 引言

语言能力的评估一直都是语言测试、语言教学和实证研究中的重要环节，也是人才选拔、等级评定等重要的社会活动之一，自1997年社会学转向（social turn）开端，社会文化理论学派的学者认为应该弱化测试的“考试”作用，而将评与教结合起来，以推动学习者语言能力的发展为目标。因此，植根于社会文化理论的动态评估以评估学习者的发展能力为目标，成为评估语言能力的一种新的理论。语言测试，从传统角度来看是指一种测量活动，通过使用语言测验这样的测量工具来衡量学习者的语言能力。现有的语言测试，如英语四六级、托福、雅思以及汉语水平考试等，大多通过两个方面来考查学习者的语言能力：语言要素知识（如语音知识、词汇知识、语法知识等）和语言技能（听、说、读、写、译等）。传统的心理测量学手段考查的是学习者在某一个阶段、某一个时刻语言能力的体现，在评估过程中尽量避免学习效应的出现。然而，动态评估认为，评估和教学是一个统一的活动，学习者不仅仅在学习的过程中实现发展，在评估的过程中也应该实现发展，学习效应不应该被当作评估的干扰因素而排除，相反，应该成为考量学习者潜在发展能力的重要因素。因此，将二者结合起来才能理解发展，并推动发展。动态评估同传统的心理测量学最大的不同在于：动态评估注重评估学习者的发展能力，而非某一个阶段、某一个任务下的静态的水平。同时，动态评估认为评估者的角色不再是观察者和测试者，评估者要和被评估者通过互动解决问题，以此来帮助被评估者实现发展。因此动态评估从认识论和本体论上对个体能力的解读都区别于传统的心理测量学。

动态评估认为学习者对于帮助的回应也体现了认知能力和发展能力，这种在帮助下才能体现出来的能力是“未发展全面”（not yet fully developed）的（Poehner，2007），但是是具有发展潜力的，更应该成为教师和评估者关注的重点。在合适的调节下，个体可以实现比独立完成任务时更佳的表现，这样的调节行为无疑促进了个体的发展。所以，动态评估的目标是为了找出个体在他人协助下能完成什么，而不是考查个体在独立情况下能完成什么（Sternberg & Grigorenko，2002）。本文主要讨论动态评估的理论源起和理论构建，从理论的角度去阐释动态评估在评估语言能力方面的思路和与之相应的评估手段，并总结了现有的动态评估模型，綜述了根据模型而开发的具体评估方式，为未来可操作性的动态评估提出了建议，为第二语言能力评估的应用、研究与教学提出建议。

2. 动态评估的理论框架

动态评估的理论框架植根于Vygotsky的社会文化理论，因此，动态评估的理论构建和社会文化理论下的调节论、最近发展区理论、迁移能力以及潜在学习能力密不可分，要深入地理解动态评估理论的内涵，则需要厘清动态评估理论与其他理论之间的关系。

Vygotsky（1986）认为，学习者的能力和水平并不是一个静止的、不变的状态，而是一个不断地与外界互动而动态发展变化的状态。因此，动态评估认为，在评估学习者能力的过程中，评估者对学习行为的调节（包括暗示、提醒、导向性问题等）和学习者如何回应这些调节是理解学习者能力的非常重要的部分，这些评估过程中的调节也有利于学习者能力发展。“动态评估更专注于修正和产生有利于学习者成功的建议”（Lidz，1991：6）。基于动态评估理论的这一基本的评估参照准则，本节将通过综述动态评估的理论起源以及与动态评估理论相关的最近发展区理论、调节论来理解动态评估的评估参照，并通过综述动态评估的两个相关指标迁移能力和潜在学习能力分数，来探讨实施动态评估的现实困难与发展方向。

2.1 动态评估起源

动态评估这一概念最早由Vygotsky的同事Luria（1961）提出，被以色列的教育学家 Feuerstein（1979，1980，1988）所发展。动态评估中的“评估”和传统心理学和教育学中的评估的意义不同。动态评估中的“评估”是指：“为了了解个体的内在能力，观察和记录个体行为，包括对评估者和学习者在互动中产生的学习能力迁移的评估。”（Poehner，2007：325）

所谓动态，有以下几个含义：（1）Vygotsky认为学习者个体的能力是动态变化发展的过程，而不是单一静止的状态；（2）评估者在评估学习者行为时，需要根据学习者的表现而采用相应的调节方式，调节方式应该以能满足学习者的认知需求并能激发学习者的发展为前提；（3）动态评估的目的并不是为了考查出学习者的现有水平，而是根据学习者对调节的回应以及能力的迁移程度而为未来的教学提供参考。因此，动态评估的目的本身也是根据学习者的发展而动态改变的。也就是说，动态评估认为学习者的语言认知能力以及语言发展能力都是可塑的，评估者和被评估者双方在评估的过程中不断进行着信息的传递、交流，形成一种互动合作关系，并且，评估者需要运用动态的眼光去看待、评价被评估者的发展变化。

因此，评估的参照准则、评估手段、评估者与被评估者的关系、被评估者的能力都是动态的，这是动态评估之所以被称为“动态”的原因。但动态评估的这一特点，也为评估的实施、结果的呈现带来诸多困难。

2.2 动态评估和最近发展区（ZPD）①理论

在语言课堂中，教师不难发现，两个考试成绩相当的学生，在课堂表现和课后交流中都体现出不同的语言能力水平。教师往往会把这种现象归因为“有的学生不擅长考试”。除去考生心理因素在考试中的影响作用，在ZPD理论看来，这是学习者现有水平和潜在发展水平之间的差距不同所带来的结果。ZPD理论认为，学习者的发展有两种水平，一种是学习者的现有水平（zone of actual development，以下简称ZAD），指学习者独立活动时所能达到的解决问题的水平；另一种是学习者潜在的、可能的发展水平，是通过接受帮助所获得的水平，两者之间的差异就是ZPD（Vygotsky， Rieber & Carton，1987）。Vygotsky举了例子：“假设我们同时考查两个心理年龄为七岁的儿童，这两个儿童可以完成大部分七岁儿童可以完成的任务。但是，当我们实施评估的时候，两个儿童的结果却截然不同。其中一个儿童在导向性问题、示例、示范等帮助下可以实现相当于九岁儿童的发展，而另一个儿童在同样条件下却只能实现超越现有年龄半岁的发展（转引自Wertsch，1985：68）。”Vygotsky认为，这两个儿童看似相同，其实不同，他们的独立完成任务的能力相同，但是他们的潜在发展能力却大大不同。ZPD理论就是强调这种潜在发展能力的重要性。这也是为什么有的学生在课堂教学中能体现出更好的与教师互动的表现，而在考试中却和其他同学的成绩无区别，因为课堂互动以及教师的引导和暗示激发了他的潜在发展能力。

两个儿童的例子说明，在调节作用下，我们不仅仅可以考查到学习者成熟的、现有的发展水平，也可以考查到学习者将要形成的、正在成熟的、正在发展的能力。Vygotsky （1998：200）认为：“实际发展水平并没有全面体现学习者的发展状况，而只是体现了并不重要的一部分。”独立完成任务的能力只展现了学习者能力全图的一部分，要想了解到学习者发展的全图，我们必须通过动态评估的手段。因此，有效的动态评估也都是发生在被评估者的最近发展区之内，动态评估的目的，也是为了全面地展现出被评估者的ZPD，从而为被评估者提供专门针对其ZPD的、适合的、恰当的调节手段。因此，ZPD本身不仅是一个发展模式，也是一个诊断工具。Lantolf and Poehner（2011）认为动态评估不只是评价工具，也不只是评价方法，而是一种“教评合一”的诠释性框架。要实现知识的发展，需要经历从心理间到心理内的过程，而这个过程一定要经历内化才能完成。内化，是指社会成员把交际活动中的符号产物转化成心理产物，以反映自己的心理活动的过程，也是学习者个体的认知能力发展从他人调控逐渐发展到自我调控的历程（Lantolf，2006）。内化是高级心理功能形成的关键因素。内化过程根据个体差异而不同，不同的个体是处于不同的发展阶段的，而个体的发展也是动态变化的。因此，内化的实现需要靠外在的辅助工具来帮助，即通过外在的调节手段达到内化，实现逐渐的发展。内化通过使用辅助工具（例如活动、语言、图片、PPT、表格等等）使复杂任务变得易于理解，使概念的难度降阶，简化为新手所能理解的概念，从而实现内化。因此，在动态评估过程中，专家只是调节者，通过给新手搭一个支架，帮助新手跨越现有水平和潜在发展水平之间的鸿沟，实现更高水平任务的完成。在这个过程中，概念就通过人与人之间的调节过程实现了个体间到个体内的传递。

动态评估的目的是要发掘出被评估者的ZPD，而动态评估要想实现帮助学习者发展的目的，则需要发生在被评估者的ZPD内，二者相辅相成，不可分割。然而，一个个体并不只有一个单一维度的ZPD。对于语言学习过程来说，ZPD可能是某一个语言知识或者某一项语言技能的ZPD，也可能是学习者整体语言认知能力的。对于一个汉语学习者来说，他学习汉语时态的ZPD可能很大，但是对于和时间副词有关的语言知识的ZPD又很小，而随着时间副词的学习，可能又会改变汉语时态学习的ZPD。一名学习者的语言能力的发展过程非常复杂，受到他的学习方式、所学教材、周围环境以及课堂教学等多种因素的影响，对一名学习者的ZPD的考查非常困难，这也是最近发展区理论的研究重点与挑战。如何利用ZPD作为动态评估的一个维度或者评估指标，也是动态评估理论的研究重点与难点。

2.3 动态评估和调节论

如前文所述，ZPD的核心是调节，人类的高级认知能力是具有文化性和社会性的，是通过不断地与外界互动而发展起来的。在互动过程中，调节工具——如其他个体、书籍、电脑、表格、数字、语言等——都起到非常重要的调节作用。我们与外部世界的关系并不是直接的，是通过调节工具的参与才实现的。如何调节、调节什么、怎么调节是动态评估领域的专家们所研究的重点。

Aljaafreh & Lantolf（1994）考查了两名英语学习者和一名专家在一对一修改作文中对调节量表的运用。专家根据学习者的表现给予恰当的调节。研究得出，ZPD内有效的帮助应该符合三个特点：（1）帮助是循序渐进的（graduated），即提供学习者所需要的最低水平的指导；（2）帮助是根据情况而定的（contingent），即在学习者需要时提供，学习者有独立完成能力时立刻撤退；（3）帮助是以合作式对话（dialogic）的形式展开的。而专家调节的方式遵循以下调节量表：

在此调节尺度量表中，如果学习者需要的调节朝尺度的隐性端靠近，他们被认为是朝着独立和自我调节的行为靠近，这是学习中值得肯定的一面，这种对他人调节的需要减少说明了学习者ZPD的微观变化发展。该研究通过对两名学习者行为的微观发生分析发现，在专家的调节下，学习者的语法能力逐渐得到了提高，学习者在发现错误和纠正错误中，对他人调节的依赖不断减少，自我纠错能力得到发展，专家对学习者的调节实现了从隐性到显性。这说明对于有的學习者，内隐式的纠错可以诱导学习发生，而对于有的学习者来说，只有外显式的纠错才可以诱导学习发生。有效的语言学习发生在学习者ZPD内的协作、互动、交流的过程中，由此，学习者才可以将专家的调节内化为自己第二语言系统的一部分。

虽然Aljaafreh & Lantolf（1994）并没有从动态评估的角度去讨论调节的作用，但是他们所设计出的调节尺度量表是互动式调节的经典示例。Nassaji & Swain（2000）验证了Aljaafreh & Lantolf提出的观点，即有效的互动要根据学习者ZPD的状态而定。对于第一名学习者，研究者按照调节尺度给予反馈，而第二名学习者不按照调节尺度给予反馈，随意选取显性或隐性的反馈，实验结果表明第一名学习者体现出进步，而第二名并没有。

Aljaafreh & Lantolf （1994），Nassaji & Swain （2000）都从调节者的角度出发，为了满足被调节者的需求而动态改变调节方式，根据调节方式从而衡量被调节者的能力和水平。Poehner（2007）在Aljaafreh & Lantolf（1994）的调节量表的基础上，对调节类型进行了更详细的划分，形成一套调节类型量表，如表2所示：

该量表遭到一些动态评估专家的质疑（Budoff et al，1987），學习者是在评估者调节的情况下成功完成任务的，那么，这个过程中，有多少是学习者自己的贡献？又有多少是源于评估者的作用？Lidz（1991）认为，对话互动的过程中有双方共同的参与和贡献，因此学习者贡献（learner reciprocity）应被考虑到互动过程中来。Lidz认为学习者贡献可以表明专家调节中有多少是被学习者真正接受了的。学习者对专家的调节是不是接受，有没有额外的或者更加具体的帮助需求，愿不愿意接受等等问题也是互动过程的重要组成部分。对学习者贡献的讨论体现学习者对专家调节意图的反应程度，用于解释动态评估过程中学习者的行为。因此，将学习者贡献考虑到互动分析中来是必要的。

因此，Poehner在Van der alsvoort & Lidz（2002）的调节回应量表（response to mediation rating scale）的基础上形成了学习者贡献类型量表（learner reciprocity typology）（如表3所示）。通过微观发生分析，对学习者在互动过程中的贡献做详细分析。在此类型量表中，学习者对任务的掌控程度由第1条到第9条逐渐加强，对完成任务的贡献逐渐加大。

综上所述，调节是实施动态评估的核心手段，这是动态评估与传统的基于心理测量学的静态评估在实施手段上面的不同。从专家调节的角度和从学习者如何回应调节的角度来理解动态评估的作用和价值必不可少，调节的过程应该包含调节者和被调节者双向的贡献，只有通过双向的综合考查才能更全面的理解调节的本质，从而更清晰地解读动态评估。然而，如何将调节的数量和质量用于评估学习者的能力，以及如何利用调节的指标来区分能力不同的学习者依然是待研究的问题。

3. 动态评估模型

已有的动态评估模型多运用于教育心理学和特殊教育领域（Feuerstein，2003；Guthke & Beckmann， 2000； Grigorenko & Sternberg， 1998；Haywood & Lidz，2006；Lidz & Gindis，2003）。

Poehner & Lantolf（2005）按照具体实施方式，将动态评估模型分为介入式（interventionist）和互动式（interactionist）。尽管动态评估在特殊教育、学科教育、心理诊断等领域已有诸多成果，却较少受到语言测试专家的关注，在汉语测试领域更鲜有研究。动态评估在特殊教育、心理诊断等更关注认知能力的发展的领域颇有成效，语言能力是认知能力不可分割的一部分，动态评估认为学习者的语言认知能力以及语言发展能力都是可塑的，因此，将动态评估引入语言评估领域，将为语言评估提供一种新的思路。

介入式动态评估为被评估者提供标准化的调节方式，所有的被评估者接受设定好的、相同的调节方式。介入式调节手段考虑了心理测量学的要求，会得出一个量化的评估结果，符合标准化测试的指标，也适用于大规模水平测试。互动式动态评估的调节手段通过评估者和被评估者之间的互动而动态浮现，并没有一个既定的考查目标，而是专注于学习者的发展状况，高度体现了动态评估理论，更能体现动态理论框架下语言能力评估的本质。

Sternberg & Grigorenko（2002）将介入式动态评估根据不同的评估方式又分为了两种：“三明治模式”（sandwich format）和“蛋糕模式”（cake format）。“三明治模式”被Budoff和他的同事（1964， 1968）所推崇，遵循的是一种“前测-介入/训练-后测”的模式。因此，三明治模式可以被大规模的应用。Budoff（1964）提出了学习潜能测量（learning potential measurement）的模型，是第一个将最近发展区理论引入测试领域的西方模型。“蛋糕模式”为被评估者提供标准化的调节方式，调节方式包括从内隐到外显的暗示。Guthke（1982）的Leipzig学能测试（leipzig learning test）也采用了该模式。Guthke（1993）认为个体的学习能力和智力水平并不只有一个ZPD，而是根据不同的学科领域有不同的ZPD。因此，Leipzig学能测试不仅仅针对智力测试，也考查语言学能。另一个“蛋糕模式”的模型是Brown等人（1984，1985）的分等级调节法（graduated prompt approach）。分等级调节法采用了更加标准化的方式实施调节，用于调节的手段方式在实施评估之前已经写好，并按照从内隐到外显的形式排列，对于任何学习者，都遵循这个事先排序好的调节顺序和调节方式来进行。

在互动式动态评估模型下，Feuerstein等（1979，1980，1988，2003）提出了认知结构可塑性理论（structural cognitive modified ability theory）来解释学习者认知能力的发展。该理论认为人的智力发展是生理发展和社会文化历史发展调节互动的结果。大脑的生物属性和个体的行为互动调节，大脑指导行为，行为塑造大脑。因此，认知结构可塑性理论认为人的智力并不是静态的，也是可塑的，个体的认知结构应该是始终处于动态发展变化的开放性系统中。由此得知，人的学习潜能并非静态不变，而是动态发展的。和前文所述的调节论一致，Feuerstein认为环境对个体的影响并不是直接的，而是要通过其他人利用调节工具来使个体实现和环境的互动。所以，学习者个体认知能力的发展是可以通过调节而改变的，要提高学习者的学习潜能，实现认知能力发展，家长或老师需要扮演好调节者的角色，为学习者的能力发展创造调节学习的环境。Feuerstein的互动式评估是最能实现Vygotsky发展为核心的教育理念的模型，但是这并不是说其他的模型就不值得探索。面对不同的问题，不同的模型可能会发挥更好的作用。互动式评估更适合在需要全面展现学习者发展能力的情况下使用，而当需要对大规模的学习者进行量化考核以及排名时，介入式会更高效地实现目的。

已有的模型中，无论是介入式还是互动式，都不专门针对语言能力的发展研究，在语言评估领域，虽未有专门针对语言能力的评估模型出现，但是Aljaafreh & Lantolf（1994）、Nassaji & Swain（2000）、Poehner（2007）等语言评估领域的专家已经尝试了将已有的动态评估方式引入语言评估领域。然而，已有研究多专注考查互动式评估在语言测试领域的运用，而关于介入式评估的实证研究较少。正如前文所述，因为评估的参照准则、评估手段以及被评估者的能力都是动态的，这为动态评估的实施和结果的呈现带来困难，这也是动态评估领域发展所面临的挑战。

4. 动态评估结果的呈现

在一项测试或者评估活动中，参与测试和评估的人一定会获得一项结果报告，用来评定或者阐释被评估者的能力水平。在动态评估中，评估结果的呈现也是研究者们重点考查的方面。在前文的讨论中，调节的数量和质量是动态评估结果呈现的两个指标，这里將增加对迁移能力、潜在学习能力这两个指标的讨论，进一步讨论动态评估的理论内涵如何在呈现结果时体现出来。

4.1 动态评估和迁移能力

Vygotsky（1998）认为真正的能力不只体现在完成眼前的评估任务，而且体现在学习者能否将在现有任务中发展起来的能力迁移到新任务中。迁移（transcendence or transfer），是指学习者将他们的学习能力运用到更复杂的语境中的行为。Feuerstein et al（1979，1988）对迁移的概念和实施方式做了详细的阐释。Feuerstein认为，迁移能力不局限于学习者完成特定任务的能力，学习者有超越现有能力并完成其他语境任务的一系列的能力。学习者独立完成任务表明他们是否将调节内化了，但是，内化的程度只有通过他们是否能迁移该学习能力来体现。Poehner（2007）的迁移任务中，一名学习者在与评估者互动中采用了之前并没有接触过的语法形式，这个语法形式完全是在学习者和评估者互动中产生的，这说明学习者在现有语法知识的基础上发展出了与之相关的语法形式，在此语法范畴内建立了关联。

Palinscar，Brown & Campione（1991）提出了分等级调节法（graduated prompt approach，以下简称GPA）。GPA模型通过三种迁移任务考查了学习者的迁移能力。三种迁移任务分别是：近迁移（near transfer）、远迁移（far transfer）和超远迁移（very far transfer）。近迁移是指迁移任务和原任务拥有相同的条件，只不过用了新的内容组合；远迁移是指学习者需要在新环境中使用新的、相关的条件；超远迁移是指更加复杂的新环境和新问题的结合。虽然Brown提出了通过考查学习者迁移能力来判断学习者对知识的内化程度，并对迁移任务进行分等级定义，但是他们并没有对三种不同程度的迁移任务进行细致的分类说明，没有给出可操作的迁移任务例子和分类方法。

动态评估的研究者们也考查了迁移任务在评估学习者的能力发展中的作用。在迁移任务评估中，评估者依然和被评估者通过互动来完成更复杂和更有难度的任务，研究表明不同的学习者虽然在某个任务上表现相同，但是当遇到新问题时，他们的表现却大不相同。Poehner（2007）的实验中采用了两个迁移任务，让学习者在经过评估后，再参与具有相同的模式和条件但是更加复杂的迁移任务，以此来考查学习者是否内化了所接受的调节。只有通过考查学习者的能力是否迁移，才有可能知道学习者的ZPD是否已经发展成了ZAD。实验结果表明，两个参与者在动态评估中表现相似，需要的调节帮助也较少，而在迁移任务中，两个参与者的表现却非常不同。其中一位可以保持在动态评估中的表现，另一位却不能。这样的结果表明，前者更大程度地内化了互动中的调节，并且更有独立完成任务的能力。

迁移任务是动态评估的重要组成部分，增加了任务复杂度可以有效地考查学习者能力提高的程度，并且预测学习者在未来学习中的表现。但是，已有研究都没有给出如何设计迁移任务（如近迁移、远迁移、超远迁移）的方法。对迁移任务的定义都局限于“具有相同的模式和调节，但是更加复杂的迁移任务”，而该定义中并没有定义何为“更加复杂”，并不具有可操作性。如何设计具有难度或者复杂度差异的迁移任务和如何使用这些迁移任务都是未来设计动态评估任务的重点和难点。

4.2 动态评估和潜在学习能力分数（LPS）①

LPS是除了迁移任务、调节的数量和质量之外的第四个可以作为动态评估结果呈现的指标。Poehner & Lantolf（2013）不认为动态评估的作用是将“藏着的”或者“固定了的”潜力激发出来，他们认为，人的能力并不是藏在大脑里的，知识是来源于心理间的。因此，潜在学习能力始终呈现对调节开放的状态（openness to mediation），学习者通过控制调节的过程来主动调节自己的学习活动。LPS是反应潜在学习能力的指标，是独立完成任务所得分数和通过调节后完成任务的所得分数之间的差（Budoff， 1987； Feuerstein & Rynders， 1988； Sternberg & Grigorenko， 2002）。

Kozulin & Garb（2002）提出了计算独立完成任务水平和通过调节完成任务水平之间的LPS的范式。LPS将学习者分为高收获者（high gainer）、中收获者（mid-level gainer）和低收获者（low gainer）。研究发现，前测分数相同的学习者在LPS上却可能有较大差异。Kozulin & Garb（2002）认为他们提出的计算范式为区分高发展潜能者和低发展潜能者提供了理论基础（见图1）。因此，一个低水平学习者可能有比高水平学习者更高的LPS，而这样的信息无法通过标准化考试获得。

在以上范式中，如果一个被评估者在前测中获得一个非常低的分数50分，但是经过调节后获得了极大的进步，在后测中获得了100分满分，那么该被评估者的LPS就是1.5。相反，如果该被评估者没有获得进步，在后测中依然只得了50分，那么他的的LPS就是0.5。根据Kozunlin & Garb的实验结果可以推测，如果根据学习者的学习潜能分数制定的教学策略会更有针对性。但是该范式所针对的调节并不是动态评估的过程中调节，而只是通过设计公式而将调节前和调节后之间的水平差距量化表现了出来，因此，该范式所体现的更接近于学习者的最近发展区，即学习者潜在的发展能力。

Poehner & Lantolf（2013）借鉴了Kozulin & Garb（2002）的LPS范式展开了关于学习者语言发展能力的实验研究，并将调节结合到了动态评估过程中。在Poehner & Lantolf的基于计算机辅助的动态评估过程中（见表4），测试者在同一个题目下有多次答题机会，答题次数增加所获得的分数依次降低。LPS的分数体现的是动态评估过程中所发掘出的学习者潜在学习能力。

Poehner & Lantolf（2013）实验结果表明，具有相同实际水平分数（actual score）的学习者，调节后分数（mediated score）却可能不同，LPS也不同，在迁移题目中的表现也不同。LPS和迁移能力的实际分数的相关性表明LPS是可以体现学习效应的，也就是说，LPS可以作为评估学习者的有效工具。

但是，这样的范式可能只适合小样本的情况，因为它忽略了评估者自身所带来的误差因素。在实施调节的过程中，我们很难确保一个评估者对不同的学习者的调节是一致的。这和主观性试题的评分者一致性信度和评分者间一致性信度分析类似。Kozulin & Garb（2002）也认为，LPS范式的潜在问题是评估者不同的调节风格可能会影响LPS的信度，所以，需要考虑LPS的信度问题。同时，Poehner & Lantolf（2013）的研究结果也表明，调节结果也有可能受到个体差异的影响。

综上所述，调节的质量与数量、迁移能力的考查、LPS这四项是现有的对动态评估结果呈现的指标，然而这四项指标分别体现学习者语言能力的哪一个维度却并未在已有研究中阐释清楚，这四项指标是不是足以体现动态评估的参照准则？是不是需要有新的指标来体现动态评估所要评估的能力？这也是动态评估亟待解决的问题。

5. 动态评估理论的信度、效度和可实施性问题

动态评估所面临的研究难点和研究重点已在前文中有所陈述，不管是在特殊教育、心理诊断、学能测试等领域还是在语言测试领域都有学者质疑动态评估的信度、效度和可实施性的问题。本小节从动态评估理论的理论构建出发，解答动态评估领域的信度、效度和可实施性提出的质疑。

5.1 信度问题

信度和标准化是测试领域所关注的基本问题，也是传统测试领域的学者对动态评估理论批评最多的地方。然而，动态评估理论构建的前提是：人类的高级认知能力是在与社会环境的互动中不断发展变化的。动态评估的目的是了解学习者在调节过程中所需的帮助，从而实现学习者能力发展。因此，动态评估在实施的过程中就是因人而异的，根据每个人的发展阶段的不同，实施的调节也是不同的，因为每个人的发展能力不同，带来的评估结果也不同。对于同一个人，同一时间参加两次动态评估的结果也可以是不同的，因为动态评估以在评估中实现学习者的发展为目的，那么第一次动态评估后，学习者的发展阶段已经被改变，接下来的第二次的动态评估结果就并不一定和第一次一致。如果一致，反而说明第一次动态评估并不成功——没有促进学习者的发展。Swain（1993）表明，好的二语能力评估应该具有低内部一致性。如果通过两次对学习者的动态评估结果并无太大差别，反而表明调节者未能为学习者提供恰当幫助，未能成功调节学习者的发展。因此，从动态评估的理论构建和核心目标来看，传统心理测量学对信度问题的讨论并不适用于动态评估。

介入式动态评估考虑了信度的问题，并试图通过调节方式的标准化来增加评估的信度。然而，互动式动态评估领域的学者认为，人类的能力本身就是一个不断变化的状态，调节手段就应根据不同个体的需求来调整，从而最大程度实现个体的发展，这个过程必然会影响到标准化的实施，影响到信度的提高。因此，在动态评估理论学者看来，信度越高，反而越阻碍学习者发展能力的提高。Lidz（1991）认为传统测试通过种种方法想要获得一个静态的结果，但是却忽略了这个现实的世界总是不断变化的事实。

因此，由于动态理论对知识的产生、知识和能力的发展的理论构念与心理测量学的理论构念并不相同，两种评估体系对信度的解读也并不一致。

5.2 效度问题

从内容效度上来看，动态评估与静态评估使用的测量工具或任务可以是相同的，因此其内容效度的验证可与静态评估相同（孔文、方洁，2013）。但是，动态评估的构念效度受到了质疑， Haywood & Tzuriel （2002）认为动态评估的理论构念尚不明确，更未使用具体的方法来证明评估结果是对其理论依据各方面的反映。然而，Haywood & Tzuriel的观点并不准确，动态评估的目的是为了实现个体语言能力的发展，实现了发展这一目的，效度也即实现。同信度问题一样，因为动态评估和传统的静态评估的理论构建、评估对象和评估手段均不相同，因此衡量评估效度的方法也不同，静态评估领域对效度问题的讨论也并不适用于动态评估。

从标准效度来看，动态评估的评估工具也广受批评，因为动态评估是通过一对一的互动调节方式，不同的个体所接受的调节不可避免地会有所差异，因此，有学者质疑评估过程中的调节和帮助难以推断学习者在实现任务中所做的贡献。但是Poehner（2007）的研究中考虑到了学习者贡献类型（reciprocity typology），并在研究中考虑了学习者回应调节的类型和数量。动态评估的优势体现在后果效度上，因为该评估方式可以直接帮助被试在评估中发展，具有良好的反拨效果（孔文、方洁，2013）。

5.3 可实施性

关于动态评估的实施目前主要集中于一对一的评估方式，已有研究证实了这种评估方式的有效性和重要意义，但是，这种评估方式所消耗的时间成本和人力成本均过高，如何大规模地实施动态评估手段、如何高效地评估一个群体的语言能力和语言发展能力是动态评估需要解决的现实问题。目前基于计算机的动态评估工具（computerized dynamic assessment）已投入大规模的使用①，但是可利用的领域依然局限在阅读和听力技能方面，对于写作、口语技能相关的可以大规模展开的评估手段还未实现。基于计算机辅助的动态评估在对分数解读上也需要得到信度和效度的验证，否则无法成为选拔、评定的标准。此外，不同的学习者所处的发展阶段不同，如何有效地对不同的个体进行调节也依然存疑。

6. 动态评估的未来研究领域

动态评估为课堂教学和课堂以外的评估都提供了一个理论基础，但是，如何将动态评估的程序标准化、可实施化以及量化都是动态评估所面临的挑战。不同的测试，其实都是妥协的结果，无论是经典的测试理论或者是基于项目反应理论的自适应测试体系都有自身的局限，有的测试为了实现效度，则不免牺牲测试的公平性，有的为了实现大规模、标准化的实施，则不免牺牲了部分效度。动态评估的目的是为了评估发展，评估的目标、手段都更有利于了解到学习者的现状和可发展的程度、能力可以迁移的程度等等，但是其操作方式和过程不适用于大规模的展开，如何权衡这两个目的就需要通过实验考察验证和测试的研制与开发。

迁移能力被视为考查学习者未来发展能力的重要指标，然而，已有研究没有给出迁移任务具体分级方法以及分级后的有效性，设计合适的迁移任务来有效地考查学习者的迁移能力也是未来研究需要解决的问题。

对于动态评估的运用范围来说，除了如前文所述将其大规模、标准化的实现以外，是不是可以发展出一套可供课堂语言教师操作的评估手段呢？在学习者日常学习中，往往会经历一个学期或者一个假期班长度的学习，因此，用一个期末成绩或者阶段性测试的成绩决定其这一阶段的学习状况是不公平和不具体的。“档案袋评价”（profile）和形成性评估（formative assessment）是课堂教学中常用的记录、评估学生的能力变化和成长状况的方法，尽管动态评估和档案袋评价与形成性评估的目的不同，但是根据动态评估的目的来看，在课堂教学中实施动态评估更有利于教师实现教评合一的目的，也能淡化评估为学生带来的“焦虑感”，提高评估过程中的学习效应，帮助学生实现能力的发展。因此，在课堂教学和评估中的具体实施方案也是动态评估未来可发展和研究的重要方向。动态评估也可以借鉴现有的档案袋评价和形成性评价的操作模式，形成专门针对语言能力的课堂评估。在英语教学界，已有在课堂写作教学中使用动态评估的例子（孔文、方洁，2013；张艳红，2010），但是在汉语教学界，关于动态评估的应用和研究都非常匮乏，此外，动态评估对调节者也就是评估者或者老师的要求更高，好的评估者可以为被评估者提供适合的、循序渐进的调节方式，从而才能更精确地确定学习者的发展阶段，每一个不同的学生都具有自己的ZPD、每一个不同班级也具有不同的集体最近发展区（group ZPD），因此，如何评估每一个个体和班级也是课堂教师和研究者可以挖掘的方向。因此，对评估者、课堂教师的培养也是动态评估需要解决的问题和面临的挑战。

[参考文献]

孔文，方洁 2013 另类评估的新发展：动态评估面面观[J]. 解放军外国语学院学报（1）：57-61. // Kong Wen & Fang Jie 2013 The new development of alternative assessment： An overview of dynamic assessment[J]. Journal of PLA University of Foreign Languages （1）： 57-61.

張艳红 2010 大学英语写作教学的动态评价体系建构[J]. 解放军外国语学院学报（1）：46-50. // Zhang Yanhong 2010 Constructing dynamic assessment mode in college English writing class[J]. Journal of PLA University of Foreign Languages 33（1）：46-50.

Aljaafreh， A. & J. P. Lantolf 1994 Negative feedback as regulation and second language learning in the zone of proximal development[J]. Modern Language Journal 78（4）： 465-483.

Budoff， M. 1968 Learning potential as a supplementary assessment procedure[J]. Learning disorders 3： 295-343.

1987 The validity of learning potential assessment[A]. Dynamic assessment： An interactional approach to evaluating learning potential[C]. New York： Guilford Press： 53-81.

Budoff， M. & M. Friedman 1964 “Learning potential” as an assessment approach to the adolescent mentally retarded[J]. Journal of Consulting Psychology 28（7）： 434-439.

Feuerstein， R. 1980 Instrumental Enrichment： Redevelopment of Cognitive Functions of Retarded Performers[M]. University Park Press.

Feuerstein， R.， Y. Rand & J. E. Rynders 1988 The learning potential assessment device[A]. In Dont Accept Me as I am[C]. Springer US： 191-207.

Feuerstein， R. ， Y. A. Rand & M. B. Hoffman 1979 The Dynamic Assessment of Retarded Performers： The Learning Potential Assessment Device， Theory， Instruments， and Techniques[M]. Scott Foresman & Co.

2003 Dynamic Assessment of Cognitive Modifiability[M]. ICELP （The International Center for the Enhancement of Learning Potential）.

Grigorenko， E. L. & R. J. Sternberg 1998 Dynamic testing[J]. Psychological Bulletin 124（1）： 75-111.

Guthke， J. 1982 The learning test concept： An alternative to the traditional static intelligence test[J]. German Journal of Psychology 6（4）： 306-324.

1993 Developments in learning potential assessment[A]. Learning potential assessment： Theoretical， methodological and practical issues[C].， 43-67.

Guthke， J. & J. F. Beckmann 2000 The learning test concept and its application in practice[J]. Dynamic assessment： Prevailing models and applications： 17-69.

Haywood， H. C. & D. Tzuriel 2002 Applications and challenges in dynamic assessment[J]. Peabody Journal of Education 77（2）：40-63.

Haywood， H. C. & C. S. Lidz 2006 Dynamic Assessment in Practice： Clinical and Educational Applications[M]. Cambridge University Press.

Kozulin， A. & E. Garb 2002 Dynamic assessment of EFL text comprehension[J]. School Psychology International 23（1）： 112-127.

Lantolf， J. P. 2006 Sociocultural theory and L2： State of the art[J]. Studies in Second Language Acquisition 28（1）： 67-109.

Lantolf， J. P. & M. E. Poehner 2010 Dynamic assessment in the classroom： Vygotskian praxis for second language development[J]. Language Teaching Research， 15（1）： 11-33.

Lidz， C. S. 1991 Practitioners Guide to Dynamic Assessment[M]. Guilford Press.

Lidz， C. S. & B. Gindis 2003 Dynamic assessment of the evolving cognitive functions in children[A]. Vygotskys educational theory in cultural context[C].， 99-116.

Luria， A. R. 1961 Study of the abnormal child[J]. The American Journal of Orthopsychiatry 31： 1-16.

Nassaji， H. & M. Swain 2000 A Vygotskian perspective on corrective feedback in L2： The effect of random versus negotiated help on the learning of English articles[J]. Language Awareness 9（1）： 34-51.

Qin， T. & R. A. van Compernolle 2017 Computerized Dynamic assessment of L2 Chinese pragmatics comprehension[Z]. Paper presented at American Association for Applied Linguistics. Portland， USA.

Sternberg， R. J. & E. L. Grigorenko 2002 Dynamic Testing： The Nature and Measurement of Learning Potential[M]. Cambridge University Press.

Swain， M. 1993 The output hypothesis： Just speaking and writing arent enough[J]. Canadian Modern Language Review 50（1）： 158-164.

Palinscar， A. S.， A. L. Brown & J. C. Campione 1991 Dynamic assessment[A]. Handbook on the assessment of learning disabilities： Theory， research， and practice [C]. 75-94.

Poehner， M. E. 2007 Beyond the test： L2 dynamic assessment and the transcendence of mediated learning[J]. Modern Language Journal 91（3）： 323-340.

Poehner， M. E. & J. P. Lantolf 2005 Dynamic assessment in the language classroom[J]. Language Teaching Research 9（3）： 233-265.

2013 Bringing the zpd into the equation： Capturing L2 development during computerized dynamic assessment （C-DA） [J]. Language Teaching Research 17（3）： 323-342.

Van der Aalsvoort， G. M. & C. S. Lidz 2002 Reciprocity in dynamic assessment in classrooms： Taking contextual influences on individual learning into account[A]. Learning potential assessment and cognitive training： Actual research and perspectives in theory building and methodology 7（1）： 111-144.

Vygotsky， L. S. 1986 Thought and language[M]. Cambridge， MA： MIT Press.

1998 Mind in society： The Development of Higher Psychological Processes[M]. Harvard University Press.

Vygotskij， L. S.， R. W. Rieber & A. S. Carton 1987 The Collected Works of LS Vygotsky.（Vol.1）， Problems of General Psychology Including the Volume Thinking and Speech[M]. Springer.

Wertsch， J. V. 1985 Adult-child interaction as a source of self-regulation in children[J]. The growth of reflection in Children， 69-97.

Key words：sociocultural theory； dynamic assessment； evaluation of language proficiency； Chinese-as-a-second-language

Abstract： Dynamic assessment （DA） is rooted in the sociocultural framework outlined by the psychologist L. S. Vygotsky and his colleagues. Contrary to the innatist view， sociocultural theory considers human cognition as developing with the ongoing interaction between the individual and with the environment. Instead of giving a static score， DA distinguishes itself from other approaches by maintaining that the unification of development and assessment during the assessment procedure is crucial to understanding learners abilities and for promoting development during the assessment process itself. Unlike traditional psychometric tools， DA lays emphasis on learners development potential implied by the difference between learners independent performance and the performance which the learner can achieve with the assistance of an expert or a computer. Ever since the 1997 social turn， DA has been widely applied in education and psychology whereas in the second language assessment area it has received scant attention. The present paper outlines the theoretical framework for the application of dynamic assessment procedures to second language assessment and pedagogy by reinterpreting the concept of second language ability from the perspective of sociocultural theory. The paper concludes with a discussion of the criticisms leveled against DA and makes some suggestions for further research on DAs potential contributions to language assessment.

【責任编辑匡小荣】

华文教学与研究2018年2期

华文教学与研究的其它文章: “把”字句习得研究中的两个问题; 关于汉语句式习得研究方法论的再探讨; 汉语国际推广背景下的韩国高校汉语教学研究; 汉语作为二语的教材语音内容编写调查研究; 汉语继承语学习者家庭因素和学习动机研究; 构式“A死我了”和“把我A死了”