语料库语言学与语言测试的接口研究

2013-08-15 00:49张文星
关键词:效度真实性语料

张文星

一、引言

上世纪60、70年代,世界上第一代大型电子语料库诞生,随后各国竞相开发语料库。经过半个多世纪的发展,语料库种类繁多,技术日渐成熟,语料库语言学的学科地位也得以确立。语料库的诞生和发展给语言研究以及语言应用研究带来了一场革命性的变化[1]。语料库在语言研究及其相关领域应用较广,且相关成果丰硕,而学者们对于语料库应用于语言测试的思考则要晚的多,要追溯到上世纪90年代。可喜的是,语言测试界近些年越发注意到外语学习者语料库和本族语者语料库在语言测试领域应用的的巨大潜力和空间[2-3]。本文将对语料库语言学和语言测试的接口进行理论探讨,分析语料库应用于语言测试相关研究的可能性、必要性及其所面临的挑战,同时结合语料库在语言测试中的具体应用进行论证说明。

二、语料库与语言测试的接口

语料库与语言测试的接口可以从真实性、科学性和对计算机技术的依赖性三个方面进行研究:

(一)真实性

语料库(corpus)是指按照一定的语言学原则,运用随机抽样方法,收集自然出现的连续的语言文本或话语片段而建成的具有一定容量的大型电子文库[4]。语料库里面存放的是大量在语言的实际使用中真实出现过的语言材料,这些语言信息可以供研究者进行语言研究、分析和描述。同时,语料库的原始语料是通过随机抽样选取的,这使得它具有代表性,可以作为语言研究与教学的重要基础和依据。在语料库的基础上对语言进行分析研究的科学就是语料库语言学(corpus linguistics),它是以语料库中收集储存的真实语言材料作为其唯一研究对象。

语言测试是一门跨学科的综合性科学,它从语言学、语言教学法和学习论取得科学内容,从心理测量学获得科学手段[5]。一个多世纪以来,语言测试大致经历了以下四个变化时期:前科学时期;心理测量:结构主义时期;心理语言学(社会语言学时期);交际语言测试时期[6]。而语言学理论先后经历了历史比较语言学、结构主义语言学、转换生成语法、心理语言学与社会语言学,可见语言测试的发展过程与语言学理论发展过程基本吻合。我们现处于交际语言测试时期,起源于上世纪70年代后期,Widdowson提出语言教学真实性问题,认为语言是交际工具,是思想表达系统,而学习语言就是要掌握一套语言的意念和功能,因此语言教学以培养交际能力为中心[7]。随后,交际语言测试应运而生。但是,伴随着交际语言测试法的向前发展,真实性问题凸显出来,受到学者们的关注和讨论,成为语言测试的一个热门话题[8]。语言测试中的真实性是指受试者在测试中使用目标语完成测试任务与其在现实生活中使用语言进行交际活动的相似程度,也就是语言测试与语言交际的统一程度[9]。Lewkowicz把真实性分解为输入的真实性(测试文本、测试任务)、输出的真实性和情景的真实性。对于测试文本的真实性,Lewkowicz则建议在测试中使用未作任何改动或简化的源文本[10]。现代语料库为第四代语料库,其容量之大、时效性之强是前几代所无法比拟的,而语料库中存储的大量多样的真实语料(其中包括书面语料和口语语料)则可以作为源文本为语言测试开发者所用,为不同规模、要求和目的的语言测试服务。语言测试对于真实性的关注和要求,使语料库在语言测试领域有了一席之地,因为语料库的使用能够保证语言测试最大限度的真实性。

(二)科学性

语料库目前已经发展到第四代,即Web多媒体或多模态语料库。语料库根据研究需要可以分成不同的种类,但是语料库中所存储的真实语料是经过加工、分析和处理(如标注和赋码等)了的,否则是不能成为有用资源为研究者所用。而加工、分析和处理语料的过程需用到相关的语言学理论知识,所以语料库的构建是建立在语料库语言学理论基础上的,是科学的。此外,对所收集的真实文本进行标注和赋码是语料库构建中的重要环节。语料库标注则指对语料库文本附加解释性的语言信息,通常分为计算机自动标注、机助人工标注和人工标注[11]。而标注又包括元信息标注(如词性赋码、句法标注、语言标注、语用标注、语音标注、语误标注等)和非语言信息标注[12]。如今,随着计算机技术的飞速发展和对大型语料库的需求,人工标注赋码显得费时费力,而市场上已有一些经济实用的自动词性赋码器,如Brill POS tagger,CLAWS,TreeTagger等。经过标注赋码后的语料库所包含的的信息丰富,研究者可以通过相关检索软件(如Word-Smith、Antcorn、BFSU ParaConc 等)进行提取,既方便又科学。所以,语料库语言学是一门科学。

语言测试试题开发首先要确定考试构念,并对语言水平等级进行描述。以往,外语水平的等级描述比较主观,也很模糊。现在,研究者可以对语料库中的语料进行分析,验证语料习得发展规律,在此基础上合理划分和描述外语水平,可以合理定位被测试者的外语水平。语言测试设计者在开发试题的各个环节会充分考虑这些研究成果信息,合理选取考试素材。同时,语料库中的各种标注信息也能为各种目的的考试所用,设计者可以通过相关检索快速定位其所关注的文本特征和语言点,大大节省人力和时间,而且较大程度地保证合理的考试效度,彰显考试的科学性和公平性。所以,二者都符合科学性的要求。

(三)对计算机和网络技术的依赖性

语料库除了真实性和代表性,它还具备可持续性,这需要依赖计算机和网络技术来实现。随着技术手段的不断更新发展,语料库的规模也越来越大,而且更新升级速度迅速提升,比如现在大型网络语料库都在朝动态语料库方向发展,能够及时补充和更新语料,这比较吻合语言发展变化这一自然属性。但是,传统描述语言变化手段速度慢、成效低,不能很好地跟踪记录语言变化,与真实语言发展变化情况脱节。语料库弥补了这一缺憾,而且语料库技术的使用可以很好地捕捉、记录和保存这些语言历时变化,为语言发展理论提供真实可靠证据。在此基础上,测试设计者可以从这些语料库中提取考试素材,适当关注语言的历时变化,能或多或少地补充和纠正所储存的语料内容。这为语言测试的设计开发和评估量表等提供了基础,使语言测试内容更符合语言真实发展状况,比传统语言测试更科学。因为它满足了语言测试对于真实文本输入的要求,也更有可能获得受试的真实语言输出,如现代英语口语考试。

如今,我们处在一个讲究效率的时代,高效便捷成了各行各业的不懈追求,语言测试也不例外。许多为中国英语学者所亲睐的考试都已采取机考或网考方式。如GRE机考和TOEFL iBT(Internet Based Test),新托福以互联网为依托,其所用语料均来源于真实学术语言环境的语料库。大规模机考网考的实施方便各种考试语料库的建立,以供研究者后续开发研究所用,所以语料库的可持续性和语言测试的机考网考趋势可以很好地对接起来。

从以上分析可知,语料库语言学与语言测试有着较好的接口,从理论上可以进行语料库在语言测试中的应用尝试。

三、语料库在语言测试领域的具体应用

语料库和语料库语言学在当今语言研究由高度抽象转向语言的实际使用这个过渡中起着十分重要的作用:一是提供真实语料;二是提供统计数据;三是验证现行的理论;四是构建新的理论[13]。而在语言测试领域,语料库也有着较广阔的应用前景:

(一)评分量表的制定和试题编制

现代大规模考试都会制定相应的评分量表来指导评分。评分量表是对语言使用者运用语言能力的一系列描述,由低到高分成几个不同等级,用来描述语言能力发展的不同阶段[14]。评分量表在主观题评分中的作用更为突出,它是评分员对考生语言行为表现进行评分的重要参考依据。所以,为了保证较高的评分员效度,一个科学的评分量表至关重要。国内外许多考试的评分量表都是基于语言测试专家的直观经验制定的,带有较强的主观性,好在国外一些考试机构已经开始利用语料库辅助评分量表制定,如剑桥ESOL考试中心开发的写作部分的通用量表(Common Scale for Writing,CSW )则是利用语料库提供的信息,采用定性和定量相结合的方法制订出来的[14]。

此外,研究者还可以利用语料库进行试题编制。我们知道,信度和效度是语言测试中的两个重要概念。Henning把效度定义为一项测试或测试一部分测量它声称测量内容的合适性[15],也就是说测试有效是指它测量了它应该测量的东西。为了保证测试的效度,我们可以利用语料库来编制试题。语料库里面存储着大量真实语言文本,而研究者通过相关语料库检索工具和技术能更清楚地认识语言使用规律。国内研究者常用语料库 (如 BNC、COCA、COBUILD英语语料库和中国英语学习者语料库CELC等)及其它各种学习者语料库都能提供真实可靠的语言信息。测试开发者还可以利用学习者语料库摸清学习者语言使用规律及其文本特征,同时还能确定处于某一外语水平的学习者常犯的语言错误及其特征,为试题编制提供重要信息,从而确保较好的效度。

(二)考试大纲词汇制订

词汇大纲的概念最初由Sinclair和Renouf提出,并由Willis给予了大纲性的论述,认为词汇大纲应该注重以下几点:语言的最基本词形;词的中心用法;词的最典型搭配[16]。传统的考试大纲词汇表大多由语言教育和语言测试领域的专家根据自身知识经验制订,因而不一定符合客观情况。比如有的不常用的低频词汇却当作重点词汇,或是某个词的不常用的用法却当作中心用法。语料库的出现使研究者制订出更为客观可靠的考试大纲词汇表成为可能。频率信息和语言真实性是使用语料库带来的两大优势[17]。研究者可以很轻松地通过语料库检索软件(如Wordsmith和Antcorn)来确定词频列表,而语料库中存储的真实语料又弥补了我们个体知识经验的不足。除此之外,研究者可以针对不同考试的目的制订出特定领域的考试大纲词汇表。

(三)利用语料库进行效度验证

语料库还可以用来进行效度验证。例如:邹申等基于传统效度验证方法之上[18],借助英语学习者语料库(CEM )和英语国家语料库(BNC)对2000-2002年TEM-8考试中的30道改错题做了实证研究,证明语料库可以帮助我们加深对改错项目内容效度的认识。穆惠峰借助自建语料库[19]、中国学生英语口笔语语料库(SWECCL)、布朗语料库(BROWN)和英语国家语料库(BNC),对大学英语四级考试的完型填空部分的内容效度进行了验证,发现了一些不足,如部分考点的典型性不太高、部分干扰项的设计不够科学等,并就如何让语料库服务语言测试提了几点建议。此外,邹申以《英语专业写作教学语料库》为例[20],探索了利用语料库进行考试效度验证新模式。目前,用语料库进行效度验证的研究仍然处于起步阶段,有着较广的发展空间。

语料库在语言测试领域的应用远不止以上三个方面,它还可以用于自动评分系统的研制。此外,各种考试语料库的构建能为研究者提供更加丰富的信息,对于外语水平能力构念的描述会有更加清楚的认识。语料库也应该可以在语言测试领域生机勃发。

四、面临的挑战

语料库可以为语言测试所用,但它也不是万能的。我们在构建和使用语料库的时候,都摆脱不了抽样的问题。因为语料库再大也是有限的,它不可能涵盖所用的真实语料。语料本身的内容及选择的标准就约束了语料库的使用范围,也决定了其在语言测试研究中的应用范围。Alderson指出当我们对数据分析结果进行解释和作出决定的时候,我们一定要认真考虑所用语料库样本的代表性和相关性[21],这其中当然包括语料库的大小及其创建年代等因素。所以语料库在语言测试研究中的应用具有一定的局限性。

其次,虽然语料库有可能提升语言能力水平测试中的透明性、连续性和可比较性,但在构建各种学习者语料库和分析其语料时,我们会发现语言能力水平仍是一个比较模糊的变量。这对基于语料库的相关研究来说是个潜在的威胁[22]。所以,语料库不能满足各种各样的测试要求,测试研究开发者应该做好基于语料库的语言能力水平的分级及其相应特征描述工作,对于所选语料库是否能够满足测试目的需提前做好评估,降低风险。

最后,国内学者已经习惯使用国际知名语料库来开展相关研究,这其中也存在一定的风险,因为像BNC这样的语料库大多为以英语为本族语者建立的语料库,而中国外语学习者的中介语有其自身发展规律和特点。我们在选择标准时,不能全部照搬国外的研究,应该结合本地国情进行,充分利用各种中国英语学习者语料库,开展相关测试研究。

五、结语

语料库语言学与语言测试理论上有着诸多接口,如同语料库应用于语言教学研究一样,语料库在语言测试领域也应具有广阔的应用前景。国外相关机构(如Cambridge ESOL和美国ETS)已经进行了相关研究和应用尝试,并推出了相关产品。中国学者的研究也已经起步,但是相关研究团队还未组建。中国是考试大国,如何利用各种英语语料库和学习者语料库进行语言测试开发和研究是摆在专家学者面前的一个重大问题。

[1]Hunston,S.Corpora in Applied Linguistics[M].Cambridge:Cambridge University Press,2002.

[2]Barker,F.How can corpora be used in language testing?//A O’Keeffe,M McCarthy.The Routledge Handbook of Corpus Linguistics[M].New York:Routledge,2010.

[3]Taylor,L,Barker,F.Using corpora for language assessment[A]//E.Shohamy,N H Hornberger.Encyclopedia of Language and Education[M].New York:Springer,2008.

[4]杨惠中.语料库语言学导论[M].上海:上海外语教育出版社,2002.

[5]杨惠中.语言测试与语言教学[J].外语界,1999(1).

[6]薛荣.交际语言测试:理论模式与评估标准[J].外语教学,2008(3).

[7]Widdowson,H.G.Teaching Language as Communication[M].Oxford:Oxford University Press,1978.

[8]Bachman,Palmer.Language Testing in Practice[M].Shanghai Foreign Language Education Press,1996.

[9]黄大勇.语言测试中的真实性概念[J].语言教学与研究,2004(2).

[10]Lewkowicz,J.A.Authenticity in language testing [J].Language Testing,2000(1):43-64.

[11]李文中.语料库标记与标注:以中国英语语料库为例[J].外语教学与研究,2012(3).

[12]梁茂成,李文中,许家金.语料库应用教程[M].北京:外语教学与研究出版社,2011.

[13]张树青.东北地方口语语料库的构建及应用[D].黑龙江:哈尔滨工程大学,2009.

[14]孔文,邹申.语料库在语言测试中的应用[J].外语电化教学,2007(4).

[15]Henning,G.A Guide to Language Testing:Developing,E-valuation,Research[M].New York:Newburg House,1987.

[16]权立宏.PowerGREP在外语词汇教学中的应用:以数据驱动学习为理念[J].山东外语教学,2010(1).

[17]肖忠华,许家金.语料库与语言教育[J].中国外语教育,2008(2).

[18]邹申,杨任明.语料库在试题设计和验证中的应用研究[J].外语电化教学,2008(5).

[19]穆惠峰.基于语料库的大学英语四级完型填空测试内容效度验证研究[J].外语电化教学,2011(4).

[20]邹申.基于语料库的写作测试效度研究:以《英语专业写作教学语料库》为例[J].外语电化教学,2012(1).

[21]Alderson J C.Do corpora have a role in language assessment[A]//Thomas,J A,Short,M H.Using Corpora for Language Research[M].London:Longman,1996.

[22]Carlsen,C.Proficiency level-a fuzzy variable in computer learner corpora[J].Applied Linguistics,2012,33 (2):161-183.

猜你喜欢
效度真实性语料
慈善募捐规制中的国家与社会:兼论《慈善法》的效度和限度
广告的真实性
基于语料调查的“连……都(也)……”出现的语义背景分析
华语电影作为真实语料在翻译教学中的应用
被看重感指数在中国大学生中的构念效度
从悬疑报道谈新闻的真实性
坚持新闻的真实性
外语形成性评估的效度验证框架
《苗防备览》中的湘西语料
国内外语用学实证研究比较:语料类型与收集方法