《汉语水平词汇与汉字等级大纲》字表的收字分级考察例析

2012-01-05 12:44王晓明
关键词:常用字词表用字

王 敏,王晓明

(教育部 语言文字应用研究所汉字与汉语拼音研究室,北京市 100010)

《汉语水平词汇与汉字等级大纲》字表的收字分级考察例析

王 敏,王晓明

(教育部 语言文字应用研究所汉字与汉语拼音研究室,北京市 100010)

选择《汉语水平词汇与汉字等级大纲》甲级字与现行国家汉字规范《现代常用独体字规范》以及三个语料库的字频统计结果进行对比,通过对数据资料的细致分析,对《大纲》甲级字收字提出了具体的建议。①乙级字1994年修订本实际有804字。据刘英林 宋绍周《汉语水平词汇与汉字等级大纲·论汉语教学字词的统计与分级(代序)》,经济科学出版社,2001年6月,27-28页。《大纲》选字分级应优先选择对于理解汉字构字规律有益的独体字和构词能力强、有利于词汇学习的汉字。②国家组织研制的汉字规范标准,通常经过较长期的研究酝酿,具有较高的可信度,对汉字应用具有很高的指导意义。③《大纲》作为汉语教学的指导性规范,其字表首先应强调基础性、通用性、广泛适用性,在最基础、最核心的甲级字的选择上尤其如此。

《汉语水平词汇与汉字等级大纲》;甲级字;汉字规范标准;教材用字

引 言

《汉语水平词汇与汉字等级大纲》(以下简称《大纲》)定位为规范性的水平大纲,是我国初、中、高等汉语水平考试的主要依据,主要适用于对外汉语教学领域的教学设计、教材编写和成绩测试,也可作为少数民族汉语教学和中小学语文教学的参考,和编制汉语水平四级通用字典等辞书的框架范围。

《大纲》的字表部分在研制过程中主要依据现行国家汉字规范《现代汉语通用字表》,根据需要进行了一定调整,“规定对外汉语教学汉字学习的总量,对这种总量进行阶段性分级”。特别要提出的是字表收字有针对性地依据词表部分的用字进行了调整,将字表的分级“与词汇分级相衔接、相协调”,以求“常用词和常用字之间要逐步建立一种科学的有机的联系”[1]27-28。

《大纲》1992年出版后,于1994年至2001年间曾进行修订,但修订主要针对词表部分,在“修订说明”中未提及字表部分。2009年,《大纲》的再次修订已经启动。本文希望通过对《大纲》的字表收字和分级状况进行考察,与现行国家汉字规范(如《现代汉语常用字表》《现代常用独体字规范》),和通行的小学语文教材用字字频统计结果分别进行对比研究提供一个思考角度,以便《大纲》在修订中更好地实现收字的合理性。

一、《大纲》收字状况与技术实现

《大纲》收字共分为四个级别。甲级字800,乙级字804,丙级字601,丁级字700,分别对应四个等级的词汇表[1]17,共计2 905字。

据《大纲》代序《论汉语教学字词的统计与分级》关于汉字部分的内容,以上分级和收字的指导原则主要有三条。一,汉字的总量与分级以相对应的词汇总量与分级为基础和必要条件;二,分级过程中主要参考《现代汉语常用字表》中的2 500字和1 000次常用字;三,分级过程中,定性与定量结合,在一定范围内进行必要的“定向性联想添加”。“定向性联想”是《大纲》词汇表制定的原则之一,目的是为了弥补词频和使用度统计的缺漏和偏差。举例来说,比如“主题联想”,有常用食品(面包),也就应有常用饮料(汽水);“类聚联想”“橘子、香蕉常买,梨、苹果也常吃”[1]17,等等。

在字表的制定中,研制者不是完全依据字频资料,而是运用定性和定量结合,进行必要的调整。调整的方法是“在源于词汇分级的基础上,主要参照《现代汉语常用字表》中的2 500常用字,对常用词表进行一定范围内的专家干预,干预目的既要增补一定数量的常用词,又要扩充这些常用词中所含的常用字种”。经过反复筛选、协调,最终结果达到“甲、乙级常用字(共1 600)字种要含全部一级常用字(1 000字种),多出的600左右,基本上应在二级字范围内。甲、乙、丙、丁4级常用字(2 900)要含一、二级常用字(2 500),多出的400,多数应在三级次常用字范围内”,允许含个别3 500常用字以外的字[1]26。

研制者的报告体现出,《大纲》的字表尊重了当时已有的主要依据汉字频度统计成果而研制的《现代汉语常用字表》,并且作为对外汉语教学和汉语水平测试的指导规范,也体现了语言学习以词汇为基础的理念。本文对《大纲字表》的考察,也将以字频统计和构词能力等作为主要衡量指标。

二、以《大纲》甲级字收字为例

汉语作为母语的教学,要求在基础教育阶段完成3 500常用字的教学,其中小学阶段要求掌握2 500常用字。与《大纲》的要求相比照,母语教学的小学阶段字量大体与汉语作为第二语言的中级水平相当。通过比较汉语在分别作为母语和第二语言的教学和测试中用字的要求与实现情况,对理解目前《大纲》的字表收字分级是否恰当不无意义。

经过具体比对,我们认为,汉字在母语教学和对外汉语教学中的选字差异,主要集中在前800字,也就是《大纲》甲级字的范围。这也是我们选择甲级字为例的重要原因。

本文选择了两种比较通行的小学语文教材进行用字频度统计,分别由语文出版社和人民教育出版社2003年出版(以下简称语文社用字和人教社用字)。以此作为参照,按照频度选取与《大纲》甲乙两级对应的两个段,即频度排序前800和前1 604的字,与《大纲》收字进行对比。

甲级字与语文社用字字频统计前800字不同的有244字,与人教社用字统计前800字不同的有236字。

当我们将比较范围扩大到甲乙两级字,对比的范围也扩大到教材用字频度统计1 604字,与语文社用字的差异字有346字,与人教社用字的差异字有316字。考虑到总字量的增加幅度是从800到1 604,增长率超过50%,而甲级字与两社用字的差异字的增长率均低于总字量的增长比例。语文社例中,增加幅度是244到346,增加102字;人教社例中,增加幅度是236到316字,增加80字。因此,我们认为,差异字主要还是集中在甲级字与教材用字前800字的段上。

根据各类语料库的字频统计,频度最高的800汉字左右是基础汉语水平的识字范围。这些字可以满足人类认知世界的一般习惯和人类的一般知识系统所需[2-3]。考虑到这一范围的字是常用度最高的字种,是基础中的基础,目前《大纲》的甲级字与小学语文教材的最常用字之间的差异也最大,选择这一范围的字进行讨论,对于理解《大纲》收字的合理性较为适合。

三、《大纲》甲级字与小学语文教材最常用800字的比较与分析

为更好地分析甲级字收字,并进一步提出优化的可能方案,我们丰富了对比的参照系。从汉字的覆盖率、构词能力,以及国家汉字规范标准——语言文字研究成果在国家文字规范中的体现,多方位考察甲级字优化的可能性。具体来说,我们采用了国家语委平衡语料库的频度统计排序、《汉语水平词汇与汉字等级大纲(词表)》(以下简称《大纲词表》)用字的频度统计排序和《现代常用独体字规范》(以下简称《独体字规范》)作为主要标杆。

国家语委现代汉语通用平衡语料库的选材全面涵盖人文社会科学、自然科学和行政文书等其他门类的现代汉语语料,选取1919年以来的各类书面资料,至今仍在不断补充,累计达到1亿字符数[3]。平衡语料库字频统计的排序,体现的是该字在大规模的书面语料中出现的次数,代表广泛的社会领域用字考察 ;《大纲》词表用字的频度统计排序,体现的是该字的构词能力——优先掌握构词能力强的汉字,对于学生的语言学习有益无害;《现代常用独体字规范》列出了256个独体字,即不能再进行构字分解的汉字,这些字既具有一个独立汉字的音形义功能,又是构建其他汉字的基本部件,若在汉语学习的基础阶段出现,有利于学习掌握汉字的结构,形成汉字构造的整体与系统观念。

因本考察的目的是为甲级字的优化提供参考,故特别注重了甲级字与两社用字统计前800字的差异字。我们选取《大纲》甲级字与两社用字统计前800字的差异字,分别与平衡语料库字频序前800字、《大纲词表》字频序前800字进行比对,分析评价这些差异字中哪些应选入甲级字。

下表列出《大纲》甲级字与人教社用字前800字、语文社用字前800字的出入字,分别在平衡语料库和《大纲词表》用字的字频序分段归属的情况。

表1 甲级字与两部教材字频统计前800字在平衡语料库和《大纲词表》字频序中的分布

按照分段资料显示,在两个字频序800字以内的范围,比较双方的差距最大。两社用字前800字超出甲级字范围的,均有将近50%的字集中在这一段,并且均高于对照数据——即高出甲级字中不在两社用字范围的字数。这就提示我们,基础教材用字与大规模语料库的常用字更为接近,基础性相对更为突出,构词能力也稍胜,可作为甲级字修订的选字参考。

特别要提出的是,两社用字前800位的字,都有若干不仅不在甲级字范围,也不在乙级字范围,而是到了丙级。这些字中人教社用字有“伴奔华曲盛”,语文社用字有“奔华曲盛威壮”,二者的交集“奔华曲盛”,应考虑纳入甲级字。其中尤其是“华曲”二字,在两个字频序中均排在800以内,是特别应该注意的。

下面以独体字的情况为例,再析应考虑进入甲级字的基础教材用字。

人教社用字前800字不在甲级字范围的236字中,有30个独体字;语文社用字前800字不在甲级字范围的244字中,有34个独体字。我们将这些字分别按照国家语委平衡语料库的字频和《大纲》词表用字的字频排序,筛查结果如下。

人教社用字不在甲级字范围内的独体字30个字,在平衡语料库和《大纲词表》用字两个字频序中均在800以内的,共有以下18字:“斗击及木曲入失石士田土卫无乡象严由于。”

语文社用字不在甲级字范围内的独体字34个,在平衡语料库和《大纲词表》用字两个字频序中均在800以内的,共有以下18字:“击及木曲入失石士田土卫无乡象血严由于”。

以上两个资料的交集共有17字,即“击及木曲入失石士田土卫无乡象严由于”。这17字,以两社用字字频衡量,以平衡语料库和《大纲词表》字频衡量,以《独体字规范》衡量,我们认为其常用性、基础性,以及汉语汉字学习科学性都足以证明应纳入《大纲》甲级字为妥。

另外,人教社用字不在《大纲》甲级字范围的,除以上所举独体字外,还有72字同时在平衡语料库字频序与《大纲词表》用字频度前800以内;语文社用字该项数据是76字。二者的交集为70字(保背兵并采沉程冲传此达底断队格古官管光害护华激金尽景居军类量料列林令落美密命脑皮品奇强沙伤射受似随台铁微味温显线形修烟养引约越造战争至制终转)。这些字以常用性、基础性、构词能力来衡量,也是甲级字收字应重点考虑的。

四、结 论

1.教学用字的选字分级需要考虑汉字学习的科学规律。

在综合考察用字状况,选择教学用字的时候,现有各类语料用字统计不可谓不多,如何在汉字应用中借鉴使用,仍需要结合汉字学的规律,语言学习的规律,进行细致的研究。不论对于母语学习者还是非母语学习者,汉字的学习都是一个长期的过程,尤其是对非母语学习者,一定程度上是终身性的。因此,“从这个长远目标出发,识字教学不但必须遵循汉字自身的规律,而且要使学习者在潜移默化中感受到汉字的表意特点、汉字的构形规律性和汉字的系统性”,只有这样,“才能在保证品质的前提下提高速度”[4]。

2.需要强调国家组织研制的汉字规范标准,对教学和其他汉字应用的指导意义。

汉字规范标准的研制,通常经过较长期的研究酝酿,反映汉字使用的基础性要求。研制者对于该方面的汉字使用状况、研究状况,通常有较为全面的把握,研制结果具有较高的可信度。将这些研究成果贯彻到汉字应用实际中,不但是执行国家规范标准的问题,也是尊重相关科研成果的必然。

3.《大纲》收字的主要依据仍应强调基础性、通用性。

以汉语为第二语言的汉字教学有其自身的特点和学习需要,有些研究成果提出了考虑到对外汉语教材的特殊性,应收入教材中常见的部分字。比如教材语料中的“尴、尬、侃、炖、啪、嚏、丫、潇、忐、忑、褶、粽、醺、蹒、跚、摞”等字,在3 500常用字表和《大纲》中均未收录,但在实际生活中却经常用到,因此这部分字似应考虑收录入《大纲》[5]。

我们认为,虽然在具体教学中,并不排除考虑到非母语成人学习者的群体特点,在部分字的选择上有所调整。但《大纲》作为汉语教学的指导性规范,其字表收字首先还是应强调基础性、通用性,通用平衡语料、基础教育语料的统计意义仍然应优于其他语料,在最基础、最核心的甲级字的选择上尤其如此。

补 记

本文是我和同事对现代汉字应用状况的系列考察之一。成文后,承蒙北京语言大学万业馨教授指教,将《汉语国际教育用音节汉字词汇等级划分》(以下简称《等级划分》<The Graded Chinese Syllables Characters and Words for the Application of Teaching Chinese to the Speakers of Other Language>)(2010.10)列为下一步考察的对象。

“研制《汉语国际教育用音节和汉字词汇等级划分(国家标准)》(以下简称《等级划分》,拟作”国家标准),不是对1992年《汉语水平词汇与汉字等级大纲》(以下简称《等级大纲》)所作的简单的、一般性的修订,而是在相隔17年之后,社会语言生活发生了巨大变化、对外汉语教学出现了重大转变的时代背景下进行的重大研究(刘英林 马箭飞,2010)。该项目的成果已作为“面向全球汉语国际教育的国家标准”颁布[6]。

因时间所限,《等级划分》的字表、词表尚未及数据化处理,与原有资料库的比对无法全面准确完成。我们将本文中建议收录的若干字与《等级划分》试作比对,列入一级字的有“华/击及木入失石士土卫无乡象由于/保背并采程冲传此达底断队格古管光害护金景军类量”,列入二级字的有“奔曲盛/田严/兵沉官激居料列林令”,“尽落”二字是多音字,较为常用的读音“尽(jìn)”“落(luò)”列在一级,不太常用的“尽(jǐn)”“落(là)”列在二级。考虑到《等级划分》一级字为“普及化等级汉字”,共收900字,比原《大纲》多100字,但我们建议应在800字级别的字,仍有部分未收进这一范围,这令我们感到很有进一步研究探讨的必要。

[1]刘英林,宋绍周.汉语水平词汇与汉字等级大纲·论汉语教学字词的统计与分级(代序)[M].北京:经济科学出版社,2001.

[2]姚喜双.《汉语800字》的思考[J].语言文字应用,2008(4):83-92.

[3]郭龙生.《汉语800字》的三点思考[J].语言文字应用,2009(3):113-119.

[4]王 宁.汉字构形学讲座[M].上海:上海教育出版社,2002.

[5]王衍军.20世纪50年代以来对外汉语精读教材用字情况调查——以五套对外汉语精读教材为例[J].暨南大学华文学院学报:华文教学与研究,2009(2):51-59.

[6]刘英林,马箭飞.研制《音节和汉字词汇等级划分》探寻汉语国际教育新思维[J].世界汉语教学,2010(1):82-92.

The Analysis for the Classification of Characters in the Table of“Words and Characters for Chinese Ability Outline”

WANG Min,WANG Xiao-ming
(Institute of Applied Linguistics of Ministry of Education,Department of Chinese Characters and Chinese Phonetics,Beijing 100010,China)

This article inspects the situation of the character classification for the Character Table of the“outline”,and a comparative study has been made with the existing State Standardization of Chinese Characters,such as“Modern Chinese characters commonly used in the table,”“Modern popular characters used alone standards,”and the frequency statistics.The article suggests on the main principle of choosing character and classifying the level in the table.①The outline should choose the chinese characters and useful single words,which are helpful to understund the word structure rules of chinese characters,have high ability of word formation,and are in favor of vocabulary learning.②The standards of chinese charaters made by the national organization,usually after a long-term research brewing,have high reliability and significance on the application of chinese characters.③As a guiding standard of teaching chinese,the table of the“Outline”should be emphasized for basic,univers,and wide applicability,and at its most basic and core first-grade chinese characters,the choice should especially do like this.

WordsandCharactersforChineseAbilityOutline;the first grade Characters;state standardization of Chinese characters;the characters in the Syllabus

H195

A

1005-6378(2012)04-0103-05

2012-03-23

王敏(1972.9-),女,河北省故城县人,教育部语言文字应用研究所,副研究员,北京师范大学文学博士,主要研究方向:现代汉字学、辞书研究、普通话语音研究。

[责任编辑 侯翠环]

猜你喜欢
常用字词表用字
容易混淆的词语
《汉语大字典》“人名用字”考误举隅
A Chinese-English List of the Sports Programmes in Winter Olympics 冬奥会项目名称汉英对照词表
科技论文表格的编排要求(五):用线和用字
关于常用字覆盖率统计算法的研究
叙词表与其他词表的互操作标准
辽代避讳用字“元”
谈常用字词的选取及其等级划分
国外叙词表的应用与发展趋势探讨*
常用联绵词表