谈常用字词的选取及其等级划分

2015-05-11 21:44李兆麟
辞书研究 2014年2期
关键词:常用词常用字词频

摘 要 文章将《汉语水平词汇与汉字等级大纲》与《汉语国际教育用音节汉字词汇等级划分》进行比较,指出后者选取常用字和常用词更准确,划分等级更简明,但还存在一些问题,提出不仅应根据使用频率选取常用字和常用词,还应按照“急需先学、先易后难、由浅入深、循序渐进”的教学原则选取常用字和常用词以及划分等级,要做到少而精,不能贪多求全,以缩短教学时间,取得事半功倍的效果。

关键词 常用字 常用词 字频 词频

一、引 言

为了适应外国人学汉语的需要,教育部和国家语言文字委员会在2010年10月发布了《汉语国际教育用音节汉字词汇等级划分》(以下简称《等级划分》)。作为国家语言文字规范,《等级划分》里的《分级汉字表》和《分级词汇表》与《汉语水平词汇与汉字等级大纲》(以下简称《大纲》)里的《HSK等级字表》和《HSK等级词表》相比,常用字和常用词的选取更准确,等级划分更简明。《大纲》将字和词分别分为甲、乙、丙、丁四级,《等级划分》将字和词分别分为一级、二级、三级,以适应不同水平学习者的需要。划分等级的常用字表和常用词表不仅对外汉语教学需要,国内小学汉语汉字教学和少数民族学习汉语汉字也需要,同时也便于教材编写、课堂教学、课程测试和工具书编写,值得深入研究。

二、常用字的选取及其等级划分

我们研制分级汉字表和分级词汇表的目的,是想使学习汉语的外国人用最少的时间和精力先学习一批用处最大、用得最多的常用字和常用词,基本上能读懂、听懂书面语和口语,以提高学习汉语汉字的效率,取得事半功倍的效果。哪些字和词是初级水平的人应该学习的,哪些字和词是中高级水平的人应该学习的,要有充分依据。把用处不大、用得不多的字和词选入字表或词表,或者选入的字和词的等级划分不恰当,或者急需学习的字和词失收过多,都会影响字表或词表的质量,徒然浪费学习者的时间和精力,这就违背了我们研制字表和词表的初衷。

现代汉语通用字约有8000个左右,除了以汉语为专业的外国人,一般学习汉语的外国人并不需要识这么多字。《分级汉字表》将外国人学汉字的字数定为3000个是恰当的,这相当于我国小学毕业生的识字水平。各种字频统计表明,如能识3000个常用汉字,现代书报刊物上用白话写的文章就可以认读出99.5%左右,剩下的5000个左右汉字的使用率仅占0.5%。如想继续提高汉语汉字水平,还需要再学习1500个以上汉字,但不必在课堂或教材中学习,读书看报时查工具书就可达到目的。

《分级汉字表》收录一、二、三级汉字各900个,三级附录汉字300个,共计3000个。据笔者统计,其中有《现代汉语常用字表》上的常用字2438个,次常用字495个,《现代汉语通用字表》上的通用字67个。由此可知,《分级汉字表》选字大多是以《现代汉语常用字表》为依据的,但又不拘泥于此。这是因为社会生活不断发展变化,汉语的词汇也随之发展变化,有些词渐渐不用或少用了,有些词用得多了起来,还有更多的新词产生出来。汉字是记录汉语的符号,词汇的这些变化也会使某些字的使用频率发生变化。例如“倭寇”“日寇”中的“寇”字,在1988年发布的《现代汉语常用字表》上是常用字,但因为近年来用得很少,所以《分级汉字表》不收这个字。又如“媒”“谐”两个字,在《现代汉语常用字表》上是次常用字,因为近年来“媒体”“传媒”“和谐”用得多了起来,查《现代汉语常用词表(草案)》(以下简称《词表(草案)》,这3个词的频序号分别是1992、6591、2234,可以看出其使用频率都较高,所以在《分级汉字表》中“媒”被划为一级汉字,“谐”被划为二级汉字。再如“弘”“崛”两个字,本来是不常用的通用字,因为近年来“弘扬”“崛起”两个词用得多了起来,查《词表(草案)》,“弘扬”的频序号是3254,“崛起”的频序号是4981,所以在《分级汉字表》中这两个字被划为三级汉字。《分级汉字表》的研制者选取这些字并对这些字划分等级是很恰当的。《HSK等级字表》不收“弘”“崛”两个字,对《现代汉语常用字表》上的2500个常用字全部照搬,没有增删一个字,虽然也收“媒”“谐”两个字,但是将这两个字划分为丁级汉字,等等,使人觉得《分级汉字表》更适合对外汉语教学需要。

由于《分级汉字表》只收3000个字,《现代汉语常用字表》上2500个常用字和1000个次常用字显然不能全收,又由于汉字的常用性一直在变化,必然有若干常用字和次常用字落选。在落选的62个常用字之中需要商榷的有:“驴、骆、驼、狐、狸、蚂、蚁、蝴、蝶、蜘、蛛”等动物类名词用字。这些字在供外国成人学习的汉语教材中可能用得很少,但在供外国少年儿童学习的汉语教材中就可能用得很多。例如《伊索寓言》《列那狐的故事》等寓言、童话中就常常用到这些字。查《现代汉语频率词典》(以下简称《频率词典》)里的《频率最高的前8000个词词表》,“驴”的频序号是4211,“骆驼”的频序号是1496,“狐狸”的频序号是5801,“蚂蚁”的频序号是3344,“蝴蝶”的频序号是3677,“蜘蛛”的频序号是3742,可知这些字和词的使用频率都较高。查《普通话三千常用词表》,这些词该表都收。由此可见,这些字和词都应该收入《分级汉字表》和《分级词汇表》。又如“眯”字,可做单音节动词,又是多音节形容词“笑眯眯”的语素,查《频率词典》,单音节词“眯”的频序号是4759,“笑眯眯”的频序号是5407,使用频率都较高,可见这个字也不能不收。再如,“箩”和“锣”是器物类名词用字,《普通话三千常用词表》收了这两个单音节词。既然《分级汉字表》收了“筐”和“鼓”,这两个字构成“箩筐”“锣鼓喧天”“紧锣密鼓”等词语时,就少不了“箩”“锣”两个字。看来增字或删字必须有照应,不能顾此失彼。

选准常用字,确定恰当的数量是为了节省教学时间,划分等级是为了便于教学,做到“急需先学、先易后难、由浅入深、循序渐进”。《HSK等级字表》中许多字的等级划分不恰当,反映了研制该表时对汉字的特点以及汉字与词汇的密切关系不够重视。例如“土、木、王、石、金、止”等字,既是最常用的基本字,又是单音节词,在《HSK等级字表》上本应划为甲级字,却被划为乙级字。这些失误以及其他失误已被《分级汉字表》纠正,但仍然不彻底,而且另外又有一些字的等级划分不恰当。例如“田、虫、豆、瓜、革”5个字,应该划为一级汉字,却被划为二级汉字。“田、虫、豆、瓜、革”都是语素字,又是单音节词,能够单用,通称单字词,在汉字系统内既是表义偏旁,能构成“界、畔、略、男、蚊、蝇、虾、蚕、豌、瓣、瓤、鞋、靴、鞭、靶”等字,又是表音偏旁,能构成“甸、佃、融、逗、短、孤、狐、弧、缂”等形声字。其中“田”“虫”两个字还是频度很高的基础部件,查《部件组字频度表》,“田”能组字480个,频序号是14,“虫”能组字328个,频序号是22。可见这5个字都是构字能力很强的基本字。查《常用构词字典》,“田”“虫”两个字各构词60多个,“豆”字构词70多个,“瓜”字构词40多个,“革”字构词20多个,可见这5个字也是构词能力很强或较强的语素字,在学习汉语词汇和汉字的初级阶段必须学习。

常用字与常用词既有联系又有区别,字的等级与词的等级也是如此。某个字的出现次数多,主要原因可能不是构词的数量多,而是在所构成的若干词中有一两个出现次数较多,这一两个词的出现次数多,字的出现次数就多。在《分级汉字表》上,绝大多数划为一级汉字的字,其构成的词在《分级词汇表》上就有一个或几个一级词,凡是划为二级或三级汉字的,其构成的词在《分级词汇表》上就没有一个一级词。如果某个字的等级划分不恰当,由其构成的词的等级划分也可能是不恰当的。例如“革”字,因为被划为二级汉字,所以“革命”“改革”两个词也被划为二级词。查《频率词典·汉字频率表》,“革”字的频序号是164,出现次数是2176。查《频率词典·频率最高的前8000个词词表》,“革命”的频序号是71,出现次数是1963,“改革”的频序号是1477,出现次数是117,“变革”的出现次数是39,“革新”的出现次数是20,“皮革”的出现次数是9,可见“革”字的出现次数大多是从“革命”和“改革”两个词的出现次数中统计出来的。再查《汉字频度表》,“革”字的频序号是61,查《最常用的汉字是哪些》,“革”字的频序号是195,查《词表(草案)》,“革命”的频序号是246,“改革”的频序号是563,这无可争辩地证明“革命”和“改革”是使用频率很高的词,都应该划为一级词,“革”字也是使用频率很高的字,应该划为一级汉字。这就使我们悟出一个道理,对外汉语教学是为了掌握常用词而识字,不是为了识常用字而掌握常用词;从选择常用词的角度来选取常用字而研制出来的常用字表一定会更准确、更适用,从选择常用字的角度来选取常用词必然有一些词被误选或者划分等级不恰当。

《分级汉字表》的三个等级比较起来,一级汉字的选取最重要,因为这一级的汉字是为以后学习更多的汉字打基础的,所以《等级划分·说明》也称这一级是“普及化等级”。在识字的初级阶段,我们必须多从教学需要考虑,查阅各种字频、词频统计资料以及其他相关资料,进行比对,同时还要综合考虑各条选取常用字的原则,从而筛选出外国人急需学习的最基本、最常用的字(词)。下文笔者再从一级汉字中提出一个字来讨论:

“李”字是我国最常见的姓氏用字之一,但不是专用字。查《汉字频度表》《最常用的汉字是哪些》等统计资料,“李”字的频序号都在800号以前。“李”字如果不做姓氏用字,作为“李树、李子、行李、瓜田李下”等语素字使用,出现次数就不多。《频率词典·汉字频率表》因为在统计时不统计姓氏用字的出现次数,所以“李”字在180多万字的语料中的出现次数只有41次,频序号是2196。如果按照《汉字频度表》上的数据(频序号是756,出现次数是5339),“李”字应该划为一级汉字,如果按照《频率词典》上的数据,“李”字划为二级汉字才比较符合实际。查1952年6月教育部发布的《常用字表》,该表未把“李”字作为最常用的字列在1010个一等常用字之内,而是列在490个次常用字之内,这是有道理的。由此可见,《分级汉字表》将“李”字划为一级汉字是不恰当的,应该划为二级汉字。

另外,还有一个三级附录汉字的等级划分需要讨论,这就是“孔”字。“孔”字被列在2700个汉字之后,使人诧异。“孔”字不仅可作姓氏字用,查《常用构词字典》,它还能构成20多个词语。在《频率词典》上可以查到“面孔、鼻孔、脸孔、孔雀”等,这些词的频序号分别是3502、4505、6829、6638,可知这些词都是高频词,但是这些高频词《分级词汇表》一个都不收。查《频率词典·汉字频率表》,“孔”字的频序号是1068,查民国时期陈鹤琴的字频统计成果——《语体文应用字汇》,“孔”字在55万多字的语料中出现次数是106,频序号约为1130,跟《汉字频率表》的频序号接近。再查1952年6月教育部发布的《常用字表》,“孔”字被划为次常用字(在1500个常用字的范围内),更证明这个字绝不应该被排列在2700号字之后,不应划为三级附录汉字,而应划为二级汉字。孔子是中华文化名人,外国人进孔子学院或孔子课堂学汉语必然要遇到一个“孔”字,为什么外国人非要到学汉字的高级阶段才能学习“孔”字呢?

三、常用词的选取及其等级划分

词汇是语言的基本材料。外国人学汉语必须首先掌握一些最基本、最常用的词。哪些词是最基本的词?哪些词是最常用的词?如何筛选?选出的词如何分级?这些都是研制分级词汇表时会遇到的问题。选取常用词并对常用词划分等级比选择常用字并对常用字划分等级复杂得多,不能仅凭词的使用频率来选词或者分级,还要根据词义性质(基本义、常用义还是罕用义)、遵循教学原则进行人工干预。

《频率词典》是我国第一部字词统计兼顾的频率词典。由于它所统计的语料具有代表性、多样性和均匀性,力求克服抽样偏差,使“假象高频词(字)减少到最低限度”,因此它所统计出的词频和字频数据最接近我国中等文化程度的人用词用字的实际情况。笔者通过比较,知道语料数量分别比它大6倍、12倍的《最常用的汉字是哪些》《汉字频度表》的统计成果,其客观性、准确性都不及它。《频率词典》的语料共计180多万字,统计出不同词语31159个,不同单字4574个,其中频率最高的前8441个词语累计出现频率占全部语料的95%,其余22718个词语仅占全部语料的5%,使我们知道日常生活、社会交际所需要掌握的词语大约是9000个左右。据笔者初步统计,频率最高的前8441个词,共用了2799个不同单字,其中有常用字2351个,次常用字375个,通用字73个。这样的用字情况与《分级汉字表》的用字情况(三级附录汉字除外)大致相似。为了使常用词表收词做到少而精,根据以上统计和《分级词汇表》所收词语的情况,笔者将其与《频率词典·频率最高的前8000个词词表》《词表(草案)》《普通话三千常用词表》《HSK等级词表》4种词表所收词语进行比对,发现供外国人学习汉语的常用词表收词9000个左右比较合适,基本上能帮助外国人表达自己的意思和进行会话,此后每提高一个百分点少则需要多学四五千个词,多则需要多学近万个词,很不经济,《分级词汇表》收词似乎多了一些。

《词表(草案)》是在《现代汉语通用词表》研制的基础上,利用3个大型语料库(总计2.5亿字)的数据,又适当地进行人工干预而编成的,是资料性的常用词表。该表判断词与非词基本上符合汉语的实际使用情况,共计收录词语56008个,用了不同单字5144个,为我们研制实用性的常用词表提供方便,弥补了《频率词典》所统计到的不同词语偏少的缺点。但是由于该表用来检测词频所采用的语料中时事新闻类语料偏多(占54%),这就使地名、国名、职务名、姓氏用字和某些词语的使用频率偏高,频序号偏前,又由于《词表(草案)》上每个词只有频序号而没有频率、使用度数据,某个词是否真正常用或者在哪一类语料中常用没有具体数字标示,容易使人误判。好在研制该表时所利用的语料数量巨大,大多数词语的常用程度还能从频序号上大致推测出来,如果再用《频率词典》《普通话三千常用词表》和《HSK等级词表》跟它进行比对,对判断词语的常用程度以及划分词语等级还是很有参考价值的。

《分级词汇表》收一级词2245个,二级词3211个,三级词4175个,三级附录词1461个,共计11092个。笔者以《词表(草案)》为依据,将《分级词汇表》所收的词语一一登录在《词表(草案)》上以后,发现《分级词汇表》所收的词语多半是《词表(草案)》上频序号15000号以前的词语,15000号以后的词语不太多,再用《频率词典》上的8441个高频词、《普通话三千常用词表》上的3996个词和《HSK等级字表》上的8822个词与《分级词汇表》的11092个词进行比对,知道《分级词汇表》失收、不必收以及分级不恰当的词语仍然不少。失收的词中名词有“老虎、老鼠、乌鸦、麻雀、衣裳、袖子、化学、电子、花朵、闲话、田地、田野、战线、阵地、皱纹”,动词有“起身、鼓吹、呼喊、轻视、厌恶、奔驰、作(做)主、走动”,形容词有“洁白、苍白、欢喜、急切、飞快、镇静、静悄悄”,等等。这些词除了“乌鸦”外,其余在《词表(草案)》上的频序号都在11000号以前。笔者还注意到,《分级词汇表》选收了“虎、鼠、衣服、化肥、肥料、电子版、电子邮件、鸦雀无声、袖珍、袖手旁观、驰名”等词语,但是“老虎、老鼠、衣裳”等口语里常用到的词却未收。“化肥”是化学肥料的简称,不收“化学”只收“化肥”,解释“化肥”时还是要讲“化学”、学“化学”这个词的。不收“电子”,解释“电子版、电子邮件”时,也要讲“电子”、学“电子”。何况现在“电子商务、电子游戏、电子图书、电子计算机”等词很多,“电子”这个词怎能不收呢?“鸦雀无声”的意思是连乌鸦和麻雀的声音都没有,形容非常安静。如果不学“乌鸦”和“麻雀”两个词,解释“鸦雀无声”时还是绕不过这两个词。此类例子很多,不再赘述。

由此可见,研制词表时我们必须多从教学上考虑如何选取词语的问题,要从词义上考虑是基本词汇还是一般词汇,基础的、具体的、可图解的词优先,然后是抽象词语,同时要重视词与词之间的关联性,不能违反“急需先学、先易后难、由浅入深、循序渐进”的原则。假如词表收词有限,宁可不收“化肥、鸦雀无声、袖珍、袖手旁观、驰名”等词语,也要收“化学、电子、乌鸦、麻雀、袖子、奔驰”等词。《普通话三千常用词表》是从日常生活和教学上是否需要来选取常用词的,1987年增订后收词3996个,常用率达到87%,大体上做到了少而精,不贪多求全,这样的选词经验值得借鉴。

再谈不必收的词。我们选取常用词主要是为了满足外国人学汉语的一般需要,很少用到的词语,“见词而知义”的熟语,仅为专业人士或更高水平的人所需要的词语要从严掌握。例如《分级词汇表》中的“忌口”“卤味”,查《词表(草案)》,这两词的频序号是53785、55761,显然是难得一用的低频词,不必收。又如“恰恰相反”“冷酷无情”“疲惫不堪”等一些“见词而知义”的熟语,因为《分级词汇表》已经收有“恰恰”“相反”“冷酷”“无情””疲惫”“不堪”等词,就没有必要再收这3个熟语,《词表(草案)》就未收。

《分级词汇表》收了跟体育运动有关的词大约40多个,例如“排球、球迷、球星、球鞋、球拍、亚运会、奥运会、比赛、竞赛、参赛、预赛、决赛、半决赛、联赛、大赛、大奖赛、金牌、银牌……”,这一类词是否需要收这么多?如果以使用频率作为选取常用词的唯一标准,“球星、球鞋、球拍”在《词表(草案)》上的频序号分别是13453、30963、33030,频序号都在11000号以后,就不必收。“亚运会”“奥运会”是简称,不必收,只收“运动会”就可以,不必具体到是什么地区或范围的运动会。假如的确需要,就另收“亚洲”“奥林匹克”。“赛”字构成的同族词《分级词汇表》收了9个。“比赛”是基本的常用词,词义涵盖面广,可以代替其他同族词使用,划为一级词毫无疑问。查《词表(草案)》,它的频序号是899,在“赛”字构成的同族词中,它的使用频率最高,也可证明这个词最常用。“参赛”是简称,一级词汇已经收了“参加”和“比赛”,这个“见词而知义”的“参赛”就不必收进词表了。“竞赛”是“比赛”的同义词,词义跟“比赛”差不多,要不要收?这就取决于词表的规模。《普通话三千常用词表》只收“比赛”,其余“赛”字构成的同族词都未收。《HSK等级词表》只收了“比赛、竞赛、预赛、决赛”4个词,也无可非议。可是《分级词汇表》不加节制,居然收了9个“赛”字构成的复词,显然有失偏颇。又如《分级词汇表》收了“球迷、歌迷、影迷”3个“迷”字构成的同族词,查《词表(草案)》,这3个词的频序号分别是4717、31156、37277,可见选取“球迷”就可以了,后两个词使用频率都不高,就不必选取。如果不严格控制,那么“戏迷、棋迷、网迷、舞迷、财迷”等词也要收进词表了。《分级词汇表》类似这样不适当地放宽收词的例子尚多,恕不赘述。须知常用词表收词有限,为了做到“少而精”,只能收最需要或较需要的,可有可无的词应尽可能不收。学生只要掌握若干基本词和常用词以后,教师就可利用语素扩展法让学生用“赛”“迷”这两个语素字构词,从而扩大词汇量,调动学生主动学习的积极性。《普通话三千常用词表》跟体育运动有关的词只收十几个,可以看出该表的研制者很注意控制收词量,讲求词义的涵盖面及常用字的构词能力。在这方面英、法、德、俄等国研制基础词汇表的许多经验很值得我们学习。比如加拿大拉瓦尔大学语言学教授萨瓦尔提出了词汇价概念的理论,目的就是为了使选词做到少而精。据《计量词汇学及其他》著者程曾厚(1987)转述:“基础词汇要少而精。少而精是和语言的经济原则直接相关的。词汇价是什么?词汇价是指一个词取代别的词的能力。在任何语言中,很少有词是不能用别的词替代的。如果一个词在很多场合能替代别的词,而表达的意义不变,那么这个词理应更有希望被收进基础词汇。”根据计量词汇学的理论和国外研制基础词汇表的经验,有了各种词频统计资料后,我们研制常用词表的重点应该是加强对基本词、同义词和同族词的研究,筛选出其中最基本又最常用的词,力求做到以简驭繁、以一当十,而不应贪多求全、无所不包。

其实多收几百个词或少收几百个词对收词11092个的《分级词汇表》的质量影响不会太大,关键是选词要准确,划分等级要恰当,尤其是一级词汇中的各个词要选得准,最基本最常用的词不能失收过多,该划为一级词就不应划为二级词,该划为二级词就不应划为一级词。对词划分等级不能仅凭使用频率高低来确定等级,同时还要考虑是基本词汇还是一般词汇,词与词之间的关联性,词的难易度,先学后学的顺序,等等。例如《分级词汇表》将“茶”“绿茶”“红茶”划为一级词,这3个词比较起来,“茶”是基本词,初级阶段必学,应收,“绿茶”“红茶”不是基本词,暂时可以不学,就不必收。因为一级词汇已经收了单音节形容词“绿”和“红”,到需要学习单义的偏正结构的合成词“绿茶”和“红茶”时,一定不会觉得困难。查《词表(草案)》,“茶”的频序号是2047,“绿茶”的频序号是24777,“红茶”的频序号是29108,可见这3个词的常用程度大不相同,不必同时学习。又如《分级词汇表》将“电话”“公用电话”划为一级词,“公用”划为三级词。既然在初级阶段已经学了“公用电话”,到了高级阶段就没有必要再学习“公用”一词。实际上将“公用电话”划为一级词是不恰当的,一级词汇只收“电话”即可。查《词表(草案)》,未收“公用电话”是有道理的。再如《分级词汇表》将“堵车”划为二级词,“堵塞”划为三级词,也是不恰当的。从意义上考虑,“堵塞”比“堵车”重要,应该先学“堵塞”“车辆”“汽车”等词(一级词汇已收“车辆”和“汽车”),后学“堵车”。这是因为合成词的词义跟语素义往往有着密切的关系,合成词的意义一般可由语素的意义去推求。查《词表(草案)》,“堵塞”的频序号是7976,“堵车”的频序号是21106,可知“堵塞”的使用频率比“堵车”高得多,应该划为二级词,“堵车”划为三级词或者不收才比较恰当。

根据《〈词表(草案)〉研制报告》,在该表收录的56008个词语中,单音节词有3181个,约占5.6%。虽然单字词在全部词语总数中只占少数,但它是词根,表达的是人们在交际时最不能缺少的概念,是词义的基础,能构成成千上万个合成词。但是长期以来在对外汉语教学中未受到足够的重视。例如《HSK等级词表》将“土”“木”“金”划为乙级词,“王”划为丁级词,“石”未收,现在《分级词汇表》将“土”“金”划为一级词是恰当的,但是将“木”“王”划为二级词,不收“石”,则不妥当。研制常用词表失收某些单字词以及对单字词的等级划分忽高忽低,反映了我们选词、划级的标准和原则不很明确,可操作性差,随意性大。“木”“王”“石”等单字词在汉字系统内也同前面论述过的“田”“虫”“豆”“瓜”“革”一样,既是表义偏旁又是表音偏旁,能构成许多常用字和更多的通用字。这3个单字词也能构成许多双音节或多音节词语,其中还有“树木、木头、木材、国王、石头、石油”等高频词,在学习汉语汉字的初级阶段必须学习。查《词表(草案)》,这3个单字词的频序号分别是2166、327、1291,也可证明应该划为一级词。如果不将这3个单音节词划为一级词,就跟《分级汉字表》上将这3个字划为一级汉字自相矛盾。

在对外汉语教学中,我们不能忽视汉字与词汇的密切关系,不能忽视基本词汇是词汇中最有用也是最稳定的部分这一事实,不能忽视汉语词的形式从以单音节为主发展到以双音节为主的历史。汉字是词的书面载体,一个字往往就是一个语素或者是一个单音节词,成千上万的合成词是由两个或两个以上的语素(字)合成的。从《HSK等级词表》到《分级词汇表》,还有不少对外汉语教材,对于汉语的词是由集形音义于一体的字构成的特点认识不足,没有紧紧抓住汉语构词的最小单位——语素,尤其是能独立运用的单字词来进行汉语教学,致使词汇教学跟汉字教学脱节,反映在研制等级词表时不重视选取单字词,或者虽然选取了,但是是“降级使用”,而不是“越级提升”,如“木”“王”“田”“瓜”等单字词就是被这样对待的。外国人学汉语可以不必从语法入手,但是不能不从词汇入手,学一些数量不多、最基本最常用的单字词和数量较多、常用的合成词。

四、结 语

《等级划分》是国家语言文字规范,是对外汉语教材和工具书编写的依据,正如《等级划分》专家鉴定会“鉴定意见”所说,它“首创汉语音节、汉字和词汇有机融合的三维基准体系”,“体现了汉语国际教育的新理念”,应该称赞,但是由于通盘协调不够,致使三维基准体系的有机融合在不少地方没有落实,所以出现上述一些问题,必须严肃对待,抓紧修订。

参考文献

1.北京语言学院语言教学研究所.现代汉语频率词典.北京:北京语言学院出版社,1986.

2.陈鹤琴.语体文应用字汇.上海:商务印书馆,1928.

3.程曾厚.计量词汇学及其他.南京:江苏教育出版社,1987.

4.傅兴岭,陈章焕.常用构词字典.北京:中国人民大学出版社,1982.

5.国家对外汉语教学领导小组办公室,北京语言学院汉语水平考试中心.汉语水平词汇与汉字等级大纲.北京:北京语言学院出版社,1992.

6.国家语言文字工作委员会汉字处.现代汉语常用字表.北京:语文出版社,1988.

7.教育部,国家语言文字工作委员会.汉语国际教育用音节汉字词汇等级划分.北京:北京语言大学出版社,2010.

8.李兆麟.汉语计量研究初探.辞书研究,1989(1).

9.李兆麟.三种字频统计资料的比较.江苏教育学院学报,1988(3).

10.《现代汉语常用词表》课题组.现代汉语常用词表(草案).北京:商务印书馆,2008.

11.郑林曦.普通话三千常用词表(增订本).北京:文字改革出版社,1987.

12.中国文字改革委员会,国家标准局.最常用的汉字是哪些.北京:文字改革出版社,1986.

13.中国文字改革委员会汉字处,武汉大学.部件组字频度表.中国语文,1985(4).

14.中央教育部.常用字表.北京:人民教育出版社,1952.

15.748工程查频小组.汉字频度表.北京:北京新华印刷厂,1977.

(江苏教育学院中文系 南京 210013)

(责任编辑 李潇潇)

猜你喜欢
常用词常用字词频
基于词频分析法的社区公园归属感营建要素研究
常用词“怠”“惰”“懒”的历时演变
关于常用字覆盖率统计算法的研究
古代头衣常用字“帽、冠、巾”的演变研究
常用词“开、辟”在“开阔”义上的演变替换
词频,一部隐秘的历史
云存储中支持词频和用户喜好的密文模糊检索
以关键词词频法透视《大学图书馆学报》学术研究特色
外语教学中的非词语化现象研究*——以常用词gain, run 为例
春节用语的英语说法