《现代汉语词典》中复杂词汇单位 立目分析

2020-03-23 06:09于屏方杜家利
辞书研究 2020年2期
关键词:词汇化现代汉语词典

于屏方 杜家利

提 要 复杂词汇单位指在形式上大于词,功能上等于词的语言单位。在《现代汉语词典》各版本中,复杂词汇单位主要采取三种立目策略: 分解策略、整体策略和兼容策略,但一部分复杂词汇单位立目策略的选择没有充分考虑复杂词汇单位自身的语言特点。文章从词汇化角度,分析汉语复杂词汇单位在语义组合性、内部结构的可分析性、结构可变性以及共现成分的可选性差异。文章认为,应根据复杂词汇单位自身特点采取适当的立目策略,即完全词汇化的复杂词汇单位应采取整体立目策略;隐喻词汇化的复杂词汇单位首先考虑分解立目策略,如共现成分具有唯一性,则考虑整体策略;弱词汇化或非词汇化复杂词汇单位立目应以分解策略为主。兼容性立目的数量应该控制。

关键词 词典立目 《现代汉语词典》 词汇化 复杂词汇单位

一、 问题的提出

复杂词汇单位指形式上大于词,功能上等于词的语言单位,包括习语和短语两大类。吕叔湘先生(1958)在《〈现代汉语词典〉编写细则》中,只有一条有关成语收录的规则,对其他复杂词汇单位的收录以及立目问题都没有涉及。但是,历版《现代汉语词典》都收录了不少非成语复杂词汇单位,其立目原则、策略是什么,在哪些复杂词汇单位的处理上出现不统一甚至是不合理之处,都需要进一步研究。

汉语复杂词汇单位内部的语义和语法关系非常复杂。一些复杂词汇单位已凝固为一个整体,内部语义具有整体性,句法结构固定,如“风马牛不相及”。另外一些复杂词汇单位内部可继续切分出一个双音节(甚至是三音节以上)语言成分,且切分出的语言成分或者能够独立使用,或者具有一定的组合能力,比如“要面子”和“休戚”。按照语义和语法关系,“要面子”可以切分出“要”和“面子”两个部分,并且“面子”本身即是一个词。“休戚”在现代汉语中不能单独使用,但可以组成“休戚与共”“休戚相关”等习语。在这种情况下,词典编纂者需要考虑立目单位应该是“面子”还是“要面子”,是“休戚”还是“休戚与共/相关”。

从理论上说,复杂词汇单位的词典立目存在三种可能: 一是考虑到语言单位的习语性和使用的高频性,把复杂词汇单位的整体作为立目单位;二是考虑到语言单位的组合能力以及对相关使用实例的覆盖程度,把且仅把复杂词汇单位分解后离析出来的语言构件作为立目单位,复杂词汇单位整体则作为配例出现;三是为方便用户查询,同时为避免对相同类型复杂词汇单位的立目资格判定结果的不一致,采取折中的办法,既把分解出来的、较小的语言构件立目,同时也把复杂词汇单位整体立目。但是,在词典编纂实践中,由于纸质词典空间的限制,复杂词汇单位的整体和析出成分一般不宜同时立目,通常需要在二者之中做出立目选择。在这种情况下,词典编纂者需要明确复杂词汇单位立目的选择标准。

当代词典编纂已经远远超出了艺术或技巧的层面,发展成为语言学理论驱动下的词典实践活动。“语言学理论发展的水平归根结底决定着词典编纂学发展的方向和水平。”(石肆壬1981)本文拟从词汇化视角,分析汉语复杂词汇单位的特点、词汇化程度及其对词典立目的影响。近年来,学界对词汇化研究非常关注,研究范围也较为广泛,涉及词汇化的定义与所指、词汇化的类型与模式、词汇化与语法化的关系等(如董秀芳2009;刘红妮2010;储泽祥,智红霞2012),其中尤以对某个(些)具体语言单位词汇化过程的分析居多(如董秀芳2003;江蓝生2004;刘红妮2007;管志斌2012)。到目前为止,从词典编纂角度关注词汇化研究的仅有徐时仪(2004)。徐文主要分析了历时性大型语文词典《汉语大词典》应如何在释义方面反映出词汇化语言单位的语义演变结果,对词典收词立目问题则未涉及。在《现代汉语词典》(以下简称《现汉》)第6版的修订中,一个重要的举措是“吸收词汇学和语法化研究的新成果,增收一些已经词汇化了的词语”(江蓝生2013)。

本文拟从词汇化的角度,分析复杂词汇单位的特点,在此基础上,分析它们在《现汉》中的立目情况,力图提出较为可行的立目建议。《现汉》是“第一部确定现代汉语词汇规范的词典……是汉语辞书发展史上的一个里程碑……《现汉》在收词……等几个方面都超越了它以前的词典,达到了前所未有的高度”(曹先擢,晁繼周2002)。对《现汉》复杂词汇单位立目情况的分析,可以反映我国共时性规范语文词典在复杂词汇单位立目资格判定中的基本策略,并揭示其中存在的较为普遍的问题。

二、 汉语词汇系统中复杂词汇单位的语言特点分析——词汇化视角

学界对复杂词汇单位的研究,大致分为两类: 一类是非建构模式(non-compositional model),认为复杂词汇单位相当于一个长单词,语义不可分解,句法不可分析,在心理词典中是整词表征形式。(Callies & Butcher2007)另一类是建构模式(compositional model),认为各构成成分对复杂词汇单位的整体意义有影响,语义可以分解,语法可以分析,在心理词典中是词素组合表征形式(Gibbs,Bogdanovich, sykes et al.1997)。我们认为,复杂词汇单位作为人类语言系统中一个重要的聚合系统,其内部成员繁多,类型多样,特点复杂,单一模式很难涵盖其全部成员的特点。复杂词汇单位宜视为一个连续统,非建构模式和建构模式分别代表的,是其两个极点状态——完全词汇化和非词汇化,二者之间还存在着中间地带,其词汇化程度依次递减。主要表现在如下方面: 复杂词汇单位语义组合性差异;内部结构的可分析性和分界差异;复杂词汇单位结构可变性以及共现成分的可选性差异。

(一) 复杂词汇单位语义的组合性分析

按照内部语义组合的融合性程度进行分析,复杂词汇单位可分为三种类型:

1. 语义组合型复杂词汇单位。此类复杂词汇单位各组成成分的常规意义完全或基本被保留,各组成成分按照常规语法关系加合之后形成整体意义,比如“出难题”“喷火器”“要面子”“传家宝”“抽油烟机”“过街天桥”“可望不可即”等。这些复杂词汇单位实际上属于通常意义上的短语,其意义加工过程涉及词汇常规意义检索与常规句法分析,整体意义具有可分析性特点,内部构词理据的清晰度高,属“非词汇化”或“弱词汇化”类型。

2. 双重语义叠合型复杂词汇单位。所谓双重语义,是指常规义及基于常规义产生的引申义的双重叠合。“交学费”“查户口”“起跑线”“含金量”等的本义和引申义可根据语境不同而相应凸显,如“该交学费了”和“算了,就算是交学费了”分别显示的是“交学费”的常规义和引申义。从构成成分字面义的显隐程度看,双重语义叠合型复杂词汇单位可分为两小类: 一是一些构成成分仍保留其常规字面义,另外一些成分凸显的则是比喻义或借喻义,比如在“露马脚”中,“露”凸显的是常规义,“马脚”则是比喻义;二是分开来看,复杂词汇单位的各构成成分依然保留其字面意义,但所有字面意义加合之后体现出来的是一种整体性的隐喻意义,且字面意义与隐喻意义间的逻辑关系较为清楚,比如“狗皮膏药”“铁饭碗”“橄榄枝”“一石二鸟”“狗尾续貂”“割鸡焉用牛刀”等。双重语义叠合型复杂词汇单位的语义特点是引申义的使用频率大大高于字面义,属于隐喻词汇化。(Packard2000)

3. 语义整合型复杂词汇单位。在该类型复杂词汇单位中,构成成分的常规义基本消失,形成“语义漂白”(bleaching)(Hopper & Traugott1993)现象,整体意义具有习语化特点,且字面义与引申义之间的语义联系极为隐晦,比如“呱呱叫”“一把手”“好家伙”等。这种情况属于强词汇化。

通常情况下,词汇化程度高的复杂词汇单位更倾向于被视为一个整体,在词典中可能被整体立目;而词汇化程度较低的复杂词汇单位因为语义的松散性和组合性,可分离程度增大,更有可能离析出具有语义自足性的更小语言构件,整体立目的可能性相对降低。

(二) 现代汉语复杂词汇单位的语法特点分析

按照上文的分析,复杂词汇单位可以分为弱词汇化的语义组合型复杂词汇单位、隐喻词汇化的双重语义叠合型复杂词汇单位以及强词汇化的语义整合性复杂词汇单位。

首先分析弱词汇化型复杂词汇单位,即语义组合型复杂词汇单位的语法特点。此类复杂词汇单位的词汇化程度最弱,语义的组合性强,可以按照句法关系进行意义加合。而且,此类复杂词汇单位语法关系清楚,内部语法分界明显,可以从中切分出具有语义自足性的语言构件,比如从“爱面子”中切分出的“面子”,既可以单独使用,也可以与除了“爱”之外的其他成分形成搭配。除了《现汉》中立目的“爱面子”“给面子”“买面子”和“要面子”等,还可以形成“有面子”“没面子”“好面子”“撑面子”“死要面子活遭罪”等组合。

再来看强词汇化的语义整合型复杂词汇单位。语义整合型复杂词汇单位在内部语法结构上出现分界消失,各构成成分发生结构黏合,“互相熔合成为一个绝对的或者难于分析的单位”(索绪尔1983)。语义整合型复杂词汇单位意义凝固,结构定型,因此不可随意调整其顺序或改变其搭配对象。比如“不得已”,在上古汉语中作为词组表示“不能停止”,而在现代汉语中“不得已”表达的意思为“无可奈何”,其内部构词理据已经淡化,语法结构也无从分析,内部的语法边界消失,无法进行结构切分。

最后分析居于复杂词汇单位词汇化连续体中间部分的双重语义叠合型复杂词汇单位。此类复杂词汇单位同时具有语义整合型和语义组合型复杂词汇单位的部分特点。在信息提取过程中,与引申义相比,作为基础意义的本义更易被提取。这样在结构切分时,语言使用者首先会对词汇化程度较低的字面义进行切分,在语法分界方面,双重语义叠合型复杂词汇单位与语义组合型复杂词汇单位基本一致,如“吃|后悔药”“碰|钉子”等。而且,此类型的部分复杂词汇单位仍具有内部的可拆分性(separability)及局部的可调整性。比如“穿小鞋”,既可以说“给她穿小鞋”,也可以说“给她小鞋穿”;“碰钉子”可以说“碰了个钉子”还可以说“给他个软钉子碰”。一些双重语义叠合型复杂词汇单位所切分出来的语言片段,其本义与引申义并存,比如上面提到的“小鞋”和“钉子”。一些双重语义叠合型复杂词汇单位切分出来的片段本身即是一种超常规搭配,凸显的一定是引申义,比如“闭门羹”“枕頭风”“后悔药”之类,在结构上具有较强的可拆分性。上述复杂词汇单位因为结构的可拆分性,在词典立目中会出现复杂词汇单位整体与部分构件立目资格的选择和判定问题。

还有一些双重语义叠合型复杂词汇单位必须作为一个整体才可能表达出引申义,如果进行结构切分,则离析出的语言片段的意义与整体意义之间的语义联系中断,比如“放鸽子”和“吃豆腐”等。从语义的一致性方面考虑,这种复杂词汇单位不能进行内部切分,必须视为一个整体。

(三) 现代汉语复杂词汇单位特点分析小结

复杂词汇单位由多个语言成分组合而成。在使用过程中,复杂词汇单位的组成成分在语义和语法方面出现了两种趋势: 1. 相关组成成分一直保持语义的独立性和自足性,在句法位置上可以进行调整或移位,甚至可以被具有相同句法功能的语言成分替换,因此能够作为一个相对完整的语言单位从复杂词汇单位中剥离出来,比如前文提到的“面子”。2. 相关组成成分对复杂词汇单位整体的依附性增大,复杂词汇单位的整体性特点超过了相关成分的组合性特点,结构日趋凝固,意义具有部分习语性特征,出现了程度不等的词汇化现象,比如“查户口”“穿小鞋”和“吃豆腐”等,其语义和语法的凝固性变大,词汇化程度增强。

三、 复杂词汇单位在《现汉》中的立目情况分析

从第二节的分析可见,复杂词汇单位内部的语义、语法特征不一,在词汇化程度上也体现出差异,语义组合型、双重语义叠合型以及语义整合型复杂词汇单位的内部造词理据的可及性程度依次降低,结构的离散程度减弱,词汇化程度依次增强。从理论上说,复杂词汇单位的特点会影响其词典立目资格的选择和判定。

纵观《现汉》各版本,复杂词汇单位的词典立目主要采取了三种策略: 分解策略、整体策略以及二者兼顾的兼容策略。下面分项论述。

(一) 复杂词汇单位的词典立目中的分解策略

所谓分解策略,指把复杂词汇单位中析取出来的某一较小语言片段作为立目单位。在《现汉》中,一些语义组合型和双重语义叠合型复杂词汇单位在立目过程中往往采用此策略。主要分为以下两种情况。

1. 为涵盖尽可能多的使用实例而采取的复杂词汇单位立目的分解策略

语义组合型复杂词汇单位是相关语言单位按照一定语法关系组合之后形成的意义加合单位,从中切分出的部分语言片段具有一定的组合能力,而且句法位置也比较灵活。在《现汉》中,有时会把切分出来的、具有语义相对自足性的语言片段作为立目单位。比如:

五服 古时丧服按跟死者关系的亲疏分为五种……后来用出没出五服表示家族关系的远近: 没出~|出了~的远房兄弟。[1]

青红皂白 借指是非、情由等: 不分~|不问~。

跌眼镜 〈方〉指事情的结果出乎意料,令人感到吃惊(多跟“大”连用): 主队意外失利,令不少行家大~。

落荒 动 离开大路,向荒野逃去(多见于早期白话): ~而逃。

以《人民日报》语料库和北京大学现代汉语CCL语料库为数据源,可以发现在这两个语料库中,与丧葬义相关的“五服”出现总频次分别为18次和37次,其组合情况包括“五服(之)内”“五服(之)外”“五服之亲”“三代五服”和“出五服”等;高频组合为“出五服”,出现频次在两个语料库中分别为5次和27次。“青红皂白”在两个语料库中的出现总频次分别为780次和324次,组合情况包括“不分/不管/不问/不论/不辨/难分/难管青红皂白”,其中高频组合为“不分青红皂白”,出现频次分别为553次和199次。“跌眼镜”的出现总频次分别为1962项和126项,组合情况为“大跌眼镜”和“直跌眼镜”,其中高频组合为“大跌眼镜”,出现频次分别为1025项和123项。“落荒”在两个语料库中出现的总频次是388项和237项,高频组合为“落荒而逃”,出现总频次分别为356项和161项。

从上面四例可以看出,《现汉》没有把部分高频习用的复杂词汇单位,比如“出五服”“不分青红皂白”“大跌眼镜”和“落荒而逃”等进行整体立目,而是选取离析出的、较小的语言片段作为立目单位。这可能是因为比起复杂词汇单位整体,一些较小语言片段在语义上相对自足,同时具有更强的组合能力,可以涵盖更多的语言使用实例,囊括更多的变体形式。对于《现汉》这种内向型语文词典而言,立目单位对相关使用实例的覆盖率是评价词典质量的一个重要参数。

2. 因“顺带收词”形成的复杂词汇单位立目的分解性策略

所谓“顺带收词”,主要指一些语义透明性高,语法结构可以分析的语言单位,如“开卷有益”之类,在词典中本来无需立目,但因为与另一个语义不透明的、需要进行词典立目的义位同形,因此“顺带”出现在立目单位的释义中。比如:

开卷 动① 〈书〉打开书本,借指读书: ~有益。② (~儿)一种考试方法,参加考试的人答题时可自由查阅有关资料(区别于“闭卷”)。

“顺带收词”也用来指一些本来可以作为立目单位的语言单位,出现在相关语言单位的释义或配例中,成为隐含性的词典处理单位。比如:

暗室 名① 有遮光设备的房间。② 〈书〉指在幽暗隐蔽的地方;没有人的地方: 不欺~(在没人看见的地方也不做昧心事)。

花边 名① 带花纹的边缘: 瓶口上有一道蓝色的~。② 手工艺品,编织或刺绣成的各种花样的带子,通常用作衣服的镶边。③ 报纸、刊物等上面的文字、图画的花纹边框: ~新闻(多为逸闻趣事)。

“暗室”和“花边”都有两个以上的义项,其中的一个为非自由义项,与其他成分组成高频使用的习用单位,在语言交际中作为组块出现,即“不欺暗室”和“花边新闻”。但因为“暗室”和“花边”已经作为词目出现,因此“不欺暗室”和“花边新闻”也“顺带”地在这两个词目下作为配例出现。又由于“不欺暗室”和“花边新闻”在语义上并不完全透明,在其后又各自提供了“括注型释义”。

由于组合单位的语序问题,“花边新闻”检索成功的可能性要大于“不欺暗室”,因为作为立目单位的“花边”在“花边新闻”的前半部分出现,而“不欺暗室”则在“暗室”的后半部分出现。这种检索率问题在汉语的同素义族中广泛存在。比如我們会在“箭”字头下查“箭步”“箭头”“箭在弦上”,而如果查“明枪暗箭”,一般会在“明”字头下查,很少会查“箭”或“暗箭”。所以,词典立目单位的选择还与词典编纂视角有关。从编纂者视角来看,内向型通用语文词典的立目单位要强调简明,强调词目对相关使用实例的概括性;如果从使用者视角看,语文词典的立目应该凸显高频性语言单位,并且在词目设立方面应考虑方便用户查询,强调易于检索。

(二) 复杂词汇单位在《现汉》立目中的整体性策略

对完全词汇化的复杂词汇单位,《现汉》采用的是整体策略。比如“不管三七二十一”“二把刀”“堂而皇之”等,这是符合语言使用实际情况的。

对一些弱词汇化或隐喻词汇化型的复杂词汇单位,《现汉》有时也会采用整体立目策略。比如:

吃回头草 比喻重又做以前放弃的事情。

“吃回头草”属于嵌入式语块(李慧2012),《现汉》第7版予以整体立目。但是,同属于嵌入式语块的“走回头路”,《现汉》第7版中立目的是“回头路”;同一类型的“吃哑巴亏”,《现汉》第7版中立目的既有“吃哑巴亏”,也有“哑巴亏”。

(三) 复杂词汇单位在《现汉》立目中的兼容性策略

兼容性立目原则指的是在语文词典对一些复杂词汇单位的立目中,既遵循分解策略,同时又遵循习语性策略。复杂词汇单位的兼容型立目在《现汉》中较为常见,主要有两种类型: 一是成语类,如“饥肠”和“饥肠辘辘”、“半途”和“半途而废”、“傲物”和“恃才傲物”、“鳌头”和“独占鳌头”等。在《现汉》第6版中,上述单位都是二者同时立目。二是惯用语类,如“穿小鞋”与“小鞋”、“吃小灶”与“小灶”、“吃回扣”与“回扣”、“吃大锅饭”与“大锅饭”、“吃老本”与“老本”、“吃后悔药”与“后悔药”、“吃闭门羹”与“闭门羹”、“吃哑巴亏”与“哑巴亏”、“背黑锅”和“黑锅”、“栽跟头”与“跟头”、“打冷枪”和“冷枪”、“打落水狗”和“落水狗”、“吹灰之力”和“不费吹灰之力”,“马蜂窝”和“捅马蜂窝”等,也都同时立目。

猜你喜欢
词汇化现代汉语词典
现代汉语中艺术类行业语泛化现象研究
《现代汉语词典》字母词收录与修订情况分析