形态构词力定量计算公式综述

2010-04-12 11:43杜丽芳

山西广播电视大学学报 2010年6期

□杜丽芳

( 大同大学大同师范分校，山西大同 037039)

构词力是形态学研究中的一个重要而又颇具争议的话题。历来不同的学者对到底什么是构词力提出了不同的看法和见解。尽管对“什么是构词力”这一概念存在争议，但诸多文献中对构词力的定量研究仍然集中在探讨词缀的构词力上。不同的学者提出了计算构词力强弱或大小的不同的公式。这些公式有的是考察某一词缀过去的构词力的大小，有的是考察词缀潜在的构词力的大小。本文试图对历来不同学者对构词力的定量计算公式做一综述，并比较其优劣和实际可操作性，为今后的进一步研究提供一些方法上的帮助。

一、构词力计算公式

1.Aronoff ’模式

该学者提出计算构词力大小的方法是：用某一构词规则实际生成的单词的数量去除可能由该构词规则生成的潜在词。用公式表示为：I= / s。其中I 代表的是构词力，代表的是实际生成的单词的数量，s 代表的是用该构词规则可能生成的单词的数量。这种计算构词力的方法在理论和实际操作上都有它的局限性。首先，如何界定的大小不是一个简单的问题，纵然现在可以利用语料库来检索所有由某一构词规则生成的词的数量，但是语料库是否穷尽了所有由该构词规则生成的词仍是一个问题。其二，考虑到词基所受到的各种各样的限制，s 的数量更是难以界定。因此，鉴于这些问题，该方法在实际操作中可行性不是很强。

2.词频模式

该模式的提出基于这样的假设：即构词力的大小直接或间接地与词频有密切的关系。词频指的是一个单词在语料库中出现的次数。词频模式分为三种：类符词频模式，形符词频模式和相对词频模式。

类符和形符是语义学当中的两个既不同又有关联的概念，这两个概念在构词力的定量研究中扮演着重要的角色,在构词力的计算中常常会用到。我们用以下两例来引入这两个相关的概念：Rose is a rose is a rose is a rose. He who laughs last laughs longest.对于这两个句子中所含有的单词的数量，有两种不同的看法：一种认为句1和句2分别由10个和6个单词组成；另一种则认为句1和句2分别由3个和5个单词组成。就第二种看法而言，它把重复出现的单词看做是一个，如 rose, is, a ;laughs.在这里,把相同的单词不管其出现几次都看作一个类符。而每出现一次就看作一个形符。如上例1：rose 出现了四次，形符为4；is 出现了三次，形符为3。 (1)类符词频模式。该计算模式是最为常用而同时又是最受到争议的一个方法。依据这种方法，决定一个词缀的构词力的大小只需要去数在某个特定的时间段里用该词缀生成的所有新词的数量。用这种方法决定一个词缀的构词力的大小引起了学者们的争议，依然举-ment为例，在早期由该词缀构成的单词数不胜数，可以说在过去该词缀是非常能产的。而今天人们几乎不用它来构成新词了，所以说这种计算构词力的模式反映的仅是词缀过去某一个特定时间段的构词力的大小，并不能反映出现如今它实际的构词力的大小。不过这却也是决定一个词缀在某一阶段时期内的构词力大小一种行之有效的方法，可以利用在线英语牛津词典去确定在某个特定的时间段里由某一词缀生成的单词的数量有多少，因为在线英语牛津字典里对所收录的每一个单词首次使用的时间都做了详细的记录。(2)形符词频模式。因为类符词频模式受到争议，所以学者又尝试提出了形符词频模式，即计算词缀构词力大小时将其形符考虑在内。Bayeen讨论了词频和构词力的关系。他的观点总结如下：一个能产的构词过程一定是包括大量的低频词和少量的高频词；反之，一个非能产的构词过程则包括大量的高频词和少量的低频词。这似乎很矛盾，他的解释如下：高频复杂词在大脑中是以“整词”模式储存的,即把单词作为一个整体来储存和提取，如disadvantage在BNC语料库中出现了1127次，属于高频词，在人们的大脑中倾向于把这个词作为整体来储存和提取；而低频复杂词则在大脑中储存的是构成该词的各个部分，如dis-representive,在BNC语料库中仅出现了一次，属于低频词，但即使是以前没听过该词的人们也会推断出其含义，原因在于在人们的大脑中储存着 dis- 词缀和representative这两个部分。而对低频词含义的每一次推断，都会加强某一特定词缀的表征。如果这种解构过程(即每一次低频词的提取都是将其解构成构成该词的各个部分)反复进行，就会加强该词缀的表现能力，使它更易于与其他词基结合构成新词，因而使得该词缀变得能产。(3)相对词频模式。相对词频模式将词基的词频和由词基派生出来的单词的词频都考虑在内，这种模式背后的假设是如果派生词的词频小于它词基的词频，那么这个构词过程是相对能产的，反之则不能产。这一模式的解释依然与复杂词在大脑中的储存和提取有关，Hay and Baayen 对此作了详细的讨论，在此不赘述。这一模式的计算方法是用派生词的词频去除词基的词频，得出的数据越大，说明构词过程越不能产，反之则能产。然而，这种计算方式在实际操作中出现许多问题：首先，如何界定一个构词过程的词基的词频不是一个简单的问题，更不用说满足该构词过程的词基数的数目有多少；其二，假设对于一个构词过程，由它生成的派生词中，有些词频要高于它的词基的词频，而有些词频却低于该派生词的词基的词频，在这种情况下如何决定？所以这种模式似乎很模糊，也不确定，因而可行性也不强。

3.或然性模式

或然性模式主要是由学者Baayen提出的，包括三个不同的亚模式。这一组模式主要是计算由某个特定构词过程生成新词的可能性，换言之，即遇到由某个构词过程生成新词的可能性的大小。这一组模式涉及到一个关键的概念，那就是一次词。一次词指的是在语料库中出现一次的词。为什么构词力的大小与一次词有关？ Baayen 给出的解释如下：…某个特定构词过程的一次词应该与该构词过程所产生的新词在数量上有关，因此一次词的数量的多少表明某个构词过程生成新词的构词力的大小。然而，Bauer对此提出了质疑，他指出语料库中的一次词与实际生成的词有关联这种看法没有多大意义，因为语料库难免会出现一些由于标记和拼写错误而产生的一次词。Anoroff在他的“什么是构词力”一书中探讨了一次词的重要性。他指出语料库中的一次词极有可能是由非常能产的构词过程生成的。笔者赞同这样的看法，认为一次词很可能是人们根据某些构词规则下意识杜撰出来的词，因此，相应地，大量的一次词可以间接表明某个构词过程或规则是能产的。下面对其中两个主要亚模式一一介绍。(1)第一个阶段：狭义的构词力。 Baayen(1989)把第一个计算构词力的阶段称为“狭义的构词力”，该模式的计算公式为P= n1,/ N, 公式中的P 代表的是构词力的大小,n1指的是语料库中由某个构词过程或词缀生成的一次词的数量，而N 则指语料库中所有由该构词过程或词缀生成的词的形符的数量。(2)第二个阶段：由一次词决定的构词力。鉴于上述阶段对构词力的定量描述有其局限性，于是Baayen(1993)又提出了另一种描述构词力的方法，把它称之为“由一次词决定的构词力”。他给出的公式如下：

P*= n1E,t/ht。其中P*表示构词力，这里用“*”是为了区别上述第一个阶段所提出的狭义的构词力P；E表示的是某一形态构词过程(比如说：以-ism结尾的名词等)；t 表示语料库中形符的数量，则表示的是由某一构词过程所产生的所有一次词的数量的多少，而则表示该语料库中所出现的所有的一次词的多少。根据这种描述，如果比较不同构词过程的构词力的大小，只需要比较各构词过程所出现的一次词的多少就行，因为对于同一语料库而言，它所含有的一次词的数量是固定的，也就是说在这个公式中，分母是个恒量，这也是该种描述方法得名的原因，即某个构词过程构词力的大小由它所出现的一次词的多少来决定。用这种模式计算出的构词力是某个构词过程或词缀的潜在的构词力的大小，即未来用该构词过程或词缀构词新词的大小或能力。随着语料库逐渐的发展和规模壮大，这种方法在实际操作起来相对于上述几种模式是比较可行的，因而在研究构词力中是最为常用的。

二、结论

国外学者试图提供一种定量研究构词力的行之有效的方法。但是，不管是从理论上还是从实际操作上来说，似乎每一种计算模式很难尽人意。尽管如此，这些不同的衡量方法却可以看做是从不同的方面反映构词力。本文将其进行了汇总并分析比较了每一种方法的优劣及其可操作性，旨在为致力于这方面研究的学者在今后的研究中提供一些方法上的指导和帮助。

参考文献：

[1]Plag,Ingo.英语构词法[M].伦敦：剑桥大学出版社，2003.

[2]Bauer,Laurie.形态构词力[M]. 伦敦：剑桥大学出版社，2001.