语料库辅助下英语作为外语目标语翻译中的词汇处理

2014-01-04 08:40王健燕
关键词:词频语料语料库

王健燕

(桂林理工大学外国语学院 广西桂林 541004)

翻译是源语和目标语二者之间信息传递的交互过程,在这个过程当中,信息传达是否准确有赖于译者是否能对这两种语言进行熟练的语码转换。“翻译的过程不是线性的而是(译者对源语和目标语)混合交错的认知过程”[1]86。译者能否在多个具有近似意义的外语目标语词汇中做出符合源语语境的恰当选择,将直接影响着译文表述的地道与否以及翻译质量的优劣。

翻译是“在一定社会语境下发生的交际过程”[2]3,而“不同民族的语言,因物质环境和所处地域不同、社会文化的哲学渊源不同,因而也必然存在各自独特的民族个性”[3]96。因此,语境是不同语言转换过程中非常重要的参考因素。翻译过程中的语境概念,不仅涉及源语和目标语的篇章语境,还应包括目标语的词汇语境。前者是译文是否忠实原文题材,话题类型的体现,后者是译文目标语是否精准、地道的考量。

计算机处理技术的完善和语料库语言学的蓬勃发展促生了“语料库翻译学”(Corpus Translation Studies),或者称为“基于语料库的翻译研究”(Corpus-based Translation Studies)。语料库翻译学是“以语言理论和翻译理论为研究指导,以概率和统计为手段,以大规模双语真实语料为对象,采用语内对比与语际对比相结合的方法,对翻译现象进行历时或共时的描写和解释,探索翻译本质的一种翻译学研究方法”[4]4。因篇幅所限,本文将着重讨论英语作为外语目标语在翻译中的词汇处理,尤其是英语语料库在词汇选择方面所提供的辅助作用。

一、英语语料库的历史与发展现状

早期英语语料库的基础资料完全来自于手工整理,1959年R.Quirk教授在伦敦大学学院(University College London)领队成立了“Survey of English Usage”(SEU,英语使用调查)研究中心。这是当时欧洲第一个与语料库相关的研究中心。后期SEU演变成为后来被世人熟知的伦敦-隆德语料库(London-Lund Corpus,LLC)则得益于上世纪70年代中期瑞典Lund大学同行的计算机语料处理技术,该语料库是第一个英语口语语料库。

1964年由Francis和Kucera等学者共同努力在美国布朗大学建成的BROWN语料库标志着电子语料库时代的开始,也是现代语料库语言学的开端。该语料库由500篇书面文本构成,总计100万词次,是当时美国英语语料库的代表。1978年英国语言学者、Lancaster大学教授G.Leech联合挪威的Oslo大学和Bergen大学学者共同编制完成了LOB英国英语语料库(Lancaster-Olso/Bergen Corpus of British English),其中包含了100万词次且是1961年前后的书面英式英语。

自上世纪80年代以来,随着计算机技术的迅猛发展,语料库建设的规模也越来越大,同时语料标注和检索的手段也不断更新,语料库的分类也相应逐渐精细化,语料库的应用领域随之向更广的领域延伸拓展。以美国Brigham Young大学的语料库语言学教授Mark Davies创建的BYU在线语料资源库系统为例,英语语料库资源分为美国英语、英国英语、加拿大英语和世界英语等。其中,美国英语语料库又包含了美国当代英语语料库(COCA,4.5亿词次)、美国历史英语语料库(COHA,4亿词次)、《时代》杂志英语语料库(Time Magazine Corpus,1亿词次)、美国电视剧英语语料库(Corpus of American Soap Operas,1亿词次)等。世界英语语料资源来自于全球网络英语语料(Global Web -Based English,GloWbE),共收集了来自于20个国家的互联网英语语料,时间跨度为2012~2013年,高达19亿词次。

语料库作为研究语言的工具最初并未得到学术界的广泛认同,在转换生成语法盛行时期,乔姆斯基认为语料只是外在化的话语汇集,语料只能对语言能力做出部分解释,既不完整也不充分。因此,语料分析法在当时并未得到推行,人们在自然语言理解、生成、翻译等研究中主要采用的方法是基于规则的(rule-based);而当计算机语言信息处理技术的发展促进语料库规模的扩大,并在信息检索、文本分析、信息过滤等方面取得飞速进步之后,人们利用大容量语料库资源对自然语言所开展的研究则转变为基于数据(data-based)。这些客观的现实语料数据能够揭示“真实语言使用的倾向性规律及其所传递的意义、功能乃至思想意识”[5]1,为语言研究提供富有说服力的证据,语料库于是开始大规模地被运用于词典、语法、文学、翻译和教学等多个语言领域。

二、语料库对英语作为外语目标语词汇翻译的辅助作用

词汇是语言的基础,而语言与文化密不可分,词汇中自然也缺少不了文化内涵。词汇文化往往突显于词义,即词汇的显性文化(explicitness),它是人们在经验基础上对客观世界万象和行为的提炼概括,具有很强的民族文化特征。除此之外,词汇的内在语法特点,即词汇的隐性文化(implicitness),也是词汇文化的重要体现。这其中包括:一词与它词的搭配、词在句中的语法位置、词的语域范围等。翻译过程不可避免会涉及到源语和目标语在词汇文化层面的差异和趋同问题,而忽略这一点,将很有可能造成原文和译文在语码转换时的信息失真,有悖翻译的最基本要求。源语和目标语之间的差异通常“不会以明显不符合目的语语法规则的形式出现,而往往以多少有些异常的形式偏离语言使用的规范”[6]226,[7]16,这也可能造成译文在目标语多方语境下可接受程度的大大降低。

Bowker认为,在对专业领域的理解、术语的准确选用及其习惯表达等方面,借助语料库所完成的译文比仅用传统资源(如词典等参考工具书)所完成的译文质量更高[8]644-648,[9]52。考虑到目前语料库的规模之大与语用真实等特点,目标语语料库可以对翻译过程中的词汇选择提供有力借鉴。译者通过对目标语语料库数据分析,可以将词汇翻译中的文化失真情况尽可能缩小至最低可控范围内。例如,语料库在汉语作为源语和英语作为目标语的翻译中对最终目标语词汇选择所提供的辅助作用可从图1中反映出来,而这一作用通常体现于对目标语语料库所提供的英语词汇隐性文化进行的数据分析。

图1 英语语料库辅助下翻译过程中的词汇处理

如前文所提到,外语词汇的隐性文化特征是指导译文遵循目的语语用规范的重要手段。在意义基础之上,译文所选择用词的词频(word frequency)、搭配(collocation)、语义韵(semantic prosody)等都是翻译中跨文化信息传递正确与否的重要考量手段。而语料库对英语作为外语目标语翻译中词汇处理的辅助功能也集中体现在这三个方面。

1.基于英语语料库词频数据的词汇处理

词频统计是语料库最基础最直观的一项功能,因为“频率是衡量语言结构可用性的概率特征”[10]424。所以,从语料库提供的自然语料中词汇使用频率高低排列顺序,可以推测英语母语使用者的词汇选择习惯。通常,词频数据可用于翻译时对近义词(短语)甚至词汇句式用法选择的考虑。一般情况下,近义词汇、短语及句式的某些显著特征差异可以从其词频高低中得到印证。虽然高词频未必是选词的绝对标准,但确实可以支持真实语用背景下英语母语者的选择倾向。

同时,英语语料库数据收集编排的赋码也可以展示不同语域(register)、语场(semantic field)环境中词频的分布状况。不同的语域决定了词汇频率高低顺序的差异。英语科学论文的翻译和普通小品文的翻译在用词选择上存在明显不同,这就意味着译者在翻译不同文体时对多个近义词(短语)的选择不能随心所欲。译者将源语翻译为英语目标语时,可以依据文本题材在英语语料库中、相应的语域分类中以最简单的词频检索方法确定目标词汇是否遵从英语为母语者的使用习惯。

英语语料库不仅可以对单个词汇(短语)的使用频率进行排列统计,还能够以该词(短语)为中心,检索分析其周边的其它词(短语)的出现频率高低,于是词频的概念便扩大到了词语的搭配。而语料库也提供了更进一步的分析手段,即KWIC(语境关键词)功能。

2.基于英语语料库KWIC功能的词汇处理

KWIC(Key Word In Context,语境关键词)是英语语料库检索系统的一个很具实用性和可信度的重要数据库。由于语料库所收集的语料来自不同行业文本,因此,它提供了非常宽泛的真实语境范围。语料库通过设立关键词检索,在整个电子文本数据中,将以关键词为中心按照预定跨距的所有共现词在该句行语境下直接展示出来,重复出现频率高的词一目了然。从英语作为外语目标语翻译中的词汇处理角度来看,KWIC功能“对研究词汇的语法关系、词汇用法、词汇搭配、词丛(word cluster)、词汇在连续语篇中呈现的范型(pattern)以及主题词之间的意义关系提供了可靠的捷径”[11]20,从而也支持译者对译文目标语词汇做出更加合理的正确选择。

以近义词 conference(n.)和 meeting(n.)为例,在对“会议”一词的英语翻译用词选择时,可以使用KWIC这一功能对二者进行比较。在COCA(美国当代英语语料库)中输入conference(限定为名词),设定关键词跨距为左4词和右4词范围(图2)进行检索,结果会在conference中心跨距范围内以不同颜色代表不同词性来呈现语境下的语用情况。按照译文参考需要,还可以具体查询到与conference共现的名词、动词、形容词等,检索结果也可以以词频列表显示。以同样的方法检索meeting关键词的语境共现词之后,语料库同样能够以词频数据显示二者的用法差别(表1)。从表中结果也不难看出,在对待不同语境下“会议”一词的英语翻译处理时译者应当如何做出选择了。

图2 COCA语料库conference语境关键词检索条件(所有共现词)

3.基于英语语料库语义韵分析的词汇处理

语义韵是基于语料库KWIC功能基础上对词汇的再分析,同时也离不开词频统计。它呈现的是关键词语境中的一种特殊的搭配现象,所体现的不仅是关键词与共现词之间的语义关系,而且还包括彼此之间的韵律关系。这种特定语义氛围下的韵律关系大致可以分为积极的(positive)、中性的(neutral)和消极的(negative)三类[12]176,主要取决于其语场范围内共现高频词的语义情绪。

表1 conference和meeting的KWIC检索结果(节选)

语义韵赋予了词汇联想意义,外语词汇的联想意义有时候并不能从词典释义中获得。翻译语码转换过程中,外语目标语词汇的典型搭配如果被忽视的话,译文的地道性便会大打折扣,甚至完全背离原文使得译文完全不可接受。因此,语义韵揭示的是词汇在其意义之外的语用功能。卫乃兴[13]51在对中国学生英语调查研究中就曾指出,commit在COBUILD语料库中,关键词语境中显著搭配词有crime、offense、suicide、murder、abuse 等 14 个,具有明显的消极语义特点;而中国学生虽然习得了commit的部分典型搭配,却不能用该词表达多种具体的“犯罪”意义。同样,在英语作为外语目标语的翻译中,词汇的选择处理不应该是盲目的语义匹配,而应该是基于对词汇语用功能的分析而选择。英语语料库的语境关键词功能和词频高低排序能够突显词汇的典型搭配,在翻译过程中为译者在目标语的近义词选择、意义组合、语气塑造等方面提供颇具价值的参考。

语料库数据甚至可以对目标语词汇的句法特点进行归纳,而且通常上述三类功能是共同发挥作用。例如,在翻译“理由、原因”意义,对 cause和reason二词进行甄别时,语境关键词数据将揭示出cause语义韵接近消极,常与高频消极语义词death、disease、cancer、alarm、crash 等搭配,因此,在翻译诸如此类的“缘由”时应当优先考虑cause。但同时对reason的搭配词词频分析却显示出no、why、whatever排序靠前,结合KWIC分析可以得出结论:在处理否定句、why定语从句和“无论什么原因”等英语句式翻译的时候,译者则应当考虑reason。由此看来,语料库对目标语词汇的借鉴作用是多方位的。由于翻译本身还涉及其它语言技能和翻译技巧,尽管语料库的任何一项功能所提供的语料分析是辅助的和参考性的,并不能作为翻译时的唯一标准,但语料库却可以更有针对性地将译文打磨得更加真实,从而进一步完善翻译过程。

三、结语

现代英语语料库的发展趋势迅猛,其应用领域也不断拓宽。英语语料库与翻译的相关研究包括了翻译共性、翻译文体、翻译过程及应用研究等诸多方面。语料库语言学的研究成果的使用不应局限于科学研究人员,而是任何从事翻译实践、进行翻译教学的专家和学者都可以利用语料库来辅助工作。词汇是语言的基础,也是从源语到目标语的翻译活动中最基本的语码要素。对译文词汇的选择处理很大程度上决定了译文的地道与否,从这个意义上来看,目标语语料库对目标语翻译贡献颇大,语料库以词汇为基础,其对翻译研究的辅助作用也将不断深化,影响也将不断深远。

[1] 唐文生.认知语言学理论与中国翻译研究的回顾与前瞻[J].西华大学学报(哲学社会科学版),2011(2).

[2] Hatim,B.and Mason,I.Discourse and the Translation[M].London:Longman,1990.

[3] 张华琴.民族文化特征在英语习语翻译中的体现[J].西华大学学报(哲学社会科学版),2008(3).

[4] 王克非.语料库语言学探索[M].上海:上海交通大学出版社,2012.

[5] 何安平.语料库语言学[J].中国外语,2012(5).

[6] Toury,G.In Search of a Theory of Translation[M].Tel Aviv:The Porter Institute for Poetics and Semiotics,1980.

[7] 王克非,胡显耀.基于语料库的翻译汉语词汇特征研究[J].中国翻译,2008(6).

[8] Bowker,L.Using Specialized Monolingual Native-Language Corpora as a Translation Resource:A Pilot Study[J].Meta:Translators’Journal,1998(4).

[9] 杨晓军.基于语料库翻译研究和译者教育[J].外语与外语教学,2007(10).

[10] Goethals,M.E.E.T.:The European English Teaching Vocabulary-list[C]//B.Lewandowska-Tomaszczyk.Practical Applicationsin Language and Computers.Frankfurt:Peter Lang,2003.

[11] 李文中,濮建忠.语料库索引在外语教学中的应用[J].解放军外国语学院学报,2001(2).

[12] Stubbs,M.Text and Corpus Analysis[M].Oxford:Blackwell Publishers,1996.

[13] 卫乃兴.基于语料库学生英语中的语义韵对比研究[J].外语学刊,2006(5).

猜你喜欢
词频语料语料库
基于归一化点向互信息的低资源平行语料过滤方法*
《语料库翻译文体学》评介
25年来中国修辞研究的关键词词频统计*——基于国家社科与教育部社科课题立项数据
基于JAVAEE的维吾尔中介语语料库开发与实现
词频,一部隐秘的历史
《苗防备览》中的湘西语料
国内外语用学实证研究比较:语料类型与收集方法
语篇元功能的语料库支撑范式介入
以关键词词频法透视《大学图书馆学报》学术研究特色
汉语音节累积词频对同音字听觉词汇表征的激活作用*