基于语料库的白睿文译者风格探究

2024-01-04 14:22韩江洪陆诗卉
关键词:译作语料库译者

韩江洪,陆诗卉

(1.合肥工业大学 国际教育学院,安徽 合肥 230000;2.合肥工业大学 外国语学院,安徽 合肥 230000)

白睿文(Michael Berry)是当代美国著名汉学家,现就职于加州大学洛杉矶分校(UCLA),同时也是中国现当代文学的杰出翻译家。截至2021 年,白睿文翻译了五部中国文学作品。作为一名译者,白睿文的译作在英语世界受到了很大的关注,既在一定程度上给中国文学走出去指明了方向,又为国外读者提供了了解中国优秀文学作品的机会。

白睿文曾表示:“身为译者,我希望读者看不到Michael Berry 的风格。我希望我扮演一个透明人的角色……译者不应该让读者在译本中感觉作品有共同点,不应该让读者通过译者的文字风格把作家联想在一起。”[1]他认为每部原创作品都有自己的特点,他在翻译时会着力突出这些属于作品本身的东西,并且努力隐去自己的存在。然而,译者真的能做到完全在译作中隐形吗?胡开宝教授认为:“无论是目的语词汇和句式结构的选择或语篇结构的重构,还是翻译策略和翻译方法的应用,都必然会打下译者的烙印,从而形成译者风格。”[2]这与白睿文的观点相矛盾。

学界关于白睿文译者风格的研究较少,大多集中在余华作品《活着》的英译本解读,如《活着》英译本文化意象研究、文化负载词研究、文本中的“假象等值”现象等等,极少涉及白睿文的其他译作。有研究认为,白睿文译作做到了他自己所说的“透明的翻译”[3],但是 “透明的翻译”就意味着没有译者风格吗?张美芳教授指出:“利用语料库进行研究,对一些难以捉摸的和不引人注目的语言习惯进行描述、分析、比较和阐释,能比较令人信服地说明译者的烙印确实存在。”[4]

本研究基于刘宓庆的风格标记理论,自建白睿文译作的中英平行语料库,通过与英国国家语料库(British National Corpus,BNC)中的小说语料库对比,从形式标记和非形式标记两个方面对白睿文译本进行量性分析,探讨白睿文多部译著是否具有风格上的相似性,是否体现出个人鲜明的翻译风格。

一、研究设计

(一)研究语料

笔者自建小型白睿文译本中英文平行语料库。中文语料包括INK 印刻文学生活杂志出版社2014年出版的张大春《我妹妹》,作家出版社2012 年8 月出版的余华《活着》,人民文学出版社2018 年出版的叶兆言《1937 年的爱情》(以下简称《爱情》),人民文学出版社2005 年出版的王安忆《长恨歌》。英文语料包括哥伦比亚大学出版社2000 年出版的Kid Sister (Wild Kids: Two Novels About Growing Up),Anchor 出版社2003 年出版的To Live,哥伦比亚大学出版社2003 年出版的Nanjing 1937: A Love Story,哥伦比亚大学出版社2007 年出版的The Song of Everlasting Sorrow。

本研究选取BNC 小说语料库作为对应的参考语料库。BNC 是目前最大的在线语料库之一,也是目前世界上最具代表性的当代英语语料库之一。BNC 语料库的语料来自英国的各大报刊、论文、小说、学术文章等,涵盖各个年龄段和社会阶层的人们的语言,具有权威性。本研究选取BNC 小说语料库与白睿文译作进行对比,能从一定程度上反映出白睿文译本与目标语国家流行小说的异同之处,能更直观地体现出白睿文译作的特点,进一步加深人们对白睿文译作的认识。

(二)研究工具

建库过程中,使用文本编辑器Emeditor 对中英文语料进行去噪,运用语料库平行软件Paraconc 做到中英文语料的句级对应平行。英文文本使用自动词性标注软件Tree Tagger 进行分词赋码处理,中文语料运用汉语分词工具Corpus Word Parser 进行分词赋码处理。在语域标记研究中,使用了Laurence Anthony 开发的用于检测网页易读性的软件Ant Word Profiler[5](以下简称AWP)。AWP 自带三个对比文本语料词表(level lists),前两个词表为英语常用的2000 个词族(general service list),每个词表1 000 个词族,第三个词表为学术用语词表(academic word list),包含570 个词族。这三个语料词表的难度依次递增。通过AWP 软件可以将待研究语料导入,与上述三个词表进行词族覆盖,得到待研究文本中各级词汇所占比例。在词语标记研究中,运用语料库检索软件WordSmith 计算标准类型比、词频和高频词。

表1 白睿文英译文音节数统计表S/W(syllables per word)Tab.1 Statistics of syllables in Michael Berry’s translation

二、研究方法

刘宓庆是我国著名的翻译理论家,他经过大量翻译实践和研究得出翻译风格具有可知性的结论。译者只有对原文进行结构分析并与非形式标志模糊集合的审美活动相结合,原文的风格才能显现,并使风格意义成为可知[6]。他把风格标记分为两个大类:形式标记和非形式标记。

形式标记是用来识别风格的最重要的方法。由于语言是一种符号系统,因此风格不可避免地被语言符号化。形式标记一共由六个部分组成,分别是音系标记、语域标记、句法标记、词语标记、章法标记、修辞标记[6]。音系标记用来反映某种语言的音系特征。刘宓庆指出人类的语言首先诉诸于听觉,因此语言文字系统的音系特征就成了语体最基本的特征[6]。音系标记通过考察译文中平均每词的元音数,可以大体推断出该译文文本的可读性和词汇使用偏好。语域标记(或使用域)指词语的使用范围,在某一特定的使用范围中流通的词语常常具有共同的特色[6]。白睿文所翻译的作品多为中国现当代小说,在用词方面不存在特殊的方言,专有词汇较少。考察译文的语域标记,通过一级词汇的比例可以直观地反映文本中词汇是否常见以及文本的阅读难易程度。词语标记显示作者的用词倾向。用词倾向与语域不同,主要指个人的用词倾向(idiolect)[6]。从语料库的方法入手,通过类型比等较为成熟的语料库考察项来具体分析译文的用词倾向。章法标记指章句组织程式,又指思维、概念的表现法。章法标记具体体现在句子长度、句子与段落之间的连贯性、叙述的时间顺序和特殊语序、直接和间接引语等方面。句法标记表现为各种有特色的句法型式[6]。修辞标记指译文中出现的修辞方法的使用特点或趋势。

要全面、准确地认识原作的风格,单凭直观的形式符号是不够的。因此,除了形式标记之外,刘宓庆还归纳了非形式标记,同样传递重要的风格意义。

非形式标记风格符号系统表现在以下四个方面并使之具有风格意义。第一,表现法,即作家对题材的选择、处理方式和处理技法。第二,作品的内在素质,包括思想和感情两个方面,也就是作品的格调,情思的高低决定作品格调的高低。第三,作家的精神气质,这是最高层次的风格分析工作。第四,接受美学所强调的接受者(即审美主体)因素[7]。

刘宓庆还指出频度(frequency)对风格具有特殊的意义。就对形式标记而言,对常规的变异只有在适度的反复出现时,才获得风格的意义,偶然的变异不能形成一种倾向性[7]。也就是说,四个译本中出现频度高的共同点就是白睿文的翻译特点。本研究依照刘宓庆的风格标记理论,通过语料库的方法对频度进行统计,基于四个译本所呈现的共同点来探究白睿文译本是否具有个人的翻译风格。

三、结果与讨论

(一)形式标记

本研究没有涵盖前文提到的全部六种形式标记,只选择了其中的四种,即音系标记、语域标记、词语标记和章法标记。因为这四个方面的语言形式特征更为明显,更适合语料库的统计方法,可以更好地再现小说的风格。

1.音系标记(phonological markers)

汉语音节通常是声母和韵母组合的拼读音节,也有两个韵母组合的拼读音节,还有单个韵母的音节。而在英语中,音节是读音的基本单位,任何单词的读音,都可分解为一个个音节朗读。英语语音的中心是单位单词内的元音,元音数决定了单个单词的音节数以及长度与难度[8]。因此,文本中单词的平均音节数越多,文本越复杂,阅读难度越高。

表1 显示,白睿文的四部译本平均每词音节数为1.41,且四部译作的S/W 值差距在0.1 左右浮动,可见除了受到原文的影响外,白睿文的翻译在音系层面逐渐形成较为稳定的风格标记。据计算,BNC 小说语料库的平均音节数为1.41,与白睿文语料库的平均值相似,这说明白睿文的译文在音系层面难度与普通英文母语小说相近,符合英语读者的阅读习惯。其中,《活着》的单词平均音节数最少(1.34),单词的发音最简单,阅读难度最低。

2.语域标记(registerial markers)

白睿文翻译的四部作品都属于中国现代小说,选词主要为现代常用词汇。常用词的比例越高,文本越容易阅读。因此,通过语料库软件Ant Word Profiler 统计白睿文英译作品中一级词汇所占比例,可以反映出白译文的易读程度。

如表2 所示,白睿文英译本的一级词汇占比普遍较高。《我妹妹》《爱情》《长恨歌》这三部作品的一级词汇占比大体相近,《活着》的一级词汇占比(85.2%)最高。据计算,BNC 小说语料库的一级词汇占比80.6%。与BNC 小说语料库对比,白睿文译作中《我妹妹》和《活着》的一级词汇占比高于BNC 小说语料库,而《爱情》和《长恨歌》略低于BNC 小说语料库。数据表明,前两篇译文在选词方面更加简单常见,生僻词使用更少,阅读难度更低。而后两篇虽然在比例上略低于BNC 小说语料库,但是差距较小,并且译文中存在某些人名、地名等词汇,对读者来说无障碍的词并没有涵盖在APW 的词族1 中,故在统计过程中一定程度上造成后两部作品的一级词汇比例被降低。考虑到这些因素,《爱情》和《长恨歌》的一级词汇占比实际上会比数据体现出来的更加靠近BNC 小说语料库。因此,语域标记方面,白睿文译文总体上使用的词汇较为常见,阅读难度较低。

表2 白睿文英译文一级词汇所占比例统计表Tab.2 Proportion of the first-level vocabulary in Michael Berry’s translation

3.词语标记(lexical markers)

(1)类型比。在语料库研究中通常使用类符/形符比来衡量文本的语言丰富程度,比值越高,词汇越丰富多变,但是容易受到文本容量的影响。标准类/形符比以文本中1 000 个形符为单位,更加精确地体现词汇多样性,具有更高的可信度[9]。表3显示,白睿文四部译作的标准类形比均低于BNC小说语料库的标准类型比,说明白睿文的英译作品词汇丰富程度不及目的语国家的非翻译英文小说文本,使用的词汇量较BNC 小说语料库小。其中,《爱情》(43.77)、《长恨歌》(44.16)、《我妹妹》(43.64)三部译作的标准类形比较为相近,并且与BNC 小说语料库(45.15)的差距较小,而《活着》(37.33)的标准类形比明显低于其他三部译作,与BNC 小说语料库的差距也较大,说明《活着》的语言丰富程度最低,这部作品中使用的词汇不及其他三部作品灵活多变。

表3 白睿文英译文标准类型比数据统计表Tab.3 Standard type ratio in Michael Berry’s translation

(2)词频。实词使用情况体现译者的语言使用偏好,根据胡壮麟的分类,英语中的实义词主要包括动词、名词、形容词和副词四类,且具有稳定的词汇意义[10]。如表4 所示,白睿文译作在实词的使用上较为稳定,与BNC 小说语料库数据相近,每部作品之间横向比较差异都很小,四部作品均为名词比例最大,其次是动词,副词、形容词比例最小。

表4 白睿文英译文中四类实词的频率统计表Tab.4 Frequency of four kinds of notional words in Michael Berry’s translation

(3)高频词。高频词是指文本中出现频率较高的词语,对高频词的考察有利于把握文本词汇使用特征[11]。本研究选取每部译作中出现频率前十的高频词,绘制表5。可以发现,前十高频词几乎全是虚词,主要有冠词、代词、介词、连词等。

表5 白睿文语料库中四部译作前十高频词统计表Tab.5 Statistics of top ten high frequency words in Michael Berry’s translation

根据英语语料库(Bank of English) 1998 年的统计,英语作为母语位于前五位的高频词是the,of,to,and 和a[12],而英语翻译语料库中位于前五位的高频词是 the,and,to,of 和a[13]。由表5 所示,白睿文的四个译本高频词顺序更符合英语母语者的习惯,这点与白睿文本人身份相符,符合他作为英语母语者的行文习惯。英译文倾向于英语母语作品也更易于英语读者阅读。

4.章法标记(textual markers)

如表6 所示,在平均句长方面,白睿文译作中《爱情》《长恨歌》《我妹妹》均超过16 字/句,其中《爱情》《我妹妹》超过17 字/句,《活着》的平均句长只有13.68 字/句,平均句长在四部作品中最短。Laviosa 通过比较英语源语和英语译语,发现英语译语平均句长为24.10 字/句,明显高于英语源语平均句长[14]。本研究采用的对比语料库BNC 小说语料库为英语源语语料库,经过计算,平均句长为12.21 字/句。白睿文的四部译作的平均句长明显低于英语译语,略微高于英语源语,从数据方面来看更加靠近英语源语的平均句长。为了排除中文原文对翻译的影响,本研究计算中文原文的平均句长。在中文原文中,《爱情》的平均句长(35.89)最长,其次是《活着》(29.73),再次是《我妹妹》(29.2),最短的是《长恨歌》(26.85)。该次序与白睿文四个译本的平均句长并不一致,说明白睿文译作不受中文原文的决定性影响。从章法标记来看,白睿文在翻译过程中充分发挥译者的主观能动性,有意将长句拆分为更简短的小句,降低四部作品的阅读难度,更符合英语读者的阅读习惯。

表6 白睿文英译文和对应中文原文平均句长统计表Tab.6 Statistics of average sentence length in Michael Berry’s translation

(二)非形式标记

根据刘宓庆的风格标记理论,仅仅依靠形式标记这样直观性的基础分析还不够具有说服力,还需要进一步分析文学作品的非形式标记。非形式标记是一种抽象的、“无形”的特征。在翻译研究过程中,研究者不仅要抓住形式标记,还要抓住非形式标记。本章主要从表现手法、作品因素这两个方面对白睿文译作进行风格再现。原文和译文的句级对应情况可以体现译者的句级翻译表现手法。译者的翻译倾向可以通过译者所选择原文的题材体现出来。

第一,表现手法。在建库和对齐中英文本的过程中,发现白睿文的译文极少出现整句增添或删除的现象,基本上原文的句子能在英译本中一一对应,并且句子与句子之间的顺序几乎没有改变。如表7所示(存在误差),根据统计,中英文的句级对应情况多集中在一对一、一对二、一对多,这三种情况占到全文的90%以上。其余的情况为多对一和多对多,但是除了在《长恨歌》译文里情况较为明显之外,其他译文中极少发生。说明白睿文在翻译过程中没有对原文进行大范围的改写,较为忠实于原文,传达原文精神。在句句对应的情况中,一对一的情况发生最多,一对二和一对多的情况次之。说明白睿文在翻译过程中习惯于直接拆分中文句子,将原作的长句译为两句或多句稍短的短句。

表7 白睿文译作的中文原文与英译本句级对应统计表Tab.7 Statistics of sentence level correspondence in Michael Berry’s translation

第二,作品题材选择。通过阅读白睿文翻译的中文原著,发现四部小说(《活着》《爱情》《长恨歌》《我妹妹》)在主题方面相似。四部作品的主题都围绕着人生之苦,并且都是悲剧结尾。《活着》讲述了从抗日战争结束到文化大革命期间福贵从地主小少爷变成普通佃户,拼尽全力养家糊口却最终没有赢过命运的故事。小说中福贵一家人除了福贵以外,爸爸、妈妈、老婆、两个孩子、女婿、孙子全都相继去世,只留下孤苦伶仃的福贵和一头牛。《爱情》讲述了南京大屠杀发生之前学者丁问渔与国民党军界元老的女儿雨媛纠缠不清的爱情故事,随着日本入侵和南京沦陷,丁问渔和雨媛的爱情注定是一场没有结局的悲剧,在故事的结尾,丁问渔为了找寻雨媛中弹身亡。《长恨歌》则讲述了民国时期(上海解放前后)一位普通的女孩王琦瑶为了步入上层社会,与多名男性产生纠葛,命运完全被男人掌控,在名利场中浮沉身不由己,最后因为金钱问题被女儿同学的男朋友杀害的故事。而《我妹妹》是这四部中唯一没有涉及到家仇国恨的作品,但是文章基调低沉,充满了悲剧色彩。“我”的家庭看似美满,但是背地里,爸爸出轨,妈妈患有精神疾病,最终他们两人离婚,“我”妹妹未婚先孕,而“我”悲惨的童年对“我”一生影响甚大。结局是妈妈被送去精神病院,“我”和妹妹当众揭发了爸爸的恶行。

白睿文接受采访时曾说过,选择这几部作品来翻译的原因,第一是自己喜欢,第二是考虑英语世界的读者会不会对作品感兴趣。比如翻译《1937 年的爱情》是受到张纯如《南京大屠杀》的启发,当时《南京大屠杀》在美国出版并且引起了轰动,于是白睿文抓住这个机会,翻译关于这个题材的《1937 年的爱情》。翻译《活着》是因为看到张艺谋导演拍摄的电影版《活着》,对其产生了极大的兴趣之后,才下定决心翻译。白睿文也提到一部翻译作品在国外出版会受到很多阻碍,例如商业出版社为了销量会大幅度改动作品,调整为英文读者适应或者说偏好的风格。白睿文觉得这样的改动虽然更符合国外读者的口味,但是会使原作失去其原来的风格。所以白睿文选择与大学出版社合作,因为大学出版社更尊重译者和原著[1]。

综上所述,白睿文的四部译作在形式标记和非形式标记方面的呈现频度较高,存在较为显著的相同点,有助于确定译者风格。形式标记方面,白睿文在翻译过程中,音系标记为偏向于使用音节数较小,与英语源语小说的音节数相近的词汇。语域标记方面,白睿文倾向于使用通俗常见的一级词汇。词语标记方面,通过语料库数据分析可见,白睿文的译文词汇丰富程度略低于BNC 小说语料库,实词词频顺序与BNC 小说语料库一致。高频词多为虚词,并且高频词的排列顺序反映出白睿文翻译小说符合英语母语者的习惯。章法标记上,白睿文译作的平均句长长于英语源语小说,短于英语译语小说,但是更靠近英语源语小说。非形式标记方面,从表现法考虑,白睿文将长句拆分为短句,没有大范围改写译文,几乎不出现整句的增添和删除。从作品题材因素考虑,白睿文所选取的中文原著都有共同的主题,他本人选择这些作品一是出于自己的兴趣,二是考虑市场情况。

四、结语

正如胡开宝教授和张美芳教授所说,译者风格通过语料库手段能得到更为清晰的阐释[2,4]。译者在译作中必然会留下自己的印记,白睿文也不例外。通过上述一系列统计和研究,可以归纳出白睿文的翻译风格如下:白译文用词简单常见,词汇丰富程度低;相比于英语译语文本,译本的遣词造句更接近英语源语文本的特点;基本上做到句句对应,习惯于拆分长句;白译文主题相似,集中于家愁国难。

白睿文作为一位致力于中国现当代文学翻译的汉学家,其本身具有的译者风格乃至译介模式对于推动中国文学对外译介和海外传播都具有重要的现实意义[15]。因此,白睿文的译者风格也具有一定的研究意义,除了语料库方法之外,还可以对其进行更深度的研究。

猜你喜欢
译作语料库译者
例析初中文言文中常见虚词的用法
生态翻译学视角下译者的适应与选择
what用法大搜索
《语料库翻译文体学》评介
论新闻翻译中的译者主体性
基于JAVAEE的维吾尔中介语语料库开发与实现
元话语翻译中的译者主体性研究
SOME汉译初探
英语中“吃”的表达方法
语料库语言学未来发展趋势