汉英机器翻译中的译前编辑研究

2023-06-24 14:20韩欣雨王非
中国新通信 2023年2期
关键词:原文译文机器

韩欣雨?王非

摘要:在人工智能广泛运用的时代,以“机器翻译+译后编辑”(MTPE)为代表的人机合译模式已成为机器翻译的主流运行方式。但对于一些特殊文体、或者文本差异较大的情况,机译效果往往不佳,增加译后编辑工作量,降低整体翻译效率。本文提出:机器译文质量的提升可以借助译前编辑来进行控制。以汉英翻译为例,译前编辑包括文体编辑、语法编辑及语义编辑。经过译前处理后的机器译文在语义上更加贴合汉语原文的意义内涵,在语言形式上也更符合英语的表达习惯。

关键词:汉英翻译;机器翻译;译前编辑+机器翻译汉英机器翻译研究现状

一、汉英机器翻译研究现状

随着基于神经网络技术的机器翻译在各个领域得到了日益广泛的应用。有些原本因人工翻译低效且费用高而被忽视甚至抛弃的语言服务细分业务,比如出国旅行的翻译服务和信息量庞大的电商网站的本地化、社交媒体信息即时翻译等业务也在机器翻译技术不断成熟的情况下业务量得到快速增长。然而目前,即使机器翻译可以较好实现内容翻译的目的,但所生成的译文质量仍然无法媲美高水平的人工翻译。尤其是对于一些特定文体以及长难句翻译时,机器翻译甚至可能出现理解错误、表达生硬等问题。因此机器翻译的应用始终需要人工干预来保证其质量[1-2]。

就汉英机器翻译而言,目前人机合译的研究重点主要放在译后编辑上,集中于对特定文本译后编辑的错误分析以及编辑策略研究。同时,译后编辑在全球语言服务行业中被广泛应用,如Microsoft和SDL International这些头部企业均有各自的译后编辑队伍。但实际操作中译后编辑由于耗时长、成本高,限制了整体的翻译效率。另一方面,针对译前编辑的研究则相对匮乏。译前编辑是在机器翻译之前进行的人工干预,译者通过比较源语与目标语之间的内在差异,对原文的语言形式进行编辑,使其更容易被机翻引擎所理解,从而预先保证了机译文本的质量,也大幅度减轻了译后编辑的工作量[2]。

二、译前编辑的内容与方法

译前编辑的工作指的是译者为了凸显原作的内容和意图、实现原文作者的交际目的,按照译入语的语言、文化习惯,对原文所包含的信息和表达形式进行调整甚至删改。机器翻译的译前编辑则要求译者对源语文本中机器不易理解和识别的词、句等进行人工处理。译前编辑是人机交互翻译的重要表现,也是提高机器翻译质量的重要途径之一,能够在一定程度上减少译后编辑的工作量,使译后编辑的效率大幅提升[3-4]。

国际译联在《翻译工作者章程》中指出“忠实于原文并不等于一字不差的直译。译文的忠实性不能排除为了让原作在形式、氛围和深层意义等方面都能在其他语言中重现,并进行恰当调整”。汉语与英语在语法结构和语义构成上存在很大差异,英语是形合语言,句与句之间的连接词较多,需要更完整的曲折形式。而中文是意合语言,句间连接词较少,在表达上更简洁,其理解更依赖于上下文。缺少译前编辑的机译文本经常存在信息理解错误、表达生硬等问题。译者需要调整不同的文本使其适应受控语言写作指南,用来实现原语写作的连贯性以及提高这些文本的可译性。而译前编辑可以使源语文本变成更加适合机翻引擎识别的语言结构,使机器译文的准确性和可读性得到一定提升[4-5]。

目前,市面上的翻译软件中,由德国公司DeepL研发的DeepL翻译器利用人工智能技术和神经网络来不断训练和提升翻译能力。而且神经网络翻译模型能够模拟人脑,进行高级别的“思维与学习”,以及更加详细地切分与精细的计算,使译文质量得到很大提高。这种翻译方法最大的优点是翻译流畅,语法规范性较强,易于理解。在DeepL公司的盲测中,专业译员在对译文出处不知情的情况下选择最准确的翻译结果,其中包括了DeepL、谷歌翻译、亚马逊翻译、微软翻译。DeepL以3:1的系数优势优于竞争对手[6-7]。

在本研究中,研究者按照“语篇-句法-词汇”三个层面的划分,将译前编辑分为文體类编辑、语法类编辑和语义类编辑三类,以机器翻译平台DeepL的产出文本为研究对象。探讨如何通过译前编辑过程达到改善机译文本的效果,并采用官方译文或名家译本作为参考,对译前编辑的效果进行验证。

(一)文体类编辑

文体类编辑的典型代表是将文言文预处理为现代汉语,或将地方方言阐释为标准普通话。以文言文为例,机器译文通常是字对字的生硬译法。所以,做译前编辑时,通常需要将文言文解释为结构清晰、语义明确的现代汉语。如例1所示:

例1

原文:固知一死生为虚诞,齐彭殇为妄作。

未经译前编辑的DeepL译文:I am sure I know that a death and a life are imaginary, and the death of Qi Peng is a delusion.

原文节选自王羲之的《兰亭集序》,“一死生,齐彭殇”则来自庄子的《齐彭殇》一书。机器译文中对于“一”、“齐”的理解是错误的。所以,研究者对文言文原文用现代汉语进行解释:“把生与死等同,把长寿和短命等同”。

经译前编辑后的原文:(我)已经意识到把生与死等同的说法是荒谬的,把长寿和短命等同起来的说法是妄造的。

经译前编辑后的DeepL译文:I have realized that it is absurd to equate life and death, and that it is a delusion to equate long life with short life.

林语堂译文:Now I come to realize that it has been ridiculous for me to equate death with life, long life with short life. [8]

经译前编辑后的译文内容在句意的理解上更为清晰,语言表达更加贴合英文的使用习惯,更加准确地展现了原文用典的修辞手法,尤其在一些词汇的运用上更加精确。同时,与著名翻译家林语堂先生的译文相比较,也可以发现,该译文在结构和用词上也与林语堂译文有较高的一致性。

(二)语法类的编辑

汉语和英语在语法结构上存在显著差别,在翻译中译者有时不得不对原文的句子结构增补必要的成分,使其易于被机翻引擎处理,机译文本的语法结构也更加贴合目标语的表达,从而提升整体的译文质量。

1.对无主句的编辑

汉语句子中经常省略主语,而英语以主语作为句子信息的出发点,主语是必不可少的语法成分。机翻引擎有时难以识别句子的隐含主语,对无主句的处理质量始终不够稳定。因此,译员需要在译前编辑时根据语境上下文适当地增添主语,以帮助机器更好地理解识别原文。如例2所示[9]:

例2

原文:文学、戏剧、电影、电视、音乐、舞蹈、美术、摄影、书法、曲艺、杂技以及民间文艺、群众文艺等各领域都要跟上时代发展、把握人民需求,以充沛的激情、生动的笔触、优美的旋律、感人的形象创作生产出人民喜闻乐见的优秀作品,让人民精神文化生活不断迈上新台阶。

未经译前编辑的DeepL译文:Literature, theatre, film, television, music, dance, art, photography, calligraphy, opera, acrobatics, folk art, mass art and other fields should keep up with the development of the times and grasp the needs of the people, so as to create and produce excellent works with passion, vivid strokes, beautiful melodies and touching images that are pleasing to the people, so that the spiritual and cultural life of the people will continue to reach a new level.

经译前编辑后的原文:(文化部门的各个领域,包括)文学、戏剧、电影、电视、音乐、舞蹈、美术、摄影、书法、曲艺、杂技以及民间文艺等,都要跟上时代发展、把握人民需求。(文艺工作者们)以充沛的激情、生动的笔触、优美的旋律、感人的形象创作生产出人民喜闻乐见的优秀作品,让人民精神文化生活不断迈上新台阶。

经译前编辑后的DeepL译文:All fields of the cultural sector, including literature, drama, film, television, music, dance, art, photography, calligraphy, opera and acrobatics, and folk arts, must keep up with the development of the times and grasp the needs of the people. With passion, vivid brushstrokes, beautiful melodies and touching images, artists and writers create and produce excellent works that are pleasing to the people, so that their spiritual and cultural life can continue to reach new heights.

官方译文:All fields in the cultural sector, including literature, drama, film, TV, music, dancing, fine arts, photography, calligraphy, acrobatics, ballad singing, storytelling and folk arts, should keep pace with the times, and cater to the current needs of the people. Their practitioners should commit themselves to creating passionate, moving works with touching images and superb lyrics that the people love, so that the public can enjoy a better cultural life.

經译前编辑后,机器译文准确地添加了句子的主语及相关内容,并实现了小句间的合理衔接,使得其句法结构也与官方译文更加接近。

2.无宾语句的编辑

中文句子的意义往往依赖于语境传达,宾语经常被省略。而英语中及物代词后都要带宾语,因此汉译英时需要增添作为宾语的代词,如例3所示:

例3

原文:口服, 一次4片, 一日2-3次。温开水或温牛奶冲服。(双歧杆菌乳杆菌三联活菌片)

未经译前编辑的DeepL译文:Take 4 tablets orally, 2-3 times a day. Take with warm water or warm milk.

原文为无宾语句,未经译前编辑的机器译文中同样缺失宾语,造成语法错误。因此在译前编辑环节中需要添加宾语“药”。

经译前编辑后的原文:口服,一次4片,一日2-3次。温开水或温牛奶冲服(药品)。

经译前编辑后的DeepL译文:Take 4 tablets orally, 2-3 times a day. Take the medicine with warm water or warm milk.

参考译文:Orally, four tablets each time, two or three times daily. Take medicine with warm water or warm milk.

与译前编辑前译文相比,经过译前编辑后的机器译文句子语法结构和内容更加完整,同时也更加清晰地表达了句意。

3.连接词缺省句的编辑

中文语篇中一般不使用明显的衔接手段,读者主要通过上下文语境来领会句子之间的关联。而英文则通过句与句之间的连接词来体现句子之间的逻辑关系。

由于中文的句子较英文更短,因此对于一些高度浓缩、但内涵丰富的句子,研究者首先应该识别其内在的逻辑关系,将其拆分为独立小句,并在小句间标注出合适的连接词。如例4所示:

例4

原文:地方小邀请不了那么多人。

未经译前编辑的机器译文:The place is too small to invite so many people.

仔细分析原文可以发现,句子中隐含了因果关系。但是未经译前编辑的机译文并未显示出句中所隐含的因果关系。“地方小”构成了“邀请不了那么多人”的原因,因此,译者将小短剧拆分为两个独立的小句,并在句中添加表达因果关系的连接词。此外,研究者基于前文中对于无主语句的译前编辑方法,在短句中增加了主语“我”。

经译前编辑后的原文:(因为)地方小,(所以)(我)邀请不了那么多人。

经译前编辑后的DeepL译文:I couldn't invite that many people because the place was small.

显然,经过译前编辑后的译文,短句的语法结构更加完整,句间关系也更加清晰,准确地传达了原文所表达的逻辑含义。

(三)语义类编辑

1.未语法化词汇的编辑

现代汉语的有些词汇已经被语法化,如“工业化、现代化”,它们在英语中有相应的对等词汇(industrialization, modernization),但仍然存在未被语法化的表达,在进行译前编辑时仍需要进行转化。如例5所示:

例5

原文:天宝村现代特色农业示范园的先行先试,为白河县乃至陕西省以园区化推动地区农业现代化提供了经验借鉴。

未经译前编辑的DeepL译文:The early and pilot implementation of the modern special agricultural demonstration park in Tianbao Village has provided experience for Baihe County and even Shaanxi Province to promote the modernization of regional agriculture with the park.

“园区化”一词尚未语法化,在英语中也无固定的对应词汇,机器译文在理解上出现较大偏差,“with the park”未能正确表达出原文的真正含义。因此,研究者在译前编辑中将“园区化”阐释为“发展工业园区”,同时将“以园区化”这一方式状语更详细地表述为“通过发展工业园区来...”,从而便于机器的理解。

经译前编辑后原文:天宝村现代特色农业示范园的先行先试,为白河县乃至陕西省通过发展工业园区来推动地区农业现代化提供了经验借鉴。

经译前编辑后DeepL译文:The early trial of modern special agricultural demonstration park in Tianbao Village has provided experience for Baihe County and even Shaanxi Province to promote regional agricultural modernization through the development of industrial parks.

2.對修辞性话语的译前编辑

汉语文本中的模糊特质无处不在,即便基于语料库的机器翻译也很难及时得到足够语料支持,导致机译文本与译前编辑后文本差距巨大。修辞的使用使不同文化背景下的人在阅读文本时出现理解的偏差,从而导致整句的理解错误。这就需要在译前编辑时,将原文本使用修辞的部分进行人工释义编辑,再使用机器翻译。如下例6所示[10]:

例6

原文:能源安全的饭碗必须端在自己手里

未经译前编辑前DeepL译文:The rice bowl of energy security must be in your own hands.

研究者在进行译前编辑时发现,句子中出现的“饭碗”一词使用了隐喻的修辞手法。而机器译文直接将“饭碗”直译了出来,使句意出现了极大的偏差。因此,研究者对“饭碗”一词进行解释,将其理解为“能源安全必须靠我们自己来保障”。

经译前编辑后原文:我们必须靠自己的力量保障能源安全。

经译前编辑后DeepL译文:We must ensure energy security on our own.

官方译文:We must hold energy security in our own hands./We must ensure energy supply secure.

经译前编辑后的原文还原了“饭碗”的指代意义,译前编辑后的机译文与官方译文贴合度基本一致,句意表达清晰完整,便于理解。

三、综合对比研究

以下材料节选自外交部翻译司副司长张璐在第二届“全国外交口译大赛”上的致辞,译文以官方译文作为参考。为便于分析,使用上标数字为每个句子作出标记。

原文:①也希望我们注意积累,厚积薄发,勤思敏学,在日常的学习过程中需要打好中文和外文的语言基础,还要锻炼好各项基本功。②在日常学习中大家应该保持好奇心,培养责任心,提高进取心。③相信在这方面通过不断的积累,进一步深入了解在中外历史文化发展阶段、思维方式等各方面的差异,④还有就是符合一定的传播规律基础上,我们能够有能力努力朝着“听得懂、 听得进、听得明白”,就说让外国受众实现“三听”方面做出自己的努力,并且也取得更大的进步。

官方译文:①First, we need to attach importance to accumulating the knowledge of Chinese and English, as well as improving language skills and to develop good habits of thinking. ②Second, we need to maintain curiosity, cultivate a sense of responsibility, and boost motivation to make more progress. ③Third, we need to figure out the differences in the historical and cultural development stages and mindsets of the people between China and other countries.④ Fourth, we need to follow related communication rules, enabling China's stories to be better understood by foreign friends.

未經译前编辑DeepL译文:①We also hope that we will pay attention to accumulate, think and learn diligently, and build a good foundation of Chinese and foreign languages in our daily study process, as well as exercise all basic skills. ②In our daily study, we should keep curiosity, cultivate responsibility, and improve our aggressiveness. ③It is believed that through continuous accumulation in this area and further understanding of the differences between Chinese and foreign history and culture, thinking, and other aspects, ④as well as on the basis of certain communication laws, we can make efforts to “ listen to, and understand”, so that foreign audiences can achieve listen to, and understand, and make more progress in the area of “three listening”.

与官方译文相比,机器翻译的译文都或多或少存在一些问题。尤其是在句间逻辑的处理上还是无法与人工翻译相提并论。从语篇层面看,分析句间逻辑关系不难发现,句与句之间存在并列关系。而机译文未能准确地识别出隐含的逻辑关系,未能进行很好的意群划分。从语义层面看,机器译文未能正确处理文中的表达。将“听得懂、听得进、听得明白”等表示强调的词句重复翻译,使得句子冗长。译文意义出现偏差。

经译前编辑后原文:①(第一,)我们要在日常的学习过程中打好中文和外文的语言基础,还要注意积累,勤思敏学。②(第二,我们)要保持好奇心,培养责任心,提高进取心。③(第三,我们要)进一步深入了解在中外历史文化发展阶段、思维方式等各方面的差异,④(第四,)在传播规律基础上,让外国受众更好地了解中国故事。

经译前编辑后DeepL译文:①First, we need to build a good language foundation in Chinese and foreign languages in the daily learning process, and pay attention to accumulation, diligent thinking and keen learning; ②Second, we need to maintain curiosity, cultivate responsibility and improve enterprise; ③Third, we need to further deepen our understanding of the differences between Chinese and foreign historical and cultural development stages, ways of thinking and other aspects; ④Fourth, we are in line with the law of communication based on the foreign audience to better understand the Chinese story.

在译前编辑中,研究者对其中的长句进行意群的划分,断句,增加主语,进行适当的释义,使经译前编辑后的机译文与官方译文更加符合,句意表达准确。研究者对原文的编辑,目的是适应机器的识别,提高机器译文的质量。在译前编辑后,两个机器翻译的译文质量都有了一定的提升,这也彰显了译前编辑对于机器翻译译文质量的重要性。

四、结束语

本文较为全面地探讨了译前编辑对于提高人机交互翻译效率的作用,以及译前编辑在应用中的具体操作路径。通过对语篇、句法、词法的研究,不难发现在使用机器翻译时,加入译前编辑这一步骤会使人机合作的效率更高,经过译前处理后的机器译文在语义上更加贴合汉语原文的意义内涵,在语言形式上也更符合英语的表达习惯。同时,译前编辑所需的时间往往少于译后编辑的时间,因为在译前编辑过程中,译员只需要对机器未能识别的表达方式进行增添或解释,从而极大地减轻译后编辑的工作量。加入译前编辑环节,对于减轻译后编辑工作量,提升人机交互翻译效率具有较强的应用价值。

作者单位:韩欣雨 王非 西安交通大学

参  考  文  献

[1] 王清然,徐珺. 技术进步视域下机器翻译技术对语言服务行业的影响分析[J]. 中国外语,2022,19(01):21-29.

[2] 彭石玉,周丹. 新闻导语翻译的译前编辑模式研究[J]. 湖北师范大学学报(哲学社会科学版),2022,42(01):92.

[3] 徐勤,吴颖. 经贸外宣资料的翻译探索[J].中国翻译,2003(03):80-82.

[4] 冯全功,高琳. 基于受控语言的译前编辑对机器翻译的影响[J].当代外语研究,2017,(02):63-68.

[5] 贾文波. 原作意图与翻译策略[J].中国翻译,2002(04):30.

[6] 闫欣,陈瑞哲,张井. 翻译技术云平台的发展现状与趋势[J]. 中国科技翻译,2019,32(01):22-25.

[7] Li, C. A Study on Chinese-English Machine Translation Based on Transfer Learning and Neural Networks[J]. Wireless Communications and Mobile Computing,2022:1-2.

[8] 林語堂. 古文小品译英[M].北京:外语教学与研究出版社,2009.

[9] Yip, P., Rimmington D. Chinese: A Comprehensive Grammar[M]. London: Taylor and Francis, 2016:589.

[10] 仲文明,徐佳敏,李芸昕. 机译中汉语科技文本的模糊特质与译前编辑[J]. 中国科技翻译,2021,34(04):36-39,42.

猜你喜欢
原文译文机器
Stem cell-based 3D brain organoids for mimicking,investigating,and challenging Alzheimer’s diseases
机器狗
机器狗
译文摘要
未来机器城
I Like Thinking
Performance of a double-layer BAF using zeolite and ceramic as media under ammonium shock load condition
译文