语言学知识在机器翻译发展领域的应用

2018-06-11 10:35高梦璐
校园英语·上旬 2018年4期
关键词:机器翻译语言学

【摘要】该文章总结了乔姆斯基的转换生成语言学、蒙太古语义学以及韩礼德的系统功能语言学知识中对机器翻译发展领域中的部分有效实践,供其他语言学学者参考。虽然目前在机器翻譯中语言研究逐渐被忽略,但语言研究的发展仍应是机器翻译中极需要攻克的难关。回顾几位语言学家的理论在机器翻译领域的应用,有助于日后语言学家进一步深化语言学研究并为翻译技术的发展提供语言根基支持。

【关键词】机器翻译;语言学;语法规则;语篇功能

【Abstract】This paper sums up some effective practices in the field of machine translation development by Chomskys transformational generative linguistics, montage semantics and hallidays systematic functional linguistics, which is for the reference of other linguists. Although language research is gradually neglected in machine translation, the development of language research should still be a great difficulty in machine translation.. The review of the application of several linguists in the field of machine translation helps to further deepen linguistic research and provide language foundation support for the development of translation technology.

【Key words】machine translation; linguistics; grammar rules; discourse function

【作者简介】高梦璐(1996- ),女,西南科技大学外国语学院在读本科生。

【基金项目】(Foundation):国家级大学生创新创业训练计划资助项目(项目编号:201710619028)。

一、引言

目前,基于统计的机器翻译系统取得不小的成绩,基于规则的翻译系统的发展却陷入停滞。就语言学家方面的原因而言,语言学家总结出的规则在应用于机器翻译中时遇到了两大难题,一是许多句法规则无法通过准确的数学公式表达出来,二是语言学家制定的这些规则具有主观性,在应用中颇具争议。因此,在机器翻译发展中,我们看到更多的是计算机学者在用技术解决问题,而语言学家的身影却逐渐消失。因此,对语言学知识在机器翻译领域的应用的研究,有利于引导机器翻译技术的发展回归语言研究,才能避免其畸形发展,从语言根基上取得较大进步,从而促进机器翻译的飞跃式发展。

二、语言学知识在机器翻译发展领域的应用

机器翻译虽横跨多个学科领域,然而究其根本,机器翻译属于语言学分支下的计算机语言学范畴内,是利用计算机技术将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。但机器翻译发展至今,语言研究成果匮乏。自上个世纪以来,乔姆斯基、蒙太古、韩礼德几位著名学语言学家的理论对机器翻译的进步与发展提供了强有力的理论支撑。在他们理论的基础上实现的各种机器翻译技术的突破性进展与实践不胜枚举,下文将以乔姆斯基的转换生成语言学、蒙太古语义学和.韩礼德的系统功能语言学为例,具体探讨语言学知识在机器翻译发展领域的有益探索。

1.乔姆斯基的转换生成语言学。上世纪50年代在《Syntactic structure》中,乔姆斯基首次提出了著名的“转换生成语法”, 为机器翻译一种新的基于规则的模式奠定了理论基石。该理论以数学式的表达方法阐释规则,因此被称为形式化的语法。以乔姆斯基为代表的转换生成语言学派认为,可以假设制定一套规则,并用这些规则来描述语言。这使语法规则在翻译系统中更易被理解。基于规则的传统机器翻译,就是在这一基础上研究而成的,其翻译过程中首先将语言用逻辑思维转换成符合语法规则的符号或数学表达式,然后再将其源语和目标语都转化成计算机可理解的参数和变量,使计算机完成翻译指令。

2.蒙太古语义学。如果说,乔姆斯基开辟了自然语言转换成形式语言的先河,那么理查德·蒙太古( Richard Montague) 则是进一步为实现自然语言到目标语言更精确的转换。在他的代表作《普遍语法》中,他提出建立(在理想状态下)无歧义的内涵逻辑人工语言系统IL,在基于规则的机器翻译中,IL被当做中间语言,用来攻克外延逻辑的准确性和自然语言内涵复杂性之间的矛盾问题。之后,他又在模型理论的基础上建立完整的IL语义学,其主要理念为,设定任意一个范畴a(如名词短语),再取一些这个范畴内的表达式,将它们按照设定的语形规则和译文映射规则得到内涵逻辑类型的翻译映射,使此范畴内的任何表达都能“翻译”成F(a)的表达式。这种采取“中介”的方法自实行起就成为了机器翻译的主流方法,在多语种翻译中尤其受用。

3.韩礼德的系统功能语言学。首先,以韩礼德为代表的系统功能语言学派认为,语义是受语境影响的。脱离语境的语篇翻译是生硬的,甚至与原文本意存在较大差距。语言系统中有三个用于表示功能意义的元功能,即概念功能、人际功能和语篇功能。这三项元功能使语境与语义的两个层面衔接在一起。与人工译文相比,缺少语篇功能的机器译文,则无法根据目标语的语言表达习惯、作者的文学动机以及文本文体等合理地对译文进行调整。

其次,韩礼德还提出了语言的五个基本单位,即“句”、“小句”、“词组/短语”、“词”和“词素”。并以此理论为基础,用实例演示了他设想的机器翻译的主要流程:在第一个阶段,按照不同层次将原句依次切分为小句、词组/短语、词和词素;第二阶段是逐层往上进行翻译,即先翻译词素,然后翻译词,以此类推。在每一层的翻译中,先在目标语中找到概率最大的等值翻译项目,然后在下一层的翻译中根据该词出现的上下文语境进行重新修改;在第三阶段,再根据目标语的内在结构修正译文的词汇和语法错误。

从上述三位学者在机器翻译领域做出的颇有成效的研究成果中我们可以看到,他们在基于规则的翻译系统中做出的大胆尝试能够有效地提升机器译文的质量,但是经过实际检验,他们的理论仍存在缺陷。乔姆斯基的转换生成语法尽管为基于规则的翻译技术提供了新思路,但是对自然语言的转换实际上要复杂得多,而且对自然语言如何转换他并没有一个详细的衡量标准,就会出现转换结果带有主观臆断的可能性。此外,蒙太古在内涵逻辑人工语言系统中,把逻辑等价原则过于理想化,而无法解决意义等同并不完全等于逻辑等价的难题,因此就会出现“同学A知道1+1=2,又有圆的直径等于半径的两倍,因为这两个命题是逻辑等价的,就能够得到同学A知道圆的直径等于半径的两倍”这样的逻辑错误问题。并且,韩礼德虽然独创性地提出了通过语篇功能调整译文的想法,但是他却没有明确地指出如何能使译文在整个语篇中做到语篇语义连贯应达到什么要求。

三、结语

纵观当前国内外对机器翻译的研究,计算機学科的学者的成果颇多,然而语言学者却成绩寥寥。由于语言学研究难度大,成效低,且加上基于规则的机器翻译系统已渐渐被基于攻击的语料库翻译系统所取代,在机器翻译发展领域中语言学家的作用逐渐被忽视,进而语言研究成果也大大减少。

目前有学者发表观点称,“相关的工程问题和数学问题固然重要,但是机器翻译的中心问题却是语言问题,即语言的描写与对比”。笔者认为,整个机器翻译的过程,首先需要语言学学者将语言规则化,总结出一套具有数学思维的语言规则;数学家再将语言规则解析成计算机专家可应用于机器翻译技术的公式;再由计算机程序员将这些语言规则转换成代码,三个环节缺一不可。虽然几位著名语言学家提出的研究理论能够使机器翻译在译文质量上有明显提升,但是也不免存在不足。至今虽已有学者基于不同理论有各自的尝试和研究成果,但是一个相对理想的翻译系统绝不可能由少数几个人完成,所以语言学者们应该避免各自为政,采取合作模式共同研发多策略的机器翻译模式,能够使某一翻译系统能够集个各策略之所长,得到更为理想的翻译系统。即使统计方法有多容易,语言规则的研究也不该因此停滞。但是正因为如果一直没有人能够跳出固有的思维模式大胆地尝试,这样的突破性研究因为语言研究作为机器翻译的根本,始终需要不断的努力,才能与计算机学者共同助力机器翻译跨越式发展。

参考文献:

[1]张珑馨.消失的语言学家:机器翻译发展的现状与歧路[J].教师教育学报,2013,11(10):96-100.

[2]朱水林.蒙太古语法和机器翻译[C].两岸逻辑教学与研究学术会议,2012.

[3]韩礼德.计算机与定量语言[M].北京大学出版社,2007.

[4]胡壮麟,朱永生,张德禄,李战子.系统功能语言学概论[M].北京:北京大学出版社,2005.

[5]李学宁,董剑桥.韩礼德的机器翻译思想初探[J].中国外语,2012 (3):90-93.

[6]潘玥.论Halliday系统功能语言学对文本翻译的贡献以及对篇章机器翻译的启示[J].湖北函授大学学报,2015(15):150-152.

[7]梁飞.蒙塔古内涵逻辑研究[D].华东师范大学,2014.

[8]冯志伟.基于短语和句法的统计机器翻译[J].燕山大学学报, 2015,39(6):546-554.

猜你喜欢
机器翻译语言学
语言学研究的多元化趋势分析
互联网+新时代下人机翻译模式研究
“语联网+行业” 助力中国伟大复兴
大数据背景下石油科技翻译
大数据背景下石油科技翻译
机器翻译不可盲取
The Application of Hedges in EFL Class
基于免费在线翻译工具的机器翻译缺陷探讨
书讯《百年中国语言学思想史》出版
The Influence of Memetics for Language Spread