俄汉—汉俄平行语料库建设与研制的迫切性及应用价值

2018-03-14 23:43李哲
文学教育下半月 2018年1期
关键词:应用价值意义

李哲

内容摘要:本文紧密结合俄语界对平行语料库的需求,概述了国内外平行语料库的发展现状,论证了俄汉-汉俄平行语料库的应用价值,阐释了现存平行语料库的普遍问题以及从中得到的启示。在平行语料库建设和研究蓬勃发展的当今世界,我国俄语界不应再止步不前,各学科之间应该加强合作,充分借鉴国内外成熟平行语料库的建设经验,加快、加强俄汉-汉俄平行语料库的建设与研制刻不容缓、势在必行。

关键词:俄汉-汉俄平行语料库 建设与研制 应用价值 意义

一.引言

平行语料库是指两种或多种语言在段落、句子甚至单词短语层面上实现同步对译的互动语料库。近三十年来,随着语料库创建和应用的不断发展,平行语料库也展现出广阔的应用前景,已成为语料库研究的一个重点。

近年来,世界各国都投入了大量的人力、物力和财力用于平行语料库的建设。其中,在欧美,平行语料库已建成有十多个,涉及近20个语种;在中国,双语平行语料库的发展势头也非常迅猛,但主要以汉英平行语料库为主。俄汉一汉俄平行语料库的建设依然是个空白,虽然国内有些学者已经在自建小型的俄汉平行语料库,但都未开放。

二.国内外平行语料库发展现状

平行语料库的构建与应用研究从20世纪90年代就已经开始。世界上第一个双语语料庫——加拿大议会会议录英-法平行语料库(the Canadian Hansard Cor-pus)于90年代初在加拿大建成。另外,如兰卡斯特大学早期创建的I-TU/Crater平行库、欧洲委员会联合中心的JRC-ACQUIS多语种平行语料库、PAROLE语料库等,这些语料库基本上都是文本来源单,标注也简单的欧洲语言专用语料库。

除此之外,比较大规模的、具有代表性的平行语料库还包括克姆尼茨英-德翻译语料库(Chem-nitz E-G Translation Corpus)、德英文学文本平行语料库(Ger-man-English Parallel Corpus of Literary Translation,GEPCOLT)、英语一挪威语平行语料库(Eng-lish-Norweigian Parallel Corpus,ENPC)等。

在国内,双语平行语料库的建设研究起步相对较晚,但近10年来也取得了很大的进展,其中最值得一提的是北京外国语大学中国外语教育研究中心王克非主持和研制的北外“通用汉英对应语料库”,该语料库是目前世界上规模最大的双语平行语料库,容量约为3000万字词。

专门用途语料库的建设也获得了一定的关注,如上海交通大学的莎士比亚戏剧英汉平行语料库、燕山大学的《红楼梦》译本平行语料库、哈尔滨工业大学计算机学院语言技术研究中心面向奥运的汉英日三语语料库、内蒙古大学建立的汉蒙对照政府文献语料库等。

涉及俄语的平行语料库主要有俄语国家语料库(Национапъныйкорпусрусскогоязыкл-НКРЯ)的平行文本语料库(Корпуспараллельныхтекстов)模块,收录有俄英、英俄、德俄、乌俄、俄乌5个文本对库,总量约为2400万词次。

相比之下,俄汉一汉俄平行语料库的建设与研究还很滞后。虽然国内有些学者已经开始尝试构建俄汉双语平行语料库,比如崔卫和张岚目前已设计研制好的俄汉翻译语料库中的子库——军事外宣汉俄翻译子库(崔卫等2014:1)、刘淼和邵青创建的基于契科夫小说的俄汉文学翻译语料库(刘淼等2016:1)、解放军外国语学院硕士研究生创建的俄汉新闻句库等。但是这些语料库大都没有实现对外开放,数量太少,而且也尚待完善。因此,紧密结合实际需求,借鉴其他语种平行语料库的建设经验,将认识不深、技术不硬、资源不足等问题彻底解决,进行俄汉领域平行语料库的建设与研制是当务之急。

三.俄汉-汉俄平行语料库建设的应用价值和意义

平行语料库的建设和研究代表了当今基于语料库方法进行语言对比研究、翻译研究和外语教学研究的发展趋势。加强俄汉一汉俄平行语料库的构建与研究,也必定会促进俄汉语言对比研究和翻译研究的发展,改进俄语教学,提高翻译质量,改进俄汉双语词典的编纂,促进俄汉双语信息检索和机器翻译的开发。

1.俄汉-汉俄平行语料库与语言对比研究

平行语料库承载着相互对应的两种语言,与语言对比研究有着天然的联系,成为语言对比研究中的默认数据源。(王克非2012:23)基于语料库的方法是俄汉对比中最常用的定量统计方法,它一般是根据语料实例观察,提出假设,然后由研究者以对应语料库为数据源对假设进行验证。(崔卫等2014:5)平行语料库可以为俄汉对比提供更多的可能性,让我们发现很多以前在语言对比认识上的错误,甚至获得新的发现。

2.俄汉-汉俄平行语料库与俄语教学

基于语料库的教学方法可以提高俄语教学的有效性。通过利用平行语料库及其相关检索工具,对特定的语料进行分析,可以有效地引领学生对同义词进行真实准确的辨析、了解词语真正的含义、学习词语的搭配和短语结构以及了解文章的结构、表达、语境和修辞信息等。特别是在翻译课教学中,平行语料库更是不可替代的参考工具或工作平台。首先,利用平行语料库便于查找特定表达方式的译法,使术语和短语的翻译更加准确、地道。其次,它还有丰富的译例,可以提供多个翻译参考,使翻译文本更加真实、更加丰富。

3.俄汉-汉俄平行语料库与词典编纂

在词典编纂领域使用语料库被视为词典编纂手段的一次革命,而平行语料库在双语词典编纂中的作用更是不可估量的:平行语料库中的两种语言互为对应,记载着两种语言中的对应词和对应单位(王克非2012:23),不仅可以提供最可靠的数据来源,而且还可以帮助词典编纂者对词进行义项分析、排序、提供例句、发现新词义等。而俄汉-汉俄平行语料库的建设也必定会为俄汉双语词典的编纂带来革命性的突破。

4.俄汉-汉俄平行语料库与翻译研究

语料库研究方法在翻译领域的应用使得一门新的交叉学科——语料库翻译学诞生,而双语语料库则是该学科的基础。基于俄汉一汉俄平行语料库,人们可以研究俄汉语翻译语言特征、翻译文体、作家语言翻译特点、特定结构或表达方式在对应语言中的体现以及译者的翻译策略和方法。除此之外,平行语料库对于机器翻译也极为重要。对齐的平行语料库能为基于例句和统计的机器翻译提供实证模型,同时也可以为基于规则的机器翻译提供验证,为机助翻译提供大量翻译记忆。(王克非2012:23)我国的科大讯飞公司已经根据语音语料库和海量语料库资源开发出了国内首款智能便携翻译机。由此可见,平行语料库在机器翻译方面的应用价值不可估量。

四.现存平行语料库的普遍问题及对俄汉-俄汉平行语料库的启示

1.平行语料库建设各自为政导致重复建设问题严重

尽管国内外现有的双语平行语料库各自己具备一定的规模,但大都各自为政,缺乏一定的综合性,而且重复建设问题严重。以国内的《红楼梦》汉英平行语料库为例,比较有代表性的至少就有三个。(崔卫等2014:1)语料库的建设本身就是一项既费时又费力的工作,重复建设只会造成力量的分散,限制语料库的规模和加工深度。

有鉴于此,在俄汉-汉俄平行语料库的建设中,笔者认为初始阶段不应求大求全,可以选择核心语料库的一个具体方面为起点,各研制团队之间加强交流沟通,分工合作,最后对现有资源进行整合,实现共享。

2.平行语料库的研究切入点不足,专门语料库类型单一

平行语料库不仅可用于跨语际的语言转换研究,还可进行不同翻译方向上译出与译入文本的类比研究,以及翻译语言与非翻译语言的类比研究等。但目前此类研究主要局限于文學作品领域,对于非文学文本类似考察并不多见,这与专门语料库类型单一的问题不无关系。目前国际上大多语料库还仅限于文学和非文学两种,而且非文学文本中的新闻、财经、法律、医药等文类细化远远不够。

因此俄汉-汉俄平行语料库的创建既要不断拓展文本类型,又要进一步发掘新的研究对象,比如对不同文本类型翻译策略的对比研究以及在历时的角度下考察翻译语言或翻译给原创语言带来的变化等。

其它如平行语料库深加工程度不够、相关技术开发不足等问题也是一直以来亟待解决的难题,这就更要求相关学科之间加强沟通与合作。语言研究者和翻译研究者可以为计算机专业人士提供新的研究课题,反过来,计算机专业人士又能为语言研究者和翻译研究者提供研究手段的支持,二者相互促进,共同发展。结语

平行语料库作为语料库的一种具体类型,是重要的语言资源,它的建设与使用也是今后语料库翻译学以及机器翻译取得新突破的硬件基础,双语平行语料库在语言学研究中的潜力还有待于进一步开发。因此,如何更好地构建俄汉一汉俄平行语料库也自然成为俄语界学者势在必行的研究课题。同时,进一步注重各研制团队之间的合作,建设超大规模、综合性、多用途的国家级语料库也成为平行语料库发展的新趋势。

猜你喜欢
应用价值意义
有意义的一天
数学中“无意义”的意义
数学中“无意义”的意义
留学的意义
企业金融管理应用价值分析
诗里有你
论巨型雕塑的多重意义