基于信息技术的布依语泰国语应用对比研究

2017-05-19 19:09黄琼
新西部·中旬刊 2017年4期
关键词:机器翻译

黄琼

【摘 要】 本文综述分析了应用对比语言学的研究成果,探索了基于信息技术的布依语泰国语应用对比研究途径:平行语料库建设,在线双语词典的编纂及双语机器翻译系统的开发。

【关键词】 布依语泰国语对比;平行语料库;在线双语词典;机器翻译

一、应用对比语言学相关理论及发展

对比语言学是对两种或多种语言进行系统比较的学科,旨在描述语言之间的近似与差异。对具体语言和语言结构的对比描写有助于更深刻地理解具体语言及其结构特性。应用对比语言学属于对比语言学的一个分支。应用对比语言学的目的是将理论对比语言学的研究成果应用到外语教学、翻译、词典编纂等相关活动中去,为应用服务,并探讨应用中的一些理论和方法。

语言对比研究最早可以追溯到十九世纪末,至今也有近百年的历史了,但这个领域是在近几十年内才真正受到重视,产出大量有益的研究成果。四十年代前受到业内肯定的成果有1892年罗曼语文学家格兰德琴特(CharlesH.Grandgent)出版的《德语和英语的语言》;还有1906年法国语音学家帕西(PaulPassy)的《简论欧洲主要语言的比较语音学》;以及1933年著名语言学家赵元任出版的《英语语调与汉语语调初探》。这个时期的对比研究领域主要集中在语音对比研究方面,而其他领域鲜有涉足。

我国的对比研究起步与发展有三个阶段。首先的起步阶段是以马建忠的《马氏文通》和严复的《英文汉诂》算起,到四十年代末。在这段时间内,不少研究人员都开展了非常有价值的汉外对比研究,主要集中在英汉对比研究领域。第二个阶段集中在1949-1976年这个时期,在这段时间内,中国的对比语言学相关研究走向沉寂,少有成果。第三个阶段是从1977年5月吕叔湘先生发表《通过对比研究语法》开始的。对比语言学开始受到关注和重视,大量有价值的研究成果不断涌现。如王克菲大型英汉双语平行语料库的建立。潘文国对比语言学的目标,研究范围和新发展进行的探索和研究。二语习得和翻译研究与教学得到长足发展,跨文化交际也有了飞跃式的进步。机器翻译和在线词典的出现使得不同文化之间的合作与交流日益频繁,为社会带来了巨大的变革和发展。

由此可见,应用对比语言学的研究已经成为语言学研究的重要领域和研究热点,如何开展有意义的应用对比语言学研究,是摆在相关研究人员面前的重要课题之一。

二、基于信息技术的布依语泰国语应用对比研究的重要性

以计算机多媒体和网络通信为基础的信息技术,已经深入到我们生活、教育、医疗和服务等各个领域,应用对比语言研究也同样面临着巨大的机遇和挑战,基于信息技术的应用对比语言研究不仅是应用对比语言学的新发展,同样也为语言的研究、翻译和教学拓宽了新的研究领域,并产出了大量有价值的成果。这充分说明,基于信息技术的应用对比语言研究是值得深入探索的领域,它必将为应用对比语言研究的发展带来更多的有益的成果,并促进社会和时代的发展与变革。

泰语与中国布依语都同属于汉藏语系侗台语族的台语支,泰国人和布依族他们来源于古越人,虽然双方距离遥远,但在经济文化上至今仍有许多相同或相似之处。而中国布依语现在面临着城镇化和汉语及主流文化的冲击和影响,其生存和发展都遭受到了前所未有的危机和挑战。如何保护和传承布依语及其文化已经成为相关研究人员亟待解决的问题之一。结合信息技术对布依语和泰语进行应用对比研究,不仅会保护布依语及其文化,而且于对比语言学的发展、双语教学以及翻译研究与实践也都有着重大应用价值。

三、基于信息技术的布依语泰国语应用对比研究形式思考

笔者在CNKI上搜索了相关论文,进行整理分析后,总结了以下三种可行的也比较有价值的基于信息技术的布依语泰国语应用对比研究形式。

1、平行语料库建设

在非计算机状态下,语言数据,不仅数据资源少,而且还分散在各种印刷媒体上和非专业化的录像和电影中,这样的数据源对于相关数据需求者来说,使用很不方便,查找,摘抄一个信息往往要花费很长的时间,也不容易保管。而有了信息技術的支持,网络上搜寻相关数据,已经是非常方便快捷,也易于储存。但仍然存在一个问题,就是没有进行系统的管理,对于数据的初步整理分类都成为了相关数据需求者的难题。而语料库,即经科学取样和加工的大规模电子文本库,就恰恰解决了这个问题,因为语料库可以借助计算机分析软件,对语料库中的海量数据进行提取分析。

而双语平行语料库更是语料库突破性的发展,它是一种重要的语言资源,统计机器翻译系统可以借此研制翻译统计模型,基于实例的机器翻译系统和各类计算机辅助翻译系统能够以此作为翻译记忆库,翻译人员也能从中观察和选取鲜活的语言与翻译实例,与当前单语语料库的建造动辄上亿词的庞大库容相比,这类资源研制的数量要少得多。

平行语料库的研制历史并不长,从世界上第一个初步的平行语料库加拿大议会会议录英法平行语料库(TheCanadianHansardCorpus)建成到目前也只有20年左右。但是因为平行语料库在语言对比研究,翻译研究,翻译教学,双语词典编纂等领域都具有巨大的潜在应用价值,因而在世界范围内得到了迅速发展。克姆尼茨英-德翻译语料库(ChemnitzE-GTranslationCorpus)、德-英文学文本平行语料库(GEPCOLT)、英语-挪威语平行语料库(ENPC)、英语-意大利语双向平行语料库(CEXI)、葡-英双向平行语料库(Compara)相继建成。国内平行语料库的研究起步较晚,但也取得了一定的发展。北京外国语大学中国外语研究中心王克非主持和研制的北外“通用汉英对应语料库”是目前世界上最大的双语平行语料库,目前容量为3000万字词,并在进一步建设中。

布依语泰国语平行语料库的建设,是布依语泰国语应用对比研究最有价值的呈现形式:第一,促进对比语言学的发展。建立一个双语平行语料库,不仅能为后续的语言对比研究提供最可靠的数据源,而且其还是应用对比研究最有价值和开发潜力的实践成果之一。第二,布依语及其文化的最原生态的记录。第三,为双语词典编纂和机器翻译提供可靠数据源。

2、在线双语词典的编纂

双语词典使用领域非常广泛,例如机器翻译、交叉语言信息提取等,对语言的学习和教学也有着不可替代的重要作用。双语词典既能够进行语言翻译,还可以帮助使用者进行文化交流。传统双语词典编纂都是通过人工完成的。这种词典是在经济全球化的时代下应运而生的,能够满足当时的社会发展需要。但是自从第一台计算机问世至今,计算机科学与通信技术日新月异,更新速度快,数据信息存储大的在线,查询便捷,成本低的在线词典已经成为了新时代的宠儿。

建立布依语泰国语在线双语词典主要的问题在于,网络上布依语的语料数据量和泰国语的语料数据量肯定是不能匹配的,布依语作为一种地区性的民族语言,在汉语及其文化的影响下,以及城镇化的发展破坏了原来布依语使用的原生态母语环境,使得布依语的使用人群开始出现了严重的老龄化倾向,年轻人在生活中主要使用汉语作为日常生活中的社会交际语言。因而在网络上布依语的语料会相对泰国语的语料来说会少很多。所以,研制布依语泰国语在线双语词典可以有两个解决途径。第一,加大网络布依语料的上传。这个可以通过政府相关政策支持,建立一些布依语汉语双语网页,或者布依语英语双语网页,对布依族的生活文化教育风俗等方面进行文章的撰写和配图、配音,相关视频制作等。然后建立一个基于网络语料库的布依语泰国语在线双语词典。第二,可以先建立起布依语泰语双语平行语料库,然后研制一个基于这个平行语料库的布依语泰语在线双语词典,这种在线双语词典会促进布依语网络上语料的增加,当网络中的布依语语料自然累积到足够数量时再建一个基于网络语料库的在线双语词典。

辞书是一个国家、一个民族文化的集中体现。双语词典是辞书的重要组成部分。在线双语词典的出版有助于推广民族语言和文化,增强国家文化软实力,对我国的经济建设、科技发展、文化繁荣等都具有很强的实用价值。

3、双语机器翻译系统的开发

自然语言理解,是研究如何利用计算机来理解和生成自然语言的理论和方法。用以完成这一过程的软件叫做机器翻译系统。而不同语言之间的翻译成为文化交流过程中的关键所在。面对海量的语言信息,人工翻译已经远远无法满足需要,因此能够实现自动化的自然语言翻译的机器翻译技术在过去十几年中一直是人工智能研究领域的热点。随着经济全球化及互联网的飞速发展,机器翻译技术在促进政治、经济、文化交流等方面起到越来越重要的作用。

机器翻译的研究起源于20世纪三四十年代。20世纪30年代初,法国科学家G.B.阿尔楚尼开始了用机器来进行翻译的理论探索。随后不久,信息论的先驱、美国科学家W.Weaver和英国工程师A.D.Booth在讨论电子计算机的应用范围时,于1947年论述了基于计算机的语言自动翻译。1949年,W.Weaver发表《翻译备忘录》,正式提出机器翻译理论。但由于1966年ALPAC委员会对机器翻译的译文质量进行调查后,否定了机器翻译的应用价值,机器翻译研究因此长期停滞不前。最近的二十年,随着语言学理论的发展、计算机科学和通信技术的不断完善,翻译理论和研究的进步,人们对机器翻译也有了更加准确的认识,机器翻译在此背景下取得了长足的发展。但是全自动高质量的机器翻译系统仍未出现,其原因在于语言知识的复杂性和人类认识语言规律的有限性。

尽管如此,相关研究仍然在强烈的需求下应运而生,不断发展。笔者认为对布依语泰语双语机器翻译系统的开发是很有必要的,因为它们在发音、词汇、语法甚至文化方面都十分近似,所以,对这两种语言进行机器翻译的效果应该会大大胜过以往民族文化不同源,发音,语法文化差异大的两种语言的机器翻译效果。那么双语机器翻译的最有效的应用领域也许会找到答案。

四、结语

布依语是区域性民族语言,目前处于濒危的困境。而与之同源的泰语却在东盟经济圈的建立背景下,越来越受到中国学习者的青睐。布依语和泰语有许多相同和相似之处。本文探究了在应用对比语言学的理论框架下如何在实践中去有价值地描述和呈现这两种语言的相似和差异的三种途径,以期在丰富和发展应用对比语言学的理论和实践的同时,能为少数民族语言的保护和传承贡献应有的力量与价值。

【参考文献】

[1] 潘文国.对比语言学的新发展[J].中国外语,2006(6)14-19.

[2] 林雯.对比语言学在英语教育中的应用[J].鸡西大学学报,2014(3)83-84.

[3] 潘文国.汉英对比研究一百年[J].世界汉语教学,2002(1)60-86.

[4] 伍文义.布依语与泰国语的语音比较研究[J].贵州民族研究,1999(1)164-172.

[5] 龙海燕,蔡吉燕.布依语的使用现状及其结构特征——以贵阳市花溪区养牛村布依语为例[J].贵州民族学院学报(哲学社会科学版),2011(1)13-17.

[6] 何高大,刘凡.信息技术与语言实验室的发展[J].中国教育技术装备,2006(5)1-5.

[7] 王克非.中国英汉平行语料库的设计与研制[J].中国外语,2012(6)23-27.

[8] 黄立波,朱志瑜.国内英汉双语平行语料库建构与研究现状及展望[J].當代外语研究,2013(1)45-49.

[9] 肖忠华,戴光荣.语料库在语言教学中的应用——中国英语学习者被动句式习得个案研究[J].浙江大学学报(人文社会科学版),2010(4)189-200.

[10] 韩军.基于万维网资源的双语词典的构造和查询处理技术研究[D].北京:清华大学,2014.

[11] 孙娜.耗散结构理论视域下的双语词典出版研究[D].四川:西南交通大学,2014.

[12] 王博.机器翻译系统的自动评价及诊断方法研究[D].哈尔滨:哈尔滨工业大学,2010.

[13] 关晓薇.基于语义语言的机器翻译系统中若干关键问题研究[D].山东:大连理工大学,2009.

[14] 郭永辉.英汉机器翻译系统关键技术研究[D].河南:信息工程大学,2006.

【作者简介】

黄 琼(1986-)女,湖南冷水江人,贵州师范学院外国语学院讲师,研究方向:现代教育技术.

猜你喜欢
机器翻译
海量数据机器单词中关键语义筛选方法研究
机器翻译不可盲取
信息时代下机器翻译的“可译”与“不可译”
互联网+新时代下人机翻译模式研究
“语联网+行业” 助力中国伟大复兴
大数据背景下石油科技翻译
大数据背景下石油科技翻译
机器翻译不可盲取
基于免费在线翻译工具的机器翻译缺陷探讨
汉哈机器翻译中的文字转换技术研究