江西旅游资源汉英双语平行语料库的应用研究

2017-03-09 23:32朱利勇
环球市场 2017年33期
关键词:语料平行语料库

朱利勇

江西科技师范大学

前言

江西旅游资源双语平行语料库集结了各类旅游资源外宣的影、视、音素材,可以跨越语言和文本障碍,有效传递旅游信息,实现良好旅游营销外宣。该语料库与时俱进,专业化扩容,同步抓取目的语对应译文和原文的特点备受行业内外关注,经初步实践应用,可为旅游翻译教学、旅游文献翻译提供有力支撑。

一、科学技术助推双语平行语料库研制与开发

旅游外宣翻译是一种直接效应的门面工作,其中的错误与缺陷会被放大,影响国家对外交流和人文环境建设。因此,为适应现代旅游行业需求,实现大数据分析、抽样检测,研制专业化的旅游资料双语平行语料库能最直接从语料库汇总优化出汉英对照文本,在旅游资源对外推介过程中具有特殊的现实意义。

语料库技术经历了人工采集语料、计算机语料库的建立和KWIC检索、Word Sketch Engine检索和FrameNet检索四个阶段。随着现代科技社会步入工业4.0时代,语料库技术的发展在旅游资源平行语料库研制和应用提取领域能逐步实现半自动化,呈现自动化影视音人机交互,从而拓展旅游资源外宣的外延。

二、双语平行语料库的研制与初步应用

按旅游资源分布、种类和特色,对江西名山名水等代表性特色资源分类,梳理各类外宣文献或成果,标记素材或文本的问题、类型及使用频率,精选出符合翻译科学和旅游市场规律的双语语料成果,最后采用现代语料库研制科技手段搭建江西旅游资源汉英双语平行语料库,并初步投入应用完成可行性测试。

秀美江西地区的诸多旅游资源极具地方人文内涵和多样性的特点。庐山物种资源丰富、人文积淀深厚,与三清山、龙虎山共同滋养着儒道佛广博而深邃的文化内涵,有一脉相承的连续性,又有各自独特性;鄱阳湖经济带彰显了现代江西发展蓝图;井冈山红色旅游文化的摇篮等等,这些江西特质都给这些宝贵的旅游资源外宣翻译造成了诸多难题,景点资源优质而相关汉英介绍不够规范、不完美,不能传神表达丰富有趣的文化现象等。现存的大型通用语料库难不能相对准确地覆盖旅游文本特征、语篇功能等信息,满足不了旅游翻译研究与实践的检索统计需求。因此,研制江西特色旅游资源汉英双语平行语料库(C-E/E-C Bilingual Parallel Corpus for Jiangxi Tourism),此举规范整合现有旅游市场应用的各类汉英素材有一定的现实意义,并适应着当下江西旅游行业发展需求。

2.1 双语平行语料库的设计与要求

参照语言学系统理论,制定一个总体设计和规划。首先,应用目标要明确。应用目标针对旅游翻译爱好者、学习者和实践者,尤其是江西地域特色旅游宣传单位或人群,为行业翻译提供参考和依据,也为语言翻译研究提供双语资源,丰富翻译实践运用,揭示旅游文献的文本功能和语体特征。其次,规模和收集范围要确定。语料库的容量大小不一,规模各异,都是为了适应不同需要,而该语料库也注重建设规模,是一个有自身特殊的应用目标的专业语料库。因此,为确保代表性和权威性,语料源于江西旅游资源管理和开发部门官方媒体资料、近年江西旅游行业调查报告或业内学者专家的公开著述。再者,实施步骤要清晰。从语料收集、预处理,到语料对齐、分析标注和SQL 数据库构建等。最后,技术标准要规范。统一标准化处理语料样本来保证数据的可交换性。国际通行的Unicode编码保证字符编码的规范性和兼容性最大化。以TEI和CES标准科学标记来保证语料库的可识别性和重复使用性,有必要时也可适当个性化。

2.2 双语平行语料库的构建

一是语料收集,注重数量和质量。该语料库涉及双语语料,特别是特殊语域双语语料。如,语言文本及其翻译质量,官方双语文献、外宣图册或双语书籍;抽样检测,语料抽样保持不同译者或出版社的作品在语料库中的平衡。二是语料预处理,将格式不一的源文本转换成统一格式的生语料文本(转换为可编辑的电子文档),处理掉空格、换行和乱码等干扰字符。三是语料的标注和对齐。特定的系统符号标记生语料并辅之以适量的人工语言信息(如,语言结构分析、标符系统设计和计算机自动化技术等等)。

2.3 双语平行语料库的实践与应用

一是辅助翻译。建立该语料库相应的Web检索平台,双语对照抽样检测。译者获得来源不同的词句参考,有效理解旅游翻译的结构和语体特征。提升机器翻译或机助翻译在旅游翻译领域的支撑和辅助,推进人机互动智能化。二是对比研究。借助WordSmith、ParaConc软件进行语料库检索统计,对比分析旅游文本文体、功能及异同,特别是文化语词的异化和归化现象。三是翻译教学。给学习者提供语言运用和典型实例的可选信息,结合旅游语言语用语境,实现文本等值概率的分析、译文风格特点的量化分析。

结束语

从理论到实践,该语料库丰富了旅游专门用途语料库。在实践过程中,科技进步使得专门用途类型的语料库跨学科、跨行业日益深入,随着语言研究深入和人工智能应用推进,词性标注、句法分析和语篇分析的技术更加准确和成熟,但旅游汉英双语平行语料库的构建始终依托语言学和翻译学理论,再对形式各异的语言现象“生料加工”、源码标记、扩容优化等等。

[1]于连江.基于语料库的翻译教学研究[J].外语电化教学,2004(02):40-44.

[2]仇海萍.论旅游英语课程中的文化教学[J].广西教育学院学报,2011,2(112):168-170.

[3]戴日新.语料库在英语教学中的应用研究[J].中国教育学刊,2012,(s1):83-84

[4]王克非.双语对应语料库研制与应用[M].北京:外语教学与研究出版社.2004.

猜你喜欢
语料平行语料库
向量的平行与垂直
平行
基于归一化点向互信息的低资源平行语料过滤方法*
逃离平行世界
《语料库翻译文体学》评介
再顶平行进口
基于JAVAEE的维吾尔中介语语料库开发与实现
《苗防备览》中的湘西语料
国内外语用学实证研究比较:语料类型与收集方法
语篇元功能的语料库支撑范式介入