主流计算机辅助翻译软件比较研究

2015-04-10 07:56
陕西学前师范学院学报 2015年4期
关键词:译员术语文档

张 剑

(宁波教育学院,浙江宁波 315000)

1 引 言

计算机辅助翻译(Computer-assisted Translation,简称CAT),源于机器翻译(Machine Translation,简称 MT),但二者的本质区别在于实际的翻译工作由谁完成。机器翻译完全由机器取代人工完成翻译过程(Kenny,1999:67),而计算机辅助翻译则是由机器辅助译员进行人工翻译[1]。计算机辅助翻译软件能够提高翻译效率,优化翻译流程,缩短翻译时间,控制翻译质量[2]。但面对国内外市场上的多款计算机辅助翻译软件,缺乏实际使用经验的译员常常难以抉择。因为不同的软件有各自的优缺点,其设计针对不同类型的翻译项目或译员的不同需求。如果使用不当,这些软件不但不能提高译员的翻译效率,反而造成事倍功半的结果。因此,有必要从译员或用户的视角对软件进行评估,通过比较各种软件各自的特点,帮助译员选择适合翻译项目、满足个体需要的软件。本文将从用户的角度,根据笔者对DéjàVu X(简称DVX)、SDLX和STAR Transit &TermStar三款软件的实际使用经验,探讨三款软件在术语管理工具、翻译记忆库、翻译对齐工具和翻译项目管理工具四个核心模块的功能异同。

2 计算机辅助翻译软件的使用和研究现状

CAT软件已在全球范围内广泛地使用。中科院科技翻译协会和中国奥委会官方网唯一多语合作伙伴传神联合公司针对中国翻译人员进行了深入、长期、大量的调研,调研后出台的《2007年中国地区译员生存状况调查报告》中显示约61%的译员使用CAT软件。侯晓琛和颜玉祚也在2008年进行了一项针对CAT工具使用现状的在线调查,发现有约66%的译员使用CAT工具。此外,根据英国帝国理工大学《2006年翻译记忆库使用调查》(Translation Memories Survey,2006)提供的数据,国际上使用最广泛的几种翻译记忆库软件按各自占使用翻译记忆库译员人数的比例依次为:TRADOS(51%);Wordfast(29%);SDL Trados 2006(24%);DéjàVu X(23%);SDLX(19%)和 STAR Transit(14%),其中53%的职业译者使用了不止一种翻译记忆系统。由于翻译记忆库是CAT软件的主要语料资源和核心部分,因此,以上数据可以看作是各种CAT软件的使用情况[3]。

由于计算机技术的迅猛发展,CAT软件研究在21世纪迎来了繁荣发展,而CAT软件的应用一直是CAT研究的重点。国外不少学者对翻译记忆工具进行了评估,如Bowker(2002)、Somers(2003)、Quah(2006)、Lagoudaki(2006)。国内学者的研究成果也十分丰硕,有对CAT软件的总体研究,也有对软件开发、使用的具体研究。其中,少数学者对TRADOS、Wordfast、SDL Trados、DéjàVu X(简称 DVX)、雅信等软件作了一些有价值的研究,如徐彬(2007)、钱多秀(2011)、朱玉彬等(2013)。但是,另外两款主流软件SDLX和STAR Transit &TermStar却鲜有人涉足,缺乏系统且清晰的分析与评估。因此,把 SDLX、STAR Transit &TermStar与译员相对熟悉的DVX进行比较,能为使用CAT软件的译员提供必要的参考,从而能选择和使用最符合工作需要的工具,以提高翻译质量和效率。

3 理论基础

对于全自动计算机翻译系统的评估可以“通过语言准确度、术语一致性和其他更为传统的标准来进行”[4]226。CAT软件因译员的全程参与而区别于机器翻译系统,因此,对CAT软件应采取不同的评估标准。国内外对CAT软件的评估标准的研究甚少,仅有少数学者对此有了初步的探索。Keith J.Miller在CAT软件的评估方面取得了一些成果,他提出EAGLES(Expert Advisory Groups for Language Engineering Standards)的七步法是以ISO质量特征体系为指导原则。钱多秀提出的评估步骤和参数也是根据EAGLES的七步法,以ISO 质量特征体系为指导原则的[4]226-227。ISO/IEC9126软件质量模型和FURPS模型是国内外主要的软件质量度量模型。软件质量度量是对软件产品进行评估的一个定量方法。ISO/IEC9126软件质量模型包括功能性、可靠性、可用性、效率、可维护性、可移植性六个质量特性。FURPS模型是由Hewlett-Packard提出的,包括功能性、可用性、可靠性、性能和支持度五个主要因素。由此可见,功能性列为评估软件质量的主要因素之一。而软件的功能性是由软件的各种技术和工具来呈现的。“现行主流计算机辅助翻译工具采用的核心技术是翻译记忆,并与附带或独立存在的术语管理工具、翻译对齐工具、翻译流程管理工具等结合使用,对翻译流程进行最优化”[4]23。因此,对软件功能的评估即对软件技术、工具的评估。本文将从用户的角度,根据笔者对DVX、SDLX和STAR Transit &TermStar三款软件的实际使用经验,探讨三款软件在术语管理工具、翻译记忆库、翻译对齐工具和翻译项目管理工具四个核心模块方面功能的异同。

4 功能性比较

4.1 术语管理工具比较

术语管理对所有翻译项目来说都是一个重要的功能。“每个学科领域(如:计算机信息处理、制造、法律、医药等)都有大量的专用术语”[5]77。根据Arntz和Picht的研究,翻译过程中的术语查询几乎占用了翻译人员75%的作业时间[6]。高效率的术语管理工具,能够在术语记录的保存、检索、更新以及确保译文术语一致性等方面有效地协助译员。一个好的术语管理系统,不仅能促进术语使用效率和语言质量的提高,同时还能有效缩短翻译过程中的周转时间[7]。

DVX、SDLX和STAR Transit &TermStar三款软件自带的术语库都没有储存任何术语,需要用户自行添加,也可将现有的术语表导入本地术语库。点击SDLX TermStar按钮面板上的TermBase按钮,用户可以为翻译项目建立一个专用的术语库(Terminology Database,简称TD)。SDLX具有术语管理的大多数重要功能,包括术语的添加、修改和删除。但是,DVX和STAR TermStar的术语管理功能比SDLX更复杂、更精细。使用DVX,用户不仅能够建立非项目专用的外部术语库,还能通过术语库建立项目专用的内部词库。项目词库指所有术语和词组的索引,可用作特定项目的词汇表。在翻译过程中,DVX在搜索术语库之前,会参考词库,从而为该项目选择正确的译文。此外,用户能够将一个以上的术语库与项目进行关联。STAR TermStar将术语划分为各个词典,并将这些词典保存在数据库中。这些词典可确保用户为特定项目或客户找到适当的术语,这一功能与DVX相似。三款软件的共同点在于处理一个项目时可同时使用多个术语库内的词典。TermStar和DVX的不同之处在于,TermStar词典里的所有数据将按字母顺序并入到项目词典中,用户能通过点击词典左侧的索引按键,直接进入词典中的特定字母组。在使用TermStar进行翻译时,译员能在一个项目词典内查看所有的数据,而DVX和SDLX则需要在术语库中的各个词库中,查看各自库内数据。

不同软件中储存的术语数据,可通过与客户或译员进行数据交换以实现相互分享。虽然数据储存采用了不同的格式,但这三种工具均支持兼容或可转换文件格式(如:纯文本格式)的输入和输出。DVX和SDLX中的术语可以文本文档的形式输出,文档中的术语都使用定界符。从DVX中输出的术语用引号作为定界符。STAR TermStar储存术语时采用的是统一字符编码标准文档,这种文档可转换为文本文档,定界符为冒号。此外,从SDLX输出的术语(中英对照)在左侧显示中文术语,而右侧显示对应的英文术语,这一点与其他两款软件有所不同。由于三款软件在输出文本文档方面存在这些细微差别,因而每个软件在输入来自其他软件的术语库或输出术语库给其他软件时都需要调整术语定界符。比如,从DVX输出至STAR TermStar、SDLX的术语在STAR TermStar词典和SDLX术语库中显示有引号。遇到这种情况,可采用的方法之一就是在将术语输出到其他软件之前,替换文本文档中的引号。在将术语从STAR TermStar输入到SDLX时,则替换文档中的冒号,以确保源语言和目标语言被划分在SDLX术语库输入向导的两个区域内。根据笔者的个人使用经验,避免在不同软件间输出和输出过程中术语库出现问题,最好的办法就是使用分隔符对储存的术语文档中的术语进行定界。

这三款软件均采用了统一字符编码标准,因此一般情况下它们都能用于处理双字节字符集的语言,如汉语、日语和韩语。三款软件的术语库为多语言术语库,这不仅表示该术语库支持一个源语言和多个目标语言,也说明同一个术语库内的源语言也可被用作其他翻译项目的目标语言。SDLX则可添加和删除语言种类,以及更改各语言的排序。相较其他两款软件,笔者认为STAR TermStar更符合用户需求。它不仅能够切换语言方向和交叉参考,还能自定义和优化每个程序、步骤和用户的术语布局,且其各项功能更易于操作。

4.2 翻译记忆库比较和翻译对齐工具比较

翻译记忆(Translation Memory,简称TM)是一种支持用户在特定数据库中,储存已翻译词组或句段,以备本地再使用或在网络上分享使用的技术[8]362。翻译记忆库则被Bowker定义为一种用于储存源语言和目标语言的语言数据库[5]93。这种技术能够减少翻译过程中的周转时间以及重复作业。

DVX、SDLX和STAR Transit均拥有翻译记忆库。DVX的翻译记忆库界面更加直白简洁,因为其基本功能的图标都位于非常显眼的位置,而没有隐藏到菜单中,比如:用于添加和删除分段的按键。使用DVX过程中,译员确认其翻译内容后,可启用“AutoSend”功能,把句子自动发送到翻译记忆库内。或者,翻译人员也可通过手动加亮源语言和目标语言的方式,将成对的词组、句段添加到翻译记忆库中。翻译和校对完成后,可使用“Sending Project to TM”功能,对翻译记忆库进行更新。使用“Look Up”功能,用户在输入目标语言第一个单词的前几个字母后,DVX将自动跳出匹配译文。STAR Transit的TM功能与DVX类似。

与DVX、STAR Transit相比较,SDLX的翻译记忆库界面的操作较为复杂,只有当用户非常熟悉菜单时,才能够在菜单中找到基本功能。不过,SDLX的功能也更为完善,且“Help”功能更详尽。与DVX相似,SDLX可使用“Options dialog box”中的“Automation”功能实现自动更新翻译记忆库,已储存的数据也可在翻译过程中进一步更新。翻译时,SDLX不仅可在翻译记忆库内搜寻匹配译文,还能为已选翻译记忆库和术语库建立检索(concordance)。检索功能支持用户为词组、句段搜索译文或源文,可用作参考工具;检索结果窗口中的内容可复制。用户可通过规定最低匹配值,控制模糊匹配百分比。系统默认设置一般为75%。若搜索到的内容与要翻译的内容100%一致,则达到完全匹配;若搜索结果并非完全一致,则是模糊匹配,译员可以根据匹配值选择完全接受或修改后使用检索到的内容。在选择一个以上的翻译记忆库时,用户可自行规定这些记忆库在进行查找时的参考顺序、更新顺序以及在检索中的参考顺序。

翻译记忆的储存方式即翻译记忆模型分为数据库模型和引用模型。DVX和SDLX使用的是数据库模型,STAR Transit采用的是引用模型。Translation Memory eXchange(简称TMX)是一种支持不同供应商之间进行翻译记忆库交换的标准格式[9]。目前TMX是基于数据库模型的。因此,在DVX和SDLX两款软件之间进行翻译记忆库交换非常顺利,也就是说,这两款软件都可以将翻译记忆库中的源语言和目标语言导出,也可以将外部的源语言和目标语言导入到翻译记忆库里。导入的文件可以是原生文件,也可以是业界认可的标准翻译记忆文件。对于以其他形式储存的翻译记忆,则必须经过格式转换后才能进行导入[10]。而DVX和SDLX两款软件与STAR Transit进行翻译记忆库交换时,因分别使用数据库模型和引用模型,导致交换不能顺利进行。

一般采用以下两种方式将翻译内容输入到翻译记忆库:通过储存源文和译文或通过翻译后对齐[5]108。对齐工具是帮助用户将源文和译文作一一对齐处理。大多数翻译记忆库,均具有对齐功能。此功能非常实用,尤其是当用户没有现成的双语材料时。三款软件的对齐工具一次只可使一对源文档和目标文档对齐。根据笔者的使用经验,用户还能使两个不同类别的文件对齐。比如,用户能够将HTML文档和Word文档对齐。尽管DVX和SDLX具有相似的基本功能,比如连接、删除等,但DVX的对齐面板上的主要功能按键非常显眼,因此更便于操作。使用STAR Transit进行对齐操作和新建一个项目一样复杂,而对齐词组、句段也与进行新文档翻译一样费时。从用户的角度看,STAR Transit中的对齐功能太过繁琐和混乱,需要改进。

4.3 翻译项目管理工具比较

翻译项目和其他项目一样,由项目经理负责翻译流程的管理。通过项目经理使用翻译项目管理工具(包括工作流程管理、用户间通讯等功能),能够自动化人工集约型流程,免除不必要的人工操作,提高翻译产量,确保译文质量。三款软件中,在DVX中创建项目和输入文档是最简单的。用户可在项目向导中规定源文档的位置,但更有效的做法是,通过定位并拖动源文档的方式,在“Project Explorer”中完成此操作。DVX能够在“Properties”窗口中自动识别文件的格式(如PowerPoint或Word文档),而不需要手动识别文件格式(SDLX和STAR Transit采用的就是手动识别)。此外,相较于SDLX和STAR Transit,DVX的翻译界面最为直白明了。用户能够在不同的窗口之间轻松切换,比如在翻译记忆库和词库界面切换。在“File Navigator”窗口中,用户能够清楚看到一个项目中的所有文档,包括词库。翻译过程中,“File Navigator”窗口下的“AutoSearch”窗口,将清晰显示在翻译记忆库和术语库中找到的与该项目相关的内容。但是,STAR Transit翻译界面的布局有些混乱,有五个窗口同时相互重叠,这使得用户需要在启动翻译前调整窗口大小。

字数统计是每个翻译项目管理中一个必要步骤,三个软件均自带字数统计工具,这些数字统计工具支持用户统计同一个文件或多个文件中的单词。根据笔者经验,一般情况下DVX和STAR Transit的字数统计功能比SDLX中的数据统计功能更完善。DVX可通过“Analysis”和“Word Count”(可帮助创建报价和自我校阅)对所有文档或当前文档进行字数统计。STAR Transit自带的报告管理器为用户进行项目分析和制单提供了大量的实用选项,并能够计算每个项目的成本,这一功能在所有三款软件中是独一无二的。不同的软件对同一份源文的字数统计有差别,因此,译员、翻译公司和客户有必要对字数统计软件进行统一。

译员在翻译过程中,通常会遇较难翻译的片段,遇到这种情况最好的办法就是跳过该片段继续后面的翻译,并在稍后返回该片段。DVX和SDLX带有预览功能,这种功能可显示已翻译和未翻译的片段,但STAR Transit没有这种功能。DVX可将预览内容保存为.rft文件,而SDLX则可将预览内容保存为与源文档相同的格式。DVX的预览内容包含备注栏、状态栏等,比SDLX的预览内容更加丰富。此外,DVX还可突出显示未经译员确定的片段。

文档标签包含的信息是源文中含有的格式化信息。为避免标签遭到意外修改,STAR Transit中几乎所有的标签都采用了标签保护功能予以保护。通过这种方式,STAR Transit可防止用户在翻译过程中无意间损坏语言文档。但是,在需要对受保护标签进行编辑时,用户也可关闭标签保护功能。此外,用户还可使用“Check formatting codes”功能,检查格式化代码是否完整。在某些标签存在问题的情况下,仍可对文档进行输出,且文档不会受损。但是,DVX和SLDX对代码检查和刷格式操作具有更严格的规则。当代码和格式化存在问题时,DVX会弹出“Wrong Codes”窗口,而SDLX会弹出“Format Paint Warning”窗口,此时用户需要在文件进行翻译之前完成刷格式操作。

校对是翻译项目管理较为重要的一个步骤,影响着译文的最终质量。在SDLX和STAR Transit中,校对人员可对实际翻译内容进行修改。在这种情况下,译员很难分辨被修改的翻译内容,而且如果译员对校对人员的修改表示接受或拒绝,将耗费大量时间。DVX的校对功能则更加细致,校对人员能够在DVX项目窗口进行校对,校对完成的文档生成为.rtf文档。译员需要查看校对结果时,可将.rtf文档输入到DVX项目中,在“Merge External View Data”窗口查看所有修改,并最终确定是否接受这些修改。

5 结论

综上所述,三款CAT软件具有类似的功能,但每个软件在术语管理、翻译记忆库管理和翻译管理等方面,都有其自身的优势和弱点。总体而言,DVX界面易于操作,功能齐全,术语管理功能强大,在DVX中新建项目和输入文档也十分简单,适合团队协作和自由译者。SDLX翻译记忆库界面的操作较为复杂,但也具有更高级的查找功能和更细致的文件编辑功能,适合经验丰富的译员。STAR Transit相较于前两者功能不够齐全,操作较为繁琐,但它拥有出色的术语管理系统和专业的报告管理器,用于进行项目分析、计算每个项目的成本,适合翻译项目经理使用。但STAR Transit自带的翻译记忆库存在一些问题,影响了翻译记忆库交换,进而降低翻译记忆库的使用效率。因此,基于用户的使用体验,CAT软件的开发商可适度简化操作界面,开发较为成熟的翻译记忆库,简化繁琐的功能。译员、翻译机构或客户在选择具体的软件时,都要充分考虑软件的功能及自身的需求,充分利用每种计算机翻译辅助软件的各项功能。

[1]Kenny,D.CAT tools in an academic environment:What are they good for[J].Target,1999(1):65-82.

[2]徐彬,郭红梅,国晓立.21世纪的计算机辅助翻译工具[J].山东外语教学,2007(4):79-86.

[3]朱玉彬,陈晓倩.国内外四种常见计算机辅助翻译软件比较研究[J].外语电化教学,2013(1):69-75.

[4]钱多秀.计算机辅助翻译[M].北京:外语教学与研究出版社,2011.

[5]Bowker,Lynne.Computer-Aided Translation Technology:A Practical Introduction[M].Canada:University of Ottawa Press,2002.

[6]Arntz,R.and H.Picht.Einführing in die Terminologiearbeit[M].Hildesheim,Zürich,New York:Olms,1989:89-103.

[7]徐彬.翻译新视野:计算机辅助翻译研究[M].济南:山东教育出版社,2010:135-152.

[8]Esselink,Bert.A Practical Guide to Localization[M].Amsterdam:John Benjamins Publishing Co.,2000:360-365.

[9]苏阳明.翻译记忆系统的现状及其启示[J].外语研究,2007(5):70-74.

[10]薛文枫.中国机器翻译软件与计算机辅助翻译软件的发展与现状[J].西南民族大学学报:人文社科版,2008(1):56-58.

猜你喜欢
译员术语文档
浅谈Matlab与Word文档的应用接口
有人一声不吭向你扔了个文档
口译中的“陷阱”
基于RI码计算的Word复制文档鉴别
论机器翻译时代人工译员与机器译员的共轭相生
Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat
译员与翻译企业的劳资关系及其和谐发展
论联络口译中译员的角色
有感于几个术语的定名与应用
从术语学基本模型的演变看术语学的发展趋势