技术赋能下的中医药健康旅游翻译可接受度研究

2023-11-27 11:59刘妍萌
文化创新比较研究 2023年26期
关键词:译本母语语料库

刘妍萌

(西北工业大学外国语学院,陕西西安 710072)

健康旅游是以医药文化、疗法、药品等作为旅游 资源开展的旅游活动,其目的是实现游客身心及精神状态的提升[1]。自新冠疫情暴发以来,中医药的价值在全球范围内逐步凸显,得到了全世界的进一步认可和重视。后疫情时代,我国入境旅游政策逐步放开,中医药健康旅游业也将吸引越来越多的海内外游客。中医药资源的引入给旅游行业带来了新的增长点和更广阔的发展空间。同时,以多元化的旅游活动为载体,向世界传播中医药文化,也拓宽了中国文化“走出去”及 “讲好中国故事,传播好中国声音”的实现途径。

翻译既是中医药健康旅游发展的关键一环,也是一大挑战。对外翻译有助于吸引海外游客、开拓海外市场,实现中医药健康旅游产品及旅游活动的跨语言、跨文化交流,促使全世界更好地了解中华优秀传统文化。但是由于人工译员培养成本高、周期长,仅依靠人工译员完成中医药健康旅游翻译的方式必然会局限中医药健康旅游的国际化发展。以机器翻译工具和语料库分析工具为代表的计算机技术进步为解决中医药健康旅游翻译所面临的问题提供新思路。本文使用机器翻译工具翻译中医药健康旅游宣传文本,并利用语料库方法探索中医药健康旅游宣传文本的机器翻译结果能否被海外游客接受的问题,旨在提升中医药健康旅游服务质量,增强中医药文化国际认同,推动中国文化海外传播。

1 相关研究现状及趋势

1.1 中医药翻译研究评述

中医药翻译长久以来一直是学术界的一大研究热点和难点,吸引了大批学者深入探索。有关中医药文化外译的研究主要集中在以下3 个方面:部分学者从微观视角探索中医药专业术语翻译[2];部分则在翻译学、传播学等学科理论指导下,开展翻译方法研究[3-4];还有一部分学者通过调研读者评价,以此判断中医药文化海外传播情况[5-6]。此类研究推动了中医药文化外译研究发展,但在本研究背景下,尚存在以下不足:

一是针对旅游业情境下的中医药健康旅游外译研究较少。旅游业情境下的翻译有其独特的翻译特点和目的。一般来说,旅游翻译的读者为入境游客。其特点在于中医专业知识水平参差不齐,对翻译的要求偏向于简单易懂,可读性高。而现有研究对中医药健康旅游翻译特点的考虑较为欠缺。

二是现存研究多依赖研究者对个案的主观解读和判断,缺乏大量客观依据支撑,一定程度上限制了研究结果的可重复性和推广落地。研究者运用多学科理论知识解读中医药外译问题,在一定程度上加深了学科交叉,但研究基本属于理论思索,缺少大量实证支撑。

三是较少考虑到机器翻译技术在翻译中的应用。将机器翻译引入翻译实践和翻译研究已成为必然趋势[7],利用机器翻译工具促进中医药健康旅游翻译也是大势所趋。开展该领域研究不仅有助于提高中医药健康旅游的翻译效率,还可为机器翻译工具的不断优化提供借鉴,以更好地适应中医药健康旅游翻译需求。

1.2 翻译研究发展趋势

除上述研究外,值得关注的是,近年来随着计算机技术的成熟和大规模翻译语料的产生,基于语料库的翻译研究逐渐兴起,并发展成为一种翻译研究范式。在大量语料库数据的基础上,研究者可观察翻译语言表达的特征和规律,为解决实际问题提供借鉴[8]。由于语料库可代表某类特定文本的语言特征,因此在本研究中,英文母语文本可被认为是英语母语人群所能接受的语言表达,翻译可接受度则是翻译文本和英语母语文本之间的同异程度[9]。二者差异越大,说明翻译文本与英语母语读者的语言习惯差异越大,故译本的接受度越小。

综上,针对目前研究的积累和不足,本文在语料库语言学的指导下,结合当前机器翻译技术,通过语料库资源和语言数据分析,比较中医药健康旅游翻译与英语母语文本之间的差异,探索机器翻译可接受度的提升之道。

2 研究设计

2.1 样本选取与语料库建设

本文建设了中医药健康旅游翻译语料库(175 889 字),下设5 个子库。

汉语源语语料库。陕西省旅游资源丰富,中医药文化历史悠久,省会西安始终是海外游客来华旅游的首选城市。因此,本文选取了100 篇西安市中医药健康旅游宣传文本,形成汉语源语语料库(A 库;48 275 字)。

英语译语语料库。本文使用谷歌翻译、DeepL、Chat GPT3.5 这3 个主流机器翻译工具,分别将汉语源语翻译成英语译语各100 篇,形成谷歌翻译译语语料库(B 库;30 919 字),DeepL 译语语料库(C 库;32 651 字),Chat GPT3.5 译语语料库(D 库;31 254字)。

英语母语语料库。本文选取了100 篇澳大利亚官方发布的健康旅游宣传材料,作为研究的英语母语语料(E 库;32 790 字)。选取样本的原因有二:一是所选语料与中医药健康旅游译本均为健康旅游文本且样本体量一致,在体裁(genre)和库容(size)上确保了二者的可比性;二是澳大利亚健康旅游业发达,接待游客数量也位居世界前列。所选语料具备易被游客所接受的文本特点,代表了健康旅游业的英语表达较高水平,保障了语料的代表性和质量。

2.2 语言特征标注与数据统计

为了深入了解机器翻译结果的可接受度情况,本文对B、C、D、E 库进行词汇层面的语言特征标注。具体包括平均词长(AWL)、连词(CC)、指示代词(DEMP)、限定词(DT)、外语词(FW)、动名词(GER)、介词(IN)、形容词(JJ)、情态动词(MD)、名词(NN)、名词化(NOMZ)、介词短语(PIN)、代词it(PIT)、所有格(POS)、副词(RB)、不定式(TO)、动词(VB)、动词过去时(VBD)、过去分词(VBN)、动词现在时(VPRT)20 个词汇特征。这些特征通过Multidimensional Analysis Tagger 1.0[10]标注和计算,并用Excel 统计和整合特征数据。

2.3 数据分析方法

完成初步的数据统计后,本文使用SPSS 27 对语言数据进行了分析。首先,检验了B、C、D、E 库中每一个语言特征数据的分布情况,确认样本数据不符合正态分布。随后,使用非参数检验法Mann-Whitney U Test 分别比较E 库与B 库、E 库与C 库、E 库与D 库在各语言特征数据上的差异。如果词汇特征在对比中表现出显著性(P<0.05),则说明译本库与母语库在该词汇特征上存在较大差异,而减少译本与母语文本之间的差异将有助于提升译本的可接受度。

3 结果与讨论

经对比(表1)发现,3 个机器翻译语料库均与英语母语语料库之间存在不同程度的差异。谷歌翻译与英语母语在15 个词汇特征数据上显示了显著性差异(P<0.05);DeepL 翻译与英语母语对比,16 个词汇特征表现出显著性差别(P<0.05);13 个词汇特征在Chat GPT 3.5 和英语母语对比中的差异具有显著性(P<0.05)。由于篇幅限制,该文表1 只展示了具有显著性差异的词汇特征数据。这些差异说明,3 个机器翻译工具在中医药健康旅游翻译方面具有一定潜力,但也存在较大的提升空间。就具有显著差异的词汇特征数量而言,Chat GPT 3.5 译本相对其他二者与英语母语文本较为相似,即在词汇层面,Chat GPT 3.5 在翻译中医药健康旅游宣传材料时具有较好的可接受度,谷歌翻译次之,DeepL 最差。

表1 语言特征数据在各语料库中的差异

3 组对比结果还体现提升机器翻译可接受度需要面对的共性问题。从表1 可知,在3 个机器翻译译本和英语母语文本的对比中,表现出显著性差异的词汇特征有12 个是重合的。从英语语法角度可将这12 个词汇语言特征归纳为3 个维度——词汇复杂度(平均词长、名词化)、表达丰富度(指示代词、介词、代词it、副词、动词、动词现在时、形容词、动词过去时)和逻辑显化度(连词、所有格)。

3.1 词汇复杂度

平均词长和名词化均体现了文本所使用词汇的复杂程度。一般来说,平均词长越长,词汇复杂程度越高,文本所使用的难词越多。名词化是指将形容词、动词、副词等转化成名词的语言现象。例如,动词act—名词action,形容词normal—名词normalization,副词happily—名词happiness。一般名词化是通过添加词缀实现,且所形成的名词多具有抽象意义和引申意义。如例1a 句中(平均词长6.72)使用名词化establishment,exhibition 来翻译原文。相比之下,例1b 句的英语母语健康旅游宣传文本在描述类似情况时则使用动词established,平均词长降低至5.19。

例1:

a.中文原文(摘自A 库):

第四部分中医药碑刻(室外)主要展示自建馆以来收藏的各种古代医药碑刻。

谷歌翻译译文(摘自B 库):

The fourth part, the Traditional Chinese Medicine Stone Inscriptions(outdoor), showcases various ancient stone inscriptions related to medicine collected since the establishment of the exhibition.(AWL:6.72)

b.英文原文参考内容(摘自E 库):

Charles and Pip Woodward realised that the oncology services were just one step in improving local cancer services and realised their vision for a cancer wellness centre to be established in Cairns.(AWL:5.19)

表1 中,3 个机器翻译译本的平均词长和名词化均高于英语母语文本。说明机器翻译应通过减少难词比例,增加简单词汇的使用,减少名词化现象等方式来降低词汇复杂度,使其在翻译中医药健康旅游文本时更接近英语母语健康旅游宣传文本,提升译本接受度。

3.2 表达丰富度

表1 中,3 个机器译本的指示代词、介词、代词it、副词、动词、动词现在时的使用频率均低于英语母语健康旅游文本,而形容词、动词过去时的使用频率高于英语母语健康旅游文本。这说明整体上,机器翻译在处理中医药健康旅游文本时,更倾向于集中使用形容词和动词过去时来翻译,而对其他词类的使用较少,导致表达方式较为单一,词汇表达丰富度较低。如例2a 句所示,机器翻译译本多局限于 “形容词—名词”的表达方式。相对于例2b 句的英文母语表达,机器翻译缺乏更丰富的表达方式,较少使用多种语法和词性,如介词、副词、动词等。

例2:

a.中文原文(摘自A 库):

西安莲湖天颐堂中医医院中医科是以内治、外治、中医心理辅导、健康理念疏导、中医养生保健、药膳食疗等各种角度进行综合治疗和辅导。

Chat GPT 3.5 译文(摘自D 库):

The Traditional Chinese Medicine Department of Xi'an Lianhu Tian yi Tang Traditional Chinese Medicine Hospital provides comprehensive treatment and counselling from various perspectives, including internal medicine, external therapy, traditional Chinese medicine psychological counselling, health concept guidance, traditional Chinese medicine health preservation, and dietary therapy.

b.英文原文参考内容(摘自E 库):

Bush tucker experts explain the sound principles of healthy and sustainable eating—and generously share a couple of recipes that you can try at home.

因此,语言表达丰富度低也是提升机器翻译可接受度需要关注的一个关键点。机器翻译工具可通过适当提高多种语法和词性的使用,提升表达方式的丰富程度,以此缩小中医药健康旅游机器翻译译本和英语母语健康旅游文本的差异,从而增强译本的可接受度。

3.3 逻辑显化度

连词和所有格均与文本的逻辑显化度相关。连词是连接两个或两个以上并列成分的词,可用于表达顺接、转折、因果等逻辑关系。所有格可用于表示所属关系,如“This dog's colour is white.”。当连词和所有格的使用频率较高时,则表示文本的逻辑关系更多地使用上述表达方式,而非靠语法结构隐性地表达。3 个机器翻译译本中此类词汇特征的使用频率低于英语母语健康旅游文本,呈现较低的逻辑显化程度。如例3a 句的中文中,“现代人”和 “脊柱肌肉、韧带、骨骼”是从属关系;“现代人……久坐不动”和“脊柱……损伤”是因果关系;“脊柱……放松和锻炼”和“慢慢……损伤”是顺承关系。例3b 中文原文前后呈并列关系,但该逻辑关系并未明显地体现在英文译文中。而例3c 句中的英语母语健康旅游文本则善于使用所有格和连词来显化句子中各部分的逻辑关系。

例3:

a.中文原文(摘自A 库):

现代人由于长时间使用手机、电脑,一天有十几个小时坐着学习或工作,久坐不运动,脊柱肌肉、韧带、骨骼得不到充分的放松和锻炼,慢慢就出现损伤。

谷歌翻译译文(摘自B 库):

Modern people due to long-term use of mobile phones, computers, more than ten hours a day to sit to study or work, sedentary without exercise, spinal muscles, ligaments, bones can not be fully relaxed and exercised, slowly appear damage.

b.DeepL 译文(摘自C 库)):

Keeping the right way to fix the foundation, innovation determines the future.(中文原文:守正方可固本,创新决定未来。)

c.英文原文参考内容(摘自E 库):

They are Australia's first astronomers, interpreting the southern sky to navigate the land and tell stories of Earth’s creation.

通过适当增加连词和所有格的使用,提高逻辑显化程度,减少机器翻译和英语母语之间的差距,是完善中医药健康旅游机器翻译可接受度的有效途径,有助于机器翻译工具在中医药健康旅游翻译领域的应用和推广。

4 结束语

综上所述,本文利用语料库数据对比分析了3个机器翻译工具在翻译中医药健康旅游文本时的可接受度情况,认为将机器翻译工具应用于中医药健康旅游翻译时,需在词汇复杂度、表达丰富度和逻辑显化度3 个维度上完善机器翻译工具,以提升读者对译文的接受程度。此外,本文还存在一定的不足,建议后续研究进一步扩大样本数量,研究视角从翻译可接受度扩展到翻译准确度等不同角度,分析方法不拘泥于单一的数据分析方法。大范围、多角度、深层次地挖掘语言数据在中医药健康旅游研究中的价值,服务中医药文化更好、更快地走向世界。

猜你喜欢
译本母语语料库
母语
《语料库翻译文体学》评介
《佛说四人出现世间经》的西夏译本
翻译中的“信”与“不信”——以《飘》的两个中文译本为例
母语
基于JAVAEE的维吾尔中介语语料库开发与实现
母语写作的宿命——《圣天门口》未完的话
语料库语言学未来发展趋势
《孙子兵法》俄译本简介
《孙子兵法》蒙古文译本简介