语料库技术在河北十大非遗中的应用

2022-07-23 15:01黄桢娜
黄河黄土黄种人 2022年7期
关键词:语料平行语料库

黄桢娜

非物质文化遗产(以下简称非遗)是中华优秀传统文化的重要组成部分,是中华民族的宝贵财富。在新时代背景下,传承和发扬非遗尤为重要,且日益成为宣传中华优秀传统文化的重要形式之一。将当下热门的语料库技术与传承千年的非遗相结合,成为宣传中国非遗的可行路径之一。文章以河北十大非遗为例,旨在通过构建河北十大非遗双语平行语料库,为中国非遗翻译工作提供一定参考依据。同时,为保护和宣传河北地区非遗以及中国非遗提供一条新路径。

一、河北非遗介绍及发展现状

作为中华民族文明发祥地之一,河北历史悠久,文化底蕴丰富。在历史长河中,这片燕赵大地为中华民族留下了众多非遗,如河北梆子、武强年画、衡水内画等。

近年来,河北积极响应国家“讲好中国故事,传播中国声音”的号召,实施文化“走出去”战略,加大了对省内非遗的宣传力度,围绕非遗的传承和宣传工作,开展了大量的理论研究和实践。河北相关部门不仅出台、完善了非遗的政策、法规,还借助众多新媒体为宣传河北非遗提供了重要平台。与此同时,河北加大了非遗保护专项资金的投入。换言之,河北在非遗的传承和宣传工作中注入了大量的人力、物力及财力。

然而,河北的非遗传承与宣传工作仍面临一些亟待解决的问题。随着互联网发展的深入,非遗受到当下新艺术形式的猛烈冲击,其生存环境受到极大的威胁,它们正在不断淡出人们的视野。当前,河北对非遗的宣传仍停留在表面,非遗宣传的渠道少,导致公众对非遗的关注少之又少,保护意识逐渐淡薄。因此,如何更有效地宣传河北非遗,提升河北非遗在海外的影响力,成为当前更为紧迫的任务。

综上所述,河北非遗的传承与宣传工作任重而道远。如何向公众推广河北非遗,向世界宣传中国非遗,需要破题,需要创新。

二、语料库概述与发展现状

语料库是指按照一定的语言学原则,运用随机抽样方法,收集自然出现的连续语言运用文本或话语片段而建成的具有一定容量的大型电子文本库。从本质上来说,语料库就是文本的集合。按照语料的语种,语料库可以分成单语、双语和多语语料库。双语和多语语料库还可分为平行语料库和可比语料库。其中平行语料库是指收集原文与译文双语对照的文本,按设定的标准将语料的句子或段落对齐。

现代意义上的语料库最早出现于20世纪60年代,近年来,发展迅速,不仅规模越来越大,而且加工度越来越深。现如今,在计算机技术的辅助下,语料库技术更加成熟,同时向专业性和个性化的方向发展,各类语料库层出不穷。语料库技术成为新时代的一大热门,有无数专家、学者都在探讨语料库技术的应用。不仅如此,语料库技术已经被广泛地应用到多个领域。语料库技术不单单能有效、快速查找所需信息,更能结合其他领域带来创新性成果。当前基于语料库的翻译研究也受到学者关注,语料库与翻译研究相结合是现代翻译研究的重要手段。

由此,利用语料库技术进行非遗文本翻译的研究是一条行之有效的新路径,能够为非遗翻译工作带来极大便利,也能够推动中国的非遗外宣工作。

三、当代语料库技术与传统河北非遗的结合

(一)构建河北十大非遗双语平行语料库的必要性

在新时代文化强国和中华文化“走出去”战略大背景下,非遗作为传统文化的重要组成部分,是中华文化的重要载体,肩负塑造国家形象的重要使命。但随着社会政治、经济、文化的日益发展,文化生态发生了翻天覆地的变化,间接地导致许多珍贵的非遗正面临淡出人们视野的危机。由此,保护和传承这些珍贵的非遗迫在眉睫。而在世界文化多元化发展的今天,语料库技术的发展为中华民族非遗的保护和外宣提供了一条崭新的途径。因此,将这一新型技术与河北十大非遗相结合很有必要。

当代语料库技术和河北十大非遗双语文本的结合,是技术和文化相融合的一次尝试。以大数据、开源软件及语料库技术等技术为依托来构建河北十大非遗双语语料库是一项创新之举。在此之前,河北并没有针对河北非遗相关内容而构建专门性双语平行语料库。因此,这一举措在一定程度上填补了河北非遗双语平行语料库的空白,为宣传河北非遗提供了新的思路。此外,这一举措对其他地区构建地方性非遗双语平行语料库有着一定借鉴和参考意义——此为必要性之一。

构建河北十大非遗双语平行语料库,需将翻译融入其中,涉及非遗翻译这一研究重点。非遗具有浓厚的历史和文化特征,在翻译的过程中会涉及很多独特的词汇和文化现象,增加了翻译的难度和复杂程度。现今的非遗翻译工作存在译文质量参差不齐、非遗专业术语翻译不到位、选取的翻译策略有误等问题。基于此,河北十大非遗双语平行语料库的构建能够在一定程度上改善这些问题。因为构建该语料库会对河北十大非遗的双语文本信息进行语料收集、整理、对齐以及对比等工作,在这一过程中能探索、发现非遗汉英两种文本在语言特征以及篇章功能方面的异同,从而进一步归纳、总结出非遗翻译原则、翻译方法及翻译策略等,可以为译者提供可信度高的翻译辅助平台——此为必要性之二。

构建河北十大非遗双语平行语料库有双重目标,一是以传播河北非遗为主要目标,力求讲好河北非遗故事,传播河北非遗声音,进而促进河北地方经济发展;二是积极响应国家“讲好中国故事,传播中国声音”的号召,以向世界宣传中国非遗为终极目标,希望借此来彰显中国传统非遗的文化自信。基于以上两点,笔者认为构建河北十大非遗双语平行语料库在文化价值层面有着不可忽视的作用——此为必要性之三。

因此,构建河北十大非遗双语平行语料库,无论是在语料库本身价值方面,还是在非遗翻译工作及非遗外宣方面都具有积极作用。

(二)构建河北十大非遗双语平行语料库的路径

在开始构建河北十大非遗雙语平行语料库之初,笔者认为需对构建语料库的研究方法进行探讨,以此更好地开展工作。研究方法可以包括问卷调查法、个案研究法、文献研究法等。通过问卷调查法了解受众人群对构建该语料库的意见和建议;通过个案研究法以及文献研究法来推进语料库构建工作,以确保其严谨性和权威性。除此之外,笔者认为关注河北非遗的最新动态以及翻译领域关于非遗翻译的最新研究成果有重要意义,这会进一步完善构建语料库的前期准备工作。

前期准备工作是构建河北十大非遗双语平行语料库路径的第一步。构建一个双语平行语料库涉及双语语料收集工作、整理工作、标注与对齐工作及应用工作等具体步骤。

第一,语料库的构建需要开发和使用语料库分析统计软件,该软件主要包含索引、词表生成、主题词计算、搭配和词族提取等多种功能,可为双语平行语料库构建提供强大的技术支持。因此,熟悉该软件的各项功能以及熟练掌握该软件的操作是构建语料库的基础。

第二,双语语料的收集工作是构建该语料库的核心步骤之一。创建一个语料库的关键在于所选语料是否适用于建立相应的语料库,其中包括语料的学术性和语料的质量。该双语平行语料库的构建依托于大量专业、权威的双语文献资料。确定非遗双语语料的来源尤为重要,权威的双语语料来源能够最大程度上保证语料库的真实性、准确性、权威性,对外宣也有更积极的作用。非遗语料的收集来源主要有以下几种途径:(1)权威的官方信息渠道,如中国外文局、《中国日报》《河北日报》以及河北省非遗相关文件等;(2)中央机关和国家外事外宣部门提供的双语资料;(3)国外权威的官方网站的英文文本等。

第三,语料收集工作完成后,则需进行语料库架构、功能设计和语料加工。对于现有的语料进行整理、归纳是语料库构建中最重要的操作。为确保最终能形成有效的语料,语料的整理、归纳工作包括筛选、删除相关性不高的非遗双语文本,并在这一基础上对其进行进一步的加工和完善,使之成为能够直接使用的语料资源,如总结河北十大非遗的高频主题名词、高频形容词及副词等。其中,在加工和完善双语语料的过程中,会遇到英文译本不全、缺失或英文译文质量较低的情况,笔者认为应对其进行改译,并请专业翻译团队进行翻译审校,以保证语料质量。然后,将这些双语语料资源按照河北十大非遗名单进行排序、编号、命名,并将它们保存到相应的文件夹中。

第四,语料的标注与对齐工作是构建双语平行语料库并使之应用于现实生活的关键性步骤。标注可采用机器和人工并用的方式:对汉语语料用汉语分词工具ICTCLAS进行切分标注,对英文语料用词性标注软件Tagger标注,完成后对标注后的文本进行人工修正。为实现汉英双语语料的快速对齐,需要借助成熟的自动对齐网站Tmxmall中的语料对齐功能。该步骤只需将之前整理好的双语语料分别导入网站中,再点击“对齐”就能快速地自动对齐。由于汉英两种语言之间的差异较大,为确保研究的准确性和可信度,还需进行人工检查和调整,以此达到语料的精准对齐。完成以上步骤之后,该双语平行语料库的初步构建已经完成。

第五,在初步完成语料库的构建工作之后,在投入使用之前,要完成语料库的双语检索测试,来检测、修正语料库的检索功能以及检测该语料库能否运用于实际操作。除此之外,仍要时刻关注有关河北十大非遗的最新动向,不断收集有关非遗翻译的专有名词、固定搭配词组以及句子等。为了提高翻译质量,语料库在收录大量词、句的同时,还将深入挖掘其文化内涵,并将这些词、句进行有机整合。

第六,在语料库建成投入使用之后,仍需对该语料库进行日常维护及升级,以适应新的软硬件和用户的不同需求。语料库内容也应紧跟时事,根据各类非遗活动的开展及最新的非遗双语文本而不断更新,以确保该语料库的代表性、时效性、权威性。此外,笔者认为语料库的推广工作也很有必要,大范围地推广能让更多人使用该语料库进行检索,可以更好地体现其实用性,更加充分地宣传非遗。

构建河北十大非遗双语平行语料库的路径是层层递进、环环相扣的,需要语料收集、整理、加工、对齐等步骤,当然也离不开细致的审校工作。同时,笔者认为,构建语料库的这一过程是“活”的,是动态发展的,因此,在形成相应的语料库之后,仍需不断修改、校正,不断探索、创新。

四、结语

非遗是中华民族源远流长的历史长河中沉淀下来的灿烂瑰宝,是凝聚先辈智慧与卓越价值的精神财富。创新非遗传播路径是非遗传承的需要,也是人类社会可持续发展的必然要求。

因此,构建河北十大非遗双语平行语料库,无论是从实际应用价值层面还是文化层面都具有深刻意义。从实际应用价值层面来看,由于该语料库可为译者提供丰富、真实的源语、目的语及双语互译实例,因而可起到统一术语或专有名词翻译的作用;而且该语料库能探索发现汉英两种语言在非遗文本方面的不同语言特征、形式以及篇章功能的异同,从而总结出非遗翻译的方法及策略,进而提高非遗翻译的译文质量。从文化层面来看,构建河北十大非遗双语平行语料库是新时代非遗传承与宣传的需要,肩负着向世界宣扬非遗的使命,能够向英文目标读者展示非遗的独特魅力,对中华文化“走出去”起到积极的促进作用,能进一步彰显中国的文化自信。

综上所述,构建河北十大非遺双语平行语料库,不仅能够给非遗翻译工作带来助力,而且能够创新性地将现代技术融入传统文化,以达到宣传非遗的目的。将当代语料库技术与传统非遗相结合,一方面,要积极探索非遗内在的文化内涵,回归传统,不忘祖辈的传承;另一方面,要与时俱进、紧跟时代脚步,在不失传统根本的基础上进行创新发展,让古老的非遗在当今社会重焕光彩!

猜你喜欢
语料平行语料库
向量的平行与垂直
平行
逃离平行世界
《语料库翻译文体学》评介
基于语料调查的“连……都(也)……”出现的语义背景分析
再顶平行进口
华语电影作为真实语料在翻译教学中的应用
基于JAVAEE的维吾尔中介语语料库开发与实现
《苗防备览》中的湘西语料
国内外语用学实证研究比较:语料类型与收集方法