基于语义分析的英语语言准确翻译方法研究

2018-03-03 06:19王晶
现代电子技术 2018年5期
关键词:语义分析翻译方法准确度

王晶

摘 要: 为了解决传统带语法类型变量的翻译方法存在语义歧义、量词不准确、翻译准确度较低的弊端,提高英语语言翻译的质量,获取更精准且通顺的译文,提出基于语义分析的英语语言准确翻译方法。从语言层、知识层以及语用层不同的语义层面,以及语料库和词典、语法剖析、语义分析和可视化表征四个过程对英语语言语义实施全面解析,再采用基于语义分析的带句法类型变量的翻译模板对英语语言实施翻译,依据语义分析并结合变量的语法类型限定条件,确保替换变量的词汇满足变量的句法语义类型,提高翻译时变量替换选取的限制度,增强英语语言翻译的准确度。实验结果表明,所提方法可避免语义理解歧义,提高英语语言翻译的准确度。

关键词: 语义分析; 英语; 语言; 模板; 翻译方法; 准确度

中图分类号: TN99?36; G434 文献标识码: A 文章编号: 1004?373X(2018)05?0178?04

Abstract: In order to eliminate the disadvantages of semantic ambiguity, inaccurate quantifier and low translation accuracy existing in traditional translation method with syntactic type variables, improve the translation quality of English language, and obtain more accurate and idiomatic translation, an English language accurate translation method based on semantic analysis is proposed to comprehensively analyze the English language semantics in the aspects of semantic layers (language layer, knowledge layer and different pragmatics semantic layer) and processes (corpus and dictionary, syntax analysis, semantic analysis and visualization characterization). The semantic analysis based translation template with syntactic type variable is used to translate the English language. The semantic analysis and variable′s syntactic type limiters are combined to ensure that the vocabulary of substitution variables can meet the syntactic semantic type of variable, enhance the selected limit degree of variable substitution while translating, and improve the accuracy of the English language translation. The experimental results show that the proposed method can avoid the semantic understanding ambiguity and improve the accuracy of English language translation.

Keywords: semantic analysis; English; language; template; translation method; accuracy

翻譯的准确度是影响交流程度的关键。高质量的翻译源于对语义的分析与理解,塑造高准确度的翻译方法具有较高的应用价值。传统带语法类型变量的翻译方法存在语义歧义、量词不准确、翻译准确度较低的弊端。针对该种弊端,本文提出基于语义分析的英语语言准确翻译方法,提高英语语言翻译的准确度。

1 基于语义分析的英语语言准确翻译方法

1.1 英语语言语义的理解

英语语言理解归根结底是对语义的理解。语义的理解可分为三个层次:语言层、知识层以及语用层。以“让这个打火机接近火源”这句话为例,句子中含有“这”、“ 打火机”、“火源”、“让接近”等4个语义单元。表示名词。对于仅有语言层理解能力的机器人来说,它会立刻找到“打火机”,识别“火源”,并将“打火机”向火源靠近,机械地完成任务。如果这个机器人同时兼备知识层的理解能力,它不会马上行动,而是能分析出该行为的后果并提示主人“危险”。知识层里又有许多分支,以“皮球”这个词为例,针对不同的人群基于知识层的理解是千差万别的:对于孩子来说就是一种玩具;对于专家而言,可能会用一本书来描述其语义。语用层是根据语言的用途来理解的,以“今天天气非常好”为例,可有多种理解:可用于邻里间打招呼;可表示妻子想让丈夫陪伴溜达;还可表示孩子提醒爸爸去游乐场玩等。

1.2 语义分析过程

可通过4步完成对英语语言内容语义的解析:

1) 确定内容语义要达到的标准,采集并编排数据;

2) 确定内容语义分析的因素,创建各因素解析类别;

3) 选取一部分内容,运用拟定的解析类别,采用人工编码的方法解析选取的内容;

4) 统筹管理经过解析的数据,验证编码者是否具有一致性,最终完成对数据表达的诠释。

在信息技术范畴,同样经过4个步骤来分析语义,从图1可以看出,对用户内容进行一层一层的分析处理来明确最终的内容意义。

语料库和词典:用户内容来自于“语料库和词典”全部的信息资源,涵盖了词形、词性以及词语解析。

语法剖析:“语法规则”阶段深度剖析句子的构造,对英语语言的主语、谓语、定语以及直接和间接宾语进行解释分析。

语义分析:在“语义规则和模板”中涵盖了高层次的语义分析并设置模式,依据语法规则、语义以及语义关联性,系统先明确内容再通过合适的语义模板进行表达。

可视化表征:在“概念类树”过程中,基于层次化、结构化的拓展性树状语言定义,以“本体”为例,抽象的、具体的、与各领域相关的类定义等。

1.3 基于语义分析的带句法变量的翻译模板

翻译是通过各种不同的翻译模板实现的英语和汉语两种语言间的转换。带句法类型变量的翻译模板是较常见的翻译模板,其中各个变量都对应一个语法类别[1]。以下是其表达形式:

式中:当时,用和描述变量。每一个变量表示即是一个非空字符串。例如1)即是一个带句法类型变量的翻译模板:

1)

从模板1)中可以看出,在“”与“”对应的基础上,英语句子“+Past”与汉语句子“我(I)+附属词(过去式)”也是对应关系。例句1)中“+Past”表示英语动词的过去式,“+附属词(过去式)”表示汉语中描述过去式的字。模板2)中的汉语句子可用1)中的翻译模板来翻译,只要“”相对应。

2) 我来过 I came

我来+附属词(过去式) I come +Past

通过图2描述的句法变量类型网可对变量的语法类型进行判别,从图2中可以看出,将句法变量类型网的顶点命名为ANY,除了顶点,其他在变量类型网里的节点都有一个或多个双亲。各个变量类型网上的类型名大部分是语法类型[2]。

采用带句法变量的翻译模板翻译的质量要高于采用带无类型限制变量的翻译模板。但在一些特定的语言环境中,带语法变量的翻译模板也会出现翻译误差。因此,本文提出一种基于语义分析的带句法类型变量的翻译模板。先分析语义再结合变量的语法类型限定条件,对变量的替换进行约束从而降低翻译结果产生误差的概率。句法语义变量的翻译模板中每一个变量都有对应的语法语义类型,以下是带句法语义变量的翻译模板形式:

式中:当时,句法语义类别是“”和“”。位于普通翻译模板“”两侧的变量数是相同的,且两侧的变量是互相对应的[3]。用“”描述此模板是双向的模板。文献[4]中提到两个形式错误的翻译模板:“”与“”,错误原因是这两个模板不符合模板两侧变量数相同的原则[5]。

在实际英语语言翻译过程中,这种形式错误的翻译模板是会被弃用的。但是,本文提出的带句法语义变量的翻译模板技术形成过程中,像“”形式的翻译模板会被继续使用。该模板在以下两种情况下运行,其中采用的汉语句法语义类型树用图3描述。

第一种情况:当变量的长度等于变量的长度时,且是的物主名词,可采用模板“”进行翻译 。从以下3)~5)例句中可以看出,英汉语句子4)可从句子3)中获取翻译模板。这是因为4)中变量的长度等于变量的长度,且是的物主名词,同时要保证“我”与“I”是对应关系,并能通过助词库查找到“I”的物主名词是“my”[6]。所以,4)中的翻译模板能够英译5)中的汉语句子。

3) 他发泄怒气He worked off his anger

她发泄怒气 She worked off her anger

4) (他、她)发泄怒气(He,She)worked off (his,her)anger

发泄怒气worked off anger if

5) 我发泄怒氣 I worked off my anger

第二种情况:当是汉语中的量词并紧邻时,可继续采用翻译模板进行翻译。可从例句6)~8)中看出,英汉语句子7)的翻译模板可从句子6)中获取。从句子7)中可知是量词且与紧邻,7)中的翻译模板可翻译8)中的汉语句子。“bag”与“包”是对应关系,依据辅助表可查到“包”的量词。

6) I have a book我有一本书

I have a pen 我有一支笔

7) I have a(book,pen)我有一(本,支)(书,笔)

I have a 我有一 If

8) I have a bag 我有一个包

除以上两种情况,带句法语义变量的翻译模板一般形式如下:

式中:当时,句法语义类型是。还有一些其他形式的带句法语义变量的翻译模板[7],例如:

(的变量数是的变量数是),则有:

式中:当时,句法语义变量是和。

带句法语义变量的翻译模板与带语法类型变量的翻译模板相比,在翻译过程中对变量选取提供更多的限制。句子9)中的模板即是一个带句法语义变量的翻译模板。

9)附属词(过去式)

从9)中的翻译模板可以看出,如果与是相互对应关系,则像“”和 “”形式的汉语句子也属于相互对应关系。从9)中的翻译模板还可以看出,该模板中英语一侧的代替词仅限于英语动词,汉语一侧的代替词仅限于汉语动词。

所以,如果“来”与“come”相互对应,则2)中的英语句子可以用9)中的翻译模板翻译。运用带句法语义变量的翻译模板翻译的过程中,代替变量的词语与变量的语法语义类型必须保持一致,否则该翻译结果不成立,最终获取高精度的翻译结果。endprint

2 实验结果与分析

2.1 准确性测试

对选自《走遍美国》的6 807句英汉句对本文方法采用带句法类型变量的翻译模板,得到测试样本1,对选自奥运会的1 619句英汉句对传统采用带语法语义变量的翻译方法,得到测试样本2,其测试结果用表1描述。

运用式(5)与式(6)对不同翻译方法的召回率以及准确率进行计算,用表2描述各种情况出现的次数以及召回率和准确率[8?9]。

分析表1和表2可知,本文采用带句法语义变量的翻译方法的召回率以及准确率都高于传统采用带语法类型变量的翻译方法,说明本文方法对语义消歧是有效的,能够实现英语语言的准确翻译。

2.2 实例分析

分别采用传统带语法类型变量的翻译方法以及本文带句法类型变量的翻译方法对“I have a pencil”进行翻译,用图4描述其翻译结果。

从图4中可以看出,采用本文带句法语义变量的翻译方法的翻译结果是“我有一支铅笔”,而带语法类型变量的翻译方法的翻译结果是“我有一个铅笔”,可知用本文方法可根据不同的名词语义来确定对应的量词,具有较高的翻译准确度。

3 结 论

本文提出基于语义分析的英语语言准确翻译方法,对英语语言进行语义分析的基础上,采用基于语义分析的带句法变量的翻译模板对英语语言实施准确翻译,得到精准且通顺的译文。

参考文献

[1] 赵志刚.英语海事公文的语言特点及翻译[J].上海海事大学学报,2014,35(2):89?94.

ZHAO Zhigang. Linguistic features and translation of English maritime official documents [J]. Journal of Shanghai Maritime University, 2014, 35(2): 89?94.

[2] BOULARES M, JEMNI M. Learning sign language machine translation based on elastic net regularization and latent semantic analysis [J]. Artificial intelligence review, 2016, 46(2): 145?166.

[3] 赵楠,黄忠廉.“公示语”英译调查与厘定[J].中国科技翻译,2015,28(3):60?62.

ZHAO Nan, HUANG Zhonglian. Investigation and determination of the English translation of "public signs" [J]. Chinese translation of science and technology, 2015, 28(3): 60?62.

[4] CHENG X, MIAO D, WANG C. A link?based approach to semantic relation analysis [J]. Neurocomputing, 2015, 154: 127?138.

[5] 粟千.弱化语法规则下英文机器翻译的优化仿真[J].计算机仿真,2016,33(11):414?417.

SU Qian. Optimization simulation of English machine translation under the weakening grammar rules [J]. Computer simulation, 2016, 33(11): 414?417.

[6] 郭峥.大型赛事新闻服务稿件的翻译原则[J].体育科技文献通报,2016,24(4):123?125.

GUO Zheng. Translation principles in news service for major sports events [J]. Sports science and technology documents, 2016, 24(4): 123?125.

[7] 周领顺.汉语移动动词“跑”的语义认知:以英语“RUN”为参照[J].河南大学学报(哲学社会科学版),2015,55(3):126?130.

ZHOU Lingshun. The semantic cognition of the "running" of the Chinese mobile verb: with the reference of "RUN" in English [J]. Journal of Henan University (philosophy and social science edition), 2015, 55(3): 126?130.

[8] HOGENBOOM A, HEERSCHOP B, FRASINCAR F, et al. Multi?lingual support for lexicon?based sentiment analysis guided by semantics [J]. Decision support systems, 2014, 62(2): 43?53.

[9] 任莉.从语义转换的角度探讨茶文化语言在英语翻译中的规范性意义[J].福建茶叶,2017(2):177?178.

REN Li. The normative significance of tea culture language in English translation from the perspective of semantic transformation [J]. Fujian tea, 2017(2): 177?178.endprint

猜你喜欢
语义分析翻译方法准确度
幕墙用挂件安装准确度控制技术
基于交叉配血的多账户识别模型研究
基于LDA模型的95598热点业务工单挖掘分析
浅谈日语翻译的方法与策略
中医语言隐喻分析及其翻译方法研究
结合语境翻译文言文方法举隅
从认知语义学的角度来看多义动词“あげる”
浅谈汉语歇后语的翻译方法
动态汽车衡准确度等级的现实意义
高炉重量布料准确度的提高