基于英语语义分析的智能算法研究

2020-11-13 03:38梁珊
微型电脑应用 2020年10期
关键词:英语语音翻译

梁珊

摘要:英语翻译过程中,语义越相似,则相关度越大,容易造成不同语境下的理解错误,给翻译工作带来困难。基于此,从英汉句子双语料入手,建立基于语义词典和语料库相结合的相似度计算模型。在建立的语料库条件下,确定相关语义提取规则和依存关系,通过英语句子相似度算法,采用向量空间模型标准,将计算的相似度作为向量元素,寻找到语句的差异化程度,区别语句和单词词性、句法、时态多方面内容。研究结果表明:系统在语句翻译过程中具备较高的准确度和召唤率,尤其是在介词、虚词、时态方面的英译过程中,具有更高的翻译效率和准确度。

关键词:英语语音;翻译;相似度模型;语法时态

中图分类号:G643

文献标志码:A

ResearchonIntelligentAlgorithmBasedonEnglishSemantic

LIANGShan

AcademicAffairsOffice,ShanxiCollegeofCommunicationTechnology,Xian710000,China

Abstract:IntheprocessofEnglishtranslation,themoresimilarthesemanticsis,thegreaterthecorrelation.Itcaneasilycauseunderstandingerrorsindifferentcontexts,andbringdifficultiestothetranslationwork.Basedonthis,thispaperestablishesasimilaritycalculationmodelbasedonthecombinationofsemanticdictionaryandcorpus.Undertheconditionoftheestablishedcorpus,therelevantsemanticextractionrulesanddependenciesaredetermined.ThroughtheEnglishsentencesimilarityalgorithm,usingthevectorspacemodelstandard,thecalculatedsimilarityisusedasthevectorelementtofindthedegreeofdifferentiationofthesentence,distinguishthesentencefromthewordpartofspeech,syntax,tense,andmanyaspectsofthecontent.Theresultsshowthatthetranslationprocesshashigheraccuracyandcallrate,especiallyinthetranslationofprepositions,functionwords,tenses,withhighertranslationefficiencyandaccuracy.

Keywords:Englishphonetics;translation;similaritymodel;grammaticaltense

0引言

随着国际经济形势和贸易的扩展,英语作为国际通用语言得到更多的重视,英语翻译成为必不可少的一部分,各类机器翻译系统快速发展[13]。机器翻译已经不局限于单个语法和句子翻译,更多的是语言内部句群、段落、篇章、体裁的语境信息[4]。从语义学角度讲,词语语义计算可在整个文本中或单个词义间进行定义,因而词语语义具备了相关度和相似度,即反应了两个词语在同一语境中的共性和两个词语间的聚合特征[57]。在一定程度上,词语间语义越相似,其相关度越大,容易造成不同语境下的理解错误,给翻译工作带来困难。目前,词语语义计算更多的是基于自然语言处理,探索词语间相关程度[811]。如结合马尔科夫模型对比输入译文和参照译文的相似词,并进行匹配,计算二者的近似度。通过将InformationContent算法融合在WordNet系统内建立词语语义的相关度模型,利用现有词义词典的概念关系度量词语语义相关度[12]。一些学者从词语文档该案属性程度方面计算词语概念相关度,通过统计算法确定文档中词语共线性和相关性[13]。基于此,本文將英语语义相似度算法应用于英语只能反应中,综合考虑英语单词和语义多方面特征,提高英语翻译系统的语句翻译准确度。

1英语翻译分析系统设计

英语翻译系统主要是将收入的译文资料保存在系统资料库中,并通过对收录语言进行语义检测,信息特征提取,进行特定语境下下单词和语义的分析,最后将结果反馈给应用者。根据英语反应系统的需求,构建层次结构主要包括译文资料收录、信息特征提取、数据模型构建和分析、结果反馈四个功能模块,如图1所示。

系统初期,通过译文资料模块收录相应的英文译文,并经过标准化处理,将获得的标准化格式保存在资料库文件中。根据文件内容通过信息特征提取模块进行内容细分,利用软件算法提取标准文件特征值。由分析模块根据提取的信息特征值获得提取结果,在此基础上通过结果反馈模块完成译文翻译和反馈工作。

同时引入自然语言处理系统进行人与机的有效通信,作为翻译系统的辅助部分实现信息交互。用户将传疑问上传到用户端,通过自然语言只能处理完成信息交互后,输入系统翻译模型,利用模型文件进行评分和结果反馈,并基于人工检验评测查阅用户英语翻译文档,选择训练模型译文集数据,提高翻译整体效果。

2系统关键技术

从系统结构层次可以看出,利用软件算法提取标准文件的信息特征值是实现不同语义环境下准确翻译的基础[14]。而词语和句子间存在的相似度是造成系统在不同语义环境下翻译下降到因素。语句的相对度包括词性、句法、语句多方面内容,通过句子相似度计算,寻找到语句的差异化程度,即相似度值越大,则表明两句子在词形、句法和语义方面的信息越解决[15]。本文基于英语距离的相似度算法计算英语单词和语句间的相似度。

2.1概念词的相似度

针对语句间概念词的相似度,在相关研究的基础上[16],重新定义了概念次的相似度计算方法,即确定两概念词间语义相似度值位于区间[0,1]间,相互关系如式(1)。

sim(w1,w2)=e-αL·12(HcH1+HcH2)

(1)

上式中

L为概念词w1和w2间的最短路径;Hc为概念词在公共上位词集的深度,Hw1、Hw2对应的深度;α为常数。对于式(1)中可以理解为:当两概念次间最短路径越小,公共上位词深度越大,距离越短,则语义相似度越大。

2.2语句间相似度

在衡量语句相似度时,采用向量空间模型标准。向量空间模型(VectorspacemodelVSM)

是把文本中的单词、短语等最小语义单元分隔开,将其计算的相似度作为向量元素[17]。在两条英语句中使用教教余弦来获得语义间的相似度。

2.2.1语句的向量化表示

在英语语句向量化表示中,首先将两个语句用等长度向量表示,如对于

语句T1和T2,将两条语句所有单词汇集程一个联合词集T如式(2)。

T=T1∪T2=w1,q1,…,wm,qn

(2)

去掉T1和T2中相同的单词,确保联合词集T中的元素互异性,其中w1,w2,…,wm为语句T1中单词集合,q1,q2,…,qn为语句T2的单词集合,例如对于英语语句:

T1:{Whatisyoufavoritesports?}

T2:{Whatkindofsportsdoyouenjoymost?}

对两个语句进行组合,将两条语句中的冠词、感叹词删除,保留实意单词原型,并记录相同单词,获得组合后的语句T:{Whatisyourfavoritesportkindofdoyouenjoymost?}。将联合语句T以一个向量S表示。联合语义向量单词长度与联合语句数量相同,同时,将语句T1表示问联合语义向量S1,将T2表示问联合语义向量S2。将向量中单词以分量值的形式,若wi包含在语义向量中,则Si取为1,若不包含在语句中,则根据式(1)计算相似度。获得语句T1和T2对应的语义向量S1和S2。

S1:1,1,1,1,1,0.8,0.8,0,0,1,0.8,0.9

S2:1,0,1,0.8,1,1,1,1,1,1,1

其中计算获得的小数为单词对应的相似度数值。语句中的of、do等介词和助动词无比较单词。确定语句T1和T2对应的语义向量S1和S2后,根据式(3)计算得到T1和T2的相似度,将相似度值大于设定阈值备选答案作为最终答案如式(3)。

sim(T1,T2)=S1·S2S1·S2

(3)

2.2.2算法的流程

算法为用户输入一条英语语句,输出与该语句相似的所有备翻译语义以及相似值,取相似度取值范围[0,1],确定算法的具体处理流程,如图2所示。

(1)输入一个英语语句,进行句子的预处理,获得翻译语句的备选答案;(2)对输入语句和备选答案进行还原处理,并标注每个单词的词性;(3)将处理后的语句和答案组成联合词集,进行向量化处理,构成联合语义向量集;(4)由将联合语义向量赋予概念相似度值,根据余弦相似度计算公式获得语义相似度值;(5)由语义相似度结果排序,并最终选择相似度最高句子作为最终答案。

3系统实现

系统以MYSQL数据库和知识题库作为数据管理系统。采用常用词词典和WordNet语义词典作为数据表,在Eclipse平台架构进行层次设计,使系统具体流程图,如图3所示。

本文选择测试用例1:“汉英对照例句集”,测试用例2:“走遍美国双语篇章级语料”第2324课,测试用例3:“Internet上双语新闻”共17篇中的双语篇章预料进行测试,测试预料信息以及获得的测试结果,如表1所示。

其中准确率R和召唤率P如式(4)、式(5)。

R=输出正确译文次数句对总数×100%

(4)

P=输出正确译文次数输出译文次数×100%

(5)

从获得的实验结果可以看出,采用系统来解决汉译音问题能够获得较高的准确率。其中测试用例3的准确率和召唤率较其他二者较低,这是由于用例3主要为新闻题材,以叙事性文和说明性文字交织,在时态方面存在较多的变化,存在一定错误,因此需要增加对受限领域、场景和句子模式识别的深入研究,以及句子衔接规律的研究。

下面针对英语翻译中常存在是时态问题进行分析,基于语义语言的机器翻译在进行转化处理中,得到的结果更多的是英语动词原形形式。如基于机器翻译系统将英语句子“Thewillinvestigatethiswork”到汉语的翻译过程如下:

(1)展开汉语句子过程:进行语义单元的编码“Thewillinvestigatethiswork”→1(The,thiswork)→1(They,2(work))→1(2,3(4))。

(2)进行语义分析过程为:1(2,3(4))→“调查(他们,该(工作))”→“调查(他们,該(工作))1”→“他们(2)调查该(工作)(3)”→“他们(2)调查该工作(4)”→“他们调查该工作”。

由于针对句子语义单元忽略了“将”一类时间副词和助词,仅提取时间短语的语义单元,对存在时间连词句子仅提取时间连词,并未在表示中标志时间信息,显然,时间模式表能直接反应时间信息和转换时态,因此,直接利用本文算法,根据语义相似度来处理句子获得时态结果,并与机器反应系统翻译结果结合,获得带有时态标记译文。

4总结

本文从英汉句子双语料入手,针对语义语言的翻译系统若干关键问题进行分析。基于语义词典和语料库相结合的相似度计算模型,并给出系统开发过程和模块的功能作用。以建立语料库为基础,确定相关语义提取规则和依存关系,通过研究英语句子相似度算法,采用向量空间模型标准,将计算的相似度作为向量元素,寻找到语句的差异化程度,区别语句和单词词性、句法、时态多方面内容。通过实际体验和使用,系统能够有效提高英语翻译的准确度,进一步提升了系统的效率。

参考文献

[1]

刘蕾.智能播种机嵌入式英语语音识别控制系统设计与研究[J].农机化研究,2018,40(12):240244.

[2]谭咏梅,吴坤.面向英语文章的词性标注算法[J].北京邮电大学学报,2014,37(6):120124.

[3]雷香花,幸晉渝.基于短语译文组合的智能化英语自动翻译系统[J].自动化与仪器仪表,2018(5):152155.

[4]吴秉健.基于人工智能的英语故事写作应用研究[J].中小学数字化教学,2018(4):8688.

[5]杨燕.BP神经网络算法下英语MOOC平台的设计与实现[J].自动化与仪器仪表,2018(8):8183.

[6]詹海宝,张立国.大学英语词汇锁屏移动学习软件的设计与应用[J].中国远程教育,2015(4):4348.

[7]谢雪梅.英语口语测试系统发音错误智能检测技术研究[J].自动化与仪器仪表,2018(12):5861.

[8]贺建英,王光琼,唐青松.一种基于遗传算法的智能组卷策略优化研究[J].计算机与数字工程,2019,47(1):130135.

[9]郭蕾.基于自然语言处理的英语翻译计算机智能评分系统设计[J].现代电子技术,2019,42(4):158160.

[10]洪常春.人工智能时代大学英语生态教学模式构建研究[J].外语电化教学,2018(6):2934.

[11]王晓茹.基于个性化推荐的英语辅助教学系统设计[J].微型电脑应用,2019,35(5):3538.

[12]涂惠燕,陈一宁.基于语音识别和手机平台的英语口语发音学习系统[J].计算机应用与软件,2011,28(9):6466.

[13]季春元,熊泽金,侯艳芳,等.基于人机交互的网络化智能翻译系统设计[J].自动化与仪器仪表,2019(8):2528.

[14]梁慧.嵌入式英语语音识别系统误差自动检测方法研究[J].自动化与仪器仪表,2019(9):5558.

[15]尹钟,陈玮,付东翔,等.智能控制课程中英双语教学方法研究与教学案例设计[J].计算机教育,2019(10):5155.

[16]刘学丰.基于差分进化算法的英语考试智能组卷[J].计算机技术与发展,2016,26(1):181184.

[17]谭咏梅,王晓辉,杨一枭.基于语料库的英语文章语法错误检查及纠正方法[J].北京邮电大学学报,2016,39(4):9297.

(收稿日期:2020.03.27)

猜你喜欢
英语语音翻译
微课环境下英语语音教学新模式探索
少数民族预科英语语音课程建设研究
关于大学英语语音的语用研究
本科英语专业翻译教学改革与实用型翻译人才的培养
浅析跨文化交际
商务英语翻译在国际贸易中的重要性及其应用
小议翻译活动中的等值理论
语音层面英语歧义及其消解浅析
英语语音教学方法的实践与研究