藏语自动标音系统的设计与实现

2015-05-30 20:22艾金勇陈小莹刘泽国
智能计算机与应用 2015年6期
关键词:藏语

艾金勇 陈小莹 刘泽国

摘要:本文在对藏文文本规范化、藏文音节结构确定和藏文SAMPA的设计与实现的基础上,设计与实现了藏语自动标音系统。藏语字音转换是文语转换系统中必不可少的一个模块,具体可以将藏文文字的拼写形式转换成音素的形式表示出来,解决从藏文文字到语音音标的转换问题。

关键词:藏语;语音合成;自动标音

中图分类号:TP391文献标识码: A文章编号:2095-2163(2015)06-

Abstract:Based on determining the Tibetan text specification, Tibetan syllable structure and design and implementation of Tibetan sampa, the paperstudies and presents the Tibetan automatic transcription system. Tibetan grapheme to phoneme conversion is a essential module for text to speech system, which can convertthe Tibetan language spelling form into phonemes representation, in order to solve the problem from the Tibetan text to speech phonetic conversion.

Keywords:Tibetan Language;Speech Synthesis;Automatic Labeling

0引 言

随着语音合成技术的发展及越来越多语音产品的出现,人机交互技术的应用也更加广泛,这些技术的应用大大提高了人们的工作效率。在语音合成系统中,首要解决的问题是文字如何发音,这就需要将文字转化成发音因素的音标形式,建立与文字相对应的音标数据库[1]。在语音合成时,主要利用字符匹配的方法来获取数据库里对应的音标。在汉语的文语转换系统中,已经实现了将汉字转化成汉语拼音这一功能,在英语和德语等语言的语音合成中,也完成了字素到音素的自动转换[2]。但是在藏语语音合成系统的相关研究中还没有关于自动注音方面系统性的文献和成果,基于此,本文提出了实现藏语字音转换的研究目标,作为文语转换系统中必不可少的一个模块,具体可以将藏文文字的拼写形式转换成音素的形式表示出来,解决从藏文文字到语音音标的转换问题。

1 系统设计及运行环境

1.1 系统设计方案

本文在分析藏文的文字特征和对应语法规则的基础上,制定藏文文本的规范化方案;通过对小字符集编码文字特征分析,提出藏文部件拆分算法,实现藏文文字的识别和分解;最后根据藏语各方言区的声韵调特征,建立基于SAMPA码的藏语各方言区机读音标系统,并参照藏语的拼读规则最终实现藏文音节的自动标注[3-4]。

在完成系统总体设计方案、部件确定算法及机读音标的设计后,把所有的算法整合运用到藏语自动注音系统中,以实现自动注音系统的整体功能。通过对文本切分,藏文文本自动注音就转化为藏语单音节自动注音,单音节自动注音的整体流程如图1所示。

1.2系统运行环境

系统运行环境主要包括硬件环境和软件开发环境。硬件环境是指对应的硬件配套设施。软件开发环境主要指Web操作系统,数据库系统和应用系统开发平台。良好的软件开发环境有利于系统开发人员设计,还有助于快速满足用户需求。

1.2.1 Web操作系统和数据库系统

由于Windows系统在国内使用较广,且不同的系统之间具有统一的界面,人机交互比较方便,普通用户的使用更加容易。此外,Windows网络操作系统比较稳定,基本上能够满足所有中、小型網络系统的需求,硬件配置相对较低。基于上述考虑,Web服务器平台系统采用Microsoft Windows 2008 server+IIS7.0,采用SQL Server 2008作为数据库服务的管理工具。

1.2.2 开发工具

通过前期系统需求分析以及系统设计方案的分析考虑,藏文自动标音系统的开发工具采用了Visual Studio.NET2010,程序设计语言选择C#,C#是基于.NET4.0平台的成熟完整的开发语言,拥有较为完善的Web Services技术框架,可以极大地缩短Web服务的开发周期,同时ADO.NET数据库访问技术能够使用.NET架构的最新特性。

2前台模块具体实现

2.1规范化文本模块

规范化文本模块的流程通过收集整理藏文文本中出现的不属于藏文字符的现象,设计处理此类文本的一些规则,收集整理网络媒体、报纸以及书本上出现的各种不规范文本现象,分析出现的语境以及具体的使用范围,最后确立相应的知识库。

2.2音节结构划分模块

音节结构划分模块首先需要对规范化的文本进行音节切分工作,音节切分主要利用藏文文本构成规则,以及规范化文本中对其它音节间隔符号的处理结果,直接根据音节点划分,利用字符串的Split函数即可实现。其次再利用建立的占位辅音和非占位辅音编码库,确定非占位辅音的个数,依据藏文正字法建立规则知识库即可实现。

2.3音节自动注音模块

藏文文本的自动注音模块主要依据已经确定的藏文音节结构,通过基字丁定位和字丁分解进行声韵母的分离,得到藏文声母和韵母,再对照三大方言的声韵母以及声调的SAMPA转写支持库的查找来实现声韵母的转换,最后将其组合,并加之声调即可。音节的实际调值由对应声韵母的调号进行组合,其中,声母SAMPA=前加字SAMPA+上加字SAMPA+基字SAMPA+下加字SAMPA;韵母SAMPA=元音SAMPA+后加字SAMPA+再后加字SAMPA,没有的部分不转写,程序实现过程中需要字丁分解表、声母SAMPA支持库、韵母SAMPA支持库以及声调SAMPA支持库的支持[5]。选择不同的方言时,只要改变支持库即可,平台运行界面如图2所示。

2.4其它模块

由于藏文字符编码显示的差异性,虽然在Windows7系统里已经实现了小字符集编码藏文的正常显示,但可能仍然有一部分存在显示不完整的情况。为了确保程序中涉及的藏文字符能够正常显示,程序中还提供了喜马拉雅藏文输入法的下载功能,同时参照拉丁转写方案,设计了拉丁转写形式。

3后台基础模块

3.1数据维护模块

由于藏语不同方言区的差异性,以及各地区语言发展的不均衡现象,各方言区的音位系统并不能完全表示该区域的发音现象。为了保持程序的正确性和可移植性,设定了针对不同区域的声母系统和韵母系统转换模式的编辑方式。用户可以直接在后台修改声韵母系统。但是为了保证数据的安全性,所有系统只能更改不能删除。

3.2日志记录模块

日志记录模块主要实现对操作历史的记录,程序可以监控所有的转换过程,可以记录操作者的日志和执行的操作,并且包含操作者的操作对象和操作结果,可以方便发现转换中的一些异常现象,以及相关系统数据的更改,有利于提升系统的维护效率。

4结束语

本文经过分析调研后,从系统的总体设计出发,通过不规范文本设计方案,确定藏文音节结构和藏语三大方言区机读音标系统的设计与实现,利用VS2010在平台上实现了藏语自动注音系统的开发,通过该平台可以获取同一文字不同方言区的机读音标和对应的拉丁转写字符,有利于不同方言区的语音交流。本文研究成果在藏语语言文字学习、计算语言学以及藏文信息化发展方向都具有重要的理论价值和实际的可操作性,同时对藏语言文字本身的发展以及藏民族文化的传播和传承也起到积极的促进作用。

藏语自动注音是实现文语转换的基础工作之一,对藏文信息处理的进一步发展有着重要推动作用,但是本系统仅实现了基本功能,仍有很多工作需要完成,下一步研究工作将在以下方面开展:

(1)系统仅仅是基于已有方言区域的音位系统上实现的自动注音,由于藏语方言语音的复杂性,很多音位系统还存在不确定性,所以后期还需要修正完善方言音系;

(2)系统对黏着语规范化处理主要基于词典库进行开展的,由于词典库中缺乏许多新词语,因此处理结果可能影响自动注音的正确性,后期还需要进一步完善扩充词典库;

(3)目前不规范文本数据的收集整理仅仅来源于常见的藏文文本,还有一些不规范藏文文本未能收集,需要下一步继续收集整理;

(4)系统还需要更好地平衡算法复杂度和实时性之间的矛盾。

参考文献:

[1]李永宏,孔江平,于洪志.藏语文-音自动规则转换及其实现[J].清华大学学报(自然科学版),2008,S1:621-626.

[2]高璐,陈琪,李永宏,于洪志.藏語语音合成中文本分析的若干问题研究[J].西北民族大学学报(自然科学版),2010,02.

[3]陈志刚,胡国平,王熙法.中文语音合成系统中的文本标准化方法[J].中文信息学报,2003,04:45-51.

[4]于洪志,高璐,李永宏,郑文思.藏语机读音标SAMPA_ST的设计[J].中文信息学报,2012,04:66-72.

[5]江荻.藏文的拉丁字母转写方法——兼论藏文语料的计算机转写处理[J].民族语文,2006,01:45-53.

猜你喜欢
藏语
浅谈藏语中的礼仪语
浅析当代藏语使用弱化问题及其对策
藏语传统辞书词目编排法探析
当代女性藏语长篇小说《花与梦》中女性成长主题研究
汉藏语及其音乐
悬置、隐藏与冒犯:松太加“藏语电影”中的“作者”话语变奏
童年的小小心愿——藏语电影《旺扎的雨靴》
藏语拉达克话的几个语音特征
藏语元音声学实验分析
藏语地理分布格局的形成原因