哈萨克族大学生汉语普通话单元音声学研究

2018-06-02 08:50古丽江·艾力江古力努尔·艾尔肯地里木拉提·吐尔逊艾斯卡尔·艾木都拉
电脑知识与技术 2018年10期

古丽江·艾力江 古力努尔·艾尔肯 地里木拉提·吐尔逊 艾斯卡尔·艾木都拉

摘 要:从高自然度参数合成与高精度语种识别技术研究的实际应用需求出发,运用实验语音学的基本理论和方法,对哈萨克族大学生汉语普通话单元音进行了统计分析。并给出了汉语学习者的单元音共振峰频率参数和分布规律,利用共振峰数据作归一化处理从而分析了元音发音差异和特点,用实验数据验证了其共振峰频率分布的口耳之学规律。研究结果对阿尔泰语系语言的语音研究及应用开发具有较高的参数价值。

关键词:普通话单元音;哈萨克族学习者;共振峰频率;语种识别

中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2018)10-0212-03

Abstract:In order to enhance the high-natural parameters of the synthetic and high-precise language identification technology research and practical application demand, using the basic theory and methods of experimental phonetics, This paper makes a statistical analysis on the monophthong of Kazakh college students in Mandarin Chinese.The Kazakh learner vowel formant distribution and frequency parameter presented, The differences and characteristics of vowels' pronunciation are analyzed by using the resonance peak data as a normalization process.The formant frequency distribution is verified with the experimental data of fragmentary hearsay knowledge. The results of the study have a high parameter value for the speech research and application development of the Altaic language.

Key words:mandarin monophthong; kazakh learner; formant; language identification

1 引言

普通话是现代汉民族共同语的俗称。它是汉藏语系的一支[1],其基本元音主要包括:/a,o,γ,u,y,i,?, ?/。而哈萨克语属于阿尔泰语系,是一种黏着型语言,哈萨克语共有九个单元音:/a,o,?, ?,u,?,e,i,y/。各单元音在彼此的元音感知空间内的位置有很大差异[2]。由于单元音可构成音节,因此在参数合成与语种识别技术中常对单元音进行精密的声学测量。

许多学者对单元音共振峰频率研究进行了不同角度和不同方法的分析。比如对上海普通话与普通话元音系统的声学特征对比研究[3],单元音共振峰参数进行处理分析,得到三种不同的共振峰参数,绘制不同共振峰参数下单元音的三维结构图并进行探讨[4],比如对维吾尔语元音共振峰模式的排列等进行了研究[5],以及对维吾尔语的声频特性分析和识别等。相比而言,从实验语音学角度来考察我国国内的阿尔泰语系少数民族汉语单元音声学的研究相对较少,目前学术界对于新疆哈萨克语背景大学生学习汉语普通话声学研究成果极少。

因此本文主要从声学特征角度出发,围绕新疆大学哈萨克族学生在学习普通话的单元音进行分析。通过对比的方法,得到哈萨克族学生的汉语普通话单元音共振峰值和具体音位特征,本研究对少数民族的语种识别是一项非常必要而且有意义的工作[7-8]。

2 实验方法

2.1被试情况

该文研究哈萨克族人的汉语普通话单元音声学特征,即母语为哈萨克语的学生学习普通话的特点,因此把学生的中国少数民族汉语水平等级考试(MHK)口语成绩作为依据,将分数在规定范围,选取年龄均为20-26岁的15名新疆大学哈萨克族学生(7男,8女)当做被试,他们的母语是哈萨克语,从小学三年级开始学习汉语,汉语水平为 MHK4 级。被试学生的汉语教师都是由民考民学习背景的本民族老师担任,其父母的汉语水平都不好。从小到大的日常交际用语主要为本民族语言,均无明显听力障碍,口齿清晰。另外10名是汉族人,来自北京,他们的普通话属于标准普通话,平均年龄是24岁。

2.2语音采集与数据处理

在专门的录音室采集实验所需语音信息,使用的硬件设备包括笔记本、外置声卡、麦克风和一些相互连接的数据线。外置声卡能达到调节声量大小、降噪声、监控爆破音等功能。采集软件为在Matlab环境下编写的录音工程。每个被试者的阅读资料是50个汉语单字节,采集频率为16kHz。采集完被试的语音后,将采集的哈萨克族大学生普通話单元音和标准普通话语音进行标注,本研究中对25个人音频进行手动人工校对,达到的准确率很高。根据已标注的单音节音,运用 Praat 语音软件可生成声音样本的三维语图并提取共振峰声学参数。

3 数据统计与分析

3.1共振峰频率分析

为了客观而更准确的研究哈萨克族大学生汉语普通话单元音的声学特征,本文主要测量了所有单元音的第一和第二共振峰并对共振峰频率,全部样点在元音共振峰的相对稳定段选取,对所测得的共振峰数据进行了统计,分别计算出单元音的共振峰、标准差、离散度。其中离散度是一项重要指标( 尤其是对于共振峰) ,其中离散度是标准差与平均值的比值,用来衡量各个体距平均值的远近。当共振峰的离散度大于 l0% 时,在听觉上可以认为是另一个元音。表 1 和表 2 分别是的共振峰频率统计结果。

共振峰频率是语音信号的一个很重要的特征参数,它的配置和时间模式反映出语音音色的重要特征,在语音的分析、识别等研究中被广泛地利用[6]。共振峰和舌位问题是声学语音学的基本论问题,很多学者从不同的领域出发研究了这个问题。表 1和2 结果显示,共振峰值都比较集中,离散度都小于 10% 。据此我们认为元音和谐在不同的语音环境中,舌位前后的变化并不造成元音和谐中各元音音质的不同,因此该元音没有其他音质,语音变化更准确。

3.2 共振峰值归一化处理

元音共振峰是元音音质最重要的量度,它是由声带振动作为激励源经声腔共鸣形成的。不同的元音有不同的声腔形状,就有各自的共振峰。一般认为,在元音声学特征来讲共振峰(F1、F2)的值与元音的发音位置呈现出相对较高的相关性,第一共振峰 F1 频率值与元音发音的舌位高低成反比,即发音时舌位越高,F1 值越低,舌位越低,F1 值越高;而第二共振峰 F2 频率值与发音时舌位的前后成正比,即发音时舌位越前,F2 值越高,舌位越后,F2 值越低。

由于语音具有显著的个体性特征,仅仅以通过均值计算的各样本共振峰数据无法真实反映其声音共性,因此,为了更好的分析哈萨克族大学生的汉语普通话单元音声学特征。本文采用了石峰的声音格局理论,对共振峰数据进行归一化处理,首先将各组 F1、F2 值转换为 Bark 值。实验得出的具体数据见下表,表3 和表4 分别代表女性哈萨克族学习者与汉语普通话母语者的单元音F1、F2巴克值以及男声哈萨克族的学习者与汉语普通话母语者的单元音F1、F2巴克值。(KF和KM表示哈萨克族学习者女性和男性,CF和CM表示汉族母语者女性和男性)

表3显示,哈萨克族学习者女声与汉语母语者女声在单元音共振峰频率值存在异同。通过实验结果,得出两组被试者的舌位是否差异显著,除了/? /外,女性哈萨克族学习者普通话单元音的 F1 均比汉语母语者普通话小,而女性哈萨克族学习者单元音的/a,γ / 的F2之外,其他均比汉语母语者小,就/i,y,? /而言,哈萨克族学习者女声的F1,F2平均值比汉语普通话母语者的F1,F2平均值稍微低,由此可以推断,学习者元音产出的舌位偏高又前,元音/ i /F1(4.12>3.7)和F2(15.26>14.60)与母语发音人的差异最为明显。其次,元音/y,? /的差异显著在于F1,哈萨克族学习者舌位高低,F2未能体现出具体统计意义的差别。元音/a/和元音/γ/而言,哈萨克族学习者女声的F1均值低于汉语母语者,而其产出的F2频率值高于汉语母语者,其中,元音/a/的产出舌位偏高偏后,与母语发音人差异则较为显著。但元音/γ/的产出差异极为显著,哈萨克族学习者的产出舌位明显高出,而元音/γ/差异不显著。对于元音/?,o,u/而言,哈萨克族学习者与汉语母语者单元音/?,o,u/产出的频率值在F1、F2上無显著性差异。

表4显示,哈萨克族学习者男声单元音/i,y,o,u/来说,F1比汉语母语者高,而其产出的该组元音F2比汉语母语者低,由此而出,学习者的产出的舌位偏低后。通过分析结果显示,元音/i/和/u/的产出差异较为显著,学习者舌位明显偏低,而其F2的数据未能体现出具有统计意义的差别。另外对于元音/y,o/而言,两组被试者无明显差异。哈萨克族学习者男声单元音的 /γ,a,?,?/的F1 均比标准普通话小,除了/?/ 的F2之外,其他哈萨克族学习者男声比母语者小。两组被试之间亦存在可辨差异,由此看出,学习者该组元音产出的舌位偏高偏前,尤其是元音/γ /F1(6.56>5.95)和(12.10>11.24)与母语者发音的差异最为明显,哈萨克族学习者男声主要以舌位高低区分元音/a/,而对于元音/?/差异的主要体现在舌位高低,进一步显示,元音/?/F1(6.02>6.00)和(12.84>12.09)与母语者元音/?/产出的共振峰值差异不大。

4 结论

通过对哈萨克族大学生汉语普通话单元音进行声学分析,给出了汉语普通话单元音的共振峰分布参数分析,以及共振峰频率的统计信息。可以看出哈萨克族大学生汉语普通话单元音离散度都小于10% 。同时从声学角度出发通过比较哈萨克族大学生汉语学习者与汉语母语者八个单元音发音的第一、第二共振峰巴克值,分析了两组被试者发音的差异和特点。

参考文献:

[1] 朱晓农. 语音学[M].北京商务印书馆,2010:190-195.

[2] 刘双双. 汉语哈萨克语音位系统对比与对外汉语教学[J]. 华中师范大学研究生学报,2015,22(3):5-8.

[3] 于珏,李爱军,王霞.上海普通话与普通话元音系统的声学特征对比研究[J].中文信息学报,2004(6):66-72.

[4] 赵茜. 单元音共振峰参数的三维结构分析[A]. 中国声学学会.2014年中国声学学会全国声学学术会议论文集[C].中国声学学会:,2014:4.

[5] 阿依努尔·努尔太,祖丽皮亚·阿曼,地里木拉提·吐尔逊,艾斯卡尔·艾木都拉.维吾尔语双音节词元音格局研究[J].计算机工程与科学,2013,35(1):185-190.

[6] 王昆仑,张贯虹,吐尔洪江·阿布都克力木.维吾尔语元音的声频特性分析和识别[J].中文信息学报,2010,24(2):122-128.

[7] 武光利.基于GMM的少数民族语自动语种识别系统设计[J].自动化与仪器仪表,2013(06):61-62.

[8]胡月,郭英,张东伟,侯文林,李红光.基于CV音节的高效语种识别方法[J].微电子学与计算机,2015,32(10):26-30.