正常成人低通滤波汉语清塞音的识别研究△

2012-01-11 06:49张梦超刘巧云卢海丹黄昭鸣杜晓新孙喜斌
听力学及言语疾病杂志 2012年2期
关键词:截止频率通滤波言语

张梦超 刘巧云 卢海丹 黄昭鸣 杜晓新 孙喜斌

言语信号经过滤波后,外在冗余度下降,随着截止频率降低,个体需要动用更多听处理能力提取其声学特征。识别时所需的声学特征越少,说明个体的听处理能力越强。早在1954年,Bocca等首先使用低冗余度的滤波言语作为听处理障碍患者的测试材料[1],并发现病变对侧耳的滤波言语识别得分降低。随后几十年间,滤波材料开始被应用于中枢病变的诊断。上世纪80年代,程锦元等编制了一部分低通滤波言语测听词表,并在中低频区域划分了7档截止频率,有350、500、750、1 100、1 600、2 500和3 500 Hz[2]。2006年苏金霏等的研究发现,500~8 000 Hz是健听成人言语识别的重要频带,单音节词是外在冗余度最少的语音单位,比有意义词更难听懂,言语测听最好使用单音节词[3]。为探讨识别低通滤波汉语到底需要多大的通带范围及不同声韵母会受到何种因素的影响,本研究选取汉语声母中的塞音,将塞音开头的单音节词作为言语识别材料,通过改变通带范围的方式,获得健听成人识别低通滤波清塞音所需的最小通带及影响因素,为进一步完善听处理相关的言语测听材料作前期探索,报告如下。

1 资料与方法

1.1研究对象 本实验对象为华东师范大学33名在读大学生,其中男17人,女16人,年龄19~24岁,平均21.5±1.2岁,双耳各频率听阈均在25 dB HL以下。

1.2研究方法

1.2.1测试材料 本实验选用汉语清塞音与韵母/a/组合的单音节(表1)为言语测试材料,声调均为一声,实验材料由一名25岁的成年女性用标准普通话朗读,平均言语基频为236.67 Hz。在隔声室内用Sony Soundforge 7.0软件单声道录制声音材料,采样频率为44 100 Hz,录制后对材料进行音量归一化。采用言语听觉科学教育部重点实验室开发的LabView平台下的低通滤波语音识别软件,由一根音频线连接至GSI 61听力计,通过听力计控制输出音量在65 dB SPL,通过TDH 50压耳式耳机播放声音。

表1 实验测试音节

1.2.2测试程序 首先选择5名在读大学生进行预实验,采用100阶巴特沃斯低通滤波器,设置起始截止频率为300 Hz,受试者在听某一音节时,若报告错误,则以100 Hz的步长上升,直至受试者在连续增长的十个步长中均正确识别。要求受试者口头报告所听到的音节,报告完全正确记“1”,报告错误记为“0”,并由测试者在软件中输入受试者实报的音节作为错误走向。通过预实验,研究者在正式实验中作了以下调整:①预实验中当截止频率为500 Hz以下时,受试者均表示无法识别,因此在正式实验中提高了截止频率;②预实验中步长200 Hz的结果与100 Hz的情况基本一致,因此在正式实验中调整了步长,缩短了实验时间;③排除了实验操作中可能存在的硬件、软件问题。

正式实验采用100阶巴特沃斯低通滤波器,设置起始截止频率为500 Hz,步长为200 Hz,受试者连续正确报告5次时停止放音,并记录5次连续正确报告中的最低截止频率,作为该受试者识别该音节的截止频率,其余流程与预实验基本一致。整个实验在隔声室内完成,本底噪声低于45 dB SPL。

1.3统计学方法 本实验用Microsoft Office Excel 2007进行数据记录,用SPSS 16.0作数据分析处理。采用2×3×3的三因素混合实验设计,受试者间变量为性别,有男、女两个水平;受试者内变量为送气方式和发音部位,其中送气方式有送气和不送气两个水平,发音部位有双唇、舌尖、舌根三个水平。因变量为低通滤波塞音正确识别的最低截止频率。

2 结果

清塞音音节的平均截止频率见表2。可见,识别/pa/所需的最低截止频率均值高于6 000 Hz,其余清塞音的最低截止频率均值均在3 000 Hz以下。识别清塞音的截止频率由低到高依次为/ka/、/ga/、/ba/、/ta/、/da/、/pa/。

表2 不同性别受试者低通滤波汉语清塞音识别的最低截止频率

对获得的截止频率进行一元方差分析,发现送气方式和发音部位的主效应均极显著,说明送气方式、发音部位影响滤波塞音的识别;受试者性别的主效应不显著。送气方式、发音部位的交互作用极显著;其余的交互效应均不显著(表3)。对发音部位进行多重比较后,发现双唇音与舌尖音(P<0.01)、双唇音与舌根音(P<0.01)、舌尖音与舌根音(P<0.01)之间差异均有显著统计学意义。

在同一发音部位上,双唇送气音/pa/与不送气音/ba/、舌尖送气音/ta/与不送气音/da/、舌根送气音/ka/与不送气音/ga/低通滤波的最低截止频率差异均有显著统计学意义。其中,双唇送气塞音/pa/比双唇不送气塞音/ba/的均值高,但舌尖音、舌根音的情况下,都是不送气塞音比送气塞音的均值高(表4)。

表3 送气方式、发音部位和性别对低通滤波汉语清塞音识别的影响

表4 同一发音部位不同送气方式的影响

注:*差值=不送气塞音最低截止频率均值-送气塞音均值

在不送气塞音水平上,双唇音/ba/与舌尖音/da/、舌尖音/da/与舌根音/ga/低通滤波的最低截止频率的差异有极显著统计学意义,双唇音/ba/与舌根音/ga/的差异无统计学意义。在送气塞音水平上,不同发音部位间两两差异均有显著统计学意义(表5)。

表5 同一送气方式不同发音部位的影响

3 讨论

本研究发现,影响清塞音识别的低通截止频率的第一个主要因素是发音部位:当送气方式相同时,除了/ba/与/ga/之间差异没有统计学意义外,其余不同部位之间差异均有显著统计学意义,说明发音部位影响了大部分清塞音识别的低通截止频率。第二个主要影响因素是送气方式:当两个塞音的发音部位相同时,识别送气音与不送气音的截止频率差异均存在显著统计学意义。此外,发音部位和送气方式之间还存在交互效应。舌相关的塞音(舌尖音、舌根音)中,不送气音的截止频率高于送气音,唇相关的塞音(双唇音)中,送气音的截止频率高于不送气音。

从文中结果看,识别/ka/、/ga/、/ba/、/ta/、/da/的最低截止频率均处于低中频区域,说明识别/ka/、/ga/、/ba/、/ta/、/da/发音部位和送气方式的声学信息基本集中在低中频区域。以/ka/为例,其截止频率均值约为1 700 Hz,说明截止频率1 700 Hz的/ka/包含了舌根送气音的声学线索,1 700 Hz以上的声学信息就可作为冗余信息。

/pa/的识别情况比较特殊,与其他清塞音比较其截止频率在高频范围。从声学分析的角度来说,识别塞音发音部位可依靠辅音共振峰判断[4],双唇音/b/、/p/的第二共振峰在1 100~1 500 Hz左右的低频部分[4,5]。结合本研究结果,发现/pa/在1 500 Hz时识别率曾达到50%,而在2 300~5 700 Hz的频段之间,/pa/大量误听为/ta/,错误率超过70%,直至截止频率达7 000 Hz以上时,/pa/的识别率才达到70%以上。吴宗济发现/pa/中的/p/除了在中低频区有一共振峰[5],还有一个7 kHz左右的辅音共振峰,本实验也从另一方面证实了这点。从听觉感知的角度来说,曾有研究提示低通截止频率为3 500 Hz时言语基本能被识别[2],但该类实验采用了阶数较低的低通滤波器,过渡带中遗留大量声学信息助于识别。本实验采用高阶滤波器,排除了过渡带的影响。结合两者可知,声学分析与听觉感知之间存在着一定差异,/pa/中/p/的发音部位体现在其高频的辅音共振峰。

男、女受试者识别低通滤波的最低截止频率没有差异,说明性别不影响低通滤波清塞音识别,在今后的实验中可以不考虑男女受试者比例。

综上所述,健听成人识别/ba/、/da/、/ga/、/ta/、/ka/所需的截止频率在3 000 Hz以下,识别/pa/需7 000 Hz以上。识别清塞音所需的低通截止频率受送气方式和发音部位的影响,但不受性别影响。同一部位不同送气方式时,舌塞音中不送气音的截止频率高于送气音,唇塞音中送气音的截止频率高于不送气音。采用高阶的低通滤波器可以降低过渡带的冗余信息,更符合中枢听觉处理评估的低冗余信息测试材料。本实验获得识别/ba/、/da/、/ga/、/ta/、/ka/的最小截止频率,能为选择低通滤波单音节词的通带范围提供参考。此外,听觉感知的机理与声学分析之间的差异也值得进一步探索,在后续研究中将对不同韵母类型的情况及其他汉语声母进行研究,并加入单、双耳的比较,为进一步完善滤波言语测听提供依据。

4 参考文献

1 Bocca E,Calearo C,Cassinari V. A new method for testing hearing in temporal lobe tumors: preliminary report[J]. Acta Otolaryngo,1954,44:9.

2 程锦元,胡逢昶,庞慧娟,等.滤波汉语清晰度的初步介绍[J].中华耳鼻咽喉科杂志,1983,18:138.

3 苏金霏,王宁宇,张秋航,等. 测试材料的滤波通带对言语识别率的影响[J].中国实验诊断学,2006,10:750.

4 曾进兴. 语言病理学基础(第二卷)[M]. 台北: 心理出版社,1996.48~51.

5 吴宗济,林茂灿. 实验语音学概要[M]. 北京:高等教育出版社,1989.127~129.

猜你喜欢
截止频率通滤波言语
基于超声Lamb波截止频率的双层薄板各层厚度表征
言语思维在前,言语品质在后
声呐发射机负载阻抗变化仿真分析
《世说新语》中的“言语”趣味故事
二阶有源低通滤波电路的计算机辅助设计
梯度饱和多孔材料中弹性波的截止频率
一种自适应共振解调方法及其在滚动轴承早期故障诊断中的应用
MEMS高量程压阻加速度计侵彻双层钢靶性能测试
基于频域分析和低通滤波的光伏并网逆变器谐振抑制研究
基于频率自适应滤波器的单相锁相环