基于Bark域的电子耳蜗频带划分分析和拟合研究

2020-04-06 02:08陈又圣曹智亮夏林中张春晓林炜臻
中国医学物理学杂志 2020年3期
关键词:频带耳蜗频段

陈又圣,曹智亮,夏林中,张春晓,林炜臻

深圳信息职业技术学院,广东深圳518000

前言

Bark 域是由Eberhard Zwicker 提出的一种心理声学尺度和信号频带划分方法。在人耳中,存在24个频率位置会产生共振,因而可以划分出从1到24的共24个临界频带,即Bark域。Bark域对频率不均匀划分的思想,有助于对低频信号给予更高的分辨率,对高频信号给予相对较低的分辨率,在噪声分类和抑制[1-3]、特征分析和特征提取[4-7]、助听器[8]、语音增强[9-12]、语音测试和评估[13]、语音识别[14]、语音端点检测[15]等方面都有广泛应用。在电子耳蜗领域应用中,Bark 域可用于信号处理和言语处理策略的设计[16-17]。电子耳蜗包括体外器件和体内植入体两部分,体外器件的主要部分是言语处理器,该处理器进行频带划分、参数提取和信号调制等过程[18-20]。目前电子耳蜗的频带划分也参考了Bark 域的心理声学尺度,按照低频划分密、高频划分疏的方式来实现。但是,目前的频带划分是固定的,对于确定电极数,滤波器所划分的频带和子带中心频率是固定的,不利于针对不同采样率参数来设置不同的频带划分模式。另一方面,目前的电子耳蜗电极数不超过24 个,但是,随着技术的进步和电极制作工艺的改善,未来植入电极数有望增加,所对应的体外言语处理器的滤波器组需要划分更多的频带。Bark 域各个临界频带所对应的是离散的频率点,可对离散的频率点进行曲线拟合,然后通过插值方式来实现针对不同参数进行自适应的频带划分。Schroeder、Zwicker、Sekey、Gersho等众多学者早期提出Bark域的拟合方法,但这些拟合公式不够精简,例如拟合公式中所含有的反三角函数不利于电子耳蜗在言语处理器中的计算实现。另外,目前的有关Bark域的拟合公式主要是从曲线本身进行分析,并没有根据电子耳蜗应用场景中的低频频段和高频频段不同特征来进行拟合。本文基于Bark 域的特征研究电子耳蜗频带划分的方法,通过对Bark域进行拟合来形成简化的频带-频率分布曲线,并提出适合应用于电子耳蜗的频带划分方法。

1 Bark域的频带划分及拟合

Bark域所划分的24个临界频带及对应的中心频率如表1所示。

表1 Bark域的24个临界频带及对应的中心频率Tab.1 Twenty-four critical frequency bands in Bark domain and the corresponding center frequencies

目前的文献对Bark 域有多种方式进行拟合,但表达式复杂,本文提出根据Bark 域的低频频段和高频频段进行不同处理的方式来进行拟合。用临界频带编号为横坐标(用n表示),所在频带的中心频率为纵坐标(用fcen表示)来探讨其函数关系,如图1所示。

图1 临界频带编号(n)和频带的中心频率(fcen)的关系和平面分布Fig.1 Relationship and planar distribution of critical frequency band number(n)and the center frequency(fcen)

图1a 表示临界频带编号(n)和频带的中心频率(fcen)的函数关系,n越大,fcen也越大。从图中进一步观察可以看到,低频频段的n和fcen具有较好的线性关系,高频频段的n和fcen则呈现指数关系。如果对fcen取对数,则得到图1b 中的n和ln(fcen)关系,从图中可以看到,fcen取自然对数后的高频频段具有良好的线性关系,而低频频段则不具备线性关系。

从图1可知,低频频段和高频频段的n和fcen呈现不同的函数关系。通过比较和计算图1a和图1b中点的分布,可以设置一个频率分界点来划分出高低频段的具体位置,让图1a中的低频各点和图1b中的高频各点都近似线性分布,进而可以拟合曲线的简化。通过计算和比较,第9频带的频率值(数值为1 000 Hz)可作为分界点,通过该频率点划分后的各频率点的分布呈良好的线性分布,如图2所示。从图2a可以看出,n和fcen在1~9频带具有非常好的线性关系,从图2b可以看出,n和ln(fcen)在9~24频带具有非常好的线性关系。因此,可以把频带分成低频段和高频段分别进行近似简化,并拟合出Bark域的n~fcen函数。

图2 选取第9频带划分出高低频带后的临界频带编号(n)和中心频率(fcen)的关系和平面分布Fig.2 Relationship and planar distribution of critical frequency band number(n)and the center frequency(fcen)after dividing the high and low bands from the 9th frequency band

在图2a中,通过两个端点(1,60)和(9,1 000)计算出直线的函数解析式。用n表示自变量,fcen(n)表示函数(因变量),则可以得到通过端点(1, 60)和(9, 1 000)的直线解析式,如式(1)所示:

在图2b 中,以n为自变量,ln(fcen(n))为因变量的直线经过两个端点(9,ln1 000)和(24,ln13500),n为和fcen满足以下的关系:

对式(2)经过简化并求解fcen(n)的表达式,可以得到式(3):

综合式(1)和式(2)可以得到经过简化和拟合后的Bark 域临界频带编号(n)和频带中心频率(fcen)的关系表达式,如式(4)所示:

2 拟合误差及分析

本文所提出的对Bark 域的拟合表达式具有简洁的优点,并且从公式的推导和分析中对低频和高频有明确不同的处理模式,探讨了心理声学尺度和信号频带划分,拟合后的频率分布对比如图3所示。从图3可以看出,本文提出对Bark域的拟合方法所得到的各个频带的频率值与Bark 域本身的值非常接近。该方法的拟合公式简单,能保持足够的准确度,并且对低频频段的信号和高频频段的信号有不同的分析模式,可应用于电子耳蜗的频带划分。

图3 曲线拟合后的中心频率(fcen)与Bark域的对比Fig.3 Comparison of the center frequency(fcen)of the frequency band after curve fitting with that in Bark domain

3 电子耳蜗的频带划分及分析

Bark域是离散的点,通过拟合的曲线可用于自适应地确定所划分的频带。目前电子耳蜗所划分的频带基本是固定的,例如,诺尔康的18通道电子耳蜗的中心频率分别是:213.0、335.0、456.5、578.0、700.0、822.0、944.0、1 066.0、1 249.0、1 523.0、1 858.0、2 254.0、2 711.0、3 259.5、3 960.5、4 814.0、5 849.5和7 098.5 Hz;而22通道电子耳蜗的中心频率分别是:213.0、335.0、456.5、578.0、700.0、822.0、944.0、1 066.0、1 218.5、1 401.0、1 583.5、1 797.0、2 071.5、2 406.5、2 772.0、3 168.5、3 625.5、4 173.5、4 813.5、5 514.5、6 337.0和7 281.5 Hz。可以看到,诺尔康的18通道电子耳蜗和22通道电子耳蜗的滤波器组所对应的各子带的中心频率是固定的,而且前8个通道的频率值是相同的。

对于采样率可变的情形来说,采用固定的频率就会不合适,而本文所提出的Bark 域拟合曲线可适用于采样率变化的情形。对于采样率fs,按照采样定理,信号的最高频率不能超过0.5fs,只要在0~0.5fs范围内选取一个最低频率fL和最高频率fH,可以在此范围内通过拟合曲线确定中间的其他通道的频率值。由于本文通过离散点拟合出曲线,因此式(4)在具体应用时n可以取非整数值。本文提出的对电子耳蜗进行频带划分的方式可以依据拟合的Bark 曲线进行,具体的算法流程通过以下几步实现:

第一步:0~0.5fs范围内选取fL和fH,具体选取时要求0<fL<1 000,1 000<fH<0.5fs。

第二步:根据拟合曲线及式(4)计算得到fL和fH对应的nL和nH值,具体计算公式如式(5)和式(6)所示:

第三步:根据通道数i确定中间的i-1 个n的值,计算公式如式(7)所示:

第四步:根据各个nj的值代入式(4)计算出对应的频率值fj,进而可以得到全部的i通道电子耳蜗滤波器组的子带中心频率值。

从上述频带划分的步骤和具体的实现方式来看,本文提出的频带划分和曲线拟合方法是高效的。目前已有的Bark 域的拟合方法,一方面,计算量更大,另一方面,文献检索并未查询到有学术论文阐述有关电子耳蜗频带划分的具体实现方式。因此,上述的方法可为自适应频带划分提供思路,也为未来更加微型化电极和更多电极条件下匹配的滤波器组的频带划分提供实施方案。

4 结论

本文研究Bark 域的心理声学尺度特征和信号频带划分模式,并提出基于Bark 域的曲线拟合算法。本文所提出的算法具有简洁、准确度高、易于算法实现等优点。Bark 域的拟合曲线对低频频段采取线性化的处理方式,对高频频段采取指数化的处理方式,并将拟合曲线用于电子耳蜗滤波器组的频带划分。本文所提出的基于Bark 域的拟合曲线的电子耳蜗频带划分算法具有自适应的特征,并结合心理声学尺度特征,可用于多模式复杂场景的频带划分,相对于固定频率的划分模式具有更强的适应性。

猜你喜欢
频带耳蜗频段
基于小波变换的输电线路故障类型识别方法研究
跳频通信系统同步捕获回路抗干扰性能分析
耳蜗微音器电位临床操作要点
5G高新视频的双频段协同传输
gPhone重力仪的面波频段响应实测研究
耳蜗不全分隔畸形患儿耳蜗形态与人工耳蜗术后效果评估
Wi-Fi网络中5G和2.4G是什么?有何区别?
雷声公司交付首套中频段下一代干扰机
单音及部分频带干扰下DSSS系统性能分析
人工耳蜗为什么贵