一种低码率移动通信音频带宽扩展方法研究

2010-11-27 05:38董智勇
关键词:码本音质解码

潘 磊,董智勇

(中原工学院 计算机学院,河南 郑州 450007)

移动通信带宽资源有限,可分配给移动音频信号的带宽更少.同时,传统通信系统中通常采用的窄带语音编解码系统,无法满足人们日益增长的对高质量移动音频信号的需求.在移动音频编解码器中,应用带宽扩展技术可以不增加或仅增加少量码率实现宽带语音频来提高解码音质[1].带宽扩展的基本原理是从窄带音频信号恢复完整的宽带音频信号.音频带宽扩展技术分为两种,一种是“盲式”的带宽扩展技术,一种是“非盲式”的带宽扩展技术[2].“盲式”带宽扩展技术的基本特征是在重建高频信号时,不用任何原始高频信息而直接利用低频带信号信息重建高频信号[3];“非盲式”带宽扩展技术的基本原理是在编码端提取部分反映高频信号特征的参数,如能量信息、谱包络信息、高频激励信号的产生、频谱平滑因子等信息传送到解码端,解码端利用低频信息使用上述高频信号特征参数重建高频信号[4].

1 传统带宽扩展算法

文献[5]介绍了一种典型的“盲式”的带宽扩展技术,利用码本映射方法产生的模拟宽带信号包络计算高频合成滤波器,然后利用低频残差信号做激励,通过高频合成滤波器得到重建的高频信号.此外,其他学者还提出了高斯混合模型等“盲式”带宽扩展方法[6].“盲式”带宽扩展方法在重建高频信号时不用任何原始高频信息,但存在如下问题:(1)对于 /s/ 和 /f/ 这样的信息主要分布在高频部分的音调,重建效果不好;(2)当信号呈现较强的非平稳特性时,重建的高频信号会出现较强的噪声,音质明显下降;(3)对音乐信号重建的效果不好[7].

3GPP最新的移动音频编解码标准 AMR-WB+采用的是一种“非盲式”的带宽扩展技术[8],在解码端利用量化的LPC系数计算信号高频端信号包络的合成滤波器,把高频信号通过该合成滤波器得到的残差信号与低频残差信号相比较,计算出两者之间的增益比值.传送增益比值和量化的高频信号的合成滤波器到解码端,在解码端得到重建的高频信号.这种方法能够较好地重建音质,但是提取高频信息参数较多、编码码率较高.

2 低计算复杂度带宽扩展

本文提出的带宽扩展方法结合了“盲式”带宽扩展技术和“非盲式”带宽扩展技术的优点.首先,通过训练得到高低频LSF系数映射码本,由码本映射法得到高频合成滤波器系数,由低频激励信号通过高频合成滤波器得到合成的高频信号和原始高频信号比较并计算增益因子,编码端在复用码流中高频部分只传递量化的增益因子.在解码端同样利用码本搜索法得到合成滤波器系数,利用增益因子调整低频激励信号,得到高频激励信号.然后,将高频激励信号通过合成滤波器得到重建的高频信号.在保证音质的前提下降低了高频部分的编码比特率.

2.1 映射码本生成

由于码流不包括高频部分的谱包络信息,解码端需要通过码本映射得到高频信号的谱包络信息[9].映射码本的结构如图1所示.高频低频映射码本是通过对音频序列对应的高频LSF参数与低频LSF参数进行码本训练得到的.

图1 映射码本结构Fig.1 Codebook mapping structure

(1)将音频序列通过低通滤波器和高通滤波器分别得到低频信号和相应的高频信号.

(2)每20 ms子帧提取16阶LPC系数,然后插值得到5 ms子帧ISP系数,再将ISP转换为ISF系数.

(3)用低频ISF参数通过LBG算法训练得到低频ISF参数矢量量化码本CBlf.

(4)使用低频矢量量化码本CBlf对音频序列的低频部分进行量化得到低频部分的码本索引.

(5)对每5 ms子帧提取8阶LPC系数,并转换为LSF系数.

(6)将码本索引相同的低频部分对应的高频部分的LSF参数求平均值,得到对应的高频LSF量化矢量,从而构建出高频LSF量化码本CBhf.

由上述方法得到的低频码本与高频码本通过码本索引一一映射.

2.2 编码算法

如图2所示,首先对输入的超长帧低频信号(1 024点)的每一帧(256个样点)求取一组16阶的LPClf系数,然后插值得到ISPlf系数,将ISPlf转换为ISFlf系数,将ISFlf系数利用矢量量化得到量化的ISFlf系数.根据低频高频映射码本由量化的低频ISFlf系数得到对应的8阶量化高频LSFhf系数.

图2 高频编码框图Fig.2 High-frequency coding diagram

(1)

令S(n)为一个低频信号子帧序列(64个样点).其中,低频分析滤波器ALF(n)由对低频信号做16阶线性预测分析通过内插得到的量化LPC系数构成,其系统函数为:

(2)

(3)

2.3 解码算法

编码端将能量增益因子传递到解码端后,解码端将利用增益因子与合成滤波器重建高频信号.解码算法如图3所示.

图3 高频解码框图Fig.3 High-frequency decoding diagram

首先,解码端由码流中得到低频ISF系数,然后根据训练得到的映射码本得到对应的8阶高频ISF系数,并根据公式(1)得到高频合成滤波器,由低频残差通过此合成滤波器得到合成的高频激励信号.

然后,从码流中提取高频增益因子,以此调整高频激励信号得到重建高频信号,并用于与低频信号合成输出宽带音频信号.

3 实验结果分析

3.1 主观音质测试

我们在AMR-WB+核心层基础上实现了本带宽扩展算法,通过主观听音测试来比较本算法与AMR-WB+带宽扩展算法[6]的音质.测试使用MPEG标准测试序列es01(Suzanne Vega清唱), es02(男性德语语音)以及es03(女性英语语音).通过初步实验,可以看到本带宽扩展算法与AMR-WB+带宽扩展算法的音质相当,见图4.

图4 本带宽扩展算法与AMR-WB+主观音质比较Fig.4 A comparative of bandwidth extension method and AMR-WB+ subjective quality

3.2 带宽扩展码率

在AMR-WB+带宽扩展算法中,每个20 ms子帧需要增加16 bit来传输高频边信息.在本带宽扩展算法中,随着低频编码模式的不同,高频码流所需比特数也不同.不同模式下每子帧所需比特数如表1所示.

表1 不同模式下高频码流比特消耗Tab.1 High-frequency coding bit stream consumption in different models

测试中,不同的音频序列具有不同的平均码率.主观测试中,三个序列的实际平均码率如表2所示.

表2 AMR-WB+和本方法高频码率Tab.2 A Comparative of AMR-WB+ and high-frequency coding rate

由表2可以看出,与AMR-WB+带宽扩展算法相比,本方法平均可以降低大约50%的码率.

3.3 计算复杂度

在编码端,AMR-WB+带宽扩展算法中,每一帧都需要计算高频ISF系数,而本方法是通过码本映射得到高频ISF系数,不需要计算高频ISF系数,所以编码端计算复杂度比AMR-WB+低.

在解码端,AMR-WB+带宽扩展算法通过码流提取高频ISF系数,本方法通过码本映射得到高频ISF系数.解码段的计算复杂度主要集中在合成滤波器与增益调整部分,所以两者的计算复杂度相当.

4 结束语

本文结合“盲式”与“非盲式”带宽扩展技术提出了一种低比特的音频带宽扩展算法,使用“盲式”技术恢复高频合成滤波器系数,使用“非盲式”技术传递能量增益因子以调整高频谱包络.与3GPP最新标准AMR-WB+相比,该方法在音质相当的情况下能够大大降低高频边信息的码率,能够更好地满足移动通信对音频编解码器的需求.

参考文献:

[1] Technical Specification Group Services and System Aspects; Speech Codec Speech Processing Functions; AMR Wide-band Speech Codec; Transcoding Functions, TS 26.190 v5.1.0[S]. 2001:134-137.

[2] OH S H, YOON W J, CHO Y H,et al.A new spectral enhancement algorithm in MP3 audio[J]. IEEE Transactions on Consumer Electronics,2006,52(1): 196-199.

[3] LARSEN E, AARTS R M.Audio Bandwidth Extension-application to Psychoacoustics, Signal Processing and Loudspeaker Design, John Wiley & Sons, Ltd[R].2004:71-73.

[4] DIETZ M,LILJERYD L,KUNZ O. Spectral Band Replication, a novel approach in audio coding[C]. In AES 112th Convention, Munich, Germany,2002:140-143.

[5] ENBOM N, KLENIJN W B. Bandwidth expansion of speech based on Vector Quantization of the Mel Frequency Cepstral Coefficients[C]. In IEEE Workshop on Speech Coding, Finland, 1999:171-173.

[6] PARK K Y, KIM H S. Narrowband to wide-band conversion of speech using GMM based transformation[C]. in Proc. IEEE Int. Conf. Acoustics, Speech, and Signal Processing 2000, 2000:1 843-1 846.

[7] ARTTU L. Bandwidth extension in high-quality audio cod-ing[D]. In Master’s Thesis, 2005:65-67.

[8] 3GPP TS 26.290. Extended AMR Wideband codec[S]. December,2004:109-112.

[9] AVENDANO C,HERMANSKY H, WAN E A. Beyond Nyquist: Towards the recovery of broad-bandwidth speech from narrow bandwidth speech[C]. Proceedings EUROSPEECH’95, Madrid Spain 1995:165-168.

猜你喜欢
码本音质解码
免调度NOMA系统中扩频码优化设计
《解码万吨站》
基于有限域上仿射空间构造新码本
私人影院音质优选 ATT(安缇)SUB-12+
让全家人共享Hi-Fi音质 DALI(达尼)OBERON C系列
在小空间享受大型音箱的音质 Definitive Technology UIW RLS Ⅱ/UIW RSS Ⅱ
基于Zadoff-Chu 矩阵的最优码本构造方法
解码eUCP2.0
NAD C368解码/放大器一体机
Quad(国都)Vena解码/放大器一体机