矢量量化图像压缩方法

2011-03-24 13:42董世锟

海军航空大学学报 2011年1期

杨超，董世锟

（1.海军航空工程学院电子信息工程系，山东烟台 264001；2.海军大连舰艇学院学员旅，辽宁大连 116018）

0 引言

图像的数据量非常大。为了有效地传输和存储图像，常有压缩图像数据的必要。图像压缩就是在没有明显失真的前提下，将图像的位图信息转变成另外一种能将数据量缩减的表达形式。这样做是有理论基础的。首先，尽管图像中数据量很大，但数据之间不是完全独立的，图像中存在着各种各样的相关性或冗余信息。即一部分数据可以由另一部分数据完全推算出来。其次，大部分图像视频信号的最终接收者是人眼，而人类的视觉系统是一种高度复杂的系统，它能从极为杂乱的图像中抽象出有意义的信息，并以非常精练的形式反映给大脑。人眼对图像中的不同部分的敏感程度是不同的，如果去除图像中对人眼不敏感或意义不大的部分，对图像的主观质量是不会有很大影响的。

正由于图像压缩的必要性和可行性，图像压缩编码研究成为一个越来越活跃的领域。在诸如基于Internet的多媒体通信、可视电话、数字电视、多媒体计算机等领域得到了广泛的应用。

图像编码技术包括三个主要方面：①图像压缩的新算法的研究；② 基于VLSI技术的压缩算法的硬件实现；③面向不同应用场合的压缩编码标准的制定。其中，压缩算法的研究是图像编码技术的关键。

本文介绍的基于矢量量化（Vector Quantization，VQ）的图像压缩方法是20世纪70年代后期发展起来的一种数据压缩技术，是在图像编码技术中研究得较多的新型量化编码方法。其基本思想是[1]：矢量量化编码优于标量量化，将若干个标量数据组构成一个矢量，然后在矢量空间给以整体量化，从而压缩了数据而不损失多少信息。

LBG算法[1]是Y.Linde，A.Buzo与R.M.Gray在1980年给出的矢量量化算法，以后有许多人进行了改进。其思想是：对于一个训练序列，先找出其中心，再用分裂法产生一个初始码书，再把训练序列按码书中的元素分组，对这一分组再找每组的中心得到新的码书，转而把新码书作为初始码书再进行上述过程直至满意为止。

本文在介绍基于矢量量化的图像压缩方法基础上，将按照LBG算法以均方误差法计算两向量之间的距离，以分裂法产生初始码书（以4×4块图像组成的256 码书），通过全搜索算法进行码字搜索，对64×64的Lena 灰度图像进行矢量压缩编码，计算还原结果；LBG算法的缺陷是运行时间长，图像质量有较大的提升空间，对此许多论文都进行了探讨[2-14]，但是，文章大多在讨论算法，对影响运行速度的重要因素——训练样本数目的讨论却鲜见文章发表。有鉴于此，本文就选择合适数目的图像样本与运算速度的关系进行讨论，试图找到提高LBG算法运算速度的有效途径。

1 基于矢量量化的图像压缩法及LBG算法

1）基于矢量量化的图像压缩方法。

在数据与图像的压缩中，无论是数据还是图像，都可以看成是一串数据。设这段数据是m个数据，把它截成M段（一般是相等的，例如每段k个数据），即把m个数据变成M个数据向量，再把M个向量分成N个组，对每个组挑选一个数据向量，作为这个组的代表，例如，第j个组中的代表为yj，j=0,1,…,N−1。所谓压缩，就是图像上的数据向量，如果属于第j个组，则这个数据向量就用这个组的代表向量 yj代替，这时的编码就是在码书的相应位置上记下编号j，而不必记下yj本身。而记录{yj}的文件称为码书。如上N为量化向量yj的个数，即码书长度为N，这时传输或存储下标所需比特数为log2N。因此，平均传输一个像素所需的比特数为(log2N)/k。例如一个图像的每个像素用256级灰度，则每个像素点占用8 比特。如果压缩后平均每个像素点占R 比特，则有 R=(log2N)/k，即N应满足关系 N=2kR。实用中，一般总令kR为正整数以便用于计算。这样，向量量化方法的压缩比是可以控制的。

2）LBG算法是典型的矢量量化算法。

a.初始化：给定级数N，失真阈值ε，一个训练序列，某个初始N级码本令

其中，si={xj:d(xj−yi)≤d(xj−yl)}，l=1,2,…,N。

计算总平均失真

c.如果（Dn−1−Dn）/Dn≤ε，停止；为最终码本；否则继续。

2 方案设计

1）中心向量。

在矢量量化编码中，关键是码本的建立和码字搜索算法。如上所述，在数据和图像的压缩中，当k 确定后，问题就变成了如何分组及如何对每个组挑选代表的问题。当然，这个代表可以是组中的向量，也可以不是组中的向量，这个理想的代表当然应当是组中各向量的中心向量。为求中心，需要引入两向量x与yj之间距离 d (x,yj)）的概念。当然，两向量之间的距离多种多样，最常用的几个如下：

d.加权均方误差

本设计的码本的生成算法是在未知信源分布，但已知信源的一列具有代表性且足够长的样点集合（即训练序列）的设计算法，具体采用的是LBG算法，两向量之间的距离采用均方误差法。

选择有许多方法，不同初始码书对最终码书往往有较大的影响。本文采用分裂法产生初始码书。设kR=l，得到2lN=级量化器，具体步骤如下：

3）搜索过程。

码字搜索是矢量量化中的一个最基本问题，矢量量化过程本身实际上就是一个搜索过程，即搜索出与输入最为匹配的码本。矢量量化中最常用的搜索方法是全搜索算法和树搜索算法。全搜索算法与码本生成算法是基本相同的，在给定速率下其复杂度随矢量维数K以指数形式增长，全搜索矢量量化器性能好但设备较复杂。树搜索算法又有二叉树和多叉树之分，它们的原理是相同的，但后者的计算量和存储量都比前者大，性能比前者好。树搜索的过程是逐步求近似的过程，中间的码字是起指引路线的作用，其复杂度比全搜索算法显著减少，搜索速度较快。由于树搜索并不是从整个码本中寻找最小失真的码字，因而它的量化器并不是最佳的，其量化信噪比低于全搜索。本文采用全搜索算法。

为了讨论选择合适训练样本数以减少运算时间方法的有效性，本文首先讨论训练样本图像数与压缩结果的关系，在图像解压质量较好的前提下，计算、比较不同训练样本数对应的图像编码时间。

3 仿真实验

用数码相机拍摄10幅图像，经过photoshop 软件的处理，使其变换成大小为64×64的灰度图像，并分别以JPG形式存储。将这些训练图像分划成4×4 并且不相交的小块，通过LBG算法计算256个码本构成的码书。按照LBG算法以均方误差法计算两向量之间的距离，通过全搜索算法进行码字搜索，得到的压缩Lena图像还原结果如图1所示，其中，a）为原始图像；b）为经过VQ 编码后解码出来的图像，压缩信噪比SNRrms为21.554 8 dB，码本维数k=16，码书长度N=256，压缩后平均每个像素点占比特数R=0.5 bpp，压缩率为1/16。

为了研究训练样本图像数与图像压缩编码效果的关系，本文由仿真试验给出了图2曲线。

图2是用LBG算法对64×64的Lena 灰度图像进行矢量编码时，训练样本个数与量化信噪比PSNR的关系，k=16，R=0.5 bpp。

图1 Lena数字图像压缩编码结果

图2 训练样本个数与量化信噪比PSNR的关系

图3是当训练样本数分别为10、20、30、50和100时，用本文的矢量量化压缩编码方法对64×64的Lena 灰度图像进行压缩编码后得到的解码图像，k=16，R=0.5 bpp。

图3 图像还原效果

由图2和图3可见，训练样本数为10幅图像以上时，用LBG算法对64×64的Lena 灰度图像进行矢量编码图像质量较好。

图4是用LBG算法对64×64的Lena 灰度图像进行矢量编码时，训练样本个数与编码运算时间的关系，k=16，R=0.5 bpp。

由图4可见，图像训练样本数为10幅、20幅和100幅图像时，LBG图像压缩算法运行时间分别是50 min、90 min和360 min。

用100幅图像作为训练样本图像进行运算需要的时间大约是以10幅图像为训练样本图像的5 倍。

图4 训练样本个数与运算时间的关系

4 结束语

本文按照LBG算法以均方误差法计算两向量之间的距离，通过全搜索算法进行码字搜索，以分裂法产生初始码书（以4×4块图像组成的256 码书），得到压缩Lena图像还原结果。仿真实验表明，以100个图像为训练样本，对64×64的灰度图像，以4×4块图像组成的256 码书进行恢复，按照LBG算法以均方误差法计算两向量之间的距离，通过全搜索算法进行码字搜索，可以得到较高的数字图像压缩比（压缩率为1/16）；另外，图像训练样本数在10个以上时，用本文的矢量量化压缩编码方法对图像进行压缩编码，都可以得到较高的数字图像压缩比，但用100幅图像作为训练样本图像进行运算需要的时间是以10幅图像为训练样本图像的5 倍。由此可见，寻找合适的训练样本图像数，可以大大缩短图像压缩编码时间。

[1]张春田,苏育挺,张静.数字图像压缩编码[M].北京:清华大学出版社,2006:284-291.

[2]张涛,于凤萍,要强,等.高效的模糊聚类初始码书生成算法[J].红外与激光,2010,39(1):179-183.

[3]陈善学.矢量量化的初始码书算法[J].计算机工程与应用,2010,11:26-28.

[4]邓宏贵,郭晟伟.采用分量均值正交分割法设计矢量量化初始码书[J].中南大学学报:自然科学版,2010,41(2):628-631.

[5]胡光波,周勇,徐骞.改进向量量化算法的图像压缩研究[J].科学技术与工程,2010,10(14):3517-3519.

[6]荣秋生,潘梅森,颜君彪.基于Hopfiled神经网络的图像矢量量化[J].微计算机信息:管理一体化,2007,23(2-3):301-302.

[7]李霆,王东进,刘发林.基于混合遗传算法的码书设计方法[J].电讯技术,2007,47(1):151-153.

[8]胡俊.基于小波变换的多级矢量量化图像编码算法[J].现代电子技术,2007,241(2):56-58.

[9]华宇宁,杨洁.基于遗传算法的码本设计及其在说话人识别中的应用[J].沈阳理工大学学报,2007,26(5):62-64.

[10]纪震,廖惠连,许文焕,等.粒子对算法在图像矢量量化中的应用[J].电子学报,2007,35(10):1916-1920.

[11]王冬芳,廖裕民,余宁梅.矢量量化码书旋转压缩的研究[J].计算机工程与应用,2008,44(24):53-58.

[12]刘刚,刘晶,王泉.一种基于覆盖域密度的LBG算法[J].计算机应用,2008,28(12):319-325.

[13]郭莹,董吉文.一种快速的码本设计算法[J].山东科学,2008,21(1):57-60.

[14]李碧,林土胜,姜灵敏.应用协同进化的图像矢量量化码书设计方法[J].计算机应用,2008,44(36):29-31.