海量多媒体图像压缩中的冗余零系数消除算法设计

2023-08-02 05:48贺鹏飞
自动化仪表 2023年7期
关键词:信息熵海量极值

马 蕾,贺鹏飞

(1.北京电子科技职业学院电信工程学院,北京 100176;2.中国人口与发展研究中心信息网络部,北京 100081)

0 引言

多媒体图像信息压缩是实现网络图像快速检索的关键步骤。压缩方法主要包含有损与无损两种。无损压缩就是在整个压缩过程中图像信息不会丢失,在解压后图像质量保持不变。有损压缩是对熵压缩,通常用于声音与图像等数据的压缩,因此会存在失真现象,出现较多冗余零系数,导致图像模糊。如何增强压缩后的图像质量已经成为图像处理领域的研究重点与难点。相关学者也提出了研究成果。

索士尧等[1]针对压缩后的图像存在块效应问题,采用压缩模型进行压缩图像的块效应消除处理,通过压缩比获取压缩信息并建立图像压缩程序模型。这种方法在最大后验框架下,构建块效应去除算法,并且通过代价函数对算法的性能进行验证。试验表明,该方法具有更可靠的客观参数与主观视觉效果。杜秀丽等[2]针对图像的压缩失真问题,采用灰度共生矩阵进行图像的压缩感知处理,构建共生矩阵进行图像的纹理特征提取,使纹理较为复杂的字块获取较高采样率。这种方法对压缩后的图形进行重构,以提高图像的压缩质量。试验结果显示,该方法改善了局部图像画质。

上述两种方法在一定程度上解决了压缩后的图像模糊现象,但不能有效去除冗余零系数。为进一步提升海量多媒体图像压缩后的质量,本文设计了一种冗余零系数消除算法,用于海量多媒体图像的压缩过程。

1 海量多媒体图像压缩方法设计

1.1 图像信息熵计算

离散余弦变换(discrete cosine transform,DCT)算法是将图像从空域转换到频域。空域中具有较强相关性的信息在频域中会集中能量,因此需在频域中实现高能区域处理而忽视低能区域部分,以达到减少空间冗余的目的[3-4]。

通过计算多媒体图像的信息熵[5],可以明确图像中信息的不确定性。信息随机变量的期望值如式(1)所示。

(1)

式中:q(x)为图像信息随机变量;I(x)为期望值。

多媒体图像中各灰度值像素点分布概率与区域不同,使得图像表现出不同形态[6]。一般情况下,图像灰度点区间为[0,255]。在灰度点区间范围内构建灰度信息熵计算式如式(2)所示。

(2)

式中:pt为灰度像素t的出现概率。

若将不同灰度值的熵进行累加并定义成图像信息熵,则多媒体图像信息熵的计算式如式(3)所示。

(3)

综上所述,计算信息熵的过程就是获取图像中离散随机变量,即获取像素点灰度值概率分布函数的过程[7]。

输入:扫描行Li中的像素点数量与所处位置像素点灰度值。

输出:扫描行信息熵。

计算图像信息熵可分为以下步骤。

①利用差值算法在灰度值一维数据中获得Pi,j灰度值Gi,j。结合Gi,j值,将灰度值分成不同灰度阶级,以获取每个灰度阶级相对的像素分布概率。

②根据图像信息熵表达式,求取不同灰度阶级[8]相对的信息熵值Ei。

1.2 海量多媒体图像信息特征提取

完成多媒体图像信息熵的计算后,本文采用尺度不变特征变换(scale invariant feature transform,SIFT)算法[9]提取多媒体图像的特征。在SIFT算法尺度不变理论的支持下,目标在不同尺度下的信息可准确表示。其模仿人眼对事物的感知方式,对图像压缩具有重要意义。

图像特征提取的本质是将图像分割为尺度空间[10],在该空间中挑选关键点,以获得关键点的位置、尺度等信息,并消除对比度较低、平稳性较差的点。

1.2.1 极值点检测

多媒体图像存在多尺度特征。通过对应的尺度空间构建图像信息处理模型,获取尺度参数并对其进行转换处理,完成视觉信息的分析,以实现图像特征提取[11]。其具体步骤如下。

①构建多媒体图像的尺度空间。尺度空间的计算式如式(4)所示。

L(x,y,σ)=G(x,y,σ)⊗Q(x,y)

(4)

式中:G(x,y,σ)为高斯函数;Q(x,y)为卷积图像;⊗为卷积过程;σ为标准差,σ和图像平滑程度正相关。

②构建高斯函数G(x,y,σ)。

(5)

③尺度归一化处理。平稳的图像特征是对高斯函数作尺度归一化处理获得的。因为经过归一化的高斯函数极值能够形成稳定的图像特性。因此,通常利用高斯差分算子代替拉普拉斯算子对极值点进行检测。极值点检测的计算式为:

D(x,y,σ)=[G(x,y,kσ)-G(x,y,σ)]×I(x,y)

(6)

这些点和邻近图像全部像素点进行比较后,可根据像素点大小判断其是否属于极值点。

1.2.2 不稳定极值点消除

真实连续空间极值点与利用函数获取的极值点存在差异。因此,需要消除不稳定的极值点。DoG函数的拟合函数表达式如式(7)所示。

(7)

(8)

根据式(7)与式(8)的计算结果,可以构建极值点稳定性判定阈值。判断阈值的计算式如式(9)所示。

(9)

通过确定重要点基准方向,可使极值点存在转换稳定特点。(x,y)的梯度、模值与方向的计算式分别如式(10)~式(12)所示。

(10)

(11)

(12)

根据式(10)~式(12),即可实现海量多媒体图像特征提取。

1.3 图像压缩

1.3.1 一维DCT压缩

定义一维序列{z(n):n=0,1,…,N-1}的长度为N,则可以构建DCT的表达式为:

(13)

一维DCT表达式如式(14)所示。

(14)

1.3.2 二维DCT压缩

本文设某二维多媒体图像序列为{z(n,m);n=0,1,…,N-1,m=0,1,…,M-1},则其DCT压缩表达式如式(15)所示。

(15)

二维DCT表达式为:

(16)

式中:L为N×N大小的图像块;CN为正交变换系数。

1.3.3 系数量化

量化的主要目的是在确保图像质量的前提下去除视觉影像不明显的信息,以获取较高压缩比。在量化矩阵中的相同位置都存在一个量化值,区间为0~255。结合实际硬件存储容量与理想的图像质量,即可确定最佳量化值。

针对E分量的图像,可以通过方差阈值Mt-E来判断子块属性。如果Mi,j>Mt-E,则子块为复杂块;反之,为平坦块。子块可按照复杂程度进行归类。

2 冗余零系数消除

海量多媒体图像经过DCT压缩后,DCT系数会表现出图像频率分布特征。本文对随机一幅图像进行压缩处理,获得一个二维函数F1(u,v)。随着(u,v)的不断增大,与其相对应的DCT系数也逐渐变大。该系数大致分成低频、中频与高频系数三类。在边缘信息丰富的清晰部分,高频零系数则较少。综上可知,内容子块会经历模糊-清晰-模糊的变换过程,与其相对应的高频零系数数量也会发生改变。

同样位置的子块在压缩过程中的DCT零系数数量变换曲线如图1所示。

图1 DCT零系数数量变换曲线

由图1可知,在多媒体图像中内容子块存在的零系数在聚焦位置处数量最小,并且曲线变化情况与理想聚焦函数变换曲线走势基本相同。背景子块的冗余零系数在一定范围内波动幅度较小,不会影响算法后续使用。若将全部子块零系数相加,获得的总数量为聚焦评价函数,则其最低值点就是聚焦位置。

本文分析DCT系数直方图基本特征保持情况。本文假设P(R=r)为初始图像DCT系数是r的概率,P(S=s)为压缩后图像DCT系数是s的概率。系数取值概率的计算式如式(17)~式(21)所示。

P(R=1)>P(R=2)>P(R=3)>P(R=4)

(17)

P(R=1)-P(R=2)>P(R=2)-P(R=3)>

P(R=3)-P(R=4)

(18)

(19)

(20)

(21)

根据聚焦评价函数构建的冗余零系数消除模型如式(22)所示。

(22)

式(22)所构建的模型可消除冗余零系数,使原始多媒体图像特征得到保持。

3 试验研究

试验使用ImageNet数据库。该数据库是目前较大的多媒体图像数据库,包括14 197 122张图像。图像类别十分丰富,包括植物、爬行动物、运动、结构、工具、树木、器皿、蔬菜、车辆、人,可以满足此次试验对于海量图像的使用需求。从ImageNet中选取7 000张不同内容的图像。图像大小为265×265到640×480不等。图像品质因素确定为85。图像嵌入信息大小设置为3 KB。

试验使用本文算法对选取的图像进行压缩,得到的小波提升系数曲线如图2所示。

图2 小波提升系数曲线

高频小波系数即细节分量值。当细节分量阈值设为30时:1级分解细节信号共有图像6 072个,包括非零值图像143个;2级分解细节信号共有图像536个,包括非零值图像119个;3级分解细节信号共有图像268个,包括非零值图像90个。3级提升得到的低频图像有269个。由图像压缩的机制可知,只需要保存非零值的图像。因此,需要保存的图像共有269+143+119+90=621个。这大幅减少了数据所占空间。

本文在评价模型中计算所有通道中信号误差并对其进行加权处理。经过加权的误差再结合掩盖效应模型进行调整,并累计误差函数以获取图像质量。本文算法、文献[1]方法与文献[2]方法的峰值信噪比对比结果如图3所示。

图3 峰值信噪比对比结果

图像的峰值信噪比越高,说明图像的失真度越低。由图3可知,本文算法获得的多媒体图像峰值信噪比更高。随着图像数量的不断增加,本文算法消除冗余零系数后,图像的峰值信噪比明显得到了提高,最高峰值信噪比为8.5 dB。而文献[1]方法与文献[2]方法处理后,图像的峰值信噪比最高不超过6.5 dB。这说明本文算法在不降低图像质量的情况下,消除了图像中的冗余零系数。

图像所占空间对比结果如图4所示。

图4 图像所占空间对比结果图

由图4可知,三种方法压缩后图像所占空间呈现上升趋势。这是由于图像数量增多导致的,属于正常现象。但是,通过分析压缩后图像所占空间,仍然能够判断出不同方法的性能。三种方法中,本文算法的所占空间最低。当试验图像数量为7 000张时,本文算法压缩后图像所占空间为340 KB。在相同的试验图像数量下:文献[1]方法压缩后图像所占空间为590 KB;文献[2]方法压缩后图像所占空间为470 KB;本文算法处理后的图像所占空间更小。这是由于本文方法在压缩过程中对图像进行量化与归类,使其占用更小的储存空间。

4 结论

为提高压缩后多媒体图像质量,本文设计了一种海量多媒体图像压缩中的冗余零系数消除算法。本文首先根据多媒体图像的信息特征,进行一维与二维DCT压缩;然后确定图像的最佳聚焦位置,构建冗余零系数消除模型,完成压缩图像冗余零系数消除。测试结果表明,本文算法能够提高海量多媒体图像压缩的峰值信噪比、降低图像所占用的空间。这说明本文算法可以提高海量多媒体图像压缩的效果与质量。该算法的性能较为优异,具有较高的实际应用价值。但由于条件限制,试验只能在虚拟机上进行。为实现更加显著的效果,后续研究将在实体计算机上构建Hadoop平台进行试验,以彻底消除图像中的冗余零系数,使图像具有更高的信噪比。

猜你喜欢
信息熵海量极值
一种傅里叶域海量数据高速谱聚类方法
基于信息熵可信度的测试点选择方法研究
极值点带你去“漂移”
极值点偏移拦路,三法可取
海量快递垃圾正在“围城”——“绿色快递”势在必行
一类“极值点偏移”问题的解法与反思
基于信息熵的实验教学量化研究
一种基于信息熵的雷达动态自适应选择跟踪方法
一个图形所蕴含的“海量”巧题
借助微分探求连续函数的极值点