一种新的基于感知字典的稀疏图像重建算法研究

2017-09-12 08:03陈瑞瑞
洛阳师范学院学报 2017年8期
关键词:原始数据字典原子

陈瑞瑞, 李 爽

(郑州工业应用技术学院信息工程学院, 河南郑州 451100)

一种新的基于感知字典的稀疏图像重建算法研究

陈瑞瑞, 李 爽

(郑州工业应用技术学院信息工程学院, 河南郑州 451100)

针对已有图像重建算法分辨率低、需要大量计算的问题,本文提出了一种基于感知字典和数据自适应性的稀疏重建算法.首先,针对图像的数据结构,对样本数据进行超完备字典的训练,继而通过针对性的字典对图像进行稀疏重建.同时,为进一步改善算法的重建性能,并充分利用图像的有效信息,本文构造了数据自适应的感知字典.实验表明,该算法在不影响图像重建精确度的前提下可以减少计算复杂度,并具有良好的鲁棒性和较高的效率.

感知字典;稀疏重建;自适应;数据结构

0 引言

随着科技的发展和高清摄像技术的普及, 高分辨率图像识别和应用越来越受到科研工作者的重视. 如果要精确地重建图像, 依据奈奎斯特采样定理, 采样频率必须大于原始信号最高频率的两倍, 而图像的重建仅仅依靠部分重要信息就可以重建, 这就导致了大量的冗余数据, 从而增加了计算的复杂度. 假设信号可以通过设定的超完备字典稀疏表示, 或者只有少量的基函数, 那么就可以达到对信号稀疏传送的目的; 同时信号在字典中稀疏的表示, 可以更好地对图像信号和噪声进行分离, 从而达到去噪效果, 进而可提高图像重建的精确度[1].

1 稀疏字典的学习

将观测信号进行分解以提取信号的特征是信号分析和处理中的一种重要手段. 在大多数情况下, 图像信号本身在空间域不具有稀疏性, 传统的信号表示是基于正交完备基函数集进行的, 但是通过特定的字典分解系数或者合适的基, 可以抽取图像的特征数据, 并使其变得稀疏. 例如:正弦信号本身不具有稀疏性, 但它的傅里叶变换却是稀疏的. 而字典性能的优劣决定了图像信号的稀疏表示程度, 因此字典的选择与设计在图像重建过程中起着至关重要的作用[2].

1.1 字典设计因素

字典设计因素包括四个方面, 分别是自适应性, 局部性, 维数限制与尺度, 多分辨率. 其简介如下:

(1)自适应性. 通过提升图像稀疏性, 变换自身需要适应信号的内容, 从而训练超完备的稀疏字典, 进而可以优化非线性逼近不能适应信号表示的缺点. 近年来, 使用局部图像块的不完全信息学习而构建的自适应字典, 由于其良好的通用性和灵活性而渐渐被人们所接受.

(2)局部性. 良好的局部边缘特性是图像重建的重要依据, 局部边缘可以通过图像矩阵较大的变换系数灵活地表示. 因此, 短时傅里叶变换(STFT)被应用到信号局部边缘特征提取. JPEG图像压缩算法就是基于这一思想的经典例子[3].

(3)维数限制与尺度. 由于训练字典需要大量的训练样本, 信号维数过大会限制字典的尺寸, 从而出现学习过程缓慢且不利于字典的灵活应用; 另一方面, 由于训练样本维数的限制, 单一的图像尺度分析会造成学习过程的缓慢, 不利于字典在实际中的应用. 因此, 学习多尺度字典, 可以大大提高字典学习的速度, 从而提高字典的适应性.

(4)多分辨率. 随着多尺度几何分析和分形维数算法的出现, 多尺度分析可以更好地表示图像的流形特征和结构信息. 其中, 多普拉斯金字塔模型能够把图像数据表示为多个不同尺度和不同频带的子图像; 作为短时傅里叶变换的多尺度扩展则由不同位置和尺度的Fourier正弦函数与高斯函数调制的Gabor字典构成[4]. 字典设计、 学习过程如图1所示.

图1 字典学习过程示意图

1.2 字典学习问题建模

根据信号本身的特点和结构, 可以灵活地选取表示信号的字典基, 从而得到信号在过完备字典上的稀疏表. 训练字典的方法适用于任何种类的信号, 但这种方法自由度很高, 运算量也相对较大. 因此, 本文通过对字典进行稀疏化来提高字典对高维数据的适应性. 假设在空间Rn中信号, 用ψ表示字典元素组成的n×p矩阵, 因此, 信号x∈Rn可以通过ψ元素的线性表示:

x=ψα

(1)

其中, α∈Rp为矩阵ψ的列原子, 或者称为字典的元素.

1.3 字典学习方法

(2)

(1)输入:采集原始训练样本库p, 稀疏字典的基字典为φ, 原子之间稀疏性最大p, 训练样本稀疏性最大值为t, 迭代次数为k;

(2)输出:估计稀疏字典Ah,Al(Ah为高频分量稀疏字典,Al为低频分量稀疏字典);

(4)对高低频图像块样本(xi,yi)进行计算, 最后对每个图像块进行重建.

2 数据自适应的感知字典设计

自适应感知字典能够充分利用图像的有效信息改善算法的重建性能. 针对给定的冗余字典和原始数据, 每个原子属于最优原子集合的可能性受多方面影响,故并不确定[6].

2.1 最优的感知字典

最优感知字典很大程度上取决于原始数据的最优原子, 而感知字典与原始数据之间最优通过“相干”来描述, 相干性是指两个原子之间存在的最大绝对内积[7]. 不相干性是指传感矩阵的行不能稀疏地表示为稀疏矩阵的列, 反之也类似. 因此, 只有当两个原子间的不相干程度越大, 那么这个矩阵就越稀疏, 矩阵中的零元素就越多, 每个非零元素所包含的信息量就越大, 需要少量的字典基就可以实现图像的重构. 感知字典与原始数据之间的相干性, 数学定义为:

(3)

式中φk是正交矩阵φ的行向量,ψj是正交矩阵ψ的列向量. 通过数学知识可知感知字典与原始数据之间的相干性的取值范围为[0,1).

2.2 自适应感知字典设计

自适应感知字典取决于原始图像的最优原子, 而构成图像最优原子受多方面因素影响[9]. 如果通过计算得到原始数据各个原子出现在最优原子集中的概率, 则通过加权φW来近似求解最优子字典, 其中感知字典ψ满足:

(4)

其中,φ表示子字典,W=diag{w1,…wN}(wi∈[0,1])为加权矩阵,wi为冗余字典各列对应的加权系数. 假设每个原子出现在最优原子集合中为等概率事件, 即W=IN, 加权矩阵中对应最优原子的权值为1, 则通过式(4)的目标函数, 可得:

(5)

实际上, 通过求解:

(6)

其中,φi为字典中的原子. 通过对每个矢量ψi, 可构造拉格朗日函数

(7)

最终得到矢量ψi:

(8)

进而, 可通过矢量ψi得到自适应感知字典ψ.

2.3 图像去噪

在噪声存在的情况下, 图像的重建分辨率会明显地下降[10]. 合适的图像去噪算法, 可以提供图像重建的性能. 设噪声图像为

Y=X+N

(9)

其中, X为原始无噪声图像, N为服从标准正态分布N(0,σ2)的高斯白噪声. 精确地重建图像, 从数学上表示即为降噪图像和含噪图像的差值与噪声无限地趋近:

(10)

(11)

通过字典基对图像的稀疏表示, 可以对图像取块操作, 将图像去噪转化为每个图像块的去噪, 即转化为yi=xi+ni, 对N的求解转化为ni的求解

(12)

最后通过对每个图像块进行重建, 可得到降噪后的图像

(13)

3 实验结果与分析

以人脸图像为样本进行重叠分块, 使图像块矩阵大小为16×16, 分别对图像进行加噪处理, 噪声强度设置为10、 20、 30, 验证在冗余度为1、 4、 16的情况下去噪的效果. 去噪效果如表1所示

表1 图像去噪效果

通过实验可知, 图像的去噪效果随着字典冗余度的增加而逐步提高, 噪声强度越大, 则表现的越明显. 之后通过对贪婪算法、 传统的OMP算法以及本文基于自适应的感知字典算法进行比较, 来验证算法的有效性. 对三种算法进行1000次独立实验得到的结果如图2所示:

通过仿真数据可知, 基于自适应的感知字典算法的重建效果要优于贪婪算法和OMP算法; 另一方面, 图像的重建还依赖于感知字典的非零元素个数, 也就是图像的稀疏性.

图2 三种算法图像重建成功率

4 总结与展望

本文创造了一种基于感知字典的稀疏图像重建算法. 其首先分析了字典设计需要考虑的因素, 由于自然图像在空间域一般不具有稀疏性, 因此在减少计算复杂度的同时, 为了不影响图像重建的鲁棒性和有效性, 继而分析了稀疏字典学习算法, 最后提出了数据自适应的感知字典设计[11]. 同时, 为了验证该算法的抗噪性, 以Yale Face为样本数据进行仿真, 通过仿真实验可得, 该算法在同等条件下图像重建的成功率优于其他算法, 同时在图像去噪效果方面也具有一定的优势[12]. 尽管如此, 该算法仍有一定的改进之处, 如何增强样本间的不相关性, 以训练更有效的稀疏字典是下一步工作的重点.

[1] 李民, 程建, 乐翔,等.稀疏字典编码的超分辨率重建[J]. 软件学报, 2012(5):1315-1324.

[2] 查绎, 曹铁勇, 黄辉,等. 软判决稀疏字典的目标跟踪算法[J]. 计算机辅助设计与图形学学报, 2014, 26(8):1279-1289.

[3] 彭真明, 景亮, 何艳敏,等. 基于多尺度稀疏字典的多聚焦图像超分辨融合[J]. 光学精密工程, 2014, 22(1):169-176.

[4] 范文兵, 方堃, 杨潇楠. 基于稀疏字典学习和核稀疏表示的激光遥感图像超分辨重建[J]. 激光杂志, 2015(6):52-58.

[5] Engan K, Aase S O, Husoy J H. Method of Optimal Directions for Frame Design.Proceedings of the Acoustics, Speech, and Signal Processing, 1999. on 1999 IEEE International Conference - Volume 05, 1999: 2443-2446.

[6] Clifton L, Clifton D A, Pimentel M A, et al.Predictive monitoring of mobile patients by combiningclinical observations with data from wearable sensor[J]. IEEE Journal of Biomedical and Health Informatics, 2014, 18(3):722-730.

[7] 张艳阁. 基于双稀疏字典的压缩感知[D]. 长春:吉林大学, 2015.

[8] 王天荆, 郑宝玉, 杨震. 基于自适应冗余字典的语音信号稀疏表示算法[J]. 电子与信息学报, 2011, 33(10):2372-2377.

[9] Baker S, Kanade T. Limits on super-resolution and how to break them[J]. IEEE Trans. on Pattern Analysis and Machine Intelligence,2002,24(9):1167-1183.

[10] Sun J, Zheng N N, Tao H, Shum H Y. Image hallucination with primal sketch priors. In: Proc. of the IEEE Computer Society Conf.on Computer Vision and Pattern Recognition (CVPR). Madison: IEEE Computer Society, 2003. 729-736.

[11] 雷洋. 压缩感知OMP重构算法稀疏字典中匹配原子的选择方法[D]. 广州:华南理工大学, 2013.

[12] 袁慧珍. 基于小波稀疏字典的图像超分辨率重构方法研究[D]. 湘潭:湘潭大学, 2015.

[责任编辑 徐 刚]

A New Algorithm for Sparse Image Reconstruction Based on Sensing Dictionary

CHEN Rui-rui

(School of Information Engineering, Zhengzhou University of Industrial Technology, Zhengzhou 451100, China)

For existing image reconstruction algorithm, the resolution is low and the computation load is high. A sparse reconstruction algorithm based on sensing dictionary and data adaptability is proposed. First, for the data structure of the image, the sample data is trained with super-complete dictionary, and then sparse reconstruction of the image is implemented through targeted dictionary. At the same time, in order to further improve the reconstruction performance of the said algorithm and make full use of the effective information of the image, a data adaptive sensing dictionary is established. Experiments indicate that the algorithm can reduce the computational complexity on the premise that image reconstruction accuracy is not affected, and has good efficiency and robustness.

sensing dictionary; sparse reconstruction; adaptive; data structure

2017-03-09

河南省科技攻关计划项目(0721002210032)

陈瑞瑞(1985—), 女, 河南新郑人, 硕士, 讲师. 研究方向:计算机应用技术.

TP391.4

A

1009-4970(2017)08-0032-04

猜你喜欢
原始数据字典原子
GOLDEN OPPORTUNITY FOR CHINA-INDONESIA COOPERATION
原子究竟有多小?
原子可以结合吗?
带你认识原子
受特定变化趋势限制的传感器数据处理方法研究
字典的由来
大头熊的字典
全新Mentor DRS360 平台借助集中式原始数据融合及直接实时传感技术实现5 级自动驾驶
正版字典
世界经济趋势