基于卡通-纹理模型的相位恢复算法

2016-08-30 11:57练秋生赵晓蕊石保顺陈书贞燕山大学信息科学与工程学院秦皇岛066004
电子与信息学报 2016年8期
关键词:卡通纹理重构

练秋生 赵晓蕊 石保顺 陈书贞(燕山大学信息科学与工程学院 秦皇岛 066004)



基于卡通-纹理模型的相位恢复算法

练秋生*赵晓蕊石保顺陈书贞
(燕山大学信息科学与工程学院秦皇岛066004)

相位恢复是指仅利用图像的傅里叶幅值对原始图像进行恢复。由于傅里叶幅值中包含的信息量较少,当图像的过采样率相对较低时,传统的相位恢复算法无法实现图像的有效重构。因此如何利用合适的先验知识来提高图像重构质量是相位恢复的一个关键问题。该文将卡通-纹理模型用于相位恢复,利用全变差(TV)和双树复数小波(DTCWT)两种稀疏表示方法将图像分解为卡通成分和纹理成分,并提出了基于交替方向乘子法(ADMM)的有效求解算法。实验结果表明,该算法能有效提高图像重构质量。

图像处理;相位恢复;卡通-纹理模型;全变差;双树复数小波

1  引言

相位恢复试图仅从傅里叶幅值中恢复图像,它是一个极具挑战性的反问题,在光学、X射线衍射成像、天文学、数字全息等科学领域具有广泛应用[14]-。由于相位信息的丢失,相位恢复问题通常是不适定的,但当图像的过采样率大于某一个特定值时,理论上能够获得准确解,从而实现图像重构[5]。

针对相位恢复中相位信息的丢失问题,文献[6]提出了GS相位恢复算法,但该算法具有迭代次数多,收敛性差等缺点。在此基础上,人们提出了一系列基于交替投影相位恢复算法,如杨-顾算法[7]、误差减少(Error Reduction, ER)算法、混合输入输出(Hybrid Input-Output, HIO)算法[8]、差值映射(D ifference M ap, DM)算法[9]等。文献[10]在强度传输方程的基础上提出了基于整体变分的相位恢复算法,并通过有限差分牛顿法求解对应的优化问题。文献[11]在HIO算法的基础上将压缩传感技术用于相位恢复,将TV约束引入HIO算法中,提出了HIO+TV算法。该算法首先经过HIO算法迭代过程,然后求解支撑域内纯相位图像的相位全变差最小的优化问题[12],这两步交替迭代,结果将逐渐收敛至满足所有约束和全变差最小的解。文献[13]提出了适合稀疏信号的GESPAR (GrEedy Sparse PhAse Retrieval)算法,该算法是一种快速局部搜索方法,属于贪婪类算法,能够对稀疏信号进行有效重建。文献[14]提出了基于GAMP(Generalized Approximate Message Passing)的PR_GAMP算法,该算法不仅适合大规模信号相位恢复问题,而且对噪声鲁棒。

由于傅里叶幅值中包含的信息量相对较少,如何将合适的先验知识用于相位恢复,提高图像的重构质量是关键问题。在图像处理中,通常将稀疏性先验用于图像重建中。自然图像具有梯度稀疏性,因此理论上利用TV[12]稀疏性进行相位恢复能够获得满意的结果。TV具有良好的保持边缘特性,可以很好地表示图像的边缘部分,但当图像的过采样率相对较低时,用它进行相位恢复,只能重构出图像的轮廓部分,而无法很好地重构出图像的细节信息。DTCW T[15]较好的方向选择性使其在图像纹理表示中占有优势,因此如何对TV和DTCWT进行有效结合,以此来增加TV缺失的细节信息,对于提高图像的重构质量很重要。

图像分层定义为将图像分解为多个不同成分的总和,根据Meyer[16]图像模型,自然图像可以分解为卡通成分和纹理成分。本文针对TV和DTCWT的互补性,将卡通-纹理模型用于相位恢复算法,利用TV和DTCW T分别表示卡通成分和纹理成分,从而达到提高图像重构质量的目的。实验结果表明,本文算法的重构图像在峰值信噪比和视觉效果两个方面都有显著提高。

2  基本相位恢复算法

在相位恢复问题中,除了已知的傅里叶幅值构成的约束集M外,通常用到的先验知识包括非负性和支撑集,非负性与支撑集D相结合可以构成非负支撑约束集S。用()r x表示未知信号,幅值约束集M表示为

M集合对应的投影运算符MP定义为

人们通常采用寻找约束集合交点的方式求解相位恢复问题:

对于式(5)描述的问题通常采用交替投影算法进行求解,例如ER算法,但M集合是非凸的,ER算法容易陷入停滞,无法实现图像的有效重构。针对ER算法存在的不足,Fienup提出了适合解决非凸问题的HIO算法,该算法的迭代过程可概括为(对于第k次迭代)

式中,1β<为抑制系数。传统的HIO算法并未引入非负约束,文献[17]提出的HPR(Hybrid Projection-Refection)算法将非负约束引入到算法中,本文借鉴这种形式。HIO算法收敛性好,在实际问题中具有广泛应用,但当图像有噪声干扰时,H IO算法容易陷入振荡而无法收敛。

3  卡通-纹理模型

近年来,图像分层技术已经成为了图像处理领域的研究热点之一,并在很多领域得到了广泛应用[18,19]。根据M eyer[16]图像模型,自然图像可以分解为卡通成分和纹理成分,其中卡通成分包括图像中较平滑的成分和边缘结构,纹理成分包含大量的细节信息。根据卡通成分和纹理成分的不同特点,选取具有平滑特性和良好边缘保持特性的TV表示卡通成分,具有较好方向选择性的DTCWT表示纹理成分,将TV和DTCW T用于图像分层,对图像x进行卡通-纹理模型分解,如式(7)所示。

采用交替优化方式求解式(7)中描述的优化问题,具体步骤包括(对于第k次迭代):

(1)当纹理成分v固定时,更新卡通成分u的优化问题为

式(8)可以看作是一个关于卡通成分u的去噪问题,可以采用文献[20]提出的方法进行求解。

(2)当卡通成分u固定时,更新纹理成分v的优化问题为

采用软阈值函数(soft thresholding)[21]对式(9)进行求解,求得的结果为

本文将Lena标准灰度图像作为测试图像进行图像分层实验,对其进行卡通-纹理模型分解,实验结果如图1所示。实验结果表明,将TV和DTCWT用于卡通-纹理模型能够将卡通成分和纹理成分有效分开。

4  基于卡通-纹理模型的相位恢复算法

由于相位信息的丢失,相位恢复是一个欠定问题,利用先验知识是解决欠定问题的常用方法。将稀疏性先验用于相位恢复,得到相位恢复问题的框架:

为了使算法对噪声鲁棒,在式(11)的基础上添加误差项,得

图1 卡通-纹理模型下图像分解结果

在图像处理中,通常利用梯度稀疏性作为先验。令式(12)中的()R z为TV正则项,将求解此优化问题的方法称为PR_TV算法。TV对应图像边缘的稀疏性,具有良好的保持边缘特性,但当图像的过采样率相对较低时,用它进行相位恢复,只能重构出图像的轮廓,从而导致细节信息大量丢失。DTCWT是纹理图像稀疏表示的常用方法,令式(12)中的R(z)为双树复数小波系数矩阵的l1范数,将求解此优化问题的方法称为PR_DTCWT算法。DTCW T具有较好的方向选择性,可以更好地保留各个方向的细节信息。根据TV和DTCWT的不同特点,本文受卡通-纹理模型的启发,利用TV表示图像的卡通成分,利用DTCWT表示图像的纹理成分,提出了基于卡通-纹理模型的相位恢复算法(为后文描述方便,本文将该算法称为PR_TV_DTCW T):

将式中的TV()u替换为全变差的离散形式,式(13)可改写为

本文采用交替方向乘子法[22]对式(14)描述的优化问题进行求解,通过变量替换,令并将式(14)改写为可利用ADMM求解的拉格朗日形式:

式中,u为图像的卡通成分,v为图像的纹理成分,h1,h2, h均为尺度对偶变量(scaled dual variable),λ1,λ2为数值保真项与各正则项之间的权衡因子。求解的具体步骤包括(对于第k次迭代):

(1)当图像u, v,x,y以及尺度对偶变量h1,h2,h固定时,更新u1,u2的优化问题为

利用广义收缩模型[23]对式(16)中的最小化问题进行求解,求得的结果为

(2)当图像x, v, y,尺度对偶变量1h,2h, h以及1u,2u固定时,更新卡通成分u的优化问题为

对u求偏导数并令其为0,从而求得u的最优解为

(3)当图像u, x, y,尺度对偶变量1h,2h, h以及1u,2u固定时,更新纹理成分v的优化问题为

采用软阈值函数对式(21)进行求解,求得的结果为

(4)当图像u, v, y,尺度对偶变量1h,2h, h以及1u,2u固定时,更新图像x的优化问题为

求解式(23)得到图像x的最优解为

(5)当图像u, v, x,尺度对偶变量1h,2h, h以及1u,2u固定时,更新图像y的优化问题为

求解式(25)得到图像y的最优解为

(6)更新变量1h,2h, h为

表1  本文算法的基本步骤

5  实验结果

为了验证本文算法的有效性,分别利用HIO算法、HIO+TV算法以及本文提出的PR_TV算法、PR_DTCW T算法、PR_TV_DTCW T算法进行仿真实验。实验采用Lena标准灰度图像作为测试图像,图像大小为512 512×,测试图像和支撑如图2所示。实验平台为Intel Core i3-3220四核CPU,主频3.30 GHz,内存4 GB,软件平台为M atlab 2012 a。本文通过峰值信噪比(Peak Signal to Noise Ratio,PSNR)和结构相似度(Structural SIM ilarity,SSIM)[25]两个指标来评价图像的重构质量,PSNR值和SSIM值越高,说明图像的重构质量越好。

图2  测试图像和支撑

本文对每个过采样率进行16次独立实验,从16次实验结果中选取FR[26]最小的结果,FR计算公式为

式中,F xˆ为估计图像xˆ的傅里叶变换,α为比例因子。

表2  不同过采样率下图像重构结果PSNR(dB)和SSIM比较

图3  过采样率为2.29时Lena图像的重构结果

表2中列出了过采样率[5]为2.35和2.29两种情况下,不同算法对Lena图像重构结果比较,其中过采样率定义为全部像素值与未知像素值数量的比值。从表2可以看出,PR_TV算法和PR_DTCWT算法的性能较HIO算法和HIO+TV算法有明显提高,PR_TV_DTCW T算法在PSNR值和SSIM值上均优于其他对比算法。图3给出无噪情况下,过采样率为2.29时,不同算法对Lena图像的重构结果。从图3可以看出,HIO算法与HIO+TV算法均无法对图像进行有效重构,PR_TV算法重构效果明显优于前两种算法,具有了清晰的轮廓,但纹理信息大量丢失,PR_DTCWT算法与PR_TV算法相比,增加了大量纹理信息,但脸部有斜纹,PR_TV_DTCWT算法保留了更多的细节信息,边缘与纹理更清晰,较其他几种对比算法具有明显优势。实验结果表明了卡通-纹理模型应用于相位恢复算法的有效性。

表3  不同算法运行时间比较(s)

图4  过采样率为2.29,噪声强度为10%时Lena图像的重构结果

为了体现各个算法的计算复杂度,表3给出了迭代次数为4000次时运行时间比较。从表3可以看出,HIO算法用时最少,PR_TV_DTCWT算法用时最多。HIO算法仅利用了集合投影,计算复杂度最低。由于需要求解TV最小化问题,HIO+TV算法计算复杂度高于HIO算法。PR_TV算法和PR_DTCWT算法利用ADMM算法分别求解引入TV正则项和双树复数小波稀疏正则项的相位恢复问题,计算复杂度高于HIO+TV算法。PR_TV_ DTCWT算法通过卡通-纹理模型将TV和DTCWT进行结合,同样利用ADMM算法求解对应的优化问题,因此计算复杂度最高。虽然PR_ TV_DTCWT算法的计算复杂度相对较高,但在低采样率下,图像的重构质量明显优于其他几种算法。

为了探求不同噪声强度对本文算法重建结果的影响,本文在真实测量值上施加噪声强度为5%~20%的高斯白噪声,其中噪声强度[26]定义为

式中,Fx为无噪图像x的傅里叶变换。

在过采样率为2.29时,表4给出了不同算法在不同噪声强度下重构图像的PSNR和SSIM。从表4可以看出,PR_TV_DTCW T算法在不同噪声强度下,重构结果均优于其他算法。在4种噪声强度下,重构图像的平均PSNR值比HIO算法、HIO+TV算法、PR_TV算法、PR_DTCWT算法分别提高了18.17 dB, 15.98 dB, 2.62 dB, 11.07 dB,平均SSIM值分别提高了0.6176, 0.5633, 0.0975, 0.2680。图4给出了噪声强度为10%时,不同算法对Lena图像的重构结果。从图4可以看出,PR_TV_ DTCWT算法的视觉效果明显优于其他对比算法,HIO算法与HIO+TV算法均无法有效重构图像,PR_TV_DTCWT算法与PR_TV算法相比,纹理信息更丰富,与PR_DTCW T算法相比,重构结果更清晰,脸部无额外斜纹存在。

表4  不同噪声强度下图像重构结果PSNR(dB)和SSIM比较

6结束语

本文针对全变差和双树复数小波的互补性,将卡通-纹理模型引入到相位恢复问题中,并利用ADMM算法对所对应的优化问题进行了求解。仿真实验表明,PR_TV_DTCW T算法与HIO算法、HIO+TV算法、PR_TV算法以及PR_DTCWT算法相比,重构图像具有更清晰的边缘与纹理信息,重构质量具有明显优势。在真实测量值上施加不同噪声强度高斯白噪声的实验表明,PR_TV_ DTCWT算法对噪声鲁棒。如何将本文中模型应用到其他图像反问题是将来的研究方向。

[1] SHECHTM AN Y, ELDAR Y C, COHEN O, et al. Phase retrieval w ith application to optical imaging: a contem porary overview[J]. IEEE Signal Processing Magazine, 2015, 32(3): 87-109. doi: 10.1109/MSP.2014.2352673.

[2] WANG Xiaogang, CHEN W en, and CHEN Xudong. Optical encryption and authentication based on phase retrieval and sparsity constraints[J]. IEEE Photonics Journal, 2015, 7(2): 1-10. doi: 10.1109/JPHOT.2015.2412936.

[3] ELDAR Y C, SIDORENKO P, M IXON D G, et al. Sparse phase retrieval from short-time Fourier measurements[J]. IEEE Signal Processing Letters, 2015, 22(5): 638-642. doi: 10.1109/LSP.2014.2364225.

[4] 戎路, 王大勇, 王云新, 等. 同轴数字全息中的相位恢复算法[J]. 中国激光, 2014, 41(2): 55-64. doi: 10.3788/cj1201441. 0209006.

RONG Lu, WANG Dayong, WANG Yunxin, et al. Phase retrieval methods in in-line digital holography[J].Chinese Journal of Lasers, 2014, 41(2): 55-64. doi: 10.3788/cj1201441. 0209006.

[5] M IAO J, SAYRE D, and CHAPMAN H N. Phase retrieval from the magnitude of the Fourier transform s of nonperiodic ob jects[J]. Journal of the Optical Society of Am erica A, 1998,15(6): 1662-1669. doi: 10.1364/JOSAA.15.001662.

[6] GERCHBERG R W and SAXTON W O. A practical algorithm for the determ ination of phase from im age and diffraction p lane pictures[J]. Optik, 1972, 35(2): 237-250.

[7] 杨国桢, 顾本源. 光学系统中振幅和相位的恢复问题[J]. 物理学报, 1981, 30(3): 410-413.

YANG Guozhen and GU Benyuan. On the am plitude-phase retrieval problem in optical system s[J]. Acta Physica Sin ica,1981, 30(3): 410-413.

[8] FIENUP J R. Phase retrieval algorithm s: a com parison[J]. Applied Optics, 1982, 21(15): 2758-2769. doi: 10.1364/A 0.21. 002758.

[9] ELSER V. Phase retrieval by iterated projections[J]. Journal of the Optical Society of Am erica A, 2003, 20(1): 40-55. doi: 10.1364/JOSAA.20.000040.

[10] 程鸿, 章权兵, 韦穗. 基于整体变分的相位恢复[J]. 中国图象图形学报, 2010, 15(10): 1425-1429. doi: 10.11834/jig. 20101007.

CHENG Hong, ZHANG Quanbing, and WEI Sui. Phase retrieval based on total variation[J]. Journal of Im age and Graphics, 2010, 15(10): 1425-1429. doi: 10.11834/jig. 20101007.

[11] 杨振亚, 郑楚君. 基于压缩传感的纯相位物体相位恢复[J]. 物理学报, 2013, 62(10): 104203. doi: 10.7498/aps.62.104203.

YANG Zhenya and ZHENG Chujun. Phase retrieval of pure phase ob ject based on com pressed sensing[J]. Acta Physica Sin ica, 2013, 62(10): 104203. doi: 10.7498/aps.62.104203.

[12] CHAMBOLLE A. An algorithm for total variation m inim ization and applications[J]. Journal of Mathematical Imaging and Vision, 2004, 20(1): 89-97. doi: 10.1023/ B:JM IV.0000011325.36760.1e.

[13] SHECHTMAN Y, BECK A, and ELDAR Y C. GESPAR: Efficient phase retrieval of sparse signals[J]. IEEE Transactions on Signal Processing, 2014, 62(4): 928-938. doi: 10.1109/TSP.2013.2297687.

[14] SCHNITER P and RANGAN S. Com pressive phase retrieval via generalized approximate message passing[J]. IEEE Transactions on Signal Processing, 2015, 63(4): 1043-1055. doi: 10.1109/A llerton.2012.6483302.

[15] K INGSBURY N G. Comp lex wavelets for shift invariant analysis and filtering of signals[J]. Applied and Computational Harm onic Analysis, 2001, 10(3): 234-253. doi: 10.1006/acha. 2000.0343.

[16] MEYER Y. Oscillating Patterns in Im age P rocessing and Non-Linear Evolution Equations[M]. Boston: University Lecture Series, Am erican M athem atical Society, 2001: 23-78.

[17] BAUSCHKE H H, COMBETTES P L, and LUKE D R. Hybrid projection-reflection method for phase retrieval[J]. Journal of the Optical Society of Am erica A, 2003, 20(6): 1025-1034. doi: 10.1364/JOSAA.20.001025.

[18] CHI J N and ERAM IAN M. Enhancement of textural differences based on m orphological com ponent analysis[J]. IEEE Transactions on Image Processing, 2015, 24(9): 2671-2684. doi: 10.1109/T IP.2015.2427514.

[19] ZHANG Zhengrong, ZHANG Jun, W EI Zhihui, et al. Cartoon-texture com posite regu larization based non-blind deblurring method for partly-textured blurred images w ith Poisson noise[J]. Signal Processing, 2015, 116(11): 127-140. doi: 10.1016/j.sigpro.2015.04.020.

[20] GOLDSTEIN T and OSHER S. The sp lit b regm an m ethod for L1-regu larized problems[J]. SIAM Journal on Imaging Sciences, 2009, 2(2): 323-343. doi: 10.1137/080725891.

[21] DONOHO D L. De-noising by soft-thresholding[J]. IEEE Transactions on Inform ation Theory, 1995, 41(3): 613-627. doi: 10.1109/18.382009.

[22] BOYD S, PARIKH N, CHU E, et al. Distributed optimization and statistical learning via the alternating method of multipliers[J]. Foundations and Trends in Machine Learning, 2011, 3(1): 1-122. doi: 10.1561/2200000016.

[23] WANG Y ilun, Y IN W otao, and ZHANG Y in. A fast algorithm for im age deblu rring w ith total variation regularization[R]. CAAM Techn ical Report TR 07-10, Rice University, Houston, 2007.

[24] GLOW INSKI R. Lectures on Numerical Methods for Non-Linear Variational Problem s[M]. Berlin: Bombay Springer-Verlag, 1980: 200-214.

[25] WANG Z H, BOVIK A C, and SHEIKH H R. Im age quality assessm ent: from error visibility to structural sim ilarity[J]. IEEE Transactions on Image Processing, 2004, 13(4): 600-612.

[26] RODRIGUEZ J A, XU Rui, CHEN Chienchun, et al. Oversam pling smoothness: an effective algorithm for phase retrieval of noisy diffraction intensities[J]. Journal of Applied Crystallography, 2013, 46(2): 312-318. doi: 10.1107/ S0021889813002471.

练秋生:男,1969年生,教授,博士生导师,研究方向为图像处理、稀疏表示、压缩感知及相位恢复.

赵晓蕊:女,1989年生,硕士生,研究方向为相位恢复.

石保顺:男,1989年生,博士生,研究方向为盲压缩感知、字典学习、相位恢复.

陈书贞:女,1968年生,副教授,研究方向为图像处理、压缩感知、生物识别、相位恢复.

Phase Retrieval Algorithm Based on Cartoon-texture Model

LIAN QiushengZHAO XiaoruiSHI BaoshunCHEN Shuzhen
(Institute of Information Science and Technology, Yanshan University, Qinhuangdao 066004, China)

Phase retrieval is an issue that tries to recover an image from its Fourier magnitude measurements. Since the Fourier magnitude measurements contain less inform ation, the traditional phase retrieval algorithm s can not reconstruct the image efficiently under the scenario that the oversam pling ratio is relatively low. Therefore, how to use the suitab le image p riors to im prove the reconstruction quality of the image is the key issue. In this paper, the cartoon-texture model is utilized for phase retrieval algorithm. Two sparse representation methods including both Total Variation (TV) and Dual-Tree Com p lex W avelet Transform (DTCW T) are exp loited to decom pose the image into two parts, namely the cartoon com ponent and the texture component. Moreover, A lternating Direction Method of Mu ltipliers (ADMM) is exp loited to solve the corresponding p roblem. The experimental results show that the proposed algorithm can effectively imp rove the quality of image reconstruction.

Image processing; Phase retrieval; Cartoon-texture model; Total Variation (TV); Dual-Tree Com plex Wavelet Transform (DTCWT)

s: The National Natural Science Foundation of China (61471313), The Natural Science Foundation of Hebei Province (F2014203076)

TN911.73

A

1009-5896(2016)08-1991-08

10.11999/JEIT151156

2015-10-16;改回日期:2016-02-25;网络出版:2016-04-24

练秋生lianqs@ysu.edu.cn

国家自然科学基金(61471313),河北省自然科学基金(F2014203076)

猜你喜欢
卡通纹理重构
视频压缩感知采样率自适应的帧间片匹配重构
长城叙事的重构
基于BM3D的复杂纹理区域图像去噪
使用纹理叠加添加艺术画特效
北方大陆 重构未来
北京的重构与再造
TEXTURE ON TEXTURE质地上的纹理
鸡鸣狗盗皮皮猪卡通
消除凹凸纹理有妙招!
趣味的卡通穿上身